From e689fbb41d17af73c83d61bd9b190e7b27501c36 Mon Sep 17 00:00:00 2001
From: "github-actions[bot]"
 <41898282+github-actions[bot]@users.noreply.github.com>
Date: Fri, 24 May 2024 11:30:50 +0200
Subject: [PATCH] DOCS: shimmer API docs for v0.5.1 (#86)

Co-authored-by: github-actions <github-actions@github.com>
---
 docs/api/v0.5.1/index.html                    |  249 +
 docs/api/v0.5.1/search.js                     |   46 +
 .../v0.5.1/shimmer/cli/ckpt_migration.html    |  319 ++
 docs/api/v0.5.1/shimmer/dataset.html          |  448 ++
 .../shimmer/modules/contrastive_loss.html     |  797 +++
 docs/api/v0.5.1/shimmer/modules/domain.html   | 1220 +++++
 .../shimmer/modules/global_workspace.html     | 4260 +++++++++++++++++
 .../api/v0.5.1/shimmer/modules/gw_module.html | 2893 +++++++++++
 docs/api/v0.5.1/shimmer/modules/losses.html   | 3888 +++++++++++++++
 .../api/v0.5.1/shimmer/modules/selection.html | 2151 +++++++++
 docs/api/v0.5.1/shimmer/modules/utils.html    |  760 +++
 docs/api/v0.5.1/shimmer/modules/vae.html      | 1288 +++++
 docs/api/v0.5.1/shimmer/types.html            |  872 ++++
 docs/api/v0.5.1/shimmer/utils.html            |  701 +++
 14 files changed, 19892 insertions(+)
 create mode 100644 docs/api/v0.5.1/index.html
 create mode 100644 docs/api/v0.5.1/search.js
 create mode 100644 docs/api/v0.5.1/shimmer/cli/ckpt_migration.html
 create mode 100644 docs/api/v0.5.1/shimmer/dataset.html
 create mode 100644 docs/api/v0.5.1/shimmer/modules/contrastive_loss.html
 create mode 100644 docs/api/v0.5.1/shimmer/modules/domain.html
 create mode 100644 docs/api/v0.5.1/shimmer/modules/global_workspace.html
 create mode 100644 docs/api/v0.5.1/shimmer/modules/gw_module.html
 create mode 100644 docs/api/v0.5.1/shimmer/modules/losses.html
 create mode 100644 docs/api/v0.5.1/shimmer/modules/selection.html
 create mode 100644 docs/api/v0.5.1/shimmer/modules/utils.html
 create mode 100644 docs/api/v0.5.1/shimmer/modules/vae.html
 create mode 100644 docs/api/v0.5.1/shimmer/types.html
 create mode 100644 docs/api/v0.5.1/shimmer/utils.html
diff --git a/docs/api/v0.5.1/index.html b/docs/api/v0.5.1/index.html
new file mode 100644
index 00000000..b62372d7
--- /dev/null
+++ b/docs/api/v0.5.1/index.html
@@ -0,0 +1,249 @@
+<!doctype html>
+<html lang="en">
+<head>
+    <meta charset="utf-8">
+    <meta name="viewport" content="width=device-width, initial-scale=1">
+    <meta name="generator" content="pdoc 14.4.0"/>
+    <title>Module List &ndash; pdoc 14.4.0</title>
+
+    <style>/*! * Bootstrap Reboot v5.0.0 (https://getbootstrap.com/) * Copyright 2011-2021 The Bootstrap Authors * Copyright 2011-2021 Twitter, Inc. * Licensed under MIT (https://github.com/twbs/bootstrap/blob/main/LICENSE) * Forked from Normalize.css, licensed MIT (https://github.com/necolas/normalize.css/blob/master/LICENSE.md) */*,::after,::before{box-sizing:border-box}@media (prefers-reduced-motion:no-preference){:root{scroll-behavior:smooth}}body{margin:0;font-family:system-ui,-apple-system,"Segoe UI",Roboto,"Helvetica Neue",Arial,"Noto Sans","Liberation Sans",sans-serif,"Apple Color Emoji","Segoe UI Emoji","Segoe UI Symbol","Noto Color Emoji";font-size:1rem;font-weight:400;line-height:1.5;color:#212529;background-color:#fff;-webkit-text-size-adjust:100%;-webkit-tap-highlight-color:transparent}hr{margin:1rem 0;color:inherit;background-color:currentColor;border:0;opacity:.25}hr:not([size]){height:1px}h1,h2,h3,h4,h5,h6{margin-top:0;margin-bottom:.5rem;font-weight:500;line-height:1.2}h1{font-size:calc(1.375rem + 1.5vw)}@media (min-width:1200px){h1{font-size:2.5rem}}h2{font-size:calc(1.325rem + .9vw)}@media (min-width:1200px){h2{font-size:2rem}}h3{font-size:calc(1.3rem + .6vw)}@media (min-width:1200px){h3{font-size:1.75rem}}h4{font-size:calc(1.275rem + .3vw)}@media (min-width:1200px){h4{font-size:1.5rem}}h5{font-size:1.25rem}h6{font-size:1rem}p{margin-top:0;margin-bottom:1rem}abbr[data-bs-original-title],abbr[title]{-webkit-text-decoration:underline dotted;text-decoration:underline dotted;cursor:help;-webkit-text-decoration-skip-ink:none;text-decoration-skip-ink:none}address{margin-bottom:1rem;font-style:normal;line-height:inherit}ol,ul{padding-left:2rem}dl,ol,ul{margin-top:0;margin-bottom:1rem}ol ol,ol ul,ul ol,ul ul{margin-bottom:0}dt{font-weight:700}dd{margin-bottom:.5rem;margin-left:0}blockquote{margin:0 0 1rem}b,strong{font-weight:bolder}small{font-size:.875em}mark{padding:.2em;background-color:#fcf8e3}sub,sup{position:relative;font-size:.75em;line-height:0;vertical-align:baseline}sub{bottom:-.25em}sup{top:-.5em}a{color:#0d6efd;text-decoration:underline}a:hover{color:#0a58ca}a:not([href]):not([class]),a:not([href]):not([class]):hover{color:inherit;text-decoration:none}code,kbd,pre,samp{font-family:SFMono-Regular,Menlo,Monaco,Consolas,"Liberation Mono","Courier New",monospace;font-size:1em;direction:ltr;unicode-bidi:bidi-override}pre{display:block;margin-top:0;margin-bottom:1rem;overflow:auto;font-size:.875em}pre code{font-size:inherit;color:inherit;word-break:normal}code{font-size:.875em;color:#d63384;word-wrap:break-word}a>code{color:inherit}kbd{padding:.2rem .4rem;font-size:.875em;color:#fff;background-color:#212529;border-radius:.2rem}kbd kbd{padding:0;font-size:1em;font-weight:700}figure{margin:0 0 1rem}img,svg{vertical-align:middle}table{caption-side:bottom;border-collapse:collapse}caption{padding-top:.5rem;padding-bottom:.5rem;color:#6c757d;text-align:left}th{text-align:inherit;text-align:-webkit-match-parent}tbody,td,tfoot,th,thead,tr{border-color:inherit;border-style:solid;border-width:0}label{display:inline-block}button{border-radius:0}button:focus:not(:focus-visible){outline:0}button,input,optgroup,select,textarea{margin:0;font-family:inherit;font-size:inherit;line-height:inherit}button,select{text-transform:none}[role=button]{cursor:pointer}select{word-wrap:normal}select:disabled{opacity:1}[list]::-webkit-calendar-picker-indicator{display:none}[type=button],[type=reset],[type=submit],button{-webkit-appearance:button}[type=button]:not(:disabled),[type=reset]:not(:disabled),[type=submit]:not(:disabled),button:not(:disabled){cursor:pointer}::-moz-focus-inner{padding:0;border-style:none}textarea{resize:vertical}fieldset{min-width:0;padding:0;margin:0;border:0}legend{float:left;width:100%;padding:0;margin-bottom:.5rem;font-size:calc(1.275rem + .3vw);line-height:inherit}@media (min-width:1200px){legend{font-size:1.5rem}}legend+*{clear:left}::-webkit-datetime-edit-day-field,::-webkit-datetime-edit-fields-wrapper,::-webkit-datetime-edit-hour-field,::-webkit-datetime-edit-minute,::-webkit-datetime-edit-month-field,::-webkit-datetime-edit-text,::-webkit-datetime-edit-year-field{padding:0}::-webkit-inner-spin-button{height:auto}[type=search]{outline-offset:-2px;-webkit-appearance:textfield}::-webkit-search-decoration{-webkit-appearance:none}::-webkit-color-swatch-wrapper{padding:0}::file-selector-button{font:inherit}::-webkit-file-upload-button{font:inherit;-webkit-appearance:button}output{display:inline-block}iframe{border:0}summary{display:list-item;cursor:pointer}progress{vertical-align:baseline}[hidden]{display:none!important}</style>
+    <style>/*! syntax-highlighting.css */pre{line-height:125%;}span.linenos{color:inherit; background-color:transparent; padding-left:5px; padding-right:20px;}.pdoc-code .hll{background-color:#ffffcc}.pdoc-code{background:#f8f8f8;}.pdoc-code .c{color:#3D7B7B; font-style:italic}.pdoc-code .err{border:1px solid #FF0000}.pdoc-code .k{color:#008000; font-weight:bold}.pdoc-code .o{color:#666666}.pdoc-code .ch{color:#3D7B7B; font-style:italic}.pdoc-code .cm{color:#3D7B7B; font-style:italic}.pdoc-code .cp{color:#9C6500}.pdoc-code .cpf{color:#3D7B7B; font-style:italic}.pdoc-code .c1{color:#3D7B7B; font-style:italic}.pdoc-code .cs{color:#3D7B7B; font-style:italic}.pdoc-code .gd{color:#A00000}.pdoc-code .ge{font-style:italic}.pdoc-code .gr{color:#E40000}.pdoc-code .gh{color:#000080; font-weight:bold}.pdoc-code .gi{color:#008400}.pdoc-code .go{color:#717171}.pdoc-code .gp{color:#000080; font-weight:bold}.pdoc-code .gs{font-weight:bold}.pdoc-code .gu{color:#800080; font-weight:bold}.pdoc-code .gt{color:#0044DD}.pdoc-code .kc{color:#008000; font-weight:bold}.pdoc-code .kd{color:#008000; font-weight:bold}.pdoc-code .kn{color:#008000; font-weight:bold}.pdoc-code .kp{color:#008000}.pdoc-code .kr{color:#008000; font-weight:bold}.pdoc-code .kt{color:#B00040}.pdoc-code .m{color:#666666}.pdoc-code .s{color:#BA2121}.pdoc-code .na{color:#687822}.pdoc-code .nb{color:#008000}.pdoc-code .nc{color:#0000FF; font-weight:bold}.pdoc-code .no{color:#880000}.pdoc-code .nd{color:#AA22FF}.pdoc-code .ni{color:#717171; font-weight:bold}.pdoc-code .ne{color:#CB3F38; font-weight:bold}.pdoc-code .nf{color:#0000FF}.pdoc-code .nl{color:#767600}.pdoc-code .nn{color:#0000FF; font-weight:bold}.pdoc-code .nt{color:#008000; font-weight:bold}.pdoc-code .nv{color:#19177C}.pdoc-code .ow{color:#AA22FF; font-weight:bold}.pdoc-code .w{color:#bbbbbb}.pdoc-code .mb{color:#666666}.pdoc-code .mf{color:#666666}.pdoc-code .mh{color:#666666}.pdoc-code .mi{color:#666666}.pdoc-code .mo{color:#666666}.pdoc-code .sa{color:#BA2121}.pdoc-code .sb{color:#BA2121}.pdoc-code .sc{color:#BA2121}.pdoc-code .dl{color:#BA2121}.pdoc-code .sd{color:#BA2121; font-style:italic}.pdoc-code .s2{color:#BA2121}.pdoc-code .se{color:#AA5D1F; font-weight:bold}.pdoc-code .sh{color:#BA2121}.pdoc-code .si{color:#A45A77; font-weight:bold}.pdoc-code .sx{color:#008000}.pdoc-code .sr{color:#A45A77}.pdoc-code .s1{color:#BA2121}.pdoc-code .ss{color:#19177C}.pdoc-code .bp{color:#008000}.pdoc-code .fm{color:#0000FF}.pdoc-code .vc{color:#19177C}.pdoc-code .vg{color:#19177C}.pdoc-code .vi{color:#19177C}.pdoc-code .vm{color:#19177C}.pdoc-code .il{color:#666666}</style>
+    <style>/*! theme.css */:root{--pdoc-background:#fff;}.pdoc{--text:#212529;--muted:#6c757d;--link:#3660a5;--link-hover:#1659c5;--code:#f8f8f8;--active:#fff598;--accent:#eee;--accent2:#c1c1c1;--nav-hover:rgba(255, 255, 255, 0.5);--name:#0066BB;--def:#008800;--annotation:#007020;}</style>
+    <style>/*! layout.css */html, body{width:100%;height:100%;}html, main{scroll-behavior:smooth;}body{background-color:var(--pdoc-background);}@media (max-width:769px){#navtoggle{cursor:pointer;position:absolute;width:50px;height:40px;top:1rem;right:1rem;border-color:var(--text);color:var(--text);display:flex;opacity:0.8;z-index:999;}#navtoggle:hover{opacity:1;}#togglestate + div{display:none;}#togglestate:checked + div{display:inherit;}main, header{padding:2rem 3vw;}header + main{margin-top:-3rem;}.git-button{display:none !important;}nav input[type="search"]{max-width:77%;}nav input[type="search"]:first-child{margin-top:-6px;}nav input[type="search"]:valid ~ *{display:none !important;}}@media (min-width:770px){:root{--sidebar-width:clamp(12.5rem, 28vw, 22rem);}nav{position:fixed;overflow:auto;height:100vh;width:var(--sidebar-width);}main, header{padding:3rem 2rem 3rem calc(var(--sidebar-width) + 3rem);width:calc(54rem + var(--sidebar-width));max-width:100%;}header + main{margin-top:-4rem;}#navtoggle{display:none;}}#togglestate{position:absolute;height:0;opacity:0;}nav.pdoc{--pad:clamp(0.5rem, 2vw, 1.75rem);--indent:1.5rem;background-color:var(--accent);border-right:1px solid var(--accent2);box-shadow:0 0 20px rgba(50, 50, 50, .2) inset;padding:0 0 0 var(--pad);overflow-wrap:anywhere;scrollbar-width:thin; scrollbar-color:var(--accent2) transparent; z-index:1}nav.pdoc::-webkit-scrollbar{width:.4rem; }nav.pdoc::-webkit-scrollbar-thumb{background-color:var(--accent2); }nav.pdoc > div{padding:var(--pad) 0;}nav.pdoc .module-list-button{display:inline-flex;align-items:center;color:var(--text);border-color:var(--muted);margin-bottom:1rem;}nav.pdoc .module-list-button:hover{border-color:var(--text);}nav.pdoc input[type=search]{display:block;outline-offset:0;width:calc(100% - var(--pad));}nav.pdoc .logo{max-width:calc(100% - var(--pad));max-height:35vh;display:block;margin:0 auto 1rem;transform:translate(calc(-.5 * var(--pad)), 0);}nav.pdoc ul{list-style:none;padding-left:0;}nav.pdoc > div > ul{margin-left:calc(0px - var(--pad));}nav.pdoc li a{padding:.2rem 0 .2rem calc(var(--pad) + var(--indent));}nav.pdoc > div > ul > li > a{padding-left:var(--pad);}nav.pdoc li{transition:all 100ms;}nav.pdoc li:hover{background-color:var(--nav-hover);}nav.pdoc a, nav.pdoc a:hover{color:var(--text);}nav.pdoc a{display:block;}nav.pdoc > h2:first-of-type{margin-top:1.5rem;}nav.pdoc .class:before{content:"class ";color:var(--muted);}nav.pdoc .function:after{content:"()";color:var(--muted);}nav.pdoc footer:before{content:"";display:block;width:calc(100% - var(--pad));border-top:solid var(--accent2) 1px;margin-top:1.5rem;padding-top:.5rem;}nav.pdoc footer{font-size:small;}</style>
+    <style>/*! content.css */.pdoc{color:var(--text);box-sizing:border-box;line-height:1.5;background:none;}.pdoc .pdoc-button{cursor:pointer;display:inline-block;border:solid black 1px;border-radius:2px;font-size:.75rem;padding:calc(0.5em - 1px) 1em;transition:100ms all;}.pdoc .pdoc-alert{padding:1rem 1rem 1rem calc(1.5rem + 24px);border:1px solid transparent;border-radius:.25rem;background-repeat:no-repeat;background-position:1rem center;margin-bottom:1rem;}.pdoc .pdoc-alert > *:last-child{margin-bottom:0;}.pdoc .pdoc-alert-note {color:#084298;background-color:#cfe2ff;border-color:#b6d4fe;background-image:url("data:image/svg+xml,%3Csvg%20xmlns%3D%22http%3A//www.w3.org/2000/svg%22%20width%3D%2224%22%20height%3D%2224%22%20fill%3D%22%23084298%22%20viewBox%3D%220%200%2016%2016%22%3E%3Cpath%20d%3D%22M8%2016A8%208%200%201%200%208%200a8%208%200%200%200%200%2016zm.93-9.412-1%204.705c-.07.34.029.533.304.533.194%200%20.487-.07.686-.246l-.088.416c-.287.346-.92.598-1.465.598-.703%200-1.002-.422-.808-1.319l.738-3.468c.064-.293.006-.399-.287-.47l-.451-.081.082-.381%202.29-.287zM8%205.5a1%201%200%201%201%200-2%201%201%200%200%201%200%202z%22/%3E%3C/svg%3E");}.pdoc .pdoc-alert-warning{color:#664d03;background-color:#fff3cd;border-color:#ffecb5;background-image:url("data:image/svg+xml,%3Csvg%20xmlns%3D%22http%3A//www.w3.org/2000/svg%22%20width%3D%2224%22%20height%3D%2224%22%20fill%3D%22%23664d03%22%20viewBox%3D%220%200%2016%2016%22%3E%3Cpath%20d%3D%22M8.982%201.566a1.13%201.13%200%200%200-1.96%200L.165%2013.233c-.457.778.091%201.767.98%201.767h13.713c.889%200%201.438-.99.98-1.767L8.982%201.566zM8%205c.535%200%20.954.462.9.995l-.35%203.507a.552.552%200%200%201-1.1%200L7.1%205.995A.905.905%200%200%201%208%205zm.002%206a1%201%200%201%201%200%202%201%201%200%200%201%200-2z%22/%3E%3C/svg%3E");}.pdoc .pdoc-alert-danger{color:#842029;background-color:#f8d7da;border-color:#f5c2c7;background-image:url("data:image/svg+xml,%3Csvg%20xmlns%3D%22http%3A//www.w3.org/2000/svg%22%20width%3D%2224%22%20height%3D%2224%22%20fill%3D%22%23842029%22%20viewBox%3D%220%200%2016%2016%22%3E%3Cpath%20d%3D%22M5.52.359A.5.5%200%200%201%206%200h4a.5.5%200%200%201%20.474.658L8.694%206H12.5a.5.5%200%200%201%20.395.807l-7%209a.5.5%200%200%201-.873-.454L6.823%209.5H3.5a.5.5%200%200%201-.48-.641l2.5-8.5z%22/%3E%3C/svg%3E");}.pdoc .visually-hidden{position:absolute !important;width:1px !important;height:1px !important;padding:0 !important;margin:-1px !important;overflow:hidden !important;clip:rect(0, 0, 0, 0) !important;white-space:nowrap !important;border:0 !important;}.pdoc h1, .pdoc h2, .pdoc h3{font-weight:300;margin:.3em 0;padding:.2em 0;}.pdoc > section:not(.module-info) h1{font-size:1.5rem;font-weight:500;}.pdoc > section:not(.module-info) h2{font-size:1.4rem;font-weight:500;}.pdoc > section:not(.module-info) h3{font-size:1.3rem;font-weight:500;}.pdoc > section:not(.module-info) h4{font-size:1.2rem;}.pdoc > section:not(.module-info) h5{font-size:1.1rem;}.pdoc a{text-decoration:none;color:var(--link);}.pdoc a:hover{color:var(--link-hover);}.pdoc blockquote{margin-left:2rem;}.pdoc pre{border-top:1px solid var(--accent2);border-bottom:1px solid var(--accent2);margin-top:0;margin-bottom:1em;padding:.5rem 0 .5rem .5rem;overflow-x:auto;background-color:var(--code);}.pdoc code{color:var(--text);padding:.2em .4em;margin:0;font-size:85%;background-color:var(--accent);border-radius:6px;}.pdoc a > code{color:inherit;}.pdoc pre > code{display:inline-block;font-size:inherit;background:none;border:none;padding:0;}.pdoc > section:not(.module-info){margin-bottom:1.5rem;}.pdoc .modulename{margin-top:0;font-weight:bold;}.pdoc .modulename a{color:var(--link);transition:100ms all;}.pdoc .git-button{float:right;border:solid var(--link) 1px;}.pdoc .git-button:hover{background-color:var(--link);color:var(--pdoc-background);}.view-source-toggle-state,.view-source-toggle-state ~ .pdoc-code{display:none;}.view-source-toggle-state:checked ~ .pdoc-code{display:block;}.view-source-button{display:inline-block;float:right;font-size:.75rem;line-height:1.5rem;color:var(--muted);padding:0 .4rem 0 1.3rem;cursor:pointer;text-indent:-2px;}.view-source-button > span{visibility:hidden;}.module-info .view-source-button{float:none;display:flex;justify-content:flex-end;margin:-1.2rem .4rem -.2rem 0;}.view-source-button::before{position:absolute;content:"View Source";display:list-item;list-style-type:disclosure-closed;}.view-source-toggle-state:checked ~ .attr .view-source-button::before,.view-source-toggle-state:checked ~ .view-source-button::before{list-style-type:disclosure-open;}.pdoc .docstring{margin-bottom:1.5rem;}.pdoc section:not(.module-info) .docstring{margin-left:clamp(0rem, 5vw - 2rem, 1rem);}.pdoc .docstring .pdoc-code{margin-left:1em;margin-right:1em;}.pdoc h1:target,.pdoc h2:target,.pdoc h3:target,.pdoc h4:target,.pdoc h5:target,.pdoc h6:target,.pdoc .pdoc-code > pre > span:target{background-color:var(--active);box-shadow:-1rem 0 0 0 var(--active);}.pdoc .pdoc-code > pre > span:target{display:block;}.pdoc div:target > .attr,.pdoc section:target > .attr,.pdoc dd:target > a{background-color:var(--active);}.pdoc *{scroll-margin:2rem;}.pdoc .pdoc-code .linenos{user-select:none;}.pdoc .attr:hover{filter:contrast(0.95);}.pdoc section, .pdoc .classattr{position:relative;}.pdoc .headerlink{--width:clamp(1rem, 3vw, 2rem);position:absolute;top:0;left:calc(0rem - var(--width));transition:all 100ms ease-in-out;opacity:0;}.pdoc .headerlink::before{content:"#";display:block;text-align:center;width:var(--width);height:2.3rem;line-height:2.3rem;font-size:1.5rem;}.pdoc .attr:hover ~ .headerlink,.pdoc *:target > .headerlink,.pdoc .headerlink:hover{opacity:1;}.pdoc .attr{display:block;margin:.5rem 0 .5rem;padding:.4rem .4rem .4rem 1rem;background-color:var(--accent);overflow-x:auto;}.pdoc .classattr{margin-left:2rem;}.pdoc .name{color:var(--name);font-weight:bold;}.pdoc .def{color:var(--def);font-weight:bold;}.pdoc .signature{background-color:transparent;}.pdoc .param, .pdoc .return-annotation{white-space:pre;}.pdoc .signature.multiline .param{display:block;}.pdoc .signature.condensed .param{display:inline-block;}.pdoc .annotation{color:var(--annotation);}.pdoc .view-value-toggle-state,.pdoc .view-value-toggle-state ~ .default_value{display:none;}.pdoc .view-value-toggle-state:checked ~ .default_value{display:inherit;}.pdoc .view-value-button{font-size:.5rem;vertical-align:middle;border-style:dashed;margin-top:-0.1rem;}.pdoc .view-value-button:hover{background:white;}.pdoc .view-value-button::before{content:"show";text-align:center;width:2.2em;display:inline-block;}.pdoc .view-value-toggle-state:checked ~ .view-value-button::before{content:"hide";}.pdoc .inherited{margin-left:2rem;}.pdoc .inherited dt{font-weight:700;}.pdoc .inherited dt, .pdoc .inherited dd{display:inline;margin-left:0;margin-bottom:.5rem;}.pdoc .inherited dd:not(:last-child):after{content:", ";}.pdoc .inherited .class:before{content:"class ";}.pdoc .inherited .function a:after{content:"()";}.pdoc .search-result .docstring{overflow:auto;max-height:25vh;}.pdoc .search-result.focused > .attr{background-color:var(--active);}.pdoc .attribution{margin-top:2rem;display:block;opacity:0.5;transition:all 200ms;filter:grayscale(100%);}.pdoc .attribution:hover{opacity:1;filter:grayscale(0%);}.pdoc .attribution img{margin-left:5px;height:35px;vertical-align:middle;width:70px;transition:all 200ms;}.pdoc table{display:block;width:max-content;max-width:100%;overflow:auto;margin-bottom:1rem;}.pdoc table th{font-weight:600;}.pdoc table th, .pdoc table td{padding:6px 13px;border:1px solid var(--accent2);}</style>
+    <style>/*! custom.css */</style>
+    <style>header.pdoc{display:flex;align-items:center;flex-wrap:wrap;}header.pdoc img{max-width:200px;max-height:75px;padding-right:2rem;}header.pdoc input[type=search]{outline-offset:0;font-size:1.5rem;min-width:60%;flex-grow:1;padding-left:.5rem;margin:1.75rem 0;}</style><script>
+    window.MathJax = {
+        tex: {
+            inlineMath: [['$', '$'], ['\\(', '\\)']]
+        }
+    };
+</script>
+<script src="https://polyfill.io/v3/polyfill.min.js?features=es6"></script>
+<script id="MathJax-script" async src="https://cdn.jsdelivr.net/npm/mathjax@3/es5/tex-mml-chtml.js"></script>
+<script>
+    /* Re-invoke MathJax when DOM content changes, for example during search. */
+    document.addEventListener("DOMContentLoaded", () => {
+        new MutationObserver(() => MathJax.typeset()).observe(
+            document.querySelector("main.pdoc").parentNode,
+            {childList: true}
+        );
+    })
+</script>
+<style>
+    mjx-container {
+        overflow-x: auto;
+    }
+</style></head>
+<body>
+    <nav class="pdoc">
+        <label id="navtoggle" for="togglestate" class="pdoc-button"><svg xmlns='http://www.w3.org/2000/svg' viewBox='0 0 30 30'><path stroke-linecap='round' stroke="currentColor" stroke-miterlimit='10' stroke-width='2' d='M4 7h22M4 15h22M4 23h22'/></svg></label>
+        <input id="togglestate" type="checkbox" aria-hidden="true" tabindex="-1">
+        <div>    <h2>Available Modules</h2>
+    <ul>
+            <li><a href="shimmer/types.html">shimmer.types</a></li>
+            <li><a href="shimmer/modules/global_workspace.html">shimmer.modules.global_workspace</a></li>
+            <li><a href="shimmer/modules/domain.html">shimmer.modules.domain</a></li>
+            <li><a href="shimmer/modules/gw_module.html">shimmer.modules.gw_module</a></li>
+            <li><a href="shimmer/modules/selection.html">shimmer.modules.selection</a></li>
+            <li><a href="shimmer/modules/losses.html">shimmer.modules.losses</a></li>
+            <li><a href="shimmer/modules/contrastive_loss.html">shimmer.modules.contrastive_loss</a></li>
+            <li><a href="shimmer/dataset.html">shimmer.dataset</a></li>
+            <li><a href="shimmer/modules/vae.html">shimmer.modules.vae</a></li>
+            <li><a href="shimmer/modules/utils.html">shimmer.modules.utils</a></li>
+            <li><a href="shimmer/utils.html">shimmer.utils</a></li>
+            <li><a href="shimmer/cli/ckpt_migration.html">shimmer.cli.ckpt_migration</a></li>
+    </ul>
+</div>
+    </nav>
+    <header class="pdoc">
+                <a href="https://pdoc.dev">
+                    <img src="data:image/svg+xml,%3Csvg%20xmlns%3D%22http%3A//www.w3.org/2000/svg%22%20role%3D%22img%22%20aria-label%3D%22pdoc%20logo%22%20width%3D%22300%22%20height%3D%22150%22%20viewBox%3D%22-1%200%2060%2030%22%3E%3Ctitle%3Epdoc%3C/title%3E%3Cpath%20d%3D%22M29.621%2021.293c-.011-.273-.214-.475-.511-.481a.5.5%200%200%200-.489.503l-.044%201.393c-.097.551-.695%201.215-1.566%201.704-.577.428-1.306.486-2.193.182-1.426-.617-2.467-1.654-3.304-2.487l-.173-.172a3.43%203.43%200%200%200-.365-.306.49.49%200%200%200-.286-.196c-1.718-1.06-4.931-1.47-7.353.191l-.219.15c-1.707%201.187-3.413%202.131-4.328%201.03-.02-.027-.49-.685-.141-1.763.233-.721.546-2.408.772-4.076.042-.09.067-.187.046-.288.166-1.347.277-2.625.241-3.351%201.378-1.008%202.271-2.586%202.271-4.362%200-.976-.272-1.935-.788-2.774-.057-.094-.122-.18-.184-.268.033-.167.052-.339.052-.516%200-1.477-1.202-2.679-2.679-2.679-.791%200-1.496.352-1.987.9a6.3%206.3%200%200%200-1.001.029c-.492-.564-1.207-.929-2.012-.929-1.477%200-2.679%201.202-2.679%202.679A2.65%202.65%200%200%200%20.97%206.554c-.383.747-.595%201.572-.595%202.41%200%202.311%201.507%204.29%203.635%205.107-.037.699-.147%202.27-.423%203.294l-.137.461c-.622%202.042-2.515%208.257%201.727%2010.643%201.614.908%203.06%201.248%204.317%201.248%202.665%200%204.492-1.524%205.322-2.401%201.476-1.559%202.886-1.854%206.491.82%201.877%201.393%203.514%201.753%204.861%201.068%202.223-1.713%202.811-3.867%203.399-6.374.077-.846.056-1.469.054-1.537zm-4.835%204.313c-.054.305-.156.586-.242.629-.034-.007-.131-.022-.307-.157-.145-.111-.314-.478-.456-.908.221.121.432.25.675.355.115.039.219.051.33.081zm-2.251-1.238c-.05.33-.158.648-.252.694-.022.001-.125-.018-.307-.157-.217-.166-.488-.906-.639-1.573.358.344.754.693%201.198%201.036zm-3.887-2.337c-.006-.116-.018-.231-.041-.342.635.145%201.189.368%201.599.625.097.231.166.481.174.642-.03.049-.055.101-.067.158-.046.013-.128.026-.298.004-.278-.037-.901-.57-1.367-1.087zm-1.127-.497c.116.306.176.625.12.71-.019.014-.117.045-.345.016-.206-.027-.604-.332-.986-.695.41-.051.816-.056%201.211-.031zm-4.535%201.535c.209.22.379.47.358.598-.006.041-.088.138-.351.234-.144.055-.539-.063-.979-.259a11.66%2011.66%200%200%200%20.972-.573zm.983-.664c.359-.237.738-.418%201.126-.554.25.237.479.548.457.694-.006.042-.087.138-.351.235-.174.064-.694-.105-1.232-.375zm-3.381%201.794c-.022.145-.061.29-.149.401-.133.166-.358.248-.69.251h-.002c-.133%200-.306-.26-.45-.621.417.091.854.07%201.291-.031zm-2.066-8.077a4.78%204.78%200%200%201-.775-.584c.172-.115.505-.254.88-.378l-.105.962zm-.331%202.302a10.32%2010.32%200%200%201-.828-.502c.202-.143.576-.328.984-.49l-.156.992zm-.45%202.157l-.701-.403c.214-.115.536-.249.891-.376a11.57%2011.57%200%200%201-.19.779zm-.181%201.716c.064.398.194.702.298.893-.194-.051-.435-.162-.736-.398.061-.119.224-.3.438-.495zM8.87%204.141c0%20.152-.123.276-.276.276s-.275-.124-.275-.276.123-.276.276-.276.275.124.275.276zm-.735-.389a1.15%201.15%200%200%200-.314.783%201.16%201.16%200%200%200%201.162%201.162c.457%200%20.842-.27%201.032-.653.026.117.042.238.042.362a1.68%201.68%200%200%201-1.679%201.679%201.68%201.68%200%200%201-1.679-1.679c0-.843.626-1.535%201.436-1.654zM5.059%205.406A1.68%201.68%200%200%201%203.38%207.085a1.68%201.68%200%200%201-1.679-1.679c0-.037.009-.072.011-.109.21.3.541.508.935.508a1.16%201.16%200%200%200%201.162-1.162%201.14%201.14%200%200%200-.474-.912c.015%200%20.03-.005.045-.005.926.001%201.679.754%201.679%201.68zM3.198%204.141c0%20.152-.123.276-.276.276s-.275-.124-.275-.276.123-.276.276-.276.275.124.275.276zM1.375%208.964c0-.52.103-1.035.288-1.52.466.394%201.06.64%201.717.64%201.144%200%202.116-.725%202.499-1.738.383%201.012%201.355%201.738%202.499%201.738.867%200%201.631-.421%202.121-1.062.307.605.478%201.267.478%201.942%200%202.486-2.153%204.51-4.801%204.51s-4.801-2.023-4.801-4.51zm24.342%2019.349c-.985.498-2.267.168-3.813-.979-3.073-2.281-5.453-3.199-7.813-.705-1.315%201.391-4.163%203.365-8.423.97-3.174-1.786-2.239-6.266-1.261-9.479l.146-.492c.276-1.02.395-2.457.444-3.268a6.11%206.11%200%200%200%201.18.115%206.01%206.01%200%200%200%202.536-.562l-.006.175c-.802.215-1.848.612-2.021%201.25-.079.295.021.601.274.837.219.203.415.364.598.501-.667.304-1.243.698-1.311%201.179-.02.144-.022.507.393.787.213.144.395.26.564.365-1.285.521-1.361.96-1.381%201.126-.018.142-.011.496.427.746l.854.489c-.473.389-.971.914-.999%201.429-.018.278.095.532.316.713.675.556%201.231.721%201.653.721.059%200%20.104-.014.158-.02.207.707.641%201.64%201.513%201.64h.013c.8-.008%201.236-.345%201.462-.626.173-.216.268-.457.325-.692.424.195.93.374%201.372.374.151%200%20.294-.021.423-.068.732-.27.944-.704.993-1.021.009-.061.003-.119.002-.179.266.086.538.147.789.147.15%200%20.294-.021.423-.069.542-.2.797-.489.914-.754.237.147.478.258.704.288.106.014.205.021.296.021.356%200%20.595-.101.767-.229.438.435%201.094.992%201.656%201.067.106.014.205.021.296.021a1.56%201.56%200%200%200%20.323-.035c.17.575.453%201.289.866%201.605.358.273.665.362.914.362a.99.99%200%200%200%20.421-.093%201.03%201.03%200%200%200%20.245-.164c.168.428.39.846.68%201.068.358.273.665.362.913.362a.99.99%200%200%200%20.421-.093c.317-.148.512-.448.639-.762.251.157.495.257.726.257.127%200%20.25-.024.37-.071.427-.17.706-.617.841-1.314.022-.015.047-.022.068-.038.067-.051.133-.104.196-.159-.443%201.486-1.107%202.761-2.086%203.257zM8.66%209.925a.5.5%200%201%200-1%200c0%20.653-.818%201.205-1.787%201.205s-1.787-.552-1.787-1.205a.5.5%200%201%200-1%200c0%201.216%201.25%202.205%202.787%202.205s2.787-.989%202.787-2.205zm4.4%2015.965l-.208.097c-2.661%201.258-4.708%201.436-6.086.527-1.542-1.017-1.88-3.19-1.844-4.198a.4.4%200%200%200-.385-.414c-.242-.029-.406.164-.414.385-.046%201.249.367%203.686%202.202%204.896.708.467%201.547.7%202.51.7%201.248%200%202.706-.392%204.362-1.174l.185-.086a.4.4%200%200%200%20.205-.527c-.089-.204-.326-.291-.527-.206zM9.547%202.292c.093.077.205.114.317.114a.5.5%200%200%200%20.318-.886L8.817.397a.5.5%200%200%200-.703.068.5.5%200%200%200%20.069.703l1.364%201.124zm-7.661-.065c.086%200%20.173-.022.253-.068l1.523-.893a.5.5%200%200%200-.506-.863l-1.523.892a.5.5%200%200%200-.179.685c.094.158.261.247.432.247z%22%20transform%3D%22matrix%28-1%200%200%201%2058%200%29%22%20fill%3D%22%233bb300%22/%3E%3Cpath%20d%3D%22M.3%2021.86V10.18q0-.46.02-.68.04-.22.18-.5.28-.54%201.34-.54%201.06%200%201.42.28.38.26.44.78.76-1.04%202.38-1.04%201.64%200%203.1%201.54%201.46%201.54%201.46%203.58%200%202.04-1.46%203.58-1.44%201.54-3.08%201.54-1.64%200-2.38-.92v4.04q0%20.46-.04.68-.02.22-.18.5-.14.3-.5.42-.36.12-.98.12-.62%200-1-.12-.36-.12-.52-.4-.14-.28-.18-.5-.02-.22-.02-.68zm3.96-9.42q-.46.54-.46%201.18%200%20.64.46%201.18.48.52%201.2.52.74%200%201.24-.52.52-.52.52-1.18%200-.66-.48-1.18-.48-.54-1.26-.54-.76%200-1.22.54zm14.741-8.36q.16-.3.54-.42.38-.12%201-.12.64%200%201.02.12.38.12.52.42.16.3.18.54.04.22.04.68v11.94q0%20.46-.04.7-.02.22-.18.5-.3.54-1.7.54-1.38%200-1.54-.98-.84.96-2.34.96-1.8%200-3.28-1.56-1.48-1.58-1.48-3.66%200-2.1%201.48-3.68%201.5-1.58%203.28-1.58%201.48%200%202.3%201v-4.2q0-.46.02-.68.04-.24.18-.52zm-3.24%2010.86q.52.54%201.26.54.74%200%201.22-.54.5-.54.5-1.18%200-.66-.48-1.22-.46-.56-1.26-.56-.8%200-1.28.56-.48.54-.48%201.2%200%20.66.52%201.2zm7.833-1.2q0-2.4%201.68-3.96%201.68-1.56%203.84-1.56%202.16%200%203.82%201.56%201.66%201.54%201.66%203.94%200%201.66-.86%202.96-.86%201.28-2.1%201.9-1.22.6-2.54.6-1.32%200-2.56-.64-1.24-.66-2.1-1.92-.84-1.28-.84-2.88zm4.18%201.44q.64.48%201.3.48.66%200%201.32-.5.66-.5.66-1.48%200-.98-.62-1.46-.62-.48-1.34-.48-.72%200-1.34.5-.62.5-.62%201.48%200%20.96.64%201.46zm11.412-1.44q0%20.84.56%201.32.56.46%201.18.46.64%200%201.18-.36.56-.38.9-.38.6%200%201.46%201.06.46.58.46%201.04%200%20.76-1.1%201.42-1.14.8-2.8.8-1.86%200-3.58-1.34-.82-.64-1.34-1.7-.52-1.08-.52-2.36%200-1.3.52-2.34.52-1.06%201.34-1.7%201.66-1.32%203.54-1.32.76%200%201.48.22.72.2%201.06.4l.32.2q.36.24.56.38.52.4.52.92%200%20.5-.42%201.14-.72%201.1-1.38%201.1-.38%200-1.08-.44-.36-.34-1.04-.34-.66%200-1.24.48-.58.48-.58%201.34z%22%20fill%3D%22green%22/%3E%3C/svg%3E"
+                         alt="pdoc"/>
+                </a>
+            <input type="search" placeholder="Search API Documentation..." aria-label="search box">
+    </header>
+    <main class="pdoc"></main>
+<script>
+    function escapeHTML(html) {
+        return document.createElement('div').appendChild(document.createTextNode(html)).parentNode.innerHTML;
+    }
+
+    const originalContent = document.querySelector("main.pdoc");
+    let currentContent = originalContent;
+
+    function setContent(innerHTML) {
+        let elem;
+        if (innerHTML) {
+            elem = document.createElement("main");
+            elem.classList.add("pdoc");
+            elem.innerHTML = innerHTML;
+        } else {
+            elem = originalContent;
+        }
+        if (currentContent !== elem) {
+            currentContent.replaceWith(elem);
+            currentContent = elem;
+        }
+    }
+
+    function getSearchTerm() {
+        return (new URL(window.location)).searchParams.get("search");
+    }
+
+    const searchBox = document.querySelector(".pdoc input[type=search]");
+    searchBox.addEventListener("input", function () {
+        let url = new URL(window.location);
+        if (searchBox.value.trim()) {
+            url.hash = "";
+            url.searchParams.set("search", searchBox.value);
+        } else {
+            url.searchParams.delete("search");
+        }
+        history.replaceState("", "", url.toString());
+        onInput();
+    });
+    window.addEventListener("popstate", onInput);
+
+
+    let search, searchErr;
+
+    async function initialize() {
+        try {
+            search = await new Promise((resolve, reject) => {
+                const script = document.createElement("script");
+                script.type = "text/javascript";
+                script.async = true;
+                script.onload = () => resolve(window.pdocSearch);
+                script.onerror = (e) => reject(e);
+                script.src = "search.js";
+                document.getElementsByTagName("head")[0].appendChild(script);
+            });
+        } catch (e) {
+            console.error("Cannot fetch pdoc search index");
+            searchErr = "Cannot fetch search index.";
+        }
+        onInput();
+
+        document.querySelector("nav.pdoc").addEventListener("click", e => {
+            if (e.target.hash) {
+                searchBox.value = "";
+                searchBox.dispatchEvent(new Event("input"));
+            }
+        });
+    }
+
+    function onInput() {
+        setContent((() => {
+            const term = getSearchTerm();
+            if (!term) {
+                return null
+            }
+            if (searchErr) {
+                return `<h3>Error: ${searchErr}</h3>`
+            }
+            if (!search) {
+                return "<h3>Searching...</h3>"
+            }
+
+            window.scrollTo({top: 0, left: 0, behavior: 'auto'});
+
+            const results = search(term);
+
+            let html;
+            if (results.length === 0) {
+                html = `No search results for '${escapeHTML(term)}'.`
+            } else {
+                html = `<h4>${results.length} search result${results.length > 1 ? "s" : ""} for '${escapeHTML(term)}'.</h4>`;
+            }
+            for (let result of results.slice(0, 10)) {
+                let doc = result.doc;
+                let url = `${doc.modulename.replaceAll(".", "/")}.html`;
+                if (doc.qualname) {
+                    url += `#${doc.qualname}`;
+                }
+
+                let heading;
+                switch (result.doc.kind) {
+                    case "function":
+                        if (doc.fullname.endsWith(".__init__")) {
+                            heading = `<span class="name">${doc.fullname.replace(/\.__init__$/, "")}</span>${doc.signature}`;
+                        } else {
+                            heading = `<span class="def">${doc.funcdef}</span> <span class="name">${doc.fullname}</span>${doc.signature}`;
+                        }
+                        break;
+                    case "class":
+                        heading = `<span class="def">class</span> <span class="name">${doc.fullname}</span>`;
+                        if (doc.bases)
+                            heading += `<wbr>(<span class="base">${doc.bases}</span>)`;
+                        heading += `:`;
+                        break;
+                    case "variable":
+                        heading = `<span class="name">${doc.fullname}</span>`;
+                        if (doc.annotation)
+                            heading += `<span class="annotation">${doc.annotation}</span>`;
+                        if (doc.default_value)
+                            heading += `<span class="default_value"> = ${doc.default_value}</span>`;
+                        break;
+                    default:
+                        heading = `<span class="name">${doc.fullname}</span>`;
+                        break;
+                }
+                html += `
+                        <section class="search-result">
+                        <a href="${url}" class="attr ${doc.kind}">${heading}</a>
+                        <div class="docstring">${doc.doc}</div>
+                        </section>
+                    `;
+
+            }
+            return html;
+        })());
+    }
+
+    if (getSearchTerm()) {
+        initialize();
+        searchBox.value = getSearchTerm();
+        onInput();
+    } else {
+        searchBox.addEventListener("focus", initialize, {once: true});
+    }
+
+    searchBox.addEventListener("keydown", e => {
+        if (["ArrowDown", "ArrowUp", "Enter"].includes(e.key)) {
+            let focused = currentContent.querySelector(".search-result.focused");
+            if (!focused) {
+                currentContent.querySelector(".search-result").classList.add("focused");
+            } else if (
+                e.key === "ArrowDown"
+                && focused.nextElementSibling
+                && focused.nextElementSibling.classList.contains("search-result")
+            ) {
+                focused.classList.remove("focused");
+                focused.nextElementSibling.classList.add("focused");
+                focused.nextElementSibling.scrollIntoView({
+                    behavior: "smooth",
+                    block: "nearest",
+                    inline: "nearest"
+                });
+            } else if (
+                e.key === "ArrowUp"
+                && focused.previousElementSibling
+                && focused.previousElementSibling.classList.contains("search-result")
+            ) {
+                focused.classList.remove("focused");
+                focused.previousElementSibling.classList.add("focused");
+                focused.previousElementSibling.scrollIntoView({
+                    behavior: "smooth",
+                    block: "nearest",
+                    inline: "nearest"
+                });
+            } else if (
+                e.key === "Enter"
+            ) {
+                focused.querySelector("a").click();
+            }
+        }
+    });
+</script></body>
+</html>
\ No newline at end of file
diff --git a/docs/api/v0.5.1/search.js b/docs/api/v0.5.1/search.js
new file mode 100644
index 00000000..6b97e191
--- /dev/null
+++ b/docs/api/v0.5.1/search.js
@@ -0,0 +1,46 @@
+window.pdocSearch = (function(){
+/** elasticlunr - http://weixsong.github.io * Copyright (C) 2017 Oliver Nightingale * Copyright (C) 2017 Wei Song * MIT Licensed */!function(){function e(e){if(null===e||"object"!=typeof e)return e;var t=e.constructor();for(var n in e)e.hasOwnProperty(n)&&(t[n]=e[n]);return t}var t=function(e){var n=new t.Index;return n.pipeline.add(t.trimmer,t.stopWordFilter,t.stemmer),e&&e.call(n,n),n};t.version="0.9.5",lunr=t,t.utils={},t.utils.warn=function(e){return function(t){e.console&&console.warn&&console.warn(t)}}(this),t.utils.toString=function(e){return void 0===e||null===e?"":e.toString()},t.EventEmitter=function(){this.events={}},t.EventEmitter.prototype.addListener=function(){var e=Array.prototype.slice.call(arguments),t=e.pop(),n=e;if("function"!=typeof t)throw new TypeError("last argument must be a function");n.forEach(function(e){this.hasHandler(e)||(this.events[e]=[]),this.events[e].push(t)},this)},t.EventEmitter.prototype.removeListener=function(e,t){if(this.hasHandler(e)){var n=this.events[e].indexOf(t);-1!==n&&(this.events[e].splice(n,1),0==this.events[e].length&&delete this.events[e])}},t.EventEmitter.prototype.emit=function(e){if(this.hasHandler(e)){var t=Array.prototype.slice.call(arguments,1);this.events[e].forEach(function(e){e.apply(void 0,t)},this)}},t.EventEmitter.prototype.hasHandler=function(e){return e in this.events},t.tokenizer=function(e){if(!arguments.length||null===e||void 0===e)return[];if(Array.isArray(e)){var n=e.filter(function(e){return null===e||void 0===e?!1:!0});n=n.map(function(e){return t.utils.toString(e).toLowerCase()});var i=[];return n.forEach(function(e){var n=e.split(t.tokenizer.seperator);i=i.concat(n)},this),i}return e.toString().trim().toLowerCase().split(t.tokenizer.seperator)},t.tokenizer.defaultSeperator=/[\s\-]+/,t.tokenizer.seperator=t.tokenizer.defaultSeperator,t.tokenizer.setSeperator=function(e){null!==e&&void 0!==e&&"object"==typeof e&&(t.tokenizer.seperator=e)},t.tokenizer.resetSeperator=function(){t.tokenizer.seperator=t.tokenizer.defaultSeperator},t.tokenizer.getSeperator=function(){return t.tokenizer.seperator},t.Pipeline=function(){this._queue=[]},t.Pipeline.registeredFunctions={},t.Pipeline.registerFunction=function(e,n){n in t.Pipeline.registeredFunctions&&t.utils.warn("Overwriting existing registered function: "+n),e.label=n,t.Pipeline.registeredFunctions[n]=e},t.Pipeline.getRegisteredFunction=function(e){return e in t.Pipeline.registeredFunctions!=!0?null:t.Pipeline.registeredFunctions[e]},t.Pipeline.warnIfFunctionNotRegistered=function(e){var n=e.label&&e.label in this.registeredFunctions;n||t.utils.warn("Function is not registered with pipeline. This may cause problems when serialising the index.\n",e)},t.Pipeline.load=function(e){var n=new t.Pipeline;return e.forEach(function(e){var i=t.Pipeline.getRegisteredFunction(e);if(!i)throw new Error("Cannot load un-registered function: "+e);n.add(i)}),n},t.Pipeline.prototype.add=function(){var e=Array.prototype.slice.call(arguments);e.forEach(function(e){t.Pipeline.warnIfFunctionNotRegistered(e),this._queue.push(e)},this)},t.Pipeline.prototype.after=function(e,n){t.Pipeline.warnIfFunctionNotRegistered(n);var i=this._queue.indexOf(e);if(-1===i)throw new Error("Cannot find existingFn");this._queue.splice(i+1,0,n)},t.Pipeline.prototype.before=function(e,n){t.Pipeline.warnIfFunctionNotRegistered(n);var i=this._queue.indexOf(e);if(-1===i)throw new Error("Cannot find existingFn");this._queue.splice(i,0,n)},t.Pipeline.prototype.remove=function(e){var t=this._queue.indexOf(e);-1!==t&&this._queue.splice(t,1)},t.Pipeline.prototype.run=function(e){for(var t=[],n=e.length,i=this._queue.length,o=0;n>o;o++){for(var r=e[o],s=0;i>s&&(r=this._queue[s](r,o,e),void 0!==r&&null!==r);s++);void 0!==r&&null!==r&&t.push(r)}return t},t.Pipeline.prototype.reset=function(){this._queue=[]},t.Pipeline.prototype.get=function(){return this._queue},t.Pipeline.prototype.toJSON=function(){return this._queue.map(function(e){return t.Pipeline.warnIfFunctionNotRegistered(e),e.label})},t.Index=function(){this._fields=[],this._ref="id",this.pipeline=new t.Pipeline,this.documentStore=new t.DocumentStore,this.index={},this.eventEmitter=new t.EventEmitter,this._idfCache={},this.on("add","remove","update",function(){this._idfCache={}}.bind(this))},t.Index.prototype.on=function(){var e=Array.prototype.slice.call(arguments);return this.eventEmitter.addListener.apply(this.eventEmitter,e)},t.Index.prototype.off=function(e,t){return this.eventEmitter.removeListener(e,t)},t.Index.load=function(e){e.version!==t.version&&t.utils.warn("version mismatch: current "+t.version+" importing "+e.version);var n=new this;n._fields=e.fields,n._ref=e.ref,n.documentStore=t.DocumentStore.load(e.documentStore),n.pipeline=t.Pipeline.load(e.pipeline),n.index={};for(var i in e.index)n.index[i]=t.InvertedIndex.load(e.index[i]);return n},t.Index.prototype.addField=function(e){return this._fields.push(e),this.index[e]=new t.InvertedIndex,this},t.Index.prototype.setRef=function(e){return this._ref=e,this},t.Index.prototype.saveDocument=function(e){return this.documentStore=new t.DocumentStore(e),this},t.Index.prototype.addDoc=function(e,n){if(e){var n=void 0===n?!0:n,i=e[this._ref];this.documentStore.addDoc(i,e),this._fields.forEach(function(n){var o=this.pipeline.run(t.tokenizer(e[n]));this.documentStore.addFieldLength(i,n,o.length);var r={};o.forEach(function(e){e in r?r[e]+=1:r[e]=1},this);for(var s in r){var u=r[s];u=Math.sqrt(u),this.index[n].addToken(s,{ref:i,tf:u})}},this),n&&this.eventEmitter.emit("add",e,this)}},t.Index.prototype.removeDocByRef=function(e){if(e&&this.documentStore.isDocStored()!==!1&&this.documentStore.hasDoc(e)){var t=this.documentStore.getDoc(e);this.removeDoc(t,!1)}},t.Index.prototype.removeDoc=function(e,n){if(e){var n=void 0===n?!0:n,i=e[this._ref];this.documentStore.hasDoc(i)&&(this.documentStore.removeDoc(i),this._fields.forEach(function(n){var o=this.pipeline.run(t.tokenizer(e[n]));o.forEach(function(e){this.index[n].removeToken(e,i)},this)},this),n&&this.eventEmitter.emit("remove",e,this))}},t.Index.prototype.updateDoc=function(e,t){var t=void 0===t?!0:t;this.removeDocByRef(e[this._ref],!1),this.addDoc(e,!1),t&&this.eventEmitter.emit("update",e,this)},t.Index.prototype.idf=function(e,t){var n="@"+t+"/"+e;if(Object.prototype.hasOwnProperty.call(this._idfCache,n))return this._idfCache[n];var i=this.index[t].getDocFreq(e),o=1+Math.log(this.documentStore.length/(i+1));return this._idfCache[n]=o,o},t.Index.prototype.getFields=function(){return this._fields.slice()},t.Index.prototype.search=function(e,n){if(!e)return[];e="string"==typeof e?{any:e}:JSON.parse(JSON.stringify(e));var i=null;null!=n&&(i=JSON.stringify(n));for(var o=new t.Configuration(i,this.getFields()).get(),r={},s=Object.keys(e),u=0;u<s.length;u++){var a=s[u];r[a]=this.pipeline.run(t.tokenizer(e[a]))}var l={};for(var c in o){var d=r[c]||r.any;if(d){var f=this.fieldSearch(d,c,o),h=o[c].boost;for(var p in f)f[p]=f[p]*h;for(var p in f)p in l?l[p]+=f[p]:l[p]=f[p]}}var v,g=[];for(var p in l)v={ref:p,score:l[p]},this.documentStore.hasDoc(p)&&(v.doc=this.documentStore.getDoc(p)),g.push(v);return g.sort(function(e,t){return t.score-e.score}),g},t.Index.prototype.fieldSearch=function(e,t,n){var i=n[t].bool,o=n[t].expand,r=n[t].boost,s=null,u={};return 0!==r?(e.forEach(function(e){var n=[e];1==o&&(n=this.index[t].expandToken(e));var r={};n.forEach(function(n){var o=this.index[t].getDocs(n),a=this.idf(n,t);if(s&&"AND"==i){var l={};for(var c in s)c in o&&(l[c]=o[c]);o=l}n==e&&this.fieldSearchStats(u,n,o);for(var c in o){var d=this.index[t].getTermFrequency(n,c),f=this.documentStore.getFieldLength(c,t),h=1;0!=f&&(h=1/Math.sqrt(f));var p=1;n!=e&&(p=.15*(1-(n.length-e.length)/n.length));var v=d*a*h*p;c in r?r[c]+=v:r[c]=v}},this),s=this.mergeScores(s,r,i)},this),s=this.coordNorm(s,u,e.length)):void 0},t.Index.prototype.mergeScores=function(e,t,n){if(!e)return t;if("AND"==n){var i={};for(var o in t)o in e&&(i[o]=e[o]+t[o]);return i}for(var o in t)o in e?e[o]+=t[o]:e[o]=t[o];return e},t.Index.prototype.fieldSearchStats=function(e,t,n){for(var i in n)i in e?e[i].push(t):e[i]=[t]},t.Index.prototype.coordNorm=function(e,t,n){for(var i in e)if(i in t){var o=t[i].length;e[i]=e[i]*o/n}return e},t.Index.prototype.toJSON=function(){var e={};return this._fields.forEach(function(t){e[t]=this.index[t].toJSON()},this),{version:t.version,fields:this._fields,ref:this._ref,documentStore:this.documentStore.toJSON(),index:e,pipeline:this.pipeline.toJSON()}},t.Index.prototype.use=function(e){var t=Array.prototype.slice.call(arguments,1);t.unshift(this),e.apply(this,t)},t.DocumentStore=function(e){this._save=null===e||void 0===e?!0:e,this.docs={},this.docInfo={},this.length=0},t.DocumentStore.load=function(e){var t=new this;return t.length=e.length,t.docs=e.docs,t.docInfo=e.docInfo,t._save=e.save,t},t.DocumentStore.prototype.isDocStored=function(){return this._save},t.DocumentStore.prototype.addDoc=function(t,n){this.hasDoc(t)||this.length++,this.docs[t]=this._save===!0?e(n):null},t.DocumentStore.prototype.getDoc=function(e){return this.hasDoc(e)===!1?null:this.docs[e]},t.DocumentStore.prototype.hasDoc=function(e){return e in this.docs},t.DocumentStore.prototype.removeDoc=function(e){this.hasDoc(e)&&(delete this.docs[e],delete this.docInfo[e],this.length--)},t.DocumentStore.prototype.addFieldLength=function(e,t,n){null!==e&&void 0!==e&&0!=this.hasDoc(e)&&(this.docInfo[e]||(this.docInfo[e]={}),this.docInfo[e][t]=n)},t.DocumentStore.prototype.updateFieldLength=function(e,t,n){null!==e&&void 0!==e&&0!=this.hasDoc(e)&&this.addFieldLength(e,t,n)},t.DocumentStore.prototype.getFieldLength=function(e,t){return null===e||void 0===e?0:e in this.docs&&t in this.docInfo[e]?this.docInfo[e][t]:0},t.DocumentStore.prototype.toJSON=function(){return{docs:this.docs,docInfo:this.docInfo,length:this.length,save:this._save}},t.stemmer=function(){var e={ational:"ate",tional:"tion",enci:"ence",anci:"ance",izer:"ize",bli:"ble",alli:"al",entli:"ent",eli:"e",ousli:"ous",ization:"ize",ation:"ate",ator:"ate",alism:"al",iveness:"ive",fulness:"ful",ousness:"ous",aliti:"al",iviti:"ive",biliti:"ble",logi:"log"},t={icate:"ic",ative:"",alize:"al",iciti:"ic",ical:"ic",ful:"",ness:""},n="[^aeiou]",i="[aeiouy]",o=n+"[^aeiouy]*",r=i+"[aeiou]*",s="^("+o+")?"+r+o,u="^("+o+")?"+r+o+"("+r+")?$",a="^("+o+")?"+r+o+r+o,l="^("+o+")?"+i,c=new RegExp(s),d=new RegExp(a),f=new RegExp(u),h=new RegExp(l),p=/^(.+?)(ss|i)es$/,v=/^(.+?)([^s])s$/,g=/^(.+?)eed$/,m=/^(.+?)(ed|ing)$/,y=/.$/,S=/(at|bl|iz)$/,x=new RegExp("([^aeiouylsz])\\1$"),w=new RegExp("^"+o+i+"[^aeiouwxy]$"),I=/^(.+?[^aeiou])y$/,b=/^(.+?)(ational|tional|enci|anci|izer|bli|alli|entli|eli|ousli|ization|ation|ator|alism|iveness|fulness|ousness|aliti|iviti|biliti|logi)$/,E=/^(.+?)(icate|ative|alize|iciti|ical|ful|ness)$/,D=/^(.+?)(al|ance|ence|er|ic|able|ible|ant|ement|ment|ent|ou|ism|ate|iti|ous|ive|ize)$/,F=/^(.+?)(s|t)(ion)$/,_=/^(.+?)e$/,P=/ll$/,k=new RegExp("^"+o+i+"[^aeiouwxy]$"),z=function(n){var i,o,r,s,u,a,l;if(n.length<3)return n;if(r=n.substr(0,1),"y"==r&&(n=r.toUpperCase()+n.substr(1)),s=p,u=v,s.test(n)?n=n.replace(s,"$1$2"):u.test(n)&&(n=n.replace(u,"$1$2")),s=g,u=m,s.test(n)){var z=s.exec(n);s=c,s.test(z[1])&&(s=y,n=n.replace(s,""))}else if(u.test(n)){var z=u.exec(n);i=z[1],u=h,u.test(i)&&(n=i,u=S,a=x,l=w,u.test(n)?n+="e":a.test(n)?(s=y,n=n.replace(s,"")):l.test(n)&&(n+="e"))}if(s=I,s.test(n)){var z=s.exec(n);i=z[1],n=i+"i"}if(s=b,s.test(n)){var z=s.exec(n);i=z[1],o=z[2],s=c,s.test(i)&&(n=i+e[o])}if(s=E,s.test(n)){var z=s.exec(n);i=z[1],o=z[2],s=c,s.test(i)&&(n=i+t[o])}if(s=D,u=F,s.test(n)){var z=s.exec(n);i=z[1],s=d,s.test(i)&&(n=i)}else if(u.test(n)){var z=u.exec(n);i=z[1]+z[2],u=d,u.test(i)&&(n=i)}if(s=_,s.test(n)){var z=s.exec(n);i=z[1],s=d,u=f,a=k,(s.test(i)||u.test(i)&&!a.test(i))&&(n=i)}return s=P,u=d,s.test(n)&&u.test(n)&&(s=y,n=n.replace(s,"")),"y"==r&&(n=r.toLowerCase()+n.substr(1)),n};return z}(),t.Pipeline.registerFunction(t.stemmer,"stemmer"),t.stopWordFilter=function(e){return e&&t.stopWordFilter.stopWords[e]!==!0?e:void 0},t.clearStopWords=function(){t.stopWordFilter.stopWords={}},t.addStopWords=function(e){null!=e&&Array.isArray(e)!==!1&&e.forEach(function(e){t.stopWordFilter.stopWords[e]=!0},this)},t.resetStopWords=function(){t.stopWordFilter.stopWords=t.defaultStopWords},t.defaultStopWords={"":!0,a:!0,able:!0,about:!0,across:!0,after:!0,all:!0,almost:!0,also:!0,am:!0,among:!0,an:!0,and:!0,any:!0,are:!0,as:!0,at:!0,be:!0,because:!0,been:!0,but:!0,by:!0,can:!0,cannot:!0,could:!0,dear:!0,did:!0,"do":!0,does:!0,either:!0,"else":!0,ever:!0,every:!0,"for":!0,from:!0,get:!0,got:!0,had:!0,has:!0,have:!0,he:!0,her:!0,hers:!0,him:!0,his:!0,how:!0,however:!0,i:!0,"if":!0,"in":!0,into:!0,is:!0,it:!0,its:!0,just:!0,least:!0,let:!0,like:!0,likely:!0,may:!0,me:!0,might:!0,most:!0,must:!0,my:!0,neither:!0,no:!0,nor:!0,not:!0,of:!0,off:!0,often:!0,on:!0,only:!0,or:!0,other:!0,our:!0,own:!0,rather:!0,said:!0,say:!0,says:!0,she:!0,should:!0,since:!0,so:!0,some:!0,than:!0,that:!0,the:!0,their:!0,them:!0,then:!0,there:!0,these:!0,they:!0,"this":!0,tis:!0,to:!0,too:!0,twas:!0,us:!0,wants:!0,was:!0,we:!0,were:!0,what:!0,when:!0,where:!0,which:!0,"while":!0,who:!0,whom:!0,why:!0,will:!0,"with":!0,would:!0,yet:!0,you:!0,your:!0},t.stopWordFilter.stopWords=t.defaultStopWords,t.Pipeline.registerFunction(t.stopWordFilter,"stopWordFilter"),t.trimmer=function(e){if(null===e||void 0===e)throw new Error("token should not be undefined");return e.replace(/^\W+/,"").replace(/\W+$/,"")},t.Pipeline.registerFunction(t.trimmer,"trimmer"),t.InvertedIndex=function(){this.root={docs:{},df:0}},t.InvertedIndex.load=function(e){var t=new this;return t.root=e.root,t},t.InvertedIndex.prototype.addToken=function(e,t,n){for(var n=n||this.root,i=0;i<=e.length-1;){var o=e[i];o in n||(n[o]={docs:{},df:0}),i+=1,n=n[o]}var r=t.ref;n.docs[r]?n.docs[r]={tf:t.tf}:(n.docs[r]={tf:t.tf},n.df+=1)},t.InvertedIndex.prototype.hasToken=function(e){if(!e)return!1;for(var t=this.root,n=0;n<e.length;n++){if(!t[e[n]])return!1;t=t[e[n]]}return!0},t.InvertedIndex.prototype.getNode=function(e){if(!e)return null;for(var t=this.root,n=0;n<e.length;n++){if(!t[e[n]])return null;t=t[e[n]]}return t},t.InvertedIndex.prototype.getDocs=function(e){var t=this.getNode(e);return null==t?{}:t.docs},t.InvertedIndex.prototype.getTermFrequency=function(e,t){var n=this.getNode(e);return null==n?0:t in n.docs?n.docs[t].tf:0},t.InvertedIndex.prototype.getDocFreq=function(e){var t=this.getNode(e);return null==t?0:t.df},t.InvertedIndex.prototype.removeToken=function(e,t){if(e){var n=this.getNode(e);null!=n&&t in n.docs&&(delete n.docs[t],n.df-=1)}},t.InvertedIndex.prototype.expandToken=function(e,t,n){if(null==e||""==e)return[];var t=t||[];if(void 0==n&&(n=this.getNode(e),null==n))return t;n.df>0&&t.push(e);for(var i in n)"docs"!==i&&"df"!==i&&this.expandToken(e+i,t,n[i]);return t},t.InvertedIndex.prototype.toJSON=function(){return{root:this.root}},t.Configuration=function(e,n){var e=e||"";if(void 0==n||null==n)throw new Error("fields should not be null");this.config={};var i;try{i=JSON.parse(e),this.buildUserConfig(i,n)}catch(o){t.utils.warn("user configuration parse failed, will use default configuration"),this.buildDefaultConfig(n)}},t.Configuration.prototype.buildDefaultConfig=function(e){this.reset(),e.forEach(function(e){this.config[e]={boost:1,bool:"OR",expand:!1}},this)},t.Configuration.prototype.buildUserConfig=function(e,n){var i="OR",o=!1;if(this.reset(),"bool"in e&&(i=e.bool||i),"expand"in e&&(o=e.expand||o),"fields"in e)for(var r in e.fields)if(n.indexOf(r)>-1){var s=e.fields[r],u=o;void 0!=s.expand&&(u=s.expand),this.config[r]={boost:s.boost||0===s.boost?s.boost:1,bool:s.bool||i,expand:u}}else t.utils.warn("field name in user configuration not found in index instance fields");else this.addAllFields2UserConfig(i,o,n)},t.Configuration.prototype.addAllFields2UserConfig=function(e,t,n){n.forEach(function(n){this.config[n]={boost:1,bool:e,expand:t}},this)},t.Configuration.prototype.get=function(){return this.config},t.Configuration.prototype.reset=function(){this.config={}},lunr.SortedSet=function(){this.length=0,this.elements=[]},lunr.SortedSet.load=function(e){var t=new this;return t.elements=e,t.length=e.length,t},lunr.SortedSet.prototype.add=function(){var e,t;for(e=0;e<arguments.length;e++)t=arguments[e],~this.indexOf(t)||this.elements.splice(this.locationFor(t),0,t);this.length=this.elements.length},lunr.SortedSet.prototype.toArray=function(){return this.elements.slice()},lunr.SortedSet.prototype.map=function(e,t){return this.elements.map(e,t)},lunr.SortedSet.prototype.forEach=function(e,t){return this.elements.forEach(e,t)},lunr.SortedSet.prototype.indexOf=function(e){for(var t=0,n=this.elements.length,i=n-t,o=t+Math.floor(i/2),r=this.elements[o];i>1;){if(r===e)return o;e>r&&(t=o),r>e&&(n=o),i=n-t,o=t+Math.floor(i/2),r=this.elements[o]}return r===e?o:-1},lunr.SortedSet.prototype.locationFor=function(e){for(var t=0,n=this.elements.length,i=n-t,o=t+Math.floor(i/2),r=this.elements[o];i>1;)e>r&&(t=o),r>e&&(n=o),i=n-t,o=t+Math.floor(i/2),r=this.elements[o];return r>e?o:e>r?o+1:void 0},lunr.SortedSet.prototype.intersect=function(e){for(var t=new lunr.SortedSet,n=0,i=0,o=this.length,r=e.length,s=this.elements,u=e.elements;;){if(n>o-1||i>r-1)break;s[n]!==u[i]?s[n]<u[i]?n++:s[n]>u[i]&&i++:(t.add(s[n]),n++,i++)}return t},lunr.SortedSet.prototype.clone=function(){var e=new lunr.SortedSet;return e.elements=this.toArray(),e.length=e.elements.length,e},lunr.SortedSet.prototype.union=function(e){var t,n,i;this.length>=e.length?(t=this,n=e):(t=e,n=this),i=t.clone();for(var o=0,r=n.toArray();o<r.length;o++)i.add(r[o]);return i},lunr.SortedSet.prototype.toJSON=function(){return this.toArray()},function(e,t){"function"==typeof define&&define.amd?define(t):"object"==typeof exports?module.exports=t():e.elasticlunr=t()}(this,function(){return t})}();
+    /** pdoc search index */const docs = {"version": "0.9.5", "fields": ["qualname", "fullname", "annotation", "default_value", "signature", "bases", "doc"], "ref": "fullname", "documentStore": {"docs": {"shimmer.types": {"fullname": "shimmer.types", "modulename": "shimmer.types", "kind": "module", "doc": "<p></p>\n"}, "shimmer.types.RawDomainGroupT": {"fullname": "shimmer.types.RawDomainGroupT", "modulename": "shimmer.types", "qualname": "RawDomainGroupT", "kind": "variable", "doc": "<p>Matched raw unimodal data from multiple domains.\nKeys of the mapping are domains names and values are the domain data.</p>\n\n<p>All values in the mapping should be matched and represent the same information.</p>\n\n<h6 id=\"example\">Example:</h6>\n\n<blockquote>\n  <div class=\"pdoc-code codehilite\">\n<pre><span></span><code><span class=\"k\">def</span> <span class=\"nf\">fun</span><span class=\"p\">(</span><span class=\"n\">domain_group</span><span class=\"p\">:</span> <span class=\"n\">RawDomainGroupT</span><span class=\"p\">):</span> <span class=\"o\">...</span>\n\n\n<span class=\"n\">x</span> <span class=\"o\">=</span> <span class=\"p\">{</span>\n    <span class=\"s2\">&quot;vision&quot;</span><span class=\"p\">:</span> <span class=\"n\">PIL</span><span class=\"o\">.</span><span class=\"n\">Image</span><span class=\"o\">.</span><span class=\"n\">Image</span><span class=\"p\">(</span><span class=\"s2\">&quot;path/to/dog/picture.png&quot;</span><span class=\"p\">),</span>\n    <span class=\"s2\">&quot;language&quot;</span><span class=\"p\">:</span> <span class=\"s2\">&quot;This is a picture of a dog.&quot;</span><span class=\"p\">,</span>\n<span class=\"p\">}</span>\n\n<span class=\"n\">fun</span><span class=\"p\">(</span><span class=\"n\">x</span><span class=\"p\">)</span>\n</code></pre>\n  </div>\n</blockquote>\n\n<h6 id=\"note\">Note:</h6>\n\n<blockquote>\n  <p>This type uses <code>collections.abc.Mapping</code> and is used for functions' inputs.\n  Use <code>RawDomainGroupDT</code> for functions' outputs.</p>\n  \n  <p>This allows to be more generic and allow passing other mappings.</p>\n</blockquote>\n", "default_value": "collections.abc.Mapping[str, typing.Any]"}, "shimmer.types.RawDomainGroupDT": {"fullname": "shimmer.types.RawDomainGroupDT", "modulename": "shimmer.types", "qualname": "RawDomainGroupDT", "kind": "variable", "doc": "<p>Output type version of <code>RawDomainGroupT</code>.\nMatched raw unimodal data from multiple domains.\nKeys of the mapping are domains names and values are the domain data.</p>\n\n<h6 id=\"example\">Example:</h6>\n\n<blockquote>\n  <div class=\"pdoc-code codehilite\">\n<pre><span></span><code><span class=\"k\">def</span> <span class=\"nf\">fun</span><span class=\"p\">()</span> <span class=\"o\">-&gt;</span> <span class=\"n\">RawDomainGroupDT</span><span class=\"p\">:</span>\n    <span class=\"k\">return</span> <span class=\"p\">{</span>\n        <span class=\"s2\">&quot;vision&quot;</span><span class=\"p\">:</span> <span class=\"n\">PIL</span><span class=\"o\">.</span><span class=\"n\">Image</span><span class=\"o\">.</span><span class=\"n\">Image</span><span class=\"p\">(</span><span class=\"s2\">&quot;path/to/dog/picture.png&quot;</span><span class=\"p\">),</span>\n        <span class=\"s2\">&quot;language&quot;</span><span class=\"p\">:</span> <span class=\"s2\">&quot;This is a picture of a dog.&quot;</span><span class=\"p\">,</span>\n    <span class=\"p\">}</span>\n</code></pre>\n  </div>\n</blockquote>\n\n<h6 id=\"note\">Note:</h6>\n\n<blockquote>\n  <p>This type uses <code>dict</code>s and is used for functions' outputs.\n  Use <code>RawDomainGroupT</code> for functions' inputs.</p>\n</blockquote>\n", "default_value": "dict[str, typing.Any]"}, "shimmer.types.LatentsDomainGroupT": {"fullname": "shimmer.types.LatentsDomainGroupT", "modulename": "shimmer.types", "qualname": "LatentsDomainGroupT", "kind": "variable", "doc": "<p>Matched unimodal latent representations from multiple domains.\nKeys of the mapping are domains names and values are <code>torch.Tensor</code> latent\nrepresentation of the domain.</p>\n\n<h6 id=\"example\">Example:</h6>\n\n<blockquote>\n  <div class=\"pdoc-code codehilite\">\n<pre><span></span><code><span class=\"k\">def</span> <span class=\"nf\">fun</span><span class=\"p\">(</span><span class=\"n\">domain_group</span><span class=\"p\">:</span> <span class=\"n\">LatentsDomainGroupT</span><span class=\"p\">):</span> <span class=\"o\">...</span>\n\n\n<span class=\"n\">x</span> <span class=\"o\">=</span> <span class=\"p\">{</span>\n    <span class=\"s2\">&quot;vision&quot;</span><span class=\"p\">:</span> <span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">Tensor</span><span class=\"p\">([</span><span class=\"mf\">0.0</span><span class=\"p\">,</span> <span class=\"mf\">1.0</span><span class=\"p\">,</span> <span class=\"mf\">0.0</span><span class=\"p\">,</span> <span class=\"o\">...</span><span class=\"p\">]),</span>\n    <span class=\"s2\">&quot;language&quot;</span><span class=\"p\">:</span> <span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">Tensor</span><span class=\"p\">([</span><span class=\"mf\">0.0</span><span class=\"p\">,</span> <span class=\"mf\">0.3</span><span class=\"p\">,</span> <span class=\"mf\">0.2</span><span class=\"p\">,</span> <span class=\"o\">...</span><span class=\"p\">]),</span>\n<span class=\"p\">}</span>\n\n<span class=\"n\">fun</span><span class=\"p\">(</span><span class=\"n\">x</span><span class=\"p\">)</span>\n</code></pre>\n  </div>\n</blockquote>\n\n<h6 id=\"note\">Note:</h6>\n\n<blockquote>\n  <p>This type uses <code>collections.abc.Mapping</code> and is used for functions' inputs.\n  Use <code>LatentsDomainGroupDT</code> for functions' outputs.</p>\n  \n  <p>This allows to be more generic and allow passing other mappings.</p>\n</blockquote>\n", "default_value": "collections.abc.Mapping[str, torch.Tensor]"}, "shimmer.types.LatentsDomainGroupDT": {"fullname": "shimmer.types.LatentsDomainGroupDT", "modulename": "shimmer.types", "qualname": "LatentsDomainGroupDT", "kind": "variable", "doc": "<p>Matched unimodal latent representations from multiple domains.\nKeys of the dict are domains names and values are <code>torch.Tensor</code> latent\nrepresentation of the domain.</p>\n\n<h6 id=\"example\">Example:</h6>\n\n<blockquote>\n  <div class=\"pdoc-code codehilite\">\n<pre><span></span><code><span class=\"k\">def</span> <span class=\"nf\">fun</span><span class=\"p\">()</span> <span class=\"o\">-&gt;</span> <span class=\"n\">LatentsDomainGroupDT</span><span class=\"p\">:</span>\n    <span class=\"k\">return</span> <span class=\"p\">{</span>\n        <span class=\"s2\">&quot;vision&quot;</span><span class=\"p\">:</span> <span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">Tensor</span><span class=\"p\">([</span><span class=\"mf\">0.0</span><span class=\"p\">,</span> <span class=\"mf\">1.0</span><span class=\"p\">,</span> <span class=\"mf\">0.0</span><span class=\"p\">,</span> <span class=\"o\">...</span><span class=\"p\">]),</span>\n        <span class=\"s2\">&quot;language&quot;</span><span class=\"p\">:</span> <span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">Tensor</span><span class=\"p\">([</span><span class=\"mf\">0.0</span><span class=\"p\">,</span> <span class=\"mf\">0.3</span><span class=\"p\">,</span> <span class=\"mf\">0.2</span><span class=\"p\">,</span> <span class=\"o\">...</span><span class=\"p\">]),</span>\n    <span class=\"p\">}</span>\n</code></pre>\n  </div>\n</blockquote>\n\n<h6 id=\"note\">Note:</h6>\n\n<blockquote>\n  <p>This type uses <code>dict</code>s and is used for functions' outputs.\n  Use <code>LatentsDomainGroupT</code> for functions' inputs.</p>\n</blockquote>\n", "default_value": "dict[str, torch.Tensor]"}, "shimmer.types.RawDomainGroupsT": {"fullname": "shimmer.types.RawDomainGroupsT", "modulename": "shimmer.types", "qualname": "RawDomainGroupsT", "kind": "variable", "doc": "<p>Mapping of <code>RawDomainGroupT</code>. Keys are frozenset of domains matched in the group.\nEach group is independent and contains different data (unpaired).</p>\n\n<h6 id=\"example\">Example:</h6>\n\n<blockquote>\n  <div class=\"pdoc-code codehilite\">\n<pre><span></span><code><span class=\"k\">def</span> <span class=\"nf\">fun</span><span class=\"p\">()</span> <span class=\"o\">-&gt;</span> <span class=\"n\">RawDomainGroupsDT</span><span class=\"p\">:</span>\n    <span class=\"k\">return</span> <span class=\"p\">{</span>\n        <span class=\"nb\">frozenset</span><span class=\"p\">([</span><span class=\"s2\">&quot;vision&quot;</span><span class=\"p\">]):</span> <span class=\"p\">{</span>\n            <span class=\"s2\">&quot;vision&quot;</span><span class=\"p\">:</span> <span class=\"n\">PIL</span><span class=\"o\">.</span><span class=\"n\">Image</span><span class=\"o\">.</span><span class=\"n\">Image</span><span class=\"p\">(</span><span class=\"s2\">&quot;path/to/cat/picture.png&quot;</span><span class=\"p\">),</span>\n        <span class=\"p\">},</span>\n        <span class=\"nb\">frozenset</span><span class=\"p\">([</span><span class=\"s2\">&quot;language&quot;</span><span class=\"p\">]):</span> <span class=\"p\">{</span>\n            <span class=\"s2\">&quot;language&quot;</span><span class=\"p\">:</span> <span class=\"s2\">&quot;This is a picture of a rabbit.&quot;</span><span class=\"p\">,</span>\n        <span class=\"p\">},</span>\n        <span class=\"nb\">frozenset</span><span class=\"p\">([</span><span class=\"s2\">&quot;vision&quot;</span><span class=\"p\">,</span> <span class=\"s2\">&quot;language&quot;</span><span class=\"p\">]):</span> <span class=\"p\">{</span>\n            <span class=\"s2\">&quot;vision&quot;</span><span class=\"p\">:</span> <span class=\"n\">PIL</span><span class=\"o\">.</span><span class=\"n\">Image</span><span class=\"o\">.</span><span class=\"n\">Image</span><span class=\"p\">(</span><span class=\"s2\">&quot;path/to/dog/picture.png&quot;</span><span class=\"p\">),</span>\n            <span class=\"s2\">&quot;language&quot;</span><span class=\"p\">:</span> <span class=\"s2\">&quot;This is a picture of a dog.&quot;</span><span class=\"p\">,</span>\n        <span class=\"p\">},</span>\n    <span class=\"p\">}</span>\n</code></pre>\n  </div>\n</blockquote>\n\n<h6 id=\"note\">Note:</h6>\n\n<blockquote>\n  <p>This type uses <code>dict</code>s and is used for functions' outputs.\n  Use <code>RawDomainGroupsT</code> for functions' inputs.</p>\n</blockquote>\n", "default_value": "collections.abc.Mapping[frozenset[str], collections.abc.Mapping[str, typing.Any]]"}, "shimmer.types.RawDomainGroupsDT": {"fullname": "shimmer.types.RawDomainGroupsDT", "modulename": "shimmer.types", "qualname": "RawDomainGroupsDT", "kind": "variable", "doc": "<p>Mapping of <code>RawDomainGroupT</code>. Keys are frozenset of domains matched in the group.\nEach group is independent and contains different data (unpaired).</p>\n\n<h6 id=\"example\">Example:</h6>\n\n<blockquote>\n  <div class=\"pdoc-code codehilite\">\n<pre><span></span><code><span class=\"k\">def</span> <span class=\"nf\">fun</span><span class=\"p\">()</span> <span class=\"o\">-&gt;</span> <span class=\"n\">RawDomainGroupsDT</span><span class=\"p\">:</span>\n    <span class=\"k\">return</span> <span class=\"p\">{</span>\n        <span class=\"nb\">frozenset</span><span class=\"p\">([</span><span class=\"s2\">&quot;vision&quot;</span><span class=\"p\">]):</span> <span class=\"p\">{</span>\n            <span class=\"s2\">&quot;vision&quot;</span><span class=\"p\">:</span> <span class=\"n\">PIL</span><span class=\"o\">.</span><span class=\"n\">Image</span><span class=\"o\">.</span><span class=\"n\">Image</span><span class=\"p\">(</span><span class=\"s2\">&quot;path/to/cat/picture.png&quot;</span><span class=\"p\">),</span>\n        <span class=\"p\">},</span>\n        <span class=\"nb\">frozenset</span><span class=\"p\">([</span><span class=\"s2\">&quot;language&quot;</span><span class=\"p\">]):</span> <span class=\"p\">{</span>\n            <span class=\"s2\">&quot;language&quot;</span><span class=\"p\">:</span> <span class=\"s2\">&quot;This is a picture of a rabbit.&quot;</span><span class=\"p\">,</span>\n        <span class=\"p\">},</span>\n        <span class=\"nb\">frozenset</span><span class=\"p\">([</span><span class=\"s2\">&quot;vision&quot;</span><span class=\"p\">,</span> <span class=\"s2\">&quot;language&quot;</span><span class=\"p\">]):</span> <span class=\"p\">{</span>\n            <span class=\"s2\">&quot;vision&quot;</span><span class=\"p\">:</span> <span class=\"n\">PIL</span><span class=\"o\">.</span><span class=\"n\">Image</span><span class=\"o\">.</span><span class=\"n\">Image</span><span class=\"p\">(</span><span class=\"s2\">&quot;path/to/dog/picture.png&quot;</span><span class=\"p\">),</span>\n            <span class=\"s2\">&quot;language&quot;</span><span class=\"p\">:</span> <span class=\"s2\">&quot;This is a picture of a dog.&quot;</span><span class=\"p\">,</span>\n        <span class=\"p\">},</span>\n    <span class=\"p\">}</span>\n</code></pre>\n  </div>\n</blockquote>\n\n<h6 id=\"note\">Note:</h6>\n\n<blockquote>\n  <p>This type uses <code>dict</code>s and is used for functions' outputs.\n  Use <code>RawDomainGroupsT</code> for functions' inputs.</p>\n</blockquote>\n", "default_value": "dict[frozenset[str], dict[str, typing.Any]]"}, "shimmer.types.LatentsDomainGroupsT": {"fullname": "shimmer.types.LatentsDomainGroupsT", "modulename": "shimmer.types", "qualname": "LatentsDomainGroupsT", "kind": "variable", "doc": "<p>Mapping of <code>LatentsDomainGroupT</code>. Keys are frozenset of domains matched in the group.\nEach group is independent and contains different data (unpaired).</p>\n\n<h6 id=\"example\">Example:</h6>\n\n<blockquote>\n  <div class=\"pdoc-code codehilite\">\n<pre><span></span><code><span class=\"k\">def</span> <span class=\"nf\">fun</span><span class=\"p\">(</span><span class=\"n\">domain_group</span><span class=\"p\">:</span> <span class=\"n\">LatentsDomainGroupsT</span><span class=\"p\">):</span> <span class=\"o\">...</span>\n\n\n<span class=\"n\">x</span> <span class=\"o\">=</span> <span class=\"p\">{</span>\n    <span class=\"nb\">frozenset</span><span class=\"p\">([</span><span class=\"s2\">&quot;vision&quot;</span><span class=\"p\">]):</span> <span class=\"p\">{</span>\n        <span class=\"s2\">&quot;vision&quot;</span><span class=\"p\">:</span> <span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">Tensor</span><span class=\"p\">([</span><span class=\"mf\">1.0</span><span class=\"p\">,</span> <span class=\"mf\">0.0</span><span class=\"p\">,</span> <span class=\"mf\">0.3</span><span class=\"p\">,</span> <span class=\"o\">...</span><span class=\"p\">]),</span>\n    <span class=\"p\">},</span>\n    <span class=\"nb\">frozenset</span><span class=\"p\">([</span><span class=\"s2\">&quot;language&quot;</span><span class=\"p\">]):</span> <span class=\"p\">{</span>\n        <span class=\"s2\">&quot;language&quot;</span><span class=\"p\">:</span> <span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">Tensor</span><span class=\"p\">([</span><span class=\"mf\">1.0</span><span class=\"p\">,</span> <span class=\"mf\">0.2</span><span class=\"p\">,</span> <span class=\"mf\">0.9</span><span class=\"p\">,</span> <span class=\"o\">...</span><span class=\"p\">]),</span>\n    <span class=\"p\">},</span>\n    <span class=\"nb\">frozenset</span><span class=\"p\">([</span><span class=\"s2\">&quot;vision&quot;</span><span class=\"p\">,</span> <span class=\"s2\">&quot;language&quot;</span><span class=\"p\">]):</span> <span class=\"p\">{</span>\n        <span class=\"s2\">&quot;vision&quot;</span><span class=\"p\">:</span> <span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">Tensor</span><span class=\"p\">([</span><span class=\"mf\">0.0</span><span class=\"p\">,</span> <span class=\"mf\">1.0</span><span class=\"p\">,</span> <span class=\"mf\">0.0</span><span class=\"p\">,</span> <span class=\"o\">...</span><span class=\"p\">]),</span>\n        <span class=\"s2\">&quot;language&quot;</span><span class=\"p\">:</span> <span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">Tensor</span><span class=\"p\">([</span><span class=\"mf\">0.0</span><span class=\"p\">,</span> <span class=\"mf\">0.3</span><span class=\"p\">,</span> <span class=\"mf\">0.2</span><span class=\"p\">,</span> <span class=\"o\">...</span><span class=\"p\">]),</span>\n    <span class=\"p\">},</span>\n<span class=\"p\">}</span>\n\n<span class=\"n\">fun</span><span class=\"p\">(</span><span class=\"n\">x</span><span class=\"p\">)</span>\n</code></pre>\n  </div>\n</blockquote>\n\n<h6 id=\"note\">Note:</h6>\n\n<blockquote>\n  <p>This type uses <code>collections.abc.Mapping</code> and is used for functions' inputs.\n  Use <code>LatentsDomainGroupsDT</code> for functions' outputs.</p>\n  \n  <p>This allows to be more generic and allow passing other mappings.</p>\n</blockquote>\n", "default_value": "collections.abc.Mapping[frozenset[str], collections.abc.Mapping[str, torch.Tensor]]"}, "shimmer.types.LatentsDomainGroupsDT": {"fullname": "shimmer.types.LatentsDomainGroupsDT", "modulename": "shimmer.types", "qualname": "LatentsDomainGroupsDT", "kind": "variable", "doc": "<p>Mapping of <code>LatentsDomainGroupDT</code>.\nKeys are frozenset of domains matched in the group.\nEach group is independent and contains different data (unpaired).</p>\n\n<h6 id=\"example\">Example:</h6>\n\n<blockquote>\n  <div class=\"pdoc-code codehilite\">\n<pre><span></span><code><span class=\"k\">def</span> <span class=\"nf\">fun</span><span class=\"p\">()</span> <span class=\"o\">-&gt;</span> <span class=\"n\">LatentsDomainGroupsDT</span><span class=\"p\">:</span>\n    <span class=\"k\">return</span> <span class=\"p\">{</span>\n        <span class=\"nb\">frozenset</span><span class=\"p\">([</span><span class=\"s2\">&quot;vision&quot;</span><span class=\"p\">]):</span> <span class=\"p\">{</span>\n            <span class=\"s2\">&quot;vision&quot;</span><span class=\"p\">:</span> <span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">Tensor</span><span class=\"p\">([</span><span class=\"mf\">1.0</span><span class=\"p\">,</span> <span class=\"mf\">0.0</span><span class=\"p\">,</span> <span class=\"mf\">0.3</span><span class=\"p\">,</span> <span class=\"o\">...</span><span class=\"p\">]),</span>\n        <span class=\"p\">},</span>\n        <span class=\"nb\">frozenset</span><span class=\"p\">([</span><span class=\"s2\">&quot;language&quot;</span><span class=\"p\">]):</span> <span class=\"p\">{</span>\n            <span class=\"s2\">&quot;language&quot;</span><span class=\"p\">:</span> <span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">Tensor</span><span class=\"p\">([</span><span class=\"mf\">1.0</span><span class=\"p\">,</span> <span class=\"mf\">0.2</span><span class=\"p\">,</span> <span class=\"mf\">0.9</span><span class=\"p\">,</span> <span class=\"o\">...</span><span class=\"p\">]),</span>\n        <span class=\"p\">},</span>\n        <span class=\"nb\">frozenset</span><span class=\"p\">([</span><span class=\"s2\">&quot;vision&quot;</span><span class=\"p\">,</span> <span class=\"s2\">&quot;language&quot;</span><span class=\"p\">]):</span> <span class=\"p\">{</span>\n            <span class=\"s2\">&quot;vision&quot;</span><span class=\"p\">:</span> <span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">Tensor</span><span class=\"p\">([</span><span class=\"mf\">0.0</span><span class=\"p\">,</span> <span class=\"mf\">1.0</span><span class=\"p\">,</span> <span class=\"mf\">0.0</span><span class=\"p\">,</span> <span class=\"o\">...</span><span class=\"p\">]),</span>\n            <span class=\"s2\">&quot;language&quot;</span><span class=\"p\">:</span> <span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">Tensor</span><span class=\"p\">([</span><span class=\"mf\">0.0</span><span class=\"p\">,</span> <span class=\"mf\">0.3</span><span class=\"p\">,</span> <span class=\"mf\">0.2</span><span class=\"p\">,</span> <span class=\"o\">...</span><span class=\"p\">]),</span>\n        <span class=\"p\">},</span>\n    <span class=\"p\">}</span>\n</code></pre>\n  </div>\n</blockquote>\n\n<h6 id=\"note\">Note:</h6>\n\n<blockquote>\n  <p>This type uses <code>dict</code>s and is used for functions' outputs.\n  Use <code>LatentsDomainGroupT</code> for functions' inputs.</p>\n</blockquote>\n", "default_value": "dict[frozenset[str], dict[str, torch.Tensor]]"}, "shimmer.types.ModelModeT": {"fullname": "shimmer.types.ModelModeT", "modulename": "shimmer.types", "qualname": "ModelModeT", "kind": "variable", "doc": "<p>Mode used by pytorch lightning (train/val, ...).</p>\n\n<p>When validating or testing in out-of-distribution data, \"val/ood\" or \"test/ood\" mode is\nused.</p>\n", "default_value": "typing.Literal[&#x27;train&#x27;, &#x27;val&#x27;, &#x27;test&#x27;, &#x27;val/ood&#x27;, &#x27;test/ood&#x27;]"}, "shimmer.modules.global_workspace": {"fullname": "shimmer.modules.global_workspace", "modulename": "shimmer.modules.global_workspace", "kind": "module", "doc": "<p></p>\n"}, "shimmer.modules.global_workspace.SchedulerArgs": {"fullname": "shimmer.modules.global_workspace.SchedulerArgs", "modulename": "shimmer.modules.global_workspace", "qualname": "SchedulerArgs", "kind": "class", "doc": "<p>TypedDict of arguments passed to the OneCycle scheduler</p>\n", "bases": "typing.TypedDict"}, "shimmer.modules.global_workspace.SchedulerArgs.max_lr": {"fullname": "shimmer.modules.global_workspace.SchedulerArgs.max_lr", "modulename": "shimmer.modules.global_workspace", "qualname": "SchedulerArgs.max_lr", "kind": "variable", "doc": "<p>Maximum learning rate</p>\n", "annotation": ": float"}, "shimmer.modules.global_workspace.SchedulerArgs.total_steps": {"fullname": "shimmer.modules.global_workspace.SchedulerArgs.total_steps", "modulename": "shimmer.modules.global_workspace", "qualname": "SchedulerArgs.total_steps", "kind": "variable", "doc": "<p>Total number of steps</p>\n", "annotation": ": int"}, "shimmer.modules.global_workspace.GWPredictionsBase": {"fullname": "shimmer.modules.global_workspace.GWPredictionsBase", "modulename": "shimmer.modules.global_workspace", "qualname": "GWPredictionsBase", "kind": "class", "doc": "<p>TypedDict of the output given when calling <code>GlobalWorkspaceBase.predict</code></p>\n", "bases": "typing.TypedDict"}, "shimmer.modules.global_workspace.GWPredictionsBase.states": {"fullname": "shimmer.modules.global_workspace.GWPredictionsBase.states", "modulename": "shimmer.modules.global_workspace", "qualname": "GWPredictionsBase.states", "kind": "variable", "doc": "<p>GW state representation from domain groups with only one domain.\nThe key represent the domain's name.</p>\n", "annotation": ": dict[str, torch.Tensor]"}, "shimmer.modules.global_workspace.GlobalWorkspaceBase": {"fullname": "shimmer.modules.global_workspace.GlobalWorkspaceBase", "modulename": "shimmer.modules.global_workspace", "qualname": "GlobalWorkspaceBase", "kind": "class", "doc": "<p>Global Workspace Lightning Module.</p>\n\n<p>This is the base class to build the Global Workspace.</p>\n", "bases": "typing.Generic[~_T_gw_mod, ~_T_selection_mod, ~_T_loss_mod], lightning.pytorch.core.module.LightningModule"}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.gw_mod": {"fullname": "shimmer.modules.global_workspace.GlobalWorkspaceBase.gw_mod", "modulename": "shimmer.modules.global_workspace", "qualname": "GlobalWorkspaceBase.gw_mod", "kind": "variable", "doc": "<p>a <code>GWModuleBase</code> implementation.</p>\n"}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.selection_mod": {"fullname": "shimmer.modules.global_workspace.GlobalWorkspaceBase.selection_mod", "modulename": "shimmer.modules.global_workspace", "qualname": "GlobalWorkspaceBase.selection_mod", "kind": "variable", "doc": "<p>A <code>SelectionBase</code> implementation.</p>\n"}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.loss_mod": {"fullname": "shimmer.modules.global_workspace.GlobalWorkspaceBase.loss_mod", "modulename": "shimmer.modules.global_workspace", "qualname": "GlobalWorkspaceBase.loss_mod", "kind": "variable", "doc": "<p>The module that computes losses of the GW</p>\n"}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.optim_lr": {"fullname": "shimmer.modules.global_workspace.GlobalWorkspaceBase.optim_lr", "modulename": "shimmer.modules.global_workspace", "qualname": "GlobalWorkspaceBase.optim_lr", "kind": "variable", "doc": "<p></p>\n"}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.optim_weight_decay": {"fullname": "shimmer.modules.global_workspace.GlobalWorkspaceBase.optim_weight_decay", "modulename": "shimmer.modules.global_workspace", "qualname": "GlobalWorkspaceBase.optim_weight_decay", "kind": "variable", "doc": "<p></p>\n"}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.scheduler_args": {"fullname": "shimmer.modules.global_workspace.GlobalWorkspaceBase.scheduler_args", "modulename": "shimmer.modules.global_workspace", "qualname": "GlobalWorkspaceBase.scheduler_args", "kind": "variable", "doc": "<p></p>\n"}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.domain_mods": {"fullname": "shimmer.modules.global_workspace.GlobalWorkspaceBase.domain_mods", "modulename": "shimmer.modules.global_workspace", "qualname": "GlobalWorkspaceBase.domain_mods", "kind": "variable", "doc": "<p></p>\n", "annotation": ": collections.abc.Mapping[str, shimmer.modules.domain.DomainModule]"}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.workspace_dim": {"fullname": "shimmer.modules.global_workspace.GlobalWorkspaceBase.workspace_dim", "modulename": "shimmer.modules.global_workspace", "qualname": "GlobalWorkspaceBase.workspace_dim", "kind": "variable", "doc": "<p>Dimension of the GW.</p>\n", "annotation": ": int"}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.encode_and_fuse": {"fullname": "shimmer.modules.global_workspace.GlobalWorkspaceBase.encode_and_fuse", "modulename": "shimmer.modules.global_workspace", "qualname": "GlobalWorkspaceBase.encode_and_fuse", "kind": "function", "doc": "<p>Encode a group of latent representations into the GW representation.</p>\n\n<h6 id=\"arguments\">Arguments:</h6>\n\n<ul>\n<li><strong>x (<code>LatentsDomainGroupsT</code>):</strong>  the input domain representations.</li>\n<li><strong>selection_scores (<code>Mapping[str, torch.Tensor]</code>):</strong> </li>\n</ul>\n\n<h6 id=\"returns\">Returns:</h6>\n\n<blockquote>\n  <p><code>dict[frozenset[str], torch.Tensor]</code>: the GW representations.</p>\n</blockquote>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"bp\">self</span>,</span><span class=\"param\">\t<span class=\"n\">x</span><span class=\"p\">:</span> <span class=\"n\">collections</span><span class=\"o\">.</span><span class=\"n\">abc</span><span class=\"o\">.</span><span class=\"n\">Mapping</span><span class=\"p\">[</span><span class=\"nb\">frozenset</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">],</span> <span class=\"n\">collections</span><span class=\"o\">.</span><span class=\"n\">abc</span><span class=\"o\">.</span><span class=\"n\">Mapping</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">Tensor</span><span class=\"p\">]]</span>,</span><span class=\"param\">\t<span class=\"n\">selection_module</span><span class=\"p\">:</span> <span class=\"n\">shimmer</span><span class=\"o\">.</span><span class=\"n\">modules</span><span class=\"o\">.</span><span class=\"n\">selection</span><span class=\"o\">.</span><span class=\"n\">SelectionBase</span></span><span class=\"return-annotation\">) -> <span class=\"nb\">dict</span><span class=\"p\">[</span><span class=\"nb\">frozenset</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">],</span> <span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">Tensor</span><span class=\"p\">]</span>:</span></span>", "funcdef": "def"}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.encode": {"fullname": "shimmer.modules.global_workspace.GlobalWorkspaceBase.encode", "modulename": "shimmer.modules.global_workspace", "qualname": "GlobalWorkspaceBase.encode", "kind": "function", "doc": "<p>Encode a group of latent representations into the pre-fusion GW representation.</p>\n\n<h6 id=\"arguments\">Arguments:</h6>\n\n<ul>\n<li><strong>x (<code>LatentsDomainGroupsT</code>):</strong>  the input domain representations.</li>\n</ul>\n\n<h6 id=\"returns\">Returns:</h6>\n\n<blockquote>\n  <p><code>LatensDomainGroupsDT</code>: the GW representations.</p>\n</blockquote>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"bp\">self</span>,</span><span class=\"param\">\t<span class=\"n\">x</span><span class=\"p\">:</span> <span class=\"n\">collections</span><span class=\"o\">.</span><span class=\"n\">abc</span><span class=\"o\">.</span><span class=\"n\">Mapping</span><span class=\"p\">[</span><span class=\"nb\">frozenset</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">],</span> <span class=\"n\">collections</span><span class=\"o\">.</span><span class=\"n\">abc</span><span class=\"o\">.</span><span class=\"n\">Mapping</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">Tensor</span><span class=\"p\">]]</span></span><span class=\"return-annotation\">) -> <span class=\"nb\">dict</span><span class=\"p\">[</span><span class=\"nb\">frozenset</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">],</span> <span class=\"nb\">dict</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">Tensor</span><span class=\"p\">]]</span>:</span></span>", "funcdef": "def"}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.fuse": {"fullname": "shimmer.modules.global_workspace.GlobalWorkspaceBase.fuse", "modulename": "shimmer.modules.global_workspace", "qualname": "GlobalWorkspaceBase.fuse", "kind": "function", "doc": "<p>Fuses a group of latent representations into the GW representation.</p>\n\n<h6 id=\"arguments\">Arguments:</h6>\n\n<ul>\n<li><strong>x (<code>LatentsDomainGroupsT</code>):</strong>  the pre-fusion latent representations</li>\n<li><strong>selection_scores (<code>Mapping[frozenset[str], Mapping[str, torch.Tensor]]</code>):</strong>  selection scores for each group</li>\n</ul>\n\n<h6 id=\"returns\">Returns:</h6>\n\n<blockquote>\n  <p><code>dict[frozenset[str], torch.Tensor]</code>: GW representation of each group</p>\n</blockquote>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"bp\">self</span>,</span><span class=\"param\">\t<span class=\"n\">x</span><span class=\"p\">:</span> <span class=\"n\">collections</span><span class=\"o\">.</span><span class=\"n\">abc</span><span class=\"o\">.</span><span class=\"n\">Mapping</span><span class=\"p\">[</span><span class=\"nb\">frozenset</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">],</span> <span class=\"n\">collections</span><span class=\"o\">.</span><span class=\"n\">abc</span><span class=\"o\">.</span><span class=\"n\">Mapping</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">Tensor</span><span class=\"p\">]]</span>,</span><span class=\"param\">\t<span class=\"n\">selection_scores</span><span class=\"p\">:</span> <span class=\"n\">collections</span><span class=\"o\">.</span><span class=\"n\">abc</span><span class=\"o\">.</span><span class=\"n\">Mapping</span><span class=\"p\">[</span><span class=\"nb\">frozenset</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">],</span> <span class=\"n\">collections</span><span class=\"o\">.</span><span class=\"n\">abc</span><span class=\"o\">.</span><span class=\"n\">Mapping</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">Tensor</span><span class=\"p\">]]</span></span><span class=\"return-annotation\">) -> <span class=\"nb\">dict</span><span class=\"p\">[</span><span class=\"nb\">frozenset</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">],</span> <span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">Tensor</span><span class=\"p\">]</span>:</span></span>", "funcdef": "def"}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.decode": {"fullname": "shimmer.modules.global_workspace.GlobalWorkspaceBase.decode", "modulename": "shimmer.modules.global_workspace", "qualname": "GlobalWorkspaceBase.decode", "kind": "function", "doc": "<p>Decode the group GW representation into given <code>domains</code>.</p>\n\n<h6 id=\"arguments\">Arguments:</h6>\n\n<ul>\n<li><strong>z (<code>torch.Tensor</code>):</strong>  the GW representation.</li>\n<li><strong>domains (<code>Iterable[str]</code>):</strong>  iterable of domains to decode.</li>\n</ul>\n\n<h6 id=\"returns\">Returns:</h6>\n\n<blockquote>\n  <p><code>dict[str, torch.Tensor]</code>: the decoded unimodal representations.</p>\n</blockquote>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"bp\">self</span>,</span><span class=\"param\">\t<span class=\"n\">z</span><span class=\"p\">:</span> <span class=\"n\">collections</span><span class=\"o\">.</span><span class=\"n\">abc</span><span class=\"o\">.</span><span class=\"n\">Mapping</span><span class=\"p\">[</span><span class=\"nb\">frozenset</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">],</span> <span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">Tensor</span><span class=\"p\">]</span>,</span><span class=\"param\">\t<span class=\"n\">domains</span><span class=\"p\">:</span> <span class=\"n\">collections</span><span class=\"o\">.</span><span class=\"n\">abc</span><span class=\"o\">.</span><span class=\"n\">Iterable</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span> <span class=\"o\">|</span> <span class=\"kc\">None</span> <span class=\"o\">=</span> <span class=\"kc\">None</span></span><span class=\"return-annotation\">) -> <span class=\"nb\">dict</span><span class=\"p\">[</span><span class=\"nb\">frozenset</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">],</span> <span class=\"nb\">dict</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">Tensor</span><span class=\"p\">]]</span>:</span></span>", "funcdef": "def"}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.batch_gw_states": {"fullname": "shimmer.modules.global_workspace.GlobalWorkspaceBase.batch_gw_states", "modulename": "shimmer.modules.global_workspace", "qualname": "GlobalWorkspaceBase.batch_gw_states", "kind": "function", "doc": "<p>Comptues GW states of a batch of groups of domains.</p>\n\n<h6 id=\"arguments\">Arguments:</h6>\n\n<ul>\n<li><strong>latent_domains (<code>LatentsT</code>):</strong>  the batch of groups of domains</li>\n</ul>\n\n<h6 id=\"returns\">Returns:</h6>\n\n<blockquote>\n  <p><code>dict[str, torch.Tensor]</code>: states for each domain.</p>\n</blockquote>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"bp\">self</span>,</span><span class=\"param\">\t<span class=\"n\">latent_domains</span><span class=\"p\">:</span> <span class=\"n\">collections</span><span class=\"o\">.</span><span class=\"n\">abc</span><span class=\"o\">.</span><span class=\"n\">Mapping</span><span class=\"p\">[</span><span class=\"nb\">frozenset</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">],</span> <span class=\"n\">collections</span><span class=\"o\">.</span><span class=\"n\">abc</span><span class=\"o\">.</span><span class=\"n\">Mapping</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">Tensor</span><span class=\"p\">]]</span></span><span class=\"return-annotation\">) -> <span class=\"nb\">dict</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">Tensor</span><span class=\"p\">]</span>:</span></span>", "funcdef": "def"}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.encode_domain": {"fullname": "shimmer.modules.global_workspace.GlobalWorkspaceBase.encode_domain", "modulename": "shimmer.modules.global_workspace", "qualname": "GlobalWorkspaceBase.encode_domain", "kind": "function", "doc": "<p>Encodes a domain from the domain data into the unimodal representation.</p>\n\n<p>This is a convenient proxy for the <code>DomainModule.encode</code> method and is\nequivalent to:</p>\n\n<div class=\"pdoc-code codehilite\">\n<pre><span></span><code><span class=\"bp\">self</span><span class=\"o\">.</span><span class=\"n\">domain_mods</span><span class=\"p\">[</span><span class=\"n\">name</span><span class=\"p\">]</span><span class=\"o\">.</span><span class=\"n\">encode</span><span class=\"p\">(</span><span class=\"n\">domain</span><span class=\"p\">)</span>\n</code></pre>\n</div>\n\n<h6 id=\"arguments\">Arguments:</h6>\n\n<ul>\n<li><strong>domain (<code>Any</code>):</strong>  the domain data</li>\n<li><strong>name (<code>str</code>):</strong>  domain name to encode</li>\n</ul>\n\n<h6 id=\"returns\">Returns:</h6>\n\n<blockquote>\n  <p><code>torch.Tensor</code>: the domain's unimodal representation.</p>\n</blockquote>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span>, </span><span class=\"param\"><span class=\"n\">domain</span><span class=\"p\">:</span> <span class=\"n\">Any</span>, </span><span class=\"param\"><span class=\"n\">name</span><span class=\"p\">:</span> <span class=\"nb\">str</span></span><span class=\"return-annotation\">) -> <span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">Tensor</span>:</span></span>", "funcdef": "def"}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.encode_domains": {"fullname": "shimmer.modules.global_workspace.GlobalWorkspaceBase.encode_domains", "modulename": "shimmer.modules.global_workspace", "qualname": "GlobalWorkspaceBase.encode_domains", "kind": "function", "doc": "<p>Encode all domains in the batch.</p>\n\n<h6 id=\"arguments\">Arguments:</h6>\n\n<ul>\n<li><strong>batch (<code>RawDomainGroupsT</code>):</strong>  the batch of\ndomain groups with raw unimodal data to encode into groups of latent\nrepresentations.</li>\n</ul>\n\n<h6 id=\"returns\">Returns:</h6>\n\n<blockquote>\n  <p><code>LatentsDomainGroupsDT</code>: the domains' unimodal representations.</p>\n</blockquote>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"bp\">self</span>,</span><span class=\"param\">\t<span class=\"n\">batch</span><span class=\"p\">:</span> <span class=\"n\">collections</span><span class=\"o\">.</span><span class=\"n\">abc</span><span class=\"o\">.</span><span class=\"n\">Mapping</span><span class=\"p\">[</span><span class=\"nb\">frozenset</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">],</span> <span class=\"n\">collections</span><span class=\"o\">.</span><span class=\"n\">abc</span><span class=\"o\">.</span><span class=\"n\">Mapping</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"n\">typing</span><span class=\"o\">.</span><span class=\"n\">Any</span><span class=\"p\">]]</span></span><span class=\"return-annotation\">) -> <span class=\"nb\">dict</span><span class=\"p\">[</span><span class=\"nb\">frozenset</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">],</span> <span class=\"nb\">dict</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">Tensor</span><span class=\"p\">]]</span>:</span></span>", "funcdef": "def"}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.decode_domain": {"fullname": "shimmer.modules.global_workspace.GlobalWorkspaceBase.decode_domain", "modulename": "shimmer.modules.global_workspace", "qualname": "GlobalWorkspaceBase.decode_domain", "kind": "function", "doc": "<p>Decodes a domain from the unimodal representation into the domain data.</p>\n\n<p>This is a convenient proxy for the <code>DomainModule.encode</code> method and is\nequivalent to:</p>\n\n<div class=\"pdoc-code codehilite\">\n<pre><span></span><code><span class=\"bp\">self</span><span class=\"o\">.</span><span class=\"n\">domain_mods</span><span class=\"p\">[</span><span class=\"n\">name</span><span class=\"p\">]</span><span class=\"o\">.</span><span class=\"n\">decode</span><span class=\"p\">(</span><span class=\"n\">domain</span><span class=\"p\">)</span>\n</code></pre>\n</div>\n\n<h6 id=\"arguments\">Arguments:</h6>\n\n<ul>\n<li><strong>domain (<code>torch.Tensor</code>):</strong>  the domain data</li>\n<li><strong>name (<code>str</code>):</strong>  domain name to encode</li>\n</ul>\n\n<h6 id=\"returns\">Returns:</h6>\n\n<blockquote>\n  <p><code>Any</code>: the domain's raw data.</p>\n</blockquote>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span>, </span><span class=\"param\"><span class=\"n\">domain</span><span class=\"p\">:</span> <span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">Tensor</span>, </span><span class=\"param\"><span class=\"n\">name</span><span class=\"p\">:</span> <span class=\"nb\">str</span></span><span class=\"return-annotation\">) -> <span class=\"n\">Any</span>:</span></span>", "funcdef": "def"}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.decode_domains": {"fullname": "shimmer.modules.global_workspace.GlobalWorkspaceBase.decode_domains", "modulename": "shimmer.modules.global_workspace", "qualname": "GlobalWorkspaceBase.decode_domains", "kind": "function", "doc": "<p>Decodes all domains in the batch.</p>\n\n<h6 id=\"arguments\">Arguments:</h6>\n\n<ul>\n<li><strong>batch (<code>LatentsDomainGroupsT</code>):</strong>  the batch of\ndomain groups with unimodal latent representation to decode into\ngroups of raw data.</li>\n</ul>\n\n<h6 id=\"returns\">Returns:</h6>\n\n<blockquote>\n  <p><code>LatentsDomainGroupsDT</code>: the domains' raw data.</p>\n</blockquote>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"bp\">self</span>,</span><span class=\"param\">\t<span class=\"n\">latents_domain</span><span class=\"p\">:</span> <span class=\"n\">collections</span><span class=\"o\">.</span><span class=\"n\">abc</span><span class=\"o\">.</span><span class=\"n\">Mapping</span><span class=\"p\">[</span><span class=\"nb\">frozenset</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">],</span> <span class=\"n\">collections</span><span class=\"o\">.</span><span class=\"n\">abc</span><span class=\"o\">.</span><span class=\"n\">Mapping</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">Tensor</span><span class=\"p\">]]</span></span><span class=\"return-annotation\">) -> <span class=\"nb\">dict</span><span class=\"p\">[</span><span class=\"nb\">frozenset</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">],</span> <span class=\"nb\">dict</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"n\">typing</span><span class=\"o\">.</span><span class=\"n\">Any</span><span class=\"p\">]]</span>:</span></span>", "funcdef": "def"}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.generic_step": {"fullname": "shimmer.modules.global_workspace.GlobalWorkspaceBase.generic_step", "modulename": "shimmer.modules.global_workspace", "qualname": "GlobalWorkspaceBase.generic_step", "kind": "function", "doc": "<p>The generic step used in <code>training_step</code>, <code>validation_step</code> and\n<code>test_step</code>.</p>\n\n<h6 id=\"arguments\">Arguments:</h6>\n\n<ul>\n<li><strong>batch (<code>RawDomainGroupsT</code>):</strong>  the batch of groups of raw unimodal data.</li>\n<li><strong>mode (<code>ModelModeT</code>):</strong> </li>\n</ul>\n\n<h6 id=\"returns\">Returns:</h6>\n\n<blockquote>\n  <p><code>torch.Tensor</code>: the loss to train on.</p>\n</blockquote>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"bp\">self</span>,</span><span class=\"param\">\t<span class=\"n\">batch</span><span class=\"p\">:</span> <span class=\"n\">collections</span><span class=\"o\">.</span><span class=\"n\">abc</span><span class=\"o\">.</span><span class=\"n\">Mapping</span><span class=\"p\">[</span><span class=\"nb\">frozenset</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">],</span> <span class=\"n\">collections</span><span class=\"o\">.</span><span class=\"n\">abc</span><span class=\"o\">.</span><span class=\"n\">Mapping</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"n\">typing</span><span class=\"o\">.</span><span class=\"n\">Any</span><span class=\"p\">]]</span>,</span><span class=\"param\">\t<span class=\"n\">mode</span><span class=\"p\">:</span> <span class=\"n\">Literal</span><span class=\"p\">[</span><span class=\"s1\">&#39;train&#39;</span><span class=\"p\">,</span> <span class=\"s1\">&#39;val&#39;</span><span class=\"p\">,</span> <span class=\"s1\">&#39;test&#39;</span><span class=\"p\">,</span> <span class=\"s1\">&#39;val/ood&#39;</span><span class=\"p\">,</span> <span class=\"s1\">&#39;test/ood&#39;</span><span class=\"p\">]</span></span><span class=\"return-annotation\">) -> <span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">Tensor</span>:</span></span>", "funcdef": "def"}, "shimmer.modules.global_workspace.freeze_domain_modules": {"fullname": "shimmer.modules.global_workspace.freeze_domain_modules", "modulename": "shimmer.modules.global_workspace", "qualname": "freeze_domain_modules", "kind": "function", "doc": "<p>Freezes weights and set to eval mode the domain modules.</p>\n\n<div class=\"pdoc-alert pdoc-alert-note\">\n\n<p>The output is casted as <code>dict[str, DomainModule]</code> type for better\nauto-completion, but is actually a torch <code>ModuleDict</code>.</p>\n\n</div>\n\n<h6 id=\"arguments\">Arguments:</h6>\n\n<ul>\n<li><strong>domain_mods (<code>Mapping[str, DomainModule]</code>):</strong>  mapping of domain modules to freeze</li>\n</ul>\n\n<h6 id=\"returns\">Returns:</h6>\n\n<blockquote>\n  <p><code>ModuleDict</code>: frozen modules.</p>\n</blockquote>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">domain_mods</span><span class=\"p\">:</span> <span class=\"n\">collections</span><span class=\"o\">.</span><span class=\"n\">abc</span><span class=\"o\">.</span><span class=\"n\">Mapping</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"n\">shimmer</span><span class=\"o\">.</span><span class=\"n\">modules</span><span class=\"o\">.</span><span class=\"n\">domain</span><span class=\"o\">.</span><span class=\"n\">DomainModule</span><span class=\"p\">]</span></span><span class=\"return-annotation\">) -> <span class=\"nb\">dict</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"n\">shimmer</span><span class=\"o\">.</span><span class=\"n\">modules</span><span class=\"o\">.</span><span class=\"n\">domain</span><span class=\"o\">.</span><span class=\"n\">DomainModule</span><span class=\"p\">]</span>:</span></span>", "funcdef": "def"}, "shimmer.modules.global_workspace.GWPredictions": {"fullname": "shimmer.modules.global_workspace.GWPredictions", "modulename": "shimmer.modules.global_workspace", "qualname": "GWPredictions", "kind": "class", "doc": "<p>TypedDict of the output given when calling <code>GlobalWorkspaceBase.predict</code></p>\n", "bases": "builtins.dict"}, "shimmer.modules.global_workspace.GWPredictions.demi_cycles": {"fullname": "shimmer.modules.global_workspace.GWPredictions.demi_cycles", "modulename": "shimmer.modules.global_workspace", "qualname": "GWPredictions.demi_cycles", "kind": "variable", "doc": "<p>Demi-cycle predictions of the model for each domain. Only computed on domain\ngroups with only one domain.</p>\n", "annotation": ": dict[str, torch.Tensor]"}, "shimmer.modules.global_workspace.GWPredictions.cycles": {"fullname": "shimmer.modules.global_workspace.GWPredictions.cycles", "modulename": "shimmer.modules.global_workspace", "qualname": "GWPredictions.cycles", "kind": "variable", "doc": "<p>Cycle predictions of the model from one domain through another one.\nOnly computed on domain groups with more than one domain.\nThe keys are tuple with start domain and intermediary domain.</p>\n", "annotation": ": dict[tuple[str, str], torch.Tensor]"}, "shimmer.modules.global_workspace.GWPredictions.translations": {"fullname": "shimmer.modules.global_workspace.GWPredictions.translations", "modulename": "shimmer.modules.global_workspace", "qualname": "GWPredictions.translations", "kind": "variable", "doc": "<p>Translation predictions of the model from one domain through another one.</p>\n\n<p>Only computed on domain groups with more than one domain.\nThe keys are tuples with start domain and target domain.</p>\n", "annotation": ": dict[tuple[str, str], torch.Tensor]"}, "shimmer.modules.global_workspace.GWPredictions.states": {"fullname": "shimmer.modules.global_workspace.GWPredictions.states", "modulename": "shimmer.modules.global_workspace", "qualname": "GWPredictions.states", "kind": "variable", "doc": "<p></p>\n", "annotation": ": dict[str, torch.Tensor]"}, "shimmer.modules.global_workspace.GlobalWorkspace2Domains": {"fullname": "shimmer.modules.global_workspace.GlobalWorkspace2Domains", "modulename": "shimmer.modules.global_workspace", "qualname": "GlobalWorkspace2Domains", "kind": "class", "doc": "<p>A simple 2-domains max flavor of GlobalWorkspaceBase.</p>\n\n<p>This is used to simplify a Global Workspace instanciation and only overrides the\n<code>__init__</code> method.</p>\n", "bases": "shimmer.modules.global_workspace.GlobalWorkspaceBase[shimmer.modules.gw_module.GWModule, shimmer.modules.selection.SingleDomainSelection, shimmer.modules.losses.GWLosses2Domains]"}, "shimmer.modules.global_workspace.GlobalWorkspace2Domains.__init__": {"fullname": "shimmer.modules.global_workspace.GlobalWorkspace2Domains.__init__", "modulename": "shimmer.modules.global_workspace", "qualname": "GlobalWorkspace2Domains.__init__", "kind": "function", "doc": "<p>Initializes a Global Workspace</p>\n\n<h6 id=\"arguments\">Arguments:</h6>\n\n<ul>\n<li><strong>domain_mods (<code>Mapping[str, DomainModule]</code>):</strong>  mapping of the domains\nconnected to the GW. Keys are domain names, values are the\n<code>DomainModule</code>.</li>\n<li><strong>gw_encoders (<code>Mapping[str, torch.nn.Module]</code>):</strong>  mapping for each domain\nname to a <code>torch.nn.Module</code> class which role is to encode a\nunimodal latent representations into a GW representation (pre fusion).</li>\n<li><strong>gw_decoders (<code>Mapping[str, torch.nn.Module]</code>):</strong>  mapping for each domain\nname to a <code>torch.nn.Module</code> class which role is to decode a\nGW representation into a unimodal latent representations.</li>\n<li><strong>workspace_dim (<code>int</code>):</strong>  dimension of the GW.</li>\n<li><strong>loss_coefs (<code>LossCoefs</code>):</strong>  loss coefficients</li>\n<li><strong>optim_lr (<code>float</code>):</strong>  learning rate</li>\n<li><strong>optim_weight_decay (<code>float</code>):</strong>  weight decay</li>\n<li><strong>scheduler_args (<code>SchedulerArgs | None</code>):</strong>  optimization scheduler's arguments</li>\n<li><strong>learn_logit_scale (<code>bool</code>):</strong>  whether to learn the contrastive learning\ncontrastive loss when using the default contrastive loss.</li>\n<li><strong>contrastive_loss (<code>ContrastiveLossType | None</code>):</strong>  a contrastive loss\nfunction used for alignment. <code>learn_logit_scale</code> will not affect custom\ncontrastive losses.</li>\n</ul>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">domain_mods</span><span class=\"p\">:</span> <span class=\"n\">collections</span><span class=\"o\">.</span><span class=\"n\">abc</span><span class=\"o\">.</span><span class=\"n\">Mapping</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"n\">shimmer</span><span class=\"o\">.</span><span class=\"n\">modules</span><span class=\"o\">.</span><span class=\"n\">domain</span><span class=\"o\">.</span><span class=\"n\">DomainModule</span><span class=\"p\">]</span>,</span><span class=\"param\">\t<span class=\"n\">gw_encoders</span><span class=\"p\">:</span> <span class=\"n\">collections</span><span class=\"o\">.</span><span class=\"n\">abc</span><span class=\"o\">.</span><span class=\"n\">Mapping</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">nn</span><span class=\"o\">.</span><span class=\"n\">modules</span><span class=\"o\">.</span><span class=\"n\">module</span><span class=\"o\">.</span><span class=\"n\">Module</span><span class=\"p\">]</span>,</span><span class=\"param\">\t<span class=\"n\">gw_decoders</span><span class=\"p\">:</span> <span class=\"n\">collections</span><span class=\"o\">.</span><span class=\"n\">abc</span><span class=\"o\">.</span><span class=\"n\">Mapping</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">nn</span><span class=\"o\">.</span><span class=\"n\">modules</span><span class=\"o\">.</span><span class=\"n\">module</span><span class=\"o\">.</span><span class=\"n\">Module</span><span class=\"p\">]</span>,</span><span class=\"param\">\t<span class=\"n\">workspace_dim</span><span class=\"p\">:</span> <span class=\"nb\">int</span>,</span><span class=\"param\">\t<span class=\"n\">loss_coefs</span><span class=\"p\">:</span> <span class=\"n\">shimmer</span><span class=\"o\">.</span><span class=\"n\">modules</span><span class=\"o\">.</span><span class=\"n\">losses</span><span class=\"o\">.</span><span class=\"n\">LossCoefs</span>,</span><span class=\"param\">\t<span class=\"n\">optim_lr</span><span class=\"p\">:</span> <span class=\"nb\">float</span> <span class=\"o\">=</span> <span class=\"mf\">0.001</span>,</span><span class=\"param\">\t<span class=\"n\">optim_weight_decay</span><span class=\"p\">:</span> <span class=\"nb\">float</span> <span class=\"o\">=</span> <span class=\"mf\">0.0</span>,</span><span class=\"param\">\t<span class=\"n\">scheduler_args</span><span class=\"p\">:</span> <span class=\"n\">shimmer</span><span class=\"o\">.</span><span class=\"n\">modules</span><span class=\"o\">.</span><span class=\"n\">global_workspace</span><span class=\"o\">.</span><span class=\"n\">SchedulerArgs</span> <span class=\"o\">|</span> <span class=\"kc\">None</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">learn_logit_scale</span><span class=\"p\">:</span> <span class=\"nb\">bool</span> <span class=\"o\">=</span> <span class=\"kc\">False</span>,</span><span class=\"param\">\t<span class=\"n\">contrastive_loss</span><span class=\"p\">:</span> <span class=\"n\">collections</span><span class=\"o\">.</span><span class=\"n\">abc</span><span class=\"o\">.</span><span class=\"n\">Callable</span><span class=\"p\">[[</span><span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">Tensor</span><span class=\"p\">,</span> <span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">Tensor</span><span class=\"p\">],</span> <span class=\"n\">shimmer</span><span class=\"o\">.</span><span class=\"n\">modules</span><span class=\"o\">.</span><span class=\"n\">domain</span><span class=\"o\">.</span><span class=\"n\">LossOutput</span><span class=\"p\">]</span> <span class=\"o\">|</span> <span class=\"kc\">None</span> <span class=\"o\">=</span> <span class=\"kc\">None</span></span>)</span>"}, "shimmer.modules.global_workspace.GlobalWorkspace2Domains.forward": {"fullname": "shimmer.modules.global_workspace.GlobalWorkspace2Domains.forward", "modulename": "shimmer.modules.global_workspace", "qualname": "GlobalWorkspace2Domains.forward", "kind": "function", "doc": "<p>Computes demi-cycles, cycles, and translations.</p>\n\n<h6 id=\"arguments\">Arguments:</h6>\n\n<ul>\n<li><strong>latent_domains (<code>LatentsT</code>):</strong>  Groups of domains for the computation.</li>\n</ul>\n\n<h6 id=\"returns\">Returns:</h6>\n\n<blockquote>\n  <p><code>GWPredictions</code>: the predictions on the batch.</p>\n</blockquote>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"bp\">self</span>,</span><span class=\"param\">\t<span class=\"n\">latent_domains</span><span class=\"p\">:</span> <span class=\"n\">collections</span><span class=\"o\">.</span><span class=\"n\">abc</span><span class=\"o\">.</span><span class=\"n\">Mapping</span><span class=\"p\">[</span><span class=\"nb\">frozenset</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">],</span> <span class=\"n\">collections</span><span class=\"o\">.</span><span class=\"n\">abc</span><span class=\"o\">.</span><span class=\"n\">Mapping</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">Tensor</span><span class=\"p\">]]</span></span><span class=\"return-annotation\">) -> <span class=\"n\">shimmer</span><span class=\"o\">.</span><span class=\"n\">modules</span><span class=\"o\">.</span><span class=\"n\">global_workspace</span><span class=\"o\">.</span><span class=\"n\">GWPredictions</span>:</span></span>", "funcdef": "def"}, "shimmer.modules.global_workspace.GlobalWorkspace": {"fullname": "shimmer.modules.global_workspace.GlobalWorkspace", "modulename": "shimmer.modules.global_workspace", "qualname": "GlobalWorkspace", "kind": "class", "doc": "<p>The 2-domain fusion (with broadcast loss) flavor of GlobalWorkspaceBase.</p>\n\n<p>This is used to simplify a Global Workspace instanciation and only overrides the\n<code>__init__</code> method.</p>\n", "bases": "shimmer.modules.global_workspace.GlobalWorkspaceBase[shimmer.modules.gw_module.GWModule, shimmer.modules.selection.RandomSelection, shimmer.modules.losses.GWLosses]"}, "shimmer.modules.global_workspace.GlobalWorkspace.__init__": {"fullname": "shimmer.modules.global_workspace.GlobalWorkspace.__init__", "modulename": "shimmer.modules.global_workspace", "qualname": "GlobalWorkspace.__init__", "kind": "function", "doc": "<p>Initializes a Global Workspace</p>\n\n<h6 id=\"arguments\">Arguments:</h6>\n\n<ul>\n<li><strong>domain_mods (<code>Mapping[str, DomainModule]</code>):</strong>  mapping of the domains\nconnected to the GW. Keys are domain names, values are the\n<code>DomainModule</code>.</li>\n<li><strong>gw_encoders (<code>Mapping[str, torch.nn.Module]</code>):</strong>  mapping for each domain\nname to a <code>torch.nn.Module</code> class which role is to encode a\nunimodal latent representations into a GW representation (pre fusion).</li>\n<li><strong>gw_decoders (<code>Mapping[str, torch.nn.Module]</code>):</strong>  mapping for each domain\nname to a <code>torch.nn.Module</code> class which role is to decode a\nGW representation into a unimodal latent representations.</li>\n<li><strong>workspace_dim (<code>int</code>):</strong>  dimension of the GW.</li>\n<li><strong>loss_coefs (<code>BroadcastLossCoefs</code>):</strong>  loss coefs for the losses.</li>\n<li><strong>selection_temperature (<code>float</code>):</strong>  temperature value for the RandomSelection\nmodule.</li>\n<li><strong>optim_lr (<code>float</code>):</strong>  learning rate</li>\n<li><strong>optim_weight_decay (<code>float</code>):</strong>  weight decay</li>\n<li><strong>scheduler_args (<code>SchedulerArgs | None</code>):</strong>  optimization scheduler's arguments</li>\n<li><strong>learn_logit_scale (<code>bool</code>):</strong>  whether to learn the contrastive learning\ncontrastive loss when using the default contrastive loss.</li>\n<li><strong>contrastive_loss (<code>ContrastiveLossType | None</code>):</strong>  a contrastive loss\nfunction used for alignment. <code>learn_logit_scale</code> will not affect custom\ncontrastive losses.</li>\n</ul>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">domain_mods</span><span class=\"p\">:</span> <span class=\"n\">collections</span><span class=\"o\">.</span><span class=\"n\">abc</span><span class=\"o\">.</span><span class=\"n\">Mapping</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"n\">shimmer</span><span class=\"o\">.</span><span class=\"n\">modules</span><span class=\"o\">.</span><span class=\"n\">domain</span><span class=\"o\">.</span><span class=\"n\">DomainModule</span><span class=\"p\">]</span>,</span><span class=\"param\">\t<span class=\"n\">gw_encoders</span><span class=\"p\">:</span> <span class=\"n\">collections</span><span class=\"o\">.</span><span class=\"n\">abc</span><span class=\"o\">.</span><span class=\"n\">Mapping</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">nn</span><span class=\"o\">.</span><span class=\"n\">modules</span><span class=\"o\">.</span><span class=\"n\">module</span><span class=\"o\">.</span><span class=\"n\">Module</span><span class=\"p\">]</span>,</span><span class=\"param\">\t<span class=\"n\">gw_decoders</span><span class=\"p\">:</span> <span class=\"n\">collections</span><span class=\"o\">.</span><span class=\"n\">abc</span><span class=\"o\">.</span><span class=\"n\">Mapping</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">nn</span><span class=\"o\">.</span><span class=\"n\">modules</span><span class=\"o\">.</span><span class=\"n\">module</span><span class=\"o\">.</span><span class=\"n\">Module</span><span class=\"p\">]</span>,</span><span class=\"param\">\t<span class=\"n\">workspace_dim</span><span class=\"p\">:</span> <span class=\"nb\">int</span>,</span><span class=\"param\">\t<span class=\"n\">loss_coefs</span><span class=\"p\">:</span> <span class=\"n\">shimmer</span><span class=\"o\">.</span><span class=\"n\">modules</span><span class=\"o\">.</span><span class=\"n\">losses</span><span class=\"o\">.</span><span class=\"n\">BroadcastLossCoefs</span>,</span><span class=\"param\">\t<span class=\"n\">selection_temperature</span><span class=\"p\">:</span> <span class=\"nb\">float</span> <span class=\"o\">=</span> <span class=\"mf\">0.2</span>,</span><span class=\"param\">\t<span class=\"n\">optim_lr</span><span class=\"p\">:</span> <span class=\"nb\">float</span> <span class=\"o\">=</span> <span class=\"mf\">0.001</span>,</span><span class=\"param\">\t<span class=\"n\">optim_weight_decay</span><span class=\"p\">:</span> <span class=\"nb\">float</span> <span class=\"o\">=</span> <span class=\"mf\">0.0</span>,</span><span class=\"param\">\t<span class=\"n\">scheduler_args</span><span class=\"p\">:</span> <span class=\"n\">shimmer</span><span class=\"o\">.</span><span class=\"n\">modules</span><span class=\"o\">.</span><span class=\"n\">global_workspace</span><span class=\"o\">.</span><span class=\"n\">SchedulerArgs</span> <span class=\"o\">|</span> <span class=\"kc\">None</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">learn_logit_scale</span><span class=\"p\">:</span> <span class=\"nb\">bool</span> <span class=\"o\">=</span> <span class=\"kc\">False</span>,</span><span class=\"param\">\t<span class=\"n\">contrastive_loss</span><span class=\"p\">:</span> <span class=\"n\">collections</span><span class=\"o\">.</span><span class=\"n\">abc</span><span class=\"o\">.</span><span class=\"n\">Callable</span><span class=\"p\">[[</span><span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">Tensor</span><span class=\"p\">,</span> <span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">Tensor</span><span class=\"p\">],</span> <span class=\"n\">shimmer</span><span class=\"o\">.</span><span class=\"n\">modules</span><span class=\"o\">.</span><span class=\"n\">domain</span><span class=\"o\">.</span><span class=\"n\">LossOutput</span><span class=\"p\">]</span> <span class=\"o\">|</span> <span class=\"kc\">None</span> <span class=\"o\">=</span> <span class=\"kc\">None</span></span>)</span>"}, "shimmer.modules.global_workspace.GlobalWorkspace.forward": {"fullname": "shimmer.modules.global_workspace.GlobalWorkspace.forward", "modulename": "shimmer.modules.global_workspace", "qualname": "GlobalWorkspace.forward", "kind": "function", "doc": "<p>Computes demi-cycles, cycles, and translations.</p>\n\n<h6 id=\"arguments\">Arguments:</h6>\n\n<ul>\n<li><strong>latent_domains (<code>LatentsT</code>):</strong>  Groups of domains for the computation.</li>\n</ul>\n\n<h6 id=\"returns\">Returns:</h6>\n\n<blockquote>\n  <p><code>GWPredictions</code>: the predictions on the batch.</p>\n</blockquote>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"bp\">self</span>,</span><span class=\"param\">\t<span class=\"n\">latent_domains</span><span class=\"p\">:</span> <span class=\"n\">collections</span><span class=\"o\">.</span><span class=\"n\">abc</span><span class=\"o\">.</span><span class=\"n\">Mapping</span><span class=\"p\">[</span><span class=\"nb\">frozenset</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">],</span> <span class=\"n\">collections</span><span class=\"o\">.</span><span class=\"n\">abc</span><span class=\"o\">.</span><span class=\"n\">Mapping</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">Tensor</span><span class=\"p\">]]</span></span><span class=\"return-annotation\">) -> <span class=\"n\">shimmer</span><span class=\"o\">.</span><span class=\"n\">modules</span><span class=\"o\">.</span><span class=\"n\">global_workspace</span><span class=\"o\">.</span><span class=\"n\">GWPredictions</span>:</span></span>", "funcdef": "def"}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian": {"fullname": "shimmer.modules.global_workspace.GlobalWorkspaceBayesian", "modulename": "shimmer.modules.global_workspace", "qualname": "GlobalWorkspaceBayesian", "kind": "class", "doc": "<p>A simple 2-domains max GlobalWorkspaceBase with a Bayesian base uncertainty\nprediction.</p>\n\n<p>This is used to simplify a Global Workspace instanciation and only overrides the\n<code>__init__</code> method.</p>\n", "bases": "shimmer.modules.global_workspace.GlobalWorkspaceBase[shimmer.modules.gw_module.GWModuleBayesian, shimmer.modules.selection.FixedSharedSelection, shimmer.modules.losses.GWLossesBayesian]"}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian.__init__": {"fullname": "shimmer.modules.global_workspace.GlobalWorkspaceBayesian.__init__", "modulename": "shimmer.modules.global_workspace", "qualname": "GlobalWorkspaceBayesian.__init__", "kind": "function", "doc": "<p>Initializes a Global Workspace</p>\n\n<h6 id=\"arguments\">Arguments:</h6>\n\n<ul>\n<li><strong>domain_mods (<code>Mapping[str, DomainModule]</code>):</strong>  mapping of the domains\nconnected to the GW. Keys are domain names, values are the\n<code>DomainModule</code>.</li>\n<li><strong>gw_encoders (<code>Mapping[str, torch.nn.Module]</code>):</strong>  mapping for each domain\nname to a <code>torch.nn.Module</code> class which role is to encode a\nunimodal latent representations into a GW representation (pre fusion).</li>\n<li><strong>gw_decoders (<code>Mapping[str, torch.nn.Module]</code>):</strong>  mapping for each domain\nname to a <code>torch.nn.Module</code> class which role is to decode a\nGW representation into a unimodal latent representations.</li>\n<li><strong>workspace_dim (<code>int</code>):</strong>  dimension of the GW.</li>\n<li><strong>loss_coefs (<code>LossCoefs</code>):</strong>  loss coefficients</li>\n<li><strong>sensitivity_selection (<code>float</code>):</strong>  sensivity coef $c'_1$</li>\n<li><strong>sensitivity_precision (<code>float</code>):</strong>  sensitivity coef $c'_2$</li>\n<li><strong>optim_lr (<code>float</code>):</strong>  learning rate</li>\n<li><strong>optim_weight_decay (<code>float</code>):</strong>  weight decay</li>\n<li><strong>scheduler_args (<code>SchedulerArgs | None</code>):</strong>  optimization scheduler's arguments</li>\n<li><strong>learn_logit_scale (<code>bool</code>):</strong>  whether to learn the contrastive learning\ncontrastive loss when using the default contrastive loss.</li>\n<li><strong>use_normalized_constrastive (<code>bool</code>):</strong>  whether to use the normalized cont\nloss by the precision coefs</li>\n<li><strong>contrastive_loss (<code>ContrastiveLossType | None</code>):</strong>  a contrastive loss\nfunction used for alignment. <code>learn_logit_scale</code> will not affect custom\ncontrastive losses.</li>\n<li><strong>precision_softmax_temp (<code>float</code>):</strong>  temperature to use in softmax of\nprecision</li>\n</ul>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">domain_mods</span><span class=\"p\">:</span> <span class=\"n\">collections</span><span class=\"o\">.</span><span class=\"n\">abc</span><span class=\"o\">.</span><span class=\"n\">Mapping</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"n\">shimmer</span><span class=\"o\">.</span><span class=\"n\">modules</span><span class=\"o\">.</span><span class=\"n\">domain</span><span class=\"o\">.</span><span class=\"n\">DomainModule</span><span class=\"p\">]</span>,</span><span class=\"param\">\t<span class=\"n\">gw_encoders</span><span class=\"p\">:</span> <span class=\"n\">collections</span><span class=\"o\">.</span><span class=\"n\">abc</span><span class=\"o\">.</span><span class=\"n\">Mapping</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">nn</span><span class=\"o\">.</span><span class=\"n\">modules</span><span class=\"o\">.</span><span class=\"n\">module</span><span class=\"o\">.</span><span class=\"n\">Module</span><span class=\"p\">]</span>,</span><span class=\"param\">\t<span class=\"n\">gw_decoders</span><span class=\"p\">:</span> <span class=\"n\">collections</span><span class=\"o\">.</span><span class=\"n\">abc</span><span class=\"o\">.</span><span class=\"n\">Mapping</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">nn</span><span class=\"o\">.</span><span class=\"n\">modules</span><span class=\"o\">.</span><span class=\"n\">module</span><span class=\"o\">.</span><span class=\"n\">Module</span><span class=\"p\">]</span>,</span><span class=\"param\">\t<span class=\"n\">workspace_dim</span><span class=\"p\">:</span> <span class=\"nb\">int</span>,</span><span class=\"param\">\t<span class=\"n\">loss_coefs</span><span class=\"p\">:</span> <span class=\"n\">shimmer</span><span class=\"o\">.</span><span class=\"n\">modules</span><span class=\"o\">.</span><span class=\"n\">losses</span><span class=\"o\">.</span><span class=\"n\">BroadcastLossCoefs</span>,</span><span class=\"param\">\t<span class=\"n\">sensitivity_selection</span><span class=\"p\">:</span> <span class=\"nb\">float</span> <span class=\"o\">=</span> <span class=\"mi\">1</span>,</span><span class=\"param\">\t<span class=\"n\">sensitivity_precision</span><span class=\"p\">:</span> <span class=\"nb\">float</span> <span class=\"o\">=</span> <span class=\"mi\">1</span>,</span><span class=\"param\">\t<span class=\"n\">optim_lr</span><span class=\"p\">:</span> <span class=\"nb\">float</span> <span class=\"o\">=</span> <span class=\"mf\">0.001</span>,</span><span class=\"param\">\t<span class=\"n\">optim_weight_decay</span><span class=\"p\">:</span> <span class=\"nb\">float</span> <span class=\"o\">=</span> <span class=\"mf\">0.0</span>,</span><span class=\"param\">\t<span class=\"n\">scheduler_args</span><span class=\"p\">:</span> <span class=\"n\">shimmer</span><span class=\"o\">.</span><span class=\"n\">modules</span><span class=\"o\">.</span><span class=\"n\">global_workspace</span><span class=\"o\">.</span><span class=\"n\">SchedulerArgs</span> <span class=\"o\">|</span> <span class=\"kc\">None</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">learn_logit_scale</span><span class=\"p\">:</span> <span class=\"nb\">bool</span> <span class=\"o\">=</span> <span class=\"kc\">False</span>,</span><span class=\"param\">\t<span class=\"n\">use_normalized_constrastive</span><span class=\"p\">:</span> <span class=\"nb\">bool</span> <span class=\"o\">=</span> <span class=\"kc\">True</span>,</span><span class=\"param\">\t<span class=\"n\">contrastive_loss</span><span class=\"p\">:</span> <span class=\"n\">collections</span><span class=\"o\">.</span><span class=\"n\">abc</span><span class=\"o\">.</span><span class=\"n\">Callable</span><span class=\"p\">[[</span><span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">Tensor</span><span class=\"p\">,</span> <span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">Tensor</span><span class=\"p\">],</span> <span class=\"n\">shimmer</span><span class=\"o\">.</span><span class=\"n\">modules</span><span class=\"o\">.</span><span class=\"n\">domain</span><span class=\"o\">.</span><span class=\"n\">LossOutput</span><span class=\"p\">]</span> <span class=\"o\">|</span> <span class=\"kc\">None</span> <span class=\"o\">=</span> <span class=\"kc\">None</span>,</span><span class=\"param\">\t<span class=\"n\">precision_softmax_temp</span><span class=\"p\">:</span> <span class=\"nb\">float</span> <span class=\"o\">=</span> <span class=\"mf\">0.01</span></span>)</span>"}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian.forward": {"fullname": "shimmer.modules.global_workspace.GlobalWorkspaceBayesian.forward", "modulename": "shimmer.modules.global_workspace", "qualname": "GlobalWorkspaceBayesian.forward", "kind": "function", "doc": "<p>Computes demi-cycles, cycles, and translations.</p>\n\n<h6 id=\"arguments\">Arguments:</h6>\n\n<ul>\n<li><strong>latent_domains (<code>LatentsT</code>):</strong>  Groups of domains for the computation.</li>\n</ul>\n\n<h6 id=\"returns\">Returns:</h6>\n\n<blockquote>\n  <p><code>GWPredictions</code>: the predictions on the batch.</p>\n</blockquote>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"bp\">self</span>,</span><span class=\"param\">\t<span class=\"n\">latent_domains</span><span class=\"p\">:</span> <span class=\"n\">collections</span><span class=\"o\">.</span><span class=\"n\">abc</span><span class=\"o\">.</span><span class=\"n\">Mapping</span><span class=\"p\">[</span><span class=\"nb\">frozenset</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">],</span> <span class=\"n\">collections</span><span class=\"o\">.</span><span class=\"n\">abc</span><span class=\"o\">.</span><span class=\"n\">Mapping</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">Tensor</span><span class=\"p\">]]</span></span><span class=\"return-annotation\">) -> <span class=\"n\">shimmer</span><span class=\"o\">.</span><span class=\"n\">modules</span><span class=\"o\">.</span><span class=\"n\">global_workspace</span><span class=\"o\">.</span><span class=\"n\">GWPredictions</span>:</span></span>", "funcdef": "def"}, "shimmer.modules.global_workspace.pretrained_global_workspace": {"fullname": "shimmer.modules.global_workspace.pretrained_global_workspace", "modulename": "shimmer.modules.global_workspace", "qualname": "pretrained_global_workspace", "kind": "function", "doc": "<p>Load a <code>GlobalWorkspace</code> flavor of <code>GlobalWorkspaceBase</code> from a checkpoint.</p>\n\n<h6 id=\"arguments\">Arguments:</h6>\n\n<ul>\n<li><strong>checkpoint_path (<code>str | Path</code>):</strong>  path to checkpoint</li>\n<li><strong>domain_mods (<code>Mapping[str, DomainModule]</code>):</strong>  mapping of the domains\nconnected to the GW. Keys are domain names, values are the\n<code>DomainModule</code>.</li>\n<li><strong>gw_encoders (<code>Mapping[str, torch.nn.Module]</code>):</strong>  mapping for each domain\nname to a <code>torch.nn.Module</code> class which role is to encode a\nunimodal latent representations into a GW representation (pre fusion).</li>\n<li><strong>gw_decoders (<code>Mapping[str, torch.nn.Module]</code>):</strong>  mapping for each domain\nname to a <code>torch.nn.Module</code> class which role is to decode a\nGW representation into a unimodal latent representations.</li>\n<li><strong>workspace_dim (<code>int</code>):</strong>  dimension of the GW.</li>\n<li><strong>loss_coefs (<code>LossCoefs</code>):</strong>  loss coefficients</li>\n<li><strong>contrastive_loss (<code>ContrastiveLossType</code>):</strong>  a contrastive loss\nfunction used for alignment. <code>learn_logit_scale</code> will not affect custom\ncontrastive losses.</li>\n<li><strong>**kwargs:</strong>  additional arguments to pass to\n<code>GlobalWorkspace.load_from_checkpoint</code>.</li>\n</ul>\n\n<h6 id=\"returns\">Returns:</h6>\n\n<blockquote>\n  <p><code>GlobalWorkspace</code>: the pretrained <code>GlobalWorkspace</code>.</p>\n</blockquote>\n\n<h6 id=\"raises\">Raises:</h6>\n\n<ul>\n<li><strong><code>TypeError</code>:</strong>  if loaded type is not <code>GlobalWorkspace</code>.</li>\n</ul>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">checkpoint_path</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">|</span> <span class=\"n\">pathlib</span><span class=\"o\">.</span><span class=\"n\">Path</span>,</span><span class=\"param\">\t<span class=\"n\">domain_mods</span><span class=\"p\">:</span> <span class=\"n\">collections</span><span class=\"o\">.</span><span class=\"n\">abc</span><span class=\"o\">.</span><span class=\"n\">Mapping</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"n\">shimmer</span><span class=\"o\">.</span><span class=\"n\">modules</span><span class=\"o\">.</span><span class=\"n\">domain</span><span class=\"o\">.</span><span class=\"n\">DomainModule</span><span class=\"p\">]</span>,</span><span class=\"param\">\t<span class=\"n\">gw_encoders</span><span class=\"p\">:</span> <span class=\"n\">collections</span><span class=\"o\">.</span><span class=\"n\">abc</span><span class=\"o\">.</span><span class=\"n\">Mapping</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">nn</span><span class=\"o\">.</span><span class=\"n\">modules</span><span class=\"o\">.</span><span class=\"n\">module</span><span class=\"o\">.</span><span class=\"n\">Module</span><span class=\"p\">]</span>,</span><span class=\"param\">\t<span class=\"n\">gw_decoders</span><span class=\"p\">:</span> <span class=\"n\">collections</span><span class=\"o\">.</span><span class=\"n\">abc</span><span class=\"o\">.</span><span class=\"n\">Mapping</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">nn</span><span class=\"o\">.</span><span class=\"n\">modules</span><span class=\"o\">.</span><span class=\"n\">module</span><span class=\"o\">.</span><span class=\"n\">Module</span><span class=\"p\">]</span>,</span><span class=\"param\">\t<span class=\"n\">workspace_dim</span><span class=\"p\">:</span> <span class=\"nb\">int</span>,</span><span class=\"param\">\t<span class=\"n\">loss_coefs</span><span class=\"p\">:</span> <span class=\"n\">shimmer</span><span class=\"o\">.</span><span class=\"n\">modules</span><span class=\"o\">.</span><span class=\"n\">losses</span><span class=\"o\">.</span><span class=\"n\">LossCoefs</span>,</span><span class=\"param\">\t<span class=\"n\">contrastive_fn</span><span class=\"p\">:</span> <span class=\"n\">collections</span><span class=\"o\">.</span><span class=\"n\">abc</span><span class=\"o\">.</span><span class=\"n\">Callable</span><span class=\"p\">[[</span><span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">Tensor</span><span class=\"p\">,</span> <span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">Tensor</span><span class=\"p\">],</span> <span class=\"n\">shimmer</span><span class=\"o\">.</span><span class=\"n\">modules</span><span class=\"o\">.</span><span class=\"n\">domain</span><span class=\"o\">.</span><span class=\"n\">LossOutput</span><span class=\"p\">]</span>,</span><span class=\"param\">\t<span class=\"o\">**</span><span class=\"n\">kwargs</span></span><span class=\"return-annotation\">) -> <span class=\"n\">shimmer</span><span class=\"o\">.</span><span class=\"n\">modules</span><span class=\"o\">.</span><span class=\"n\">global_workspace</span><span class=\"o\">.</span><span class=\"n\">GlobalWorkspace2Domains</span>:</span></span>", "funcdef": "def"}, "shimmer.modules.domain": {"fullname": "shimmer.modules.domain", "modulename": "shimmer.modules.domain", "kind": "module", "doc": "<p></p>\n"}, "shimmer.modules.domain.LossOutput": {"fullname": "shimmer.modules.domain.LossOutput", "modulename": "shimmer.modules.domain", "qualname": "LossOutput", "kind": "class", "doc": "<p>This is a python dataclass use as a returned value for losses.\nIt keeps track of what is used for training (<code>loss</code>) and what is used\nonly for logging (<code>metrics</code>).</p>\n"}, "shimmer.modules.domain.LossOutput.__init__": {"fullname": "shimmer.modules.domain.LossOutput.__init__", "modulename": "shimmer.modules.domain", "qualname": "LossOutput.__init__", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">loss</span><span class=\"p\">:</span> <span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">Tensor</span>, </span><span class=\"param\"><span class=\"n\">metrics</span><span class=\"p\">:</span> <span class=\"nb\">dict</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">Tensor</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"o\">&lt;</span><span class=\"n\">factory</span><span class=\"o\">&gt;</span></span>)</span>"}, "shimmer.modules.domain.LossOutput.loss": {"fullname": "shimmer.modules.domain.LossOutput.loss", "modulename": "shimmer.modules.domain", "qualname": "LossOutput.loss", "kind": "variable", "doc": "<p>Loss used during training.</p>\n", "annotation": ": torch.Tensor"}, "shimmer.modules.domain.LossOutput.metrics": {"fullname": "shimmer.modules.domain.LossOutput.metrics", "modulename": "shimmer.modules.domain", "qualname": "LossOutput.metrics", "kind": "variable", "doc": "<p>Some additional metrics to log (not used during training).</p>\n", "annotation": ": dict[str, torch.Tensor]"}, "shimmer.modules.domain.LossOutput.all": {"fullname": "shimmer.modules.domain.LossOutput.all", "modulename": "shimmer.modules.domain", "qualname": "LossOutput.all", "kind": "variable", "doc": "<p>Returns a dict with all metrics and loss with \"loss\" key.</p>\n", "annotation": ": dict[str, torch.Tensor]"}, "shimmer.modules.domain.DomainModule": {"fullname": "shimmer.modules.domain.DomainModule", "modulename": "shimmer.modules.domain", "qualname": "DomainModule", "kind": "class", "doc": "<p>Base class for a DomainModule that defines domain specific modules of the GW.</p>\n", "bases": "lightning.pytorch.core.module.LightningModule"}, "shimmer.modules.domain.DomainModule.__init__": {"fullname": "shimmer.modules.domain.DomainModule.__init__", "modulename": "shimmer.modules.domain", "qualname": "DomainModule.__init__", "kind": "function", "doc": "<p>Initializes a DomainModule.</p>\n\n<h6 id=\"arguments\">Arguments:</h6>\n\n<ul>\n<li><strong>latent_dim (<code>int</code>):</strong>  latent dimension of the unimodal module</li>\n</ul>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">latent_dim</span><span class=\"p\">:</span> <span class=\"nb\">int</span></span>)</span>"}, "shimmer.modules.domain.DomainModule.latent_dim": {"fullname": "shimmer.modules.domain.DomainModule.latent_dim", "modulename": "shimmer.modules.domain", "qualname": "DomainModule.latent_dim", "kind": "variable", "doc": "<p>The latent dimension of the module.</p>\n"}, "shimmer.modules.domain.DomainModule.encode": {"fullname": "shimmer.modules.domain.DomainModule.encode", "modulename": "shimmer.modules.domain", "qualname": "DomainModule.encode", "kind": "function", "doc": "<p>Encode the domain data into a unimodal representation.</p>\n\n<h6 id=\"arguments\">Arguments:</h6>\n\n<ul>\n<li><strong>x (<code>Any</code>):</strong>  data of the domain.</li>\n</ul>\n\n<h6 id=\"returns\">Returns:</h6>\n\n<blockquote>\n  <p><code>torch.Tensor</code>: a unimodal representation.</p>\n</blockquote>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span>, </span><span class=\"param\"><span class=\"n\">x</span><span class=\"p\">:</span> <span class=\"n\">Any</span></span><span class=\"return-annotation\">) -> <span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">Tensor</span>:</span></span>", "funcdef": "def"}, "shimmer.modules.domain.DomainModule.decode": {"fullname": "shimmer.modules.domain.DomainModule.decode", "modulename": "shimmer.modules.domain", "qualname": "DomainModule.decode", "kind": "function", "doc": "<p>Decode data from unimodal representation back to the domain data.</p>\n\n<h6 id=\"arguments\">Arguments:</h6>\n\n<ul>\n<li><strong>z (<code>torch.Tensor</code>):</strong>  unimodal representation of the domain.</li>\n</ul>\n\n<h6 id=\"returns\">Returns:</h6>\n\n<blockquote>\n  <p><code>Any</code>: the original domain data.</p>\n</blockquote>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span>, </span><span class=\"param\"><span class=\"n\">z</span><span class=\"p\">:</span> <span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">Tensor</span></span><span class=\"return-annotation\">) -> <span class=\"n\">Any</span>:</span></span>", "funcdef": "def"}, "shimmer.modules.domain.DomainModule.compute_loss": {"fullname": "shimmer.modules.domain.DomainModule.compute_loss", "modulename": "shimmer.modules.domain", "qualname": "DomainModule.compute_loss", "kind": "function", "doc": "<p>Generic loss computation  the modality.</p>\n\n<h6 id=\"arguments\">Arguments:</h6>\n\n<ul>\n<li><strong>pred (<code>torch.Tensor</code>):</strong>  prediction of the model</li>\n<li><strong>target (<code>torch.Tensor</code>):</strong>  target tensor</li>\n</ul>\n\n<h6 id=\"results\">Results:</h6>\n\n<blockquote>\n  <p><code>LossOutput</code>: LossOuput with training loss and additional metrics.</p>\n</blockquote>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"bp\">self</span>,</span><span class=\"param\">\t<span class=\"n\">pred</span><span class=\"p\">:</span> <span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">Tensor</span>,</span><span class=\"param\">\t<span class=\"n\">target</span><span class=\"p\">:</span> <span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">Tensor</span></span><span class=\"return-annotation\">) -> <span class=\"n\">shimmer</span><span class=\"o\">.</span><span class=\"n\">modules</span><span class=\"o\">.</span><span class=\"n\">domain</span><span class=\"o\">.</span><span class=\"n\">LossOutput</span>:</span></span>", "funcdef": "def"}, "shimmer.modules.domain.DomainModule.compute_dcy_loss": {"fullname": "shimmer.modules.domain.DomainModule.compute_dcy_loss", "modulename": "shimmer.modules.domain", "qualname": "DomainModule.compute_dcy_loss", "kind": "function", "doc": "<p>Computes the loss for a demi-cycle. Override if the demi-cycle loss is\ndifferent that the generic loss.</p>\n\n<h6 id=\"arguments\">Arguments:</h6>\n\n<ul>\n<li><strong>pred (<code>torch.Tensor</code>):</strong>  prediction of the model</li>\n<li><strong>target (<code>torch.Tensor</code>):</strong>  target tensor</li>\n</ul>\n\n<h6 id=\"results\">Results:</h6>\n\n<blockquote>\n  <p><code>LossOutput</code>: LossOuput with training loss and additional metrics.</p>\n</blockquote>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"bp\">self</span>,</span><span class=\"param\">\t<span class=\"n\">pred</span><span class=\"p\">:</span> <span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">Tensor</span>,</span><span class=\"param\">\t<span class=\"n\">target</span><span class=\"p\">:</span> <span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">Tensor</span></span><span class=\"return-annotation\">) -> <span class=\"n\">shimmer</span><span class=\"o\">.</span><span class=\"n\">modules</span><span class=\"o\">.</span><span class=\"n\">domain</span><span class=\"o\">.</span><span class=\"n\">LossOutput</span>:</span></span>", "funcdef": "def"}, "shimmer.modules.domain.DomainModule.compute_cy_loss": {"fullname": "shimmer.modules.domain.DomainModule.compute_cy_loss", "modulename": "shimmer.modules.domain", "qualname": "DomainModule.compute_cy_loss", "kind": "function", "doc": "<p>Computes the loss for a cycle. Override if the cycle loss is\ndifferent that the generic loss.</p>\n\n<h6 id=\"arguments\">Arguments:</h6>\n\n<ul>\n<li><strong>pred (<code>torch.Tensor</code>):</strong>  prediction of the model</li>\n<li><strong>target (<code>torch.Tensor</code>):</strong>  target tensor</li>\n</ul>\n\n<h6 id=\"results\">Results:</h6>\n\n<blockquote>\n  <p><code>LossOutput</code>: LossOuput with training loss and additional metrics.</p>\n</blockquote>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"bp\">self</span>,</span><span class=\"param\">\t<span class=\"n\">pred</span><span class=\"p\">:</span> <span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">Tensor</span>,</span><span class=\"param\">\t<span class=\"n\">target</span><span class=\"p\">:</span> <span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">Tensor</span></span><span class=\"return-annotation\">) -> <span class=\"n\">shimmer</span><span class=\"o\">.</span><span class=\"n\">modules</span><span class=\"o\">.</span><span class=\"n\">domain</span><span class=\"o\">.</span><span class=\"n\">LossOutput</span>:</span></span>", "funcdef": "def"}, "shimmer.modules.domain.DomainModule.compute_tr_loss": {"fullname": "shimmer.modules.domain.DomainModule.compute_tr_loss", "modulename": "shimmer.modules.domain", "qualname": "DomainModule.compute_tr_loss", "kind": "function", "doc": "<p>Computes the loss for a translation. Override if the translation loss is\ndifferent that the generic loss.</p>\n\n<h6 id=\"arguments\">Arguments:</h6>\n\n<ul>\n<li><strong>pred (<code>torch.Tensor</code>):</strong>  prediction of the model</li>\n<li><strong>target (<code>torch.Tensor</code>):</strong>  target tensor</li>\n</ul>\n\n<h6 id=\"results\">Results:</h6>\n\n<blockquote>\n  <p><code>LossOutput</code>: LossOuput with training loss and additional metrics.</p>\n</blockquote>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"bp\">self</span>,</span><span class=\"param\">\t<span class=\"n\">pred</span><span class=\"p\">:</span> <span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">Tensor</span>,</span><span class=\"param\">\t<span class=\"n\">target</span><span class=\"p\">:</span> <span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">Tensor</span></span><span class=\"return-annotation\">) -> <span class=\"n\">shimmer</span><span class=\"o\">.</span><span class=\"n\">modules</span><span class=\"o\">.</span><span class=\"n\">domain</span><span class=\"o\">.</span><span class=\"n\">LossOutput</span>:</span></span>", "funcdef": "def"}, "shimmer.modules.domain.DomainModule.compute_broadcast_loss": {"fullname": "shimmer.modules.domain.DomainModule.compute_broadcast_loss", "modulename": "shimmer.modules.domain", "qualname": "DomainModule.compute_broadcast_loss", "kind": "function", "doc": "<p>Computes the loss for a broadcast (fusion). Override if the broadcast loss is\ndifferent that the generic loss.</p>\n\n<h6 id=\"arguments\">Arguments:</h6>\n\n<ul>\n<li><strong>pred (<code>torch.Tensor</code>):</strong>  prediction of the model</li>\n<li><strong>target (<code>torch.Tensor</code>):</strong>  target tensor</li>\n</ul>\n\n<h6 id=\"results\">Results:</h6>\n\n<blockquote>\n  <p><code>LossOutput</code>: LossOuput with training loss and additional metrics.</p>\n</blockquote>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"bp\">self</span>,</span><span class=\"param\">\t<span class=\"n\">pred</span><span class=\"p\">:</span> <span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">Tensor</span>,</span><span class=\"param\">\t<span class=\"n\">target</span><span class=\"p\">:</span> <span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">Tensor</span></span><span class=\"return-annotation\">) -> <span class=\"n\">shimmer</span><span class=\"o\">.</span><span class=\"n\">modules</span><span class=\"o\">.</span><span class=\"n\">domain</span><span class=\"o\">.</span><span class=\"n\">LossOutput</span>:</span></span>", "funcdef": "def"}, "shimmer.modules.gw_module": {"fullname": "shimmer.modules.gw_module", "modulename": "shimmer.modules.gw_module", "kind": "module", "doc": "<p></p>\n"}, "shimmer.modules.gw_module.get_n_layers": {"fullname": "shimmer.modules.gw_module.get_n_layers", "modulename": "shimmer.modules.gw_module", "qualname": "get_n_layers", "kind": "function", "doc": "<p>Makes a list of <code>n_layers</code> <code>nn.Linear</code> layers with <code>nn.ReLU</code>.</p>\n\n<h6 id=\"arguments\">Arguments:</h6>\n\n<ul>\n<li><strong>n_layers (<code>int</code>):</strong>  number of layers</li>\n<li><strong>hidden_dim (<code>int</code>):</strong>  size of the hidden dimension</li>\n</ul>\n\n<h6 id=\"returns\">Returns:</h6>\n\n<blockquote>\n  <p><code>list[nn.Module]</code>: list of linear and relu layers.</p>\n</blockquote>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">n_layers</span><span class=\"p\">:</span> <span class=\"nb\">int</span>, </span><span class=\"param\"><span class=\"n\">hidden_dim</span><span class=\"p\">:</span> <span class=\"nb\">int</span></span><span class=\"return-annotation\">) -> <span class=\"nb\">list</span><span class=\"p\">[</span><span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">nn</span><span class=\"o\">.</span><span class=\"n\">modules</span><span class=\"o\">.</span><span class=\"n\">module</span><span class=\"o\">.</span><span class=\"n\">Module</span><span class=\"p\">]</span>:</span></span>", "funcdef": "def"}, "shimmer.modules.gw_module.GWDecoder": {"fullname": "shimmer.modules.gw_module.GWDecoder", "modulename": "shimmer.modules.gw_module", "qualname": "GWDecoder", "kind": "class", "doc": "<p>A Decoder network for GWModules.</p>\n", "bases": "torch.nn.modules.container.Sequential"}, "shimmer.modules.gw_module.GWDecoder.__init__": {"fullname": "shimmer.modules.gw_module.GWDecoder.__init__", "modulename": "shimmer.modules.gw_module", "qualname": "GWDecoder.__init__", "kind": "function", "doc": "<p>Initializes the decoder.</p>\n\n<h6 id=\"arguments\">Arguments:</h6>\n\n<ul>\n<li><strong>in_dim (<code>int</code>):</strong>  input dimension</li>\n<li><strong>hidden_dim (<code>int</code>):</strong>  hidden dimension</li>\n<li><strong>out_dim (<code>int</code>):</strong>  output dimension</li>\n<li><strong>n_layers (<code>int</code>):</strong>  number of hidden layers. The total number of layers\nwill be <code>n_layers</code> + 2 (one before, one after).</li>\n</ul>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">in_dim</span><span class=\"p\">:</span> <span class=\"nb\">int</span>, </span><span class=\"param\"><span class=\"n\">hidden_dim</span><span class=\"p\">:</span> <span class=\"nb\">int</span>, </span><span class=\"param\"><span class=\"n\">out_dim</span><span class=\"p\">:</span> <span class=\"nb\">int</span>, </span><span class=\"param\"><span class=\"n\">n_layers</span><span class=\"p\">:</span> <span class=\"nb\">int</span></span>)</span>"}, "shimmer.modules.gw_module.GWDecoder.in_dim": {"fullname": "shimmer.modules.gw_module.GWDecoder.in_dim", "modulename": "shimmer.modules.gw_module", "qualname": "GWDecoder.in_dim", "kind": "variable", "doc": "<p>input dimension</p>\n"}, "shimmer.modules.gw_module.GWDecoder.hidden_dim": {"fullname": "shimmer.modules.gw_module.GWDecoder.hidden_dim", "modulename": "shimmer.modules.gw_module", "qualname": "GWDecoder.hidden_dim", "kind": "variable", "doc": "<p>hidden dimension</p>\n"}, "shimmer.modules.gw_module.GWDecoder.out_dim": {"fullname": "shimmer.modules.gw_module.GWDecoder.out_dim", "modulename": "shimmer.modules.gw_module", "qualname": "GWDecoder.out_dim", "kind": "variable", "doc": "<p>output dimension</p>\n"}, "shimmer.modules.gw_module.GWDecoder.n_layers": {"fullname": "shimmer.modules.gw_module.GWDecoder.n_layers", "modulename": "shimmer.modules.gw_module", "qualname": "GWDecoder.n_layers", "kind": "variable", "doc": "<p>number of hidden layers. The total number of layers\n        will be <code>n_layers</code> + 2 (one before, one after).</p>\n"}, "shimmer.modules.gw_module.GWEncoder": {"fullname": "shimmer.modules.gw_module.GWEncoder", "modulename": "shimmer.modules.gw_module", "qualname": "GWEncoder", "kind": "class", "doc": "<p>An Encoder network used in GWModules.</p>\n\n<p>This is similar to the decoder, but adds a tanh non-linearity at the end.</p>\n", "bases": "GWDecoder"}, "shimmer.modules.gw_module.GWEncoder.__init__": {"fullname": "shimmer.modules.gw_module.GWEncoder.__init__", "modulename": "shimmer.modules.gw_module", "qualname": "GWEncoder.__init__", "kind": "function", "doc": "<p>Initializes the encoder.</p>\n\n<h6 id=\"arguments\">Arguments:</h6>\n\n<ul>\n<li><strong>in_dim (<code>int</code>):</strong>  input dimension</li>\n<li><strong>hidden_dim (<code>int</code>):</strong>  hidden dimension</li>\n<li><strong>out_dim (<code>int</code>):</strong>  output dimension</li>\n<li><strong>n_layers (<code>int</code>):</strong>  number of hidden layers. The total number of layers\nwill be <code>n_layers</code> + 2 (one before, one after).</li>\n</ul>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">in_dim</span><span class=\"p\">:</span> <span class=\"nb\">int</span>, </span><span class=\"param\"><span class=\"n\">hidden_dim</span><span class=\"p\">:</span> <span class=\"nb\">int</span>, </span><span class=\"param\"><span class=\"n\">out_dim</span><span class=\"p\">:</span> <span class=\"nb\">int</span>, </span><span class=\"param\"><span class=\"n\">n_layers</span><span class=\"p\">:</span> <span class=\"nb\">int</span></span>)</span>"}, "shimmer.modules.gw_module.GWEncoder.forward": {"fullname": "shimmer.modules.gw_module.GWEncoder.forward", "modulename": "shimmer.modules.gw_module", "qualname": "GWEncoder.forward", "kind": "function", "doc": "<p>Define the computation performed at every call.</p>\n\n<p>Should be overridden by all subclasses.</p>\n\n<div class=\"pdoc-alert pdoc-alert-note\">\n\n<p>Although the recipe for forward pass needs to be defined within\nthis function, one should call the <code>Module</code> instance afterwards\ninstead of this since the former takes care of running the\nregistered hooks while the latter silently ignores them.</p>\n\n</div>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span>, </span><span class=\"param\"><span class=\"nb\">input</span><span class=\"p\">:</span> <span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">Tensor</span></span><span class=\"return-annotation\">) -> <span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">Tensor</span>:</span></span>", "funcdef": "def"}, "shimmer.modules.gw_module.GWEncoderLinear": {"fullname": "shimmer.modules.gw_module.GWEncoderLinear", "modulename": "shimmer.modules.gw_module", "qualname": "GWEncoderLinear", "kind": "class", "doc": "<p>A linear Encoder network used in GWModules.</p>\n", "bases": "torch.nn.modules.linear.Linear"}, "shimmer.modules.gw_module.GWEncoderLinear.forward": {"fullname": "shimmer.modules.gw_module.GWEncoderLinear.forward", "modulename": "shimmer.modules.gw_module", "qualname": "GWEncoderLinear.forward", "kind": "function", "doc": "<p>Define the computation performed at every call.</p>\n\n<p>Should be overridden by all subclasses.</p>\n\n<div class=\"pdoc-alert pdoc-alert-note\">\n\n<p>Although the recipe for forward pass needs to be defined within\nthis function, one should call the <code>Module</code> instance afterwards\ninstead of this since the former takes care of running the\nregistered hooks while the latter silently ignores them.</p>\n\n</div>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span>, </span><span class=\"param\"><span class=\"nb\">input</span><span class=\"p\">:</span> <span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">Tensor</span></span><span class=\"return-annotation\">) -> <span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">Tensor</span>:</span></span>", "funcdef": "def"}, "shimmer.modules.gw_module.GWModuleBase": {"fullname": "shimmer.modules.gw_module.GWModuleBase", "modulename": "shimmer.modules.gw_module", "qualname": "GWModuleBase", "kind": "class", "doc": "<p>Base class for GWModule.</p>\n\n<p>GWModule handles encoding, decoding the unimodal representations\nusing the <code>gw_encoders</code> and<code>gw_decoders</code>, and define\nsome common operations in GW like cycles and translations.</p>\n\n<p>This is an abstract class and should be implemented.\nFor an implemented interface, see <code>GWModule</code>.</p>\n", "bases": "torch.nn.modules.module.Module, abc.ABC"}, "shimmer.modules.gw_module.GWModuleBase.__init__": {"fullname": "shimmer.modules.gw_module.GWModuleBase.__init__", "modulename": "shimmer.modules.gw_module", "qualname": "GWModuleBase.__init__", "kind": "function", "doc": "<p>Initializes the GWModule.</p>\n\n<h6 id=\"arguments\">Arguments:</h6>\n\n<ul>\n<li><strong>domain_modules (<code>Mapping[str, DomainModule]</code>):</strong>  the domain modules.</li>\n<li><strong>workspace_dim (<code>int</code>):</strong>  dimension of the GW.</li>\n</ul>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">domain_mods</span><span class=\"p\">:</span> <span class=\"n\">collections</span><span class=\"o\">.</span><span class=\"n\">abc</span><span class=\"o\">.</span><span class=\"n\">Mapping</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"n\">shimmer</span><span class=\"o\">.</span><span class=\"n\">modules</span><span class=\"o\">.</span><span class=\"n\">domain</span><span class=\"o\">.</span><span class=\"n\">DomainModule</span><span class=\"p\">]</span>,</span><span class=\"param\">\t<span class=\"n\">workspace_dim</span><span class=\"p\">:</span> <span class=\"nb\">int</span>,</span><span class=\"param\">\t<span class=\"o\">*</span><span class=\"n\">args</span>,</span><span class=\"param\">\t<span class=\"o\">**</span><span class=\"n\">kwargs</span></span>)</span>"}, "shimmer.modules.gw_module.GWModuleBase.domain_mods": {"fullname": "shimmer.modules.gw_module.GWModuleBase.domain_mods", "modulename": "shimmer.modules.gw_module", "qualname": "GWModuleBase.domain_mods", "kind": "variable", "doc": "<p>The unimodal domain modules.</p>\n"}, "shimmer.modules.gw_module.GWModuleBase.workspace_dim": {"fullname": "shimmer.modules.gw_module.GWModuleBase.workspace_dim", "modulename": "shimmer.modules.gw_module", "qualname": "GWModuleBase.workspace_dim", "kind": "variable", "doc": "<p>Dimension of the GW</p>\n"}, "shimmer.modules.gw_module.GWModuleBase.fuse": {"fullname": "shimmer.modules.gw_module.GWModuleBase.fuse", "modulename": "shimmer.modules.gw_module", "qualname": "GWModuleBase.fuse", "kind": "function", "doc": "<p>Merge function used to combine domains.</p>\n\n<h6 id=\"arguments\">Arguments:</h6>\n\n<ul>\n<li><strong>x (<code>LatentsDomainGroupT</code>):</strong>  the group of latent representation.</li>\n<li><strong>selection_score (<code>Mapping[str, torch.Tensor]</code>):</strong>  attention scores to\nuse to encode the reprensetation.</li>\n</ul>\n\n<h6 id=\"returns\">Returns:</h6>\n\n<blockquote>\n  <p><code>torch.Tensor</code>: The merged representation.</p>\n</blockquote>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"bp\">self</span>,</span><span class=\"param\">\t<span class=\"n\">x</span><span class=\"p\">:</span> <span class=\"n\">collections</span><span class=\"o\">.</span><span class=\"n\">abc</span><span class=\"o\">.</span><span class=\"n\">Mapping</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">Tensor</span><span class=\"p\">]</span>,</span><span class=\"param\">\t<span class=\"n\">selection_scores</span><span class=\"p\">:</span> <span class=\"n\">collections</span><span class=\"o\">.</span><span class=\"n\">abc</span><span class=\"o\">.</span><span class=\"n\">Mapping</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">Tensor</span><span class=\"p\">]</span></span><span class=\"return-annotation\">) -> <span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">Tensor</span>:</span></span>", "funcdef": "def"}, "shimmer.modules.gw_module.GWModuleBase.encode": {"fullname": "shimmer.modules.gw_module.GWModuleBase.encode", "modulename": "shimmer.modules.gw_module", "qualname": "GWModuleBase.encode", "kind": "function", "doc": "<p>Encode the latent representation infos to the pre-fusion GW representation.</p>\n\n<h6 id=\"arguments\">Arguments:</h6>\n\n<ul>\n<li><strong>x (<code>LatentsDomainGroupT</code>):</strong>  the input domain representations</li>\n</ul>\n\n<h6 id=\"returns\">Returns:</h6>\n\n<blockquote>\n  <p><code>LatentsDomainGroupT</code>: pre-fusion GW representations</p>\n</blockquote>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"bp\">self</span>,</span><span class=\"param\">\t<span class=\"n\">x</span><span class=\"p\">:</span> <span class=\"n\">collections</span><span class=\"o\">.</span><span class=\"n\">abc</span><span class=\"o\">.</span><span class=\"n\">Mapping</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">Tensor</span><span class=\"p\">]</span></span><span class=\"return-annotation\">) -> <span class=\"nb\">dict</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">Tensor</span><span class=\"p\">]</span>:</span></span>", "funcdef": "def"}, "shimmer.modules.gw_module.GWModuleBase.encode_and_fuse": {"fullname": "shimmer.modules.gw_module.GWModuleBase.encode_and_fuse", "modulename": "shimmer.modules.gw_module", "qualname": "GWModuleBase.encode_and_fuse", "kind": "function", "doc": "<p>Encode the latent representation infos to the final GW representation.\nIt combines the encode and fuse methods.</p>\n\n<h6 id=\"arguments\">Arguments:</h6>\n\n<ul>\n<li><strong>x (<code>LatentsDomainGroupT</code>):</strong>  the input domain representations</li>\n<li><strong>selection_score (<code>Mapping[str, torch.Tensor]</code>):</strong>  attention scores to\nuse to encode the reprensetation.</li>\n</ul>\n\n<h6 id=\"returns\">Returns:</h6>\n\n<blockquote>\n  <p><code>torch.Tensor</code>: The merged representation.</p>\n</blockquote>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"bp\">self</span>,</span><span class=\"param\">\t<span class=\"n\">x</span><span class=\"p\">:</span> <span class=\"n\">collections</span><span class=\"o\">.</span><span class=\"n\">abc</span><span class=\"o\">.</span><span class=\"n\">Mapping</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">Tensor</span><span class=\"p\">]</span>,</span><span class=\"param\">\t<span class=\"n\">selection_module</span><span class=\"p\">:</span> <span class=\"n\">shimmer</span><span class=\"o\">.</span><span class=\"n\">modules</span><span class=\"o\">.</span><span class=\"n\">selection</span><span class=\"o\">.</span><span class=\"n\">SelectionBase</span></span><span class=\"return-annotation\">) -> <span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">Tensor</span>:</span></span>", "funcdef": "def"}, "shimmer.modules.gw_module.GWModuleBase.decode": {"fullname": "shimmer.modules.gw_module.GWModuleBase.decode", "modulename": "shimmer.modules.gw_module", "qualname": "GWModuleBase.decode", "kind": "function", "doc": "<p>Decode the GW representation into given <code>domains</code>.</p>\n\n<h6 id=\"arguments\">Arguments:</h6>\n\n<ul>\n<li><strong>z (<code>torch.Tensor</code>):</strong>  the GW representation.</li>\n<li><strong>domains (<code>Iterable[str]</code>):</strong>  iterable of domains to decode.</li>\n</ul>\n\n<h6 id=\"returns\">Returns:</h6>\n\n<blockquote>\n  <p><code>LatentsDomainGroupDT</code>: the decoded unimodal representations.</p>\n</blockquote>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"bp\">self</span>,</span><span class=\"param\">\t<span class=\"n\">z</span><span class=\"p\">:</span> <span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">Tensor</span>,</span><span class=\"param\">\t<span class=\"n\">domains</span><span class=\"p\">:</span> <span class=\"n\">collections</span><span class=\"o\">.</span><span class=\"n\">abc</span><span class=\"o\">.</span><span class=\"n\">Iterable</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span> <span class=\"o\">|</span> <span class=\"kc\">None</span> <span class=\"o\">=</span> <span class=\"kc\">None</span></span><span class=\"return-annotation\">) -> <span class=\"nb\">dict</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">Tensor</span><span class=\"p\">]</span>:</span></span>", "funcdef": "def"}, "shimmer.modules.gw_module.GWModule": {"fullname": "shimmer.modules.gw_module.GWModule", "modulename": "shimmer.modules.gw_module", "qualname": "GWModule", "kind": "class", "doc": "<p>GW nn.Module. Implements <code>GWModuleBase</code>.</p>\n", "bases": "GWModuleBase"}, "shimmer.modules.gw_module.GWModule.__init__": {"fullname": "shimmer.modules.gw_module.GWModule.__init__", "modulename": "shimmer.modules.gw_module", "qualname": "GWModule.__init__", "kind": "function", "doc": "<p>Initializes the GWModule.</p>\n\n<h6 id=\"arguments\">Arguments:</h6>\n\n<ul>\n<li><strong>domain_modules (<code>Mapping[str, DomainModule]</code>):</strong>  the domain modules.</li>\n<li><strong>workspace_dim (<code>int</code>):</strong>  dimension of the GW.</li>\n<li><strong>gw_encoders (<code>Mapping[str, torch.nn.Module]</code>):</strong>  mapping for each domain\nname to a an torch.nn.Module class that encodes a\nunimodal latent representations into a GW representation (pre fusion).</li>\n<li><strong>gw_decoders (<code>Mapping[str, torch.nn.Module]</code>):</strong>  mapping for each domain\nname to a an torch.nn.Module class that decodes a\n GW representation to a unimodal latent representation.</li>\n</ul>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">domain_modules</span><span class=\"p\">:</span> <span class=\"n\">collections</span><span class=\"o\">.</span><span class=\"n\">abc</span><span class=\"o\">.</span><span class=\"n\">Mapping</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"n\">shimmer</span><span class=\"o\">.</span><span class=\"n\">modules</span><span class=\"o\">.</span><span class=\"n\">domain</span><span class=\"o\">.</span><span class=\"n\">DomainModule</span><span class=\"p\">]</span>,</span><span class=\"param\">\t<span class=\"n\">workspace_dim</span><span class=\"p\">:</span> <span class=\"nb\">int</span>,</span><span class=\"param\">\t<span class=\"n\">gw_encoders</span><span class=\"p\">:</span> <span class=\"n\">collections</span><span class=\"o\">.</span><span class=\"n\">abc</span><span class=\"o\">.</span><span class=\"n\">Mapping</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">nn</span><span class=\"o\">.</span><span class=\"n\">modules</span><span class=\"o\">.</span><span class=\"n\">module</span><span class=\"o\">.</span><span class=\"n\">Module</span><span class=\"p\">]</span>,</span><span class=\"param\">\t<span class=\"n\">gw_decoders</span><span class=\"p\">:</span> <span class=\"n\">collections</span><span class=\"o\">.</span><span class=\"n\">abc</span><span class=\"o\">.</span><span class=\"n\">Mapping</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">nn</span><span class=\"o\">.</span><span class=\"n\">modules</span><span class=\"o\">.</span><span class=\"n\">module</span><span class=\"o\">.</span><span class=\"n\">Module</span><span class=\"p\">]</span></span>)</span>"}, "shimmer.modules.gw_module.GWModule.gw_encoders": {"fullname": "shimmer.modules.gw_module.GWModule.gw_encoders", "modulename": "shimmer.modules.gw_module", "qualname": "GWModule.gw_encoders", "kind": "variable", "doc": "<p>The module's encoders</p>\n"}, "shimmer.modules.gw_module.GWModule.gw_decoders": {"fullname": "shimmer.modules.gw_module.GWModule.gw_decoders", "modulename": "shimmer.modules.gw_module", "qualname": "GWModule.gw_decoders", "kind": "variable", "doc": "<p>The module's decoders</p>\n"}, "shimmer.modules.gw_module.GWModule.fuse": {"fullname": "shimmer.modules.gw_module.GWModule.fuse", "modulename": "shimmer.modules.gw_module", "qualname": "GWModule.fuse", "kind": "function", "doc": "<p>Merge function used to combine domains.</p>\n\n<h6 id=\"arguments\">Arguments:</h6>\n\n<ul>\n<li><strong>x (<code>LatentsDomainGroupT</code>):</strong>  the group of latent representation.</li>\n<li><strong>selection_score (<code>Mapping[str, torch.Tensor]</code>):</strong>  attention scores to\nuse to encode the reprensetation.</li>\n</ul>\n\n<h6 id=\"returns\">Returns:</h6>\n\n<blockquote>\n  <p><code>torch.Tensor</code>: The merged representation.</p>\n</blockquote>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"bp\">self</span>,</span><span class=\"param\">\t<span class=\"n\">x</span><span class=\"p\">:</span> <span class=\"n\">collections</span><span class=\"o\">.</span><span class=\"n\">abc</span><span class=\"o\">.</span><span class=\"n\">Mapping</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">Tensor</span><span class=\"p\">]</span>,</span><span class=\"param\">\t<span class=\"n\">selection_scores</span><span class=\"p\">:</span> <span class=\"n\">collections</span><span class=\"o\">.</span><span class=\"n\">abc</span><span class=\"o\">.</span><span class=\"n\">Mapping</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">Tensor</span><span class=\"p\">]</span></span><span class=\"return-annotation\">) -> <span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">Tensor</span>:</span></span>", "funcdef": "def"}, "shimmer.modules.gw_module.GWModule.encode": {"fullname": "shimmer.modules.gw_module.GWModule.encode", "modulename": "shimmer.modules.gw_module", "qualname": "GWModule.encode", "kind": "function", "doc": "<p>Encode the latent representation infos to the pre-fusion GW representation.</p>\n\n<h6 id=\"arguments\">Arguments:</h6>\n\n<ul>\n<li><strong>x (<code>LatentsDomainGroupT</code>):</strong>  the input domain representations.</li>\n</ul>\n\n<h6 id=\"returns\">Returns:</h6>\n\n<blockquote>\n  <p><code>LatentsDomainGroupT</code>: pre-fusion representation</p>\n</blockquote>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"bp\">self</span>,</span><span class=\"param\">\t<span class=\"n\">x</span><span class=\"p\">:</span> <span class=\"n\">collections</span><span class=\"o\">.</span><span class=\"n\">abc</span><span class=\"o\">.</span><span class=\"n\">Mapping</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">Tensor</span><span class=\"p\">]</span></span><span class=\"return-annotation\">) -> <span class=\"nb\">dict</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">Tensor</span><span class=\"p\">]</span>:</span></span>", "funcdef": "def"}, "shimmer.modules.gw_module.GWModule.decode": {"fullname": "shimmer.modules.gw_module.GWModule.decode", "modulename": "shimmer.modules.gw_module", "qualname": "GWModule.decode", "kind": "function", "doc": "<p>Decodes a GW representation to multiple domains.</p>\n\n<h6 id=\"arguments\">Arguments:</h6>\n\n<ul>\n<li><strong>z (<code>torch.Tensor</code>):</strong>  the GW representation</li>\n<li><strong>domains (<code>Iterable[str] | None</code>):</strong>  the domains to decode to. Defaults to\nuse keys in <code>gw_interfaces</code> (all domains).</li>\n</ul>\n\n<h6 id=\"returns\">Returns:</h6>\n\n<blockquote>\n  <p><code>LatentsDomainGroupDT</code>: decoded unimodal representation</p>\n</blockquote>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"bp\">self</span>,</span><span class=\"param\">\t<span class=\"n\">z</span><span class=\"p\">:</span> <span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">Tensor</span>,</span><span class=\"param\">\t<span class=\"n\">domains</span><span class=\"p\">:</span> <span class=\"n\">collections</span><span class=\"o\">.</span><span class=\"n\">abc</span><span class=\"o\">.</span><span class=\"n\">Iterable</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span> <span class=\"o\">|</span> <span class=\"kc\">None</span> <span class=\"o\">=</span> <span class=\"kc\">None</span></span><span class=\"return-annotation\">) -> <span class=\"nb\">dict</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">Tensor</span><span class=\"p\">]</span>:</span></span>", "funcdef": "def"}, "shimmer.modules.gw_module.compute_fusion_scores": {"fullname": "shimmer.modules.gw_module.compute_fusion_scores", "modulename": "shimmer.modules.gw_module", "qualname": "compute_fusion_scores", "kind": "function", "doc": "<p>Combine precision scores using std summation in quadrature</p>\n\n<p>The two scores should have the same dimension.</p>\n\n<h6 id=\"arguments\">Arguments:</h6>\n\n<ul>\n<li><strong>score_1 (<code>torch.Tensor</code>):</strong>  First scores.</li>\n<li><strong>score_2 (<code>torch.Tensor</code>):</strong>  Second scores.</li>\n<li><strong>sensitivity_1 (<code>float</code>):</strong>  sensitivity for the first score</li>\n<li><strong>sensitivity_2 (<code>float</code>):</strong>  sensitivity for the second score</li>\n<li><strong>eps (<code>float</code>):</strong>  a value added to avoid numerical unstability.</li>\n</ul>\n\n<h6 id=\"returns\">Returns:</h6>\n\n<blockquote>\n  <p><code>torch.Tensor</code>: the combined scores</p>\n</blockquote>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">score_1</span><span class=\"p\">:</span> <span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">Tensor</span>,</span><span class=\"param\">\t<span class=\"n\">score_2</span><span class=\"p\">:</span> <span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">Tensor</span>,</span><span class=\"param\">\t<span class=\"n\">sensitivity_1</span><span class=\"p\">:</span> <span class=\"nb\">float</span> <span class=\"o\">=</span> <span class=\"mf\">1.0</span>,</span><span class=\"param\">\t<span class=\"n\">sensitivity_2</span><span class=\"p\">:</span> <span class=\"nb\">float</span> <span class=\"o\">=</span> <span class=\"mf\">1.0</span>,</span><span class=\"param\">\t<span class=\"n\">eps</span><span class=\"p\">:</span> <span class=\"nb\">float</span> <span class=\"o\">=</span> <span class=\"mf\">1e-06</span></span><span class=\"return-annotation\">) -> <span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">Tensor</span>:</span></span>", "funcdef": "def"}, "shimmer.modules.gw_module.GWModuleBayesian": {"fullname": "shimmer.modules.gw_module.GWModuleBayesian", "modulename": "shimmer.modules.gw_module", "qualname": "GWModuleBayesian", "kind": "class", "doc": "<p><code>GWModule</code> with a Bayesian based uncertainty prediction.</p>\n", "bases": "GWModule"}, "shimmer.modules.gw_module.GWModuleBayesian.__init__": {"fullname": "shimmer.modules.gw_module.GWModuleBayesian.__init__", "modulename": "shimmer.modules.gw_module", "qualname": "GWModuleBayesian.__init__", "kind": "function", "doc": "<p>Initializes the GWModuleBayesian.</p>\n\n<h6 id=\"arguments\">Arguments:</h6>\n\n<ul>\n<li><strong>domain_modules (<code>Mapping[str, DomainModule]</code>):</strong>  the domain modules.</li>\n<li><strong>workspace_dim (<code>int</code>):</strong>  dimension of the GW.</li>\n<li><strong>gw_encoders (<code>Mapping[str, torch.nn.Module]</code>):</strong>  mapping for each domain\nname to a an torch.nn.Module class that encodes a\nunimodal latent representations into a GW representation (pre fusion).</li>\n<li><strong>gw_decoders (<code>Mapping[str, torch.nn.Module]</code>):</strong>  mapping for each domain\nname to a an torch.nn.Module class that decodes a\n GW representation to a unimodal latent representation.</li>\n<li><strong>sensitivity_selection (<code>float</code>):</strong>  sensivity coef $c'_1$</li>\n<li><strong>sensitivity_precision (<code>float</code>):</strong>  sensitivity coef $c'_2$</li>\n<li><strong>precision_softmax_temp (<code>float</code>):</strong>  temperature to use in softmax of\nprecision</li>\n</ul>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">domain_modules</span><span class=\"p\">:</span> <span class=\"n\">collections</span><span class=\"o\">.</span><span class=\"n\">abc</span><span class=\"o\">.</span><span class=\"n\">Mapping</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"n\">shimmer</span><span class=\"o\">.</span><span class=\"n\">modules</span><span class=\"o\">.</span><span class=\"n\">domain</span><span class=\"o\">.</span><span class=\"n\">DomainModule</span><span class=\"p\">]</span>,</span><span class=\"param\">\t<span class=\"n\">workspace_dim</span><span class=\"p\">:</span> <span class=\"nb\">int</span>,</span><span class=\"param\">\t<span class=\"n\">gw_encoders</span><span class=\"p\">:</span> <span class=\"n\">collections</span><span class=\"o\">.</span><span class=\"n\">abc</span><span class=\"o\">.</span><span class=\"n\">Mapping</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">nn</span><span class=\"o\">.</span><span class=\"n\">modules</span><span class=\"o\">.</span><span class=\"n\">module</span><span class=\"o\">.</span><span class=\"n\">Module</span><span class=\"p\">]</span>,</span><span class=\"param\">\t<span class=\"n\">gw_decoders</span><span class=\"p\">:</span> <span class=\"n\">collections</span><span class=\"o\">.</span><span class=\"n\">abc</span><span class=\"o\">.</span><span class=\"n\">Mapping</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">nn</span><span class=\"o\">.</span><span class=\"n\">modules</span><span class=\"o\">.</span><span class=\"n\">module</span><span class=\"o\">.</span><span class=\"n\">Module</span><span class=\"p\">]</span>,</span><span class=\"param\">\t<span class=\"n\">sensitivity_selection</span><span class=\"p\">:</span> <span class=\"nb\">float</span> <span class=\"o\">=</span> <span class=\"mi\">1</span>,</span><span class=\"param\">\t<span class=\"n\">sensitivity_precision</span><span class=\"p\">:</span> <span class=\"nb\">float</span> <span class=\"o\">=</span> <span class=\"mi\">1</span>,</span><span class=\"param\">\t<span class=\"n\">precision_softmax_temp</span><span class=\"p\">:</span> <span class=\"nb\">float</span> <span class=\"o\">=</span> <span class=\"mf\">0.01</span></span>)</span>"}, "shimmer.modules.gw_module.GWModuleBayesian.precisions": {"fullname": "shimmer.modules.gw_module.GWModuleBayesian.precisions", "modulename": "shimmer.modules.gw_module", "qualname": "GWModuleBayesian.precisions", "kind": "variable", "doc": "<p>Precision at the neuron level for every domain.</p>\n"}, "shimmer.modules.gw_module.GWModuleBayesian.sensitivity_selection": {"fullname": "shimmer.modules.gw_module.GWModuleBayesian.sensitivity_selection", "modulename": "shimmer.modules.gw_module", "qualname": "GWModuleBayesian.sensitivity_selection", "kind": "variable", "doc": "<p></p>\n"}, "shimmer.modules.gw_module.GWModuleBayesian.sensitivity_precision": {"fullname": "shimmer.modules.gw_module.GWModuleBayesian.sensitivity_precision", "modulename": "shimmer.modules.gw_module", "qualname": "GWModuleBayesian.sensitivity_precision", "kind": "variable", "doc": "<p></p>\n"}, "shimmer.modules.gw_module.GWModuleBayesian.precision_softmax_temp": {"fullname": "shimmer.modules.gw_module.GWModuleBayesian.precision_softmax_temp", "modulename": "shimmer.modules.gw_module", "qualname": "GWModuleBayesian.precision_softmax_temp", "kind": "variable", "doc": "<p></p>\n"}, "shimmer.modules.gw_module.GWModuleBayesian.get_precision": {"fullname": "shimmer.modules.gw_module.GWModuleBayesian.get_precision", "modulename": "shimmer.modules.gw_module", "qualname": "GWModuleBayesian.get_precision", "kind": "function", "doc": "<p>Get the precision vector of given domain and batch</p>\n\n<h6 id=\"arguments\">Arguments:</h6>\n\n<ul>\n<li><strong>domain (<code>str</code>):</strong> </li>\n<li><strong>x (<code>torch.Tensor</code>):</strong>  batch of inputs</li>\n</ul>\n\n<h6 id=\"returns\">Returns:</h6>\n\n<blockquote>\n  <p><code>torch.Tensor</code>: batch of precision</p>\n</blockquote>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span>, </span><span class=\"param\"><span class=\"n\">domain</span><span class=\"p\">:</span> <span class=\"nb\">str</span>, </span><span class=\"param\"><span class=\"n\">x</span><span class=\"p\">:</span> <span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">Tensor</span></span><span class=\"return-annotation\">) -> <span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">Tensor</span>:</span></span>", "funcdef": "def"}, "shimmer.modules.gw_module.GWModuleBayesian.fuse": {"fullname": "shimmer.modules.gw_module.GWModuleBayesian.fuse", "modulename": "shimmer.modules.gw_module", "qualname": "GWModuleBayesian.fuse", "kind": "function", "doc": "<p>Merge function used to combine domains.</p>\n\n<p>In the following, $D$ is the number of domains, $N$ the batch size, and $d$ the\ndimension of the Global Workspace.</p>\n\n<p>This function needs to merge two kind of scores:</p>\n\n<ul>\n<li>the selection scores $a\\in [0,1]^{D\\times N}$;</li>\n<li>the precision scores $b \\in [0,1]^{D\\times N \\times d}$.</li>\n</ul>\n\n<div class=\"pdoc-alert pdoc-alert-note\">\n\n<p>The precision score is obtained by predicting logits and using a softmax</p>\n\n</div>\n\n<p>We can obtain associated uncertainties to the scores by introducing a std\nvariable and using bayesian integration:</p>\n\n<p>$$a_k = \\frac{M_1}{\\sigma_k^2}$$\nwhere $M_1 = \\frac{1}{\\sum_{i=1}^D \\frac{1}{\\sigma_i^2}}$.</p>\n\n<p>Similarly,\n$$b_k = \\frac{M_2}{\\mu_k^2}$$\nwhere $M_2 = \\frac{1}{\\sum_{i=1}^D \\frac{1}{\\mu_i^2}}$.</p>\n\n<p>The we can sum the variances to obtain the final uncertainty (squared) $\\xi$:\n$$\\xi_k^2 = c_1 \\sigma_k^2 + c_2 \\mu_k^2$$</p>\n\n<p>which, in terms of $a_k$ and $b_k$ yields:\n$$\\xi_k^2 = \\frac{c'_1}{a_k} + \\frac{c'_2}{b_k}$$\nwhere $c'_1 = c_1 \\cdot M_1$ and $c'_2 = c_2 \\cdot M_2$.</p>\n\n<p>Finally, the finale combined coefficient is\n$$\\lambda_k = \\frac{M_3}{\\frac{c'_1}{a_k} + \\frac{c'_2}{b_k}}$$\nwhere\n$$M_3 = \\frac{1}{\\sum_{i=1}^D\n    \\frac{1}{\\frac{c'_1}{a_i} + \\frac{c'_2}{b_i}}}$$</p>\n\n<h6 id=\"arguments\">Arguments:</h6>\n\n<ul>\n<li><strong>x (<code>LatentsDomainGroupT</code>):</strong>  the group of latent representation.</li>\n<li><strong>selection_score (<code>Mapping[str, torch.Tensor]</code>):</strong>  attention scores to\nuse to encode the reprensetation.</li>\n</ul>\n\n<h6 id=\"returns\">Returns:</h6>\n\n<blockquote>\n  <p><code>torch.Tensor</code>: The merged representation.</p>\n</blockquote>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"bp\">self</span>,</span><span class=\"param\">\t<span class=\"n\">x</span><span class=\"p\">:</span> <span class=\"n\">collections</span><span class=\"o\">.</span><span class=\"n\">abc</span><span class=\"o\">.</span><span class=\"n\">Mapping</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">Tensor</span><span class=\"p\">]</span>,</span><span class=\"param\">\t<span class=\"n\">selection_scores</span><span class=\"p\">:</span> <span class=\"n\">collections</span><span class=\"o\">.</span><span class=\"n\">abc</span><span class=\"o\">.</span><span class=\"n\">Mapping</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">Tensor</span><span class=\"p\">]</span></span><span class=\"return-annotation\">) -> <span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">Tensor</span>:</span></span>", "funcdef": "def"}, "shimmer.modules.selection": {"fullname": "shimmer.modules.selection", "modulename": "shimmer.modules.selection", "kind": "module", "doc": "<p></p>\n"}, "shimmer.modules.selection.SelectionBase": {"fullname": "shimmer.modules.selection.SelectionBase", "modulename": "shimmer.modules.selection", "qualname": "SelectionBase", "kind": "class", "doc": "<p>This is the base class for the selection mechanism.\nThe selection mechanisms handles the \"competition\" between modules and <em>selects</em>\nfusion coefficients for the domains.</p>\n", "bases": "torch.nn.modules.module.Module, abc.ABC"}, "shimmer.modules.selection.SelectionBase.update_gw_state": {"fullname": "shimmer.modules.selection.SelectionBase.update_gw_state", "modulename": "shimmer.modules.selection", "qualname": "SelectionBase.update_gw_state", "kind": "function", "doc": "<p>Update the internal copy of the previous GW state.\nBy default, this is not implemented and will raise an error if used.</p>\n\n<p>:note..\n    This is not defined as an abstractmethod as some selection method may\n    not need it.</p>\n\n<h6 id=\"arguments\">Arguments:</h6>\n\n<ul>\n<li><strong>gw_state (<code>torch.Tensor</code>):</strong>  the previous GW state</li>\n</ul>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span>, </span><span class=\"param\"><span class=\"n\">gw_state</span><span class=\"p\">:</span> <span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">Tensor</span></span><span class=\"return-annotation\">) -> <span class=\"kc\">None</span>:</span></span>", "funcdef": "def"}, "shimmer.modules.selection.SelectionBase.forward": {"fullname": "shimmer.modules.selection.SelectionBase.forward", "modulename": "shimmer.modules.selection", "qualname": "SelectionBase.forward", "kind": "function", "doc": "<p>Forward pass of the selection method.</p>\n\n<h6 id=\"arguments\">Arguments:</h6>\n\n<ul>\n<li><strong>domains (<code>LatentsDomainGroupT</code>):</strong>  Group of unimodal latent representations.</li>\n</ul>\n\n<h6 id=\"returns\">Returns:</h6>\n\n<blockquote>\n  <p><code>dict[str, torch.Tensor]</code>: for each domain in the group, the fusion\n  coefficient for each item in the batch.</p>\n</blockquote>\n\n<h6 id=\"example\">Example:</h6>\n\n<blockquote>\n  <div class=\"pdoc-code codehilite\">\n<pre><span></span><code><span class=\"gp\">&gt;&gt;&gt; </span><span class=\"n\">SomeSelectionImplementation</span><span class=\"p\">()</span><span class=\"o\">.</span><span class=\"n\">forward</span><span class=\"p\">(</span>\n<span class=\"gp\">... </span>    <span class=\"p\">{</span><span class=\"s2\">&quot;v&quot;</span><span class=\"p\">:</span> <span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">randn</span><span class=\"p\">(</span><span class=\"mi\">3</span><span class=\"p\">,</span> <span class=\"mi\">4</span><span class=\"p\">),</span> <span class=\"s2\">&quot;t&quot;</span><span class=\"p\">:</span> <span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">randn</span><span class=\"p\">(</span><span class=\"mi\">3</span><span class=\"p\">,</span> <span class=\"mi\">8</span><span class=\"p\">)}</span>\n<span class=\"gp\">... </span><span class=\"p\">)</span>\n<span class=\"go\">{&quot;v&quot;: torch.Tensor([0.0, 0.4, 1.0]), &quot;t&quot;: torch.Tensor([1.0, 0.6, 0.0])}</span>\n</code></pre>\n  </div>\n</blockquote>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"bp\">self</span>,</span><span class=\"param\">\t<span class=\"n\">domains</span><span class=\"p\">:</span> <span class=\"n\">collections</span><span class=\"o\">.</span><span class=\"n\">abc</span><span class=\"o\">.</span><span class=\"n\">Mapping</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">Tensor</span><span class=\"p\">]</span>,</span><span class=\"param\">\t<span class=\"n\">encodings_pre_fusion</span><span class=\"p\">:</span> <span class=\"n\">collections</span><span class=\"o\">.</span><span class=\"n\">abc</span><span class=\"o\">.</span><span class=\"n\">Mapping</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">Tensor</span><span class=\"p\">]</span></span><span class=\"return-annotation\">) -> <span class=\"nb\">dict</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">Tensor</span><span class=\"p\">]</span>:</span></span>", "funcdef": "def"}, "shimmer.modules.selection.SingleDomainSelection": {"fullname": "shimmer.modules.selection.SingleDomainSelection", "modulename": "shimmer.modules.selection", "qualname": "SingleDomainSelection", "kind": "class", "doc": "<p>This selection mechanism handles groups that can have multiple domains, but always\nreturn a selection of 1 domain from the group with a uniform distribution.</p>\n\n<p>For example, if the group has 2 domains, there is a 50% chance of selecting each\ndomain.</p>\n", "bases": "SelectionBase"}, "shimmer.modules.selection.SingleDomainSelection.forward": {"fullname": "shimmer.modules.selection.SingleDomainSelection.forward", "modulename": "shimmer.modules.selection", "qualname": "SingleDomainSelection.forward", "kind": "function", "doc": "<p>Forward pass of the module.</p>\n\n<h6 id=\"arguments\">Arguments:</h6>\n\n<ul>\n<li><strong>domains (<code>LatentsDomainGroupT</code>):</strong>  input unimodal latent representations</li>\n<li><strong>gw_state (<code>torch.Tensor</code>):</strong>  the previous GW state</li>\n</ul>\n\n<h6 id=\"returns\">Returns:</h6>\n\n<blockquote>\n  <p><code>dict[str, torch.Tensor]</code>: whether the domain is selected for each input\n  in the batch.</p>\n</blockquote>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"bp\">self</span>,</span><span class=\"param\">\t<span class=\"n\">domains</span><span class=\"p\">:</span> <span class=\"n\">collections</span><span class=\"o\">.</span><span class=\"n\">abc</span><span class=\"o\">.</span><span class=\"n\">Mapping</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">Tensor</span><span class=\"p\">]</span>,</span><span class=\"param\">\t<span class=\"n\">encodings_pre_fusion</span><span class=\"p\">:</span> <span class=\"n\">collections</span><span class=\"o\">.</span><span class=\"n\">abc</span><span class=\"o\">.</span><span class=\"n\">Mapping</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">Tensor</span><span class=\"p\">]</span></span><span class=\"return-annotation\">) -> <span class=\"nb\">dict</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">Tensor</span><span class=\"p\">]</span>:</span></span>", "funcdef": "def"}, "shimmer.modules.selection.FixedSharedSelection": {"fullname": "shimmer.modules.selection.FixedSharedSelection", "modulename": "shimmer.modules.selection", "qualname": "FixedSharedSelection", "kind": "class", "doc": "<p>This selection mechanism is deterministic and always shares the weights equally\nbetween domains.</p>\n\n<p>For example, if 2 domains, it gives 0.5 for each; 3 domains, 1/3 for each...</p>\n", "bases": "SelectionBase"}, "shimmer.modules.selection.FixedSharedSelection.forward": {"fullname": "shimmer.modules.selection.FixedSharedSelection.forward", "modulename": "shimmer.modules.selection", "qualname": "FixedSharedSelection.forward", "kind": "function", "doc": "<p>Forward pass of the module.</p>\n\n<h6 id=\"arguments\">Arguments:</h6>\n\n<ul>\n<li><strong>domains (<code>LatentsDomainGroupT</code>):</strong>  input unimodal latent representations</li>\n<li><strong>gw_state (<code>torch.Tensor</code>):</strong>  the previous GW state</li>\n</ul>\n\n<h6 id=\"returns\">Returns:</h6>\n\n<blockquote>\n  <p><code>dict[str, torch.Tensor]</code>: whether the domain is selected for each input\n  in the batch.</p>\n</blockquote>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"bp\">self</span>,</span><span class=\"param\">\t<span class=\"n\">domains</span><span class=\"p\">:</span> <span class=\"n\">collections</span><span class=\"o\">.</span><span class=\"n\">abc</span><span class=\"o\">.</span><span class=\"n\">Mapping</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">Tensor</span><span class=\"p\">]</span>,</span><span class=\"param\">\t<span class=\"n\">encodings_pre_fusion</span><span class=\"p\">:</span> <span class=\"n\">collections</span><span class=\"o\">.</span><span class=\"n\">abc</span><span class=\"o\">.</span><span class=\"n\">Mapping</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">Tensor</span><span class=\"p\">]</span></span><span class=\"return-annotation\">) -> <span class=\"nb\">dict</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">Tensor</span><span class=\"p\">]</span>:</span></span>", "funcdef": "def"}, "shimmer.modules.selection.KQFixedQSelection": {"fullname": "shimmer.modules.selection.KQFixedQSelection", "modulename": "shimmer.modules.selection", "qualname": "KQFixedQSelection", "kind": "class", "doc": "<p>Key-Query attention with a fixed gw vector.</p>\n", "bases": "SelectionBase"}, "shimmer.modules.selection.KQFixedQSelection.__init__": {"fullname": "shimmer.modules.selection.KQFixedQSelection.__init__", "modulename": "shimmer.modules.selection", "qualname": "KQFixedQSelection.__init__", "kind": "function", "doc": "<h6 id=\"arguments\">Arguments:</h6>\n\n<ul>\n<li><strong>head_size (<code>int</code>) :</strong>  dimension of the key and query vectors.</li>\n<li><strong>domain_dim (<code>int</code>) :</strong>  dimension of the input dims (assumed to be the same\nfor now)</li>\n<li><strong>domain_names  (<code>Iterable[str]</code>) :</strong>  list of input domains</li>\n</ul>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">head_size</span><span class=\"p\">:</span> <span class=\"nb\">int</span>,</span><span class=\"param\">\t<span class=\"n\">domain_dim</span><span class=\"p\">:</span> <span class=\"nb\">int</span>,</span><span class=\"param\">\t<span class=\"n\">domain_names</span><span class=\"p\">:</span> <span class=\"n\">collections</span><span class=\"o\">.</span><span class=\"n\">abc</span><span class=\"o\">.</span><span class=\"n\">Iterable</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span></span>)</span>"}, "shimmer.modules.selection.KQFixedQSelection.head_size": {"fullname": "shimmer.modules.selection.KQFixedQSelection.head_size", "modulename": "shimmer.modules.selection", "qualname": "KQFixedQSelection.head_size", "kind": "variable", "doc": "<p></p>\n"}, "shimmer.modules.selection.KQFixedQSelection.query_layer": {"fullname": "shimmer.modules.selection.KQFixedQSelection.query_layer", "modulename": "shimmer.modules.selection", "qualname": "KQFixedQSelection.query_layer", "kind": "variable", "doc": "<p></p>\n"}, "shimmer.modules.selection.KQFixedQSelection.key_layers": {"fullname": "shimmer.modules.selection.KQFixedQSelection.key_layers", "modulename": "shimmer.modules.selection", "qualname": "KQFixedQSelection.key_layers", "kind": "variable", "doc": "<p></p>\n"}, "shimmer.modules.selection.KQFixedQSelection.forward": {"fullname": "shimmer.modules.selection.KQFixedQSelection.forward", "modulename": "shimmer.modules.selection", "qualname": "KQFixedQSelection.forward", "kind": "function", "doc": "<p>Compute keys and queries, match them with dot product and softmax.\nDoes this twice, once with the static query and once with a dynamic query.</p>\n\n<h6 id=\"arguments\">Arguments:</h6>\n\n<ul>\n<li><strong>domains (<code>LatentsDomainGroupT</code>):</strong>  Group of unimodal latent representations.</li>\n<li><strong>encodings (<code>LatentsDomainGroupT</code>):</strong>  Group of pre-fusion encodings.</li>\n</ul>\n\n<h6 id=\"returns\">Returns:</h6>\n\n<blockquote>\n  <p><code>dict[str, torch.Tensor]</code>: the attention scores for each domain in the\n  group.</p>\n</blockquote>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"bp\">self</span>,</span><span class=\"param\">\t<span class=\"n\">domains</span><span class=\"p\">:</span> <span class=\"n\">collections</span><span class=\"o\">.</span><span class=\"n\">abc</span><span class=\"o\">.</span><span class=\"n\">Mapping</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">Tensor</span><span class=\"p\">]</span>,</span><span class=\"param\">\t<span class=\"n\">encodings_pre_fusion</span><span class=\"p\">:</span> <span class=\"n\">collections</span><span class=\"o\">.</span><span class=\"n\">abc</span><span class=\"o\">.</span><span class=\"n\">Mapping</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">Tensor</span><span class=\"p\">]</span></span><span class=\"return-annotation\">) -> <span class=\"nb\">dict</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">Tensor</span><span class=\"p\">]</span>:</span></span>", "funcdef": "def"}, "shimmer.modules.selection.RandomSelection": {"fullname": "shimmer.modules.selection.RandomSelection", "modulename": "shimmer.modules.selection", "qualname": "RandomSelection", "kind": "class", "doc": "<p>Modified random attention to only utilize uniform-softmax scores across modalities.\nThis version omits the binary scaling factors and focuses on generating attention\ncoefficients using a uniform distribution followed by a domain-wise softmax.</p>\n", "bases": "SelectionBase"}, "shimmer.modules.selection.RandomSelection.__init__": {"fullname": "shimmer.modules.selection.RandomSelection.__init__", "modulename": "shimmer.modules.selection", "qualname": "RandomSelection.__init__", "kind": "function", "doc": "<h6 id=\"arguments\">Arguments:</h6>\n\n<ul>\n<li><strong>temperature (<code>float</code>):</strong>  Temperature of the softmax applied to uniform\nscaling factors.</li>\n</ul>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">temperature</span><span class=\"p\">:</span> <span class=\"nb\">float</span></span>)</span>"}, "shimmer.modules.selection.RandomSelection.temperature": {"fullname": "shimmer.modules.selection.RandomSelection.temperature", "modulename": "shimmer.modules.selection", "qualname": "RandomSelection.temperature", "kind": "variable", "doc": "<p></p>\n"}, "shimmer.modules.selection.RandomSelection.forward": {"fullname": "shimmer.modules.selection.RandomSelection.forward", "modulename": "shimmer.modules.selection", "qualname": "RandomSelection.forward", "kind": "function", "doc": "<p>Generate uniform-then-domain-wise-softmaxed samples for each domain.</p>\n\n<h6 id=\"arguments\">Arguments:</h6>\n\n<ul>\n<li><strong>domains (<code>LatentsDomainGroupT</code>):</strong>  Group of unimodal latent representations.\nThis is not used in the function directly but determines the structure\nof the returned attention coefficients.</li>\n</ul>\n\n<h6 id=\"returns\">Returns:</h6>\n\n<blockquote>\n  <p><code>dict[str, torch.Tensor]</code>: For each domain in the group, the fusion\n  coefficient for each item in the batch, based solely on\n  uniform-softmax scores.</p>\n</blockquote>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"bp\">self</span>,</span><span class=\"param\">\t<span class=\"n\">domains</span><span class=\"p\">:</span> <span class=\"n\">collections</span><span class=\"o\">.</span><span class=\"n\">abc</span><span class=\"o\">.</span><span class=\"n\">Mapping</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">Tensor</span><span class=\"p\">]</span>,</span><span class=\"param\">\t<span class=\"n\">encodings_pre_fusion</span><span class=\"p\">:</span> <span class=\"n\">collections</span><span class=\"o\">.</span><span class=\"n\">abc</span><span class=\"o\">.</span><span class=\"n\">Mapping</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">Tensor</span><span class=\"p\">]</span></span><span class=\"return-annotation\">) -> <span class=\"nb\">dict</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">Tensor</span><span class=\"p\">]</span>:</span></span>", "funcdef": "def"}, "shimmer.modules.selection.DynamicQueryAttention": {"fullname": "shimmer.modules.selection.DynamicQueryAttention", "modulename": "shimmer.modules.selection", "qualname": "DynamicQueryAttention", "kind": "class", "doc": "<p>Key-Query attention with a dynamic gw vector.\nThe query is updated based on the scaled gw vector.</p>\n", "bases": "SelectionBase"}, "shimmer.modules.selection.DynamicQueryAttention.__init__": {"fullname": "shimmer.modules.selection.DynamicQueryAttention.__init__", "modulename": "shimmer.modules.selection", "qualname": "DynamicQueryAttention.__init__", "kind": "function", "doc": "<h6 id=\"arguments\">Arguments:</h6>\n\n<ul>\n<li><strong>head_size (<code>int</code>) :</strong>  dimension of the key and query vectors.</li>\n<li><strong>domain_dim (<code>int</code>) :</strong>  dimension of the input dims (assumed to be the same\nfor now)</li>\n<li><strong>domain_names  (<code>Iterable[str]</code>) :</strong>  list of input domains</li>\n</ul>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">head_size</span><span class=\"p\">:</span> <span class=\"nb\">int</span>,</span><span class=\"param\">\t<span class=\"n\">domain_dim</span><span class=\"p\">:</span> <span class=\"nb\">int</span>,</span><span class=\"param\">\t<span class=\"n\">domain_names</span><span class=\"p\">:</span> <span class=\"n\">collections</span><span class=\"o\">.</span><span class=\"n\">abc</span><span class=\"o\">.</span><span class=\"n\">Iterable</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span></span>)</span>"}, "shimmer.modules.selection.DynamicQueryAttention.head_size": {"fullname": "shimmer.modules.selection.DynamicQueryAttention.head_size", "modulename": "shimmer.modules.selection", "qualname": "DynamicQueryAttention.head_size", "kind": "variable", "doc": "<p></p>\n"}, "shimmer.modules.selection.DynamicQueryAttention.query_layer": {"fullname": "shimmer.modules.selection.DynamicQueryAttention.query_layer", "modulename": "shimmer.modules.selection", "qualname": "DynamicQueryAttention.query_layer", "kind": "variable", "doc": "<p></p>\n"}, "shimmer.modules.selection.DynamicQueryAttention.key_layers": {"fullname": "shimmer.modules.selection.DynamicQueryAttention.key_layers", "modulename": "shimmer.modules.selection", "qualname": "DynamicQueryAttention.key_layers", "kind": "variable", "doc": "<p></p>\n"}, "shimmer.modules.selection.DynamicQueryAttention.fuse_weighted_encodings": {"fullname": "shimmer.modules.selection.DynamicQueryAttention.fuse_weighted_encodings", "modulename": "shimmer.modules.selection", "qualname": "DynamicQueryAttention.fuse_weighted_encodings", "kind": "function", "doc": "<p>Fuse the weighted encodings using the attention scores.</p>\n\n<h6 id=\"arguments\">Arguments:</h6>\n\n<ul>\n<li><strong>encodings (<code>LatentsDomainGroupT</code>):</strong>  Unimodal latent representation</li>\n<li><strong>attention_dict (<code>dict[str, torch.Tensor]</code>):</strong>  The attention scores for each\ndomain in the group.</li>\n</ul>\n\n<h6 id=\"returns\">Returns:</h6>\n\n<blockquote>\n  <p><code>torch.Tensor</code>: The fused tensor.</p>\n</blockquote>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"bp\">self</span>,</span><span class=\"param\">\t<span class=\"n\">encodings</span><span class=\"p\">:</span> <span class=\"n\">collections</span><span class=\"o\">.</span><span class=\"n\">abc</span><span class=\"o\">.</span><span class=\"n\">Mapping</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">Tensor</span><span class=\"p\">]</span>,</span><span class=\"param\">\t<span class=\"n\">attention_dict</span><span class=\"p\">:</span> <span class=\"nb\">dict</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">Tensor</span><span class=\"p\">]</span></span><span class=\"return-annotation\">) -> <span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">Tensor</span>:</span></span>", "funcdef": "def"}, "shimmer.modules.selection.DynamicQueryAttention.forward": {"fullname": "shimmer.modules.selection.DynamicQueryAttention.forward", "modulename": "shimmer.modules.selection", "qualname": "DynamicQueryAttention.forward", "kind": "function", "doc": "<p>Compute keys and queries, match them with dot product and softmax.\nDoes this twice, once with the static query and once with a dynamic query.</p>\n\n<h6 id=\"arguments\">Arguments:</h6>\n\n<ul>\n<li><strong>domains (<code>LatentsDomainGroupT</code>):</strong>  Group of unimodal latent representations.</li>\n<li><strong>encodings (<code>LatentsDomainGroupT</code>):</strong>  Group of pre-fusion encodings.</li>\n</ul>\n\n<h6 id=\"returns\">Returns:</h6>\n\n<blockquote>\n  <p><code>dict[str, torch.Tensor]</code>: the attention scores for each domain in the\n  group.</p>\n</blockquote>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"bp\">self</span>,</span><span class=\"param\">\t<span class=\"n\">domains</span><span class=\"p\">:</span> <span class=\"n\">collections</span><span class=\"o\">.</span><span class=\"n\">abc</span><span class=\"o\">.</span><span class=\"n\">Mapping</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">Tensor</span><span class=\"p\">]</span>,</span><span class=\"param\">\t<span class=\"n\">encodings_pre_fusion</span><span class=\"p\">:</span> <span class=\"n\">collections</span><span class=\"o\">.</span><span class=\"n\">abc</span><span class=\"o\">.</span><span class=\"n\">Mapping</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">Tensor</span><span class=\"p\">]</span></span><span class=\"return-annotation\">) -> <span class=\"nb\">dict</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">Tensor</span><span class=\"p\">]</span>:</span></span>", "funcdef": "def"}, "shimmer.modules.losses": {"fullname": "shimmer.modules.losses", "modulename": "shimmer.modules.losses", "kind": "module", "doc": "<p></p>\n"}, "shimmer.modules.losses.GWLossesBase": {"fullname": "shimmer.modules.losses.GWLossesBase", "modulename": "shimmer.modules.losses", "qualname": "GWLossesBase", "kind": "class", "doc": "<p>Base Abstract Class for Global Workspace (GW) losses. This module is used\nto compute the different losses of the GW (typically translation, cycle,\ndemi-cycle, contrastive losses).</p>\n", "bases": "torch.nn.modules.module.Module, abc.ABC"}, "shimmer.modules.losses.GWLossesBase.step": {"fullname": "shimmer.modules.losses.GWLossesBase.step", "modulename": "shimmer.modules.losses", "qualname": "GWLossesBase.step", "kind": "function", "doc": "<p>Computes the losses.</p>\n\n<h6 id=\"arguments\">Arguments:</h6>\n\n<ul>\n<li><strong>domain_latents (<code>LatentsDomainGroupsT</code>):</strong>  All latent groups</li>\n<li><strong>mode (<code>Literal[\"train\", \"val\", \"test\", \"val/ood\", \"test/ood\"]</code>):</strong>  model mode</li>\n</ul>\n\n<h6 id=\"returns\">Returns:</h6>\n\n<blockquote>\n  <p><code>LossOutput</code>: the losses</p>\n</blockquote>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"bp\">self</span>,</span><span class=\"param\">\t<span class=\"n\">domain_latents</span><span class=\"p\">:</span> <span class=\"n\">collections</span><span class=\"o\">.</span><span class=\"n\">abc</span><span class=\"o\">.</span><span class=\"n\">Mapping</span><span class=\"p\">[</span><span class=\"nb\">frozenset</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">],</span> <span class=\"n\">collections</span><span class=\"o\">.</span><span class=\"n\">abc</span><span class=\"o\">.</span><span class=\"n\">Mapping</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">Tensor</span><span class=\"p\">]]</span>,</span><span class=\"param\">\t<span class=\"n\">mode</span><span class=\"p\">:</span> <span class=\"n\">Literal</span><span class=\"p\">[</span><span class=\"s1\">&#39;train&#39;</span><span class=\"p\">,</span> <span class=\"s1\">&#39;val&#39;</span><span class=\"p\">,</span> <span class=\"s1\">&#39;test&#39;</span><span class=\"p\">,</span> <span class=\"s1\">&#39;val/ood&#39;</span><span class=\"p\">,</span> <span class=\"s1\">&#39;test/ood&#39;</span><span class=\"p\">]</span></span><span class=\"return-annotation\">) -> <span class=\"n\">shimmer</span><span class=\"o\">.</span><span class=\"n\">modules</span><span class=\"o\">.</span><span class=\"n\">domain</span><span class=\"o\">.</span><span class=\"n\">LossOutput</span>:</span></span>", "funcdef": "def"}, "shimmer.modules.losses.demi_cycle_loss": {"fullname": "shimmer.modules.losses.demi_cycle_loss", "modulename": "shimmer.modules.losses", "qualname": "demi_cycle_loss", "kind": "function", "doc": "<p>Computes the demi-cycle loss.</p>\n\n<h6 id=\"this-return-multiple-metrics\">This return multiple metrics:</h6>\n\n<blockquote>\n  <ul>\n  <li><code>demi_cycle_{domain_name}</code> with the demi-cycle of a particular domain;</li>\n  <li><code>demi_cycle_{domain_name}_{metric}</code> with additional metrics provided by\n  the domain_mod's <code>compute_dcy_loss</code> output;</li>\n  <li><code>demi_cycles</code> with the average value of all <code>demi_cycle_{domain_name}</code> values.</li>\n  </ul>\n</blockquote>\n\n<h6 id=\"arguments\">Arguments:</h6>\n\n<ul>\n<li><strong>gw_mod (<code>shimmer.modules.gw_module.GWModuleBase</code>):</strong>  The GWModule to use</li>\n<li><strong>selection_mod (<code>shimmer.modules.selection.SelectionBase</code>):</strong>  Selection mod to use</li>\n<li><strong>domain_mods (<code>Mapping[str, DomainModule]</code>):</strong>  the domain modules</li>\n<li><strong>latent_domains (<code>shimmer.types.LatentsDomainGroupsT</code>):</strong>  the latent unimodal\ngroups</li>\n</ul>\n\n<h6 id=\"returns\">Returns:</h6>\n\n<blockquote>\n  <p><code>dict[str, torch.Tensor]</code>: a dict of metrics.</p>\n</blockquote>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">gw_mod</span><span class=\"p\">:</span> <span class=\"n\">shimmer</span><span class=\"o\">.</span><span class=\"n\">modules</span><span class=\"o\">.</span><span class=\"n\">gw_module</span><span class=\"o\">.</span><span class=\"n\">GWModuleBase</span>,</span><span class=\"param\">\t<span class=\"n\">selection_mod</span><span class=\"p\">:</span> <span class=\"n\">shimmer</span><span class=\"o\">.</span><span class=\"n\">modules</span><span class=\"o\">.</span><span class=\"n\">selection</span><span class=\"o\">.</span><span class=\"n\">SelectionBase</span>,</span><span class=\"param\">\t<span class=\"n\">domain_mods</span><span class=\"p\">:</span> <span class=\"n\">collections</span><span class=\"o\">.</span><span class=\"n\">abc</span><span class=\"o\">.</span><span class=\"n\">Mapping</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"n\">shimmer</span><span class=\"o\">.</span><span class=\"n\">modules</span><span class=\"o\">.</span><span class=\"n\">domain</span><span class=\"o\">.</span><span class=\"n\">DomainModule</span><span class=\"p\">]</span>,</span><span class=\"param\">\t<span class=\"n\">latent_domains</span><span class=\"p\">:</span> <span class=\"n\">collections</span><span class=\"o\">.</span><span class=\"n\">abc</span><span class=\"o\">.</span><span class=\"n\">Mapping</span><span class=\"p\">[</span><span class=\"nb\">frozenset</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">],</span> <span class=\"n\">collections</span><span class=\"o\">.</span><span class=\"n\">abc</span><span class=\"o\">.</span><span class=\"n\">Mapping</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">Tensor</span><span class=\"p\">]]</span></span><span class=\"return-annotation\">) -> <span class=\"nb\">dict</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">Tensor</span><span class=\"p\">]</span>:</span></span>", "funcdef": "def"}, "shimmer.modules.losses.cycle_loss": {"fullname": "shimmer.modules.losses.cycle_loss", "modulename": "shimmer.modules.losses", "qualname": "cycle_loss", "kind": "function", "doc": "<p>Computes the cycle loss.</p>\n\n<h6 id=\"this-return-multiple-metrics\">This return multiple metrics:</h6>\n\n<blockquote>\n  <ul>\n  <li><code>cycle_{domain_source}_through_{domain_target}</code> with the cycle of\n  a particular domain;</li>\n  <li><code>cycle_{domain_source}_through_{domain_target}_{metric}</code> with additional\n  metrics provided by the domain_mod's <code>compute_cy_loss</code> output;</li>\n  <li><code>cycles</code> with the average value of all\n  <code>cycle_{domain_source}_through_{domain_target}</code> values.</li>\n  </ul>\n</blockquote>\n\n<h6 id=\"arguments\">Arguments:</h6>\n\n<ul>\n<li><strong>gw_mod (<code>GWModuleBase</code>):</strong>  The GWModule to use</li>\n<li><strong>selection_mod (<code>shimmer.modules.selection.SelectionBase</code>):</strong>  Selection mod to use</li>\n<li><strong>domain_mods (<code>Mapping[str, DomainModule]</code>):</strong>  the domain modules</li>\n<li><strong>latent_domains (<code>LatentsDomainGroupsT</code>):</strong>  the latent unimodal groups</li>\n</ul>\n\n<h6 id=\"returns\">Returns:</h6>\n\n<blockquote>\n  <p><code>dict[str, torch.Tensor]</code>: a dict of metrics.</p>\n</blockquote>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">gw_mod</span><span class=\"p\">:</span> <span class=\"n\">shimmer</span><span class=\"o\">.</span><span class=\"n\">modules</span><span class=\"o\">.</span><span class=\"n\">gw_module</span><span class=\"o\">.</span><span class=\"n\">GWModuleBase</span>,</span><span class=\"param\">\t<span class=\"n\">selection_mod</span><span class=\"p\">:</span> <span class=\"n\">shimmer</span><span class=\"o\">.</span><span class=\"n\">modules</span><span class=\"o\">.</span><span class=\"n\">selection</span><span class=\"o\">.</span><span class=\"n\">SelectionBase</span>,</span><span class=\"param\">\t<span class=\"n\">domain_mods</span><span class=\"p\">:</span> <span class=\"n\">collections</span><span class=\"o\">.</span><span class=\"n\">abc</span><span class=\"o\">.</span><span class=\"n\">Mapping</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"n\">shimmer</span><span class=\"o\">.</span><span class=\"n\">modules</span><span class=\"o\">.</span><span class=\"n\">domain</span><span class=\"o\">.</span><span class=\"n\">DomainModule</span><span class=\"p\">]</span>,</span><span class=\"param\">\t<span class=\"n\">latent_domains</span><span class=\"p\">:</span> <span class=\"n\">collections</span><span class=\"o\">.</span><span class=\"n\">abc</span><span class=\"o\">.</span><span class=\"n\">Mapping</span><span class=\"p\">[</span><span class=\"nb\">frozenset</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">],</span> <span class=\"n\">collections</span><span class=\"o\">.</span><span class=\"n\">abc</span><span class=\"o\">.</span><span class=\"n\">Mapping</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">Tensor</span><span class=\"p\">]]</span></span><span class=\"return-annotation\">) -> <span class=\"nb\">dict</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">Tensor</span><span class=\"p\">]</span>:</span></span>", "funcdef": "def"}, "shimmer.modules.losses.translation_loss": {"fullname": "shimmer.modules.losses.translation_loss", "modulename": "shimmer.modules.losses", "qualname": "translation_loss", "kind": "function", "doc": "<p>Computes the translation loss.</p>\n\n<h6 id=\"this-return-multiple-metrics\">This return multiple metrics:</h6>\n\n<blockquote>\n  <ul>\n  <li><code>translation_{domain_source}_to_{domain_target}</code> with the translation\n  from a domain source to a domain target;</li>\n  <li><code>translation_{domain_source}_to_{domain_target}_{metric}</code> with\n  additional metrics provided by the domain_mod's\n  <code>compute_tr_loss</code> output;</li>\n  <li><code>translations</code> with the average value of all\n  <code>translation_{domain_source}_to_{domain_target}</code> values.</li>\n  </ul>\n</blockquote>\n\n<h6 id=\"arguments\">Arguments:</h6>\n\n<ul>\n<li><strong>gw_mod (<code>GWModuleBase</code>):</strong>  The GWModule to use</li>\n<li><strong>domain_mods (<code>Mapping[str, DomainModule]</code>):</strong>  the domain modules</li>\n<li><strong>latent_domains (<code>LatentsDomainGroupsT</code>):</strong>  the latent unimodal groups</li>\n</ul>\n\n<h6 id=\"returns\">Returns:</h6>\n\n<blockquote>\n  <p><code>dict[str, torch.Tensor]</code>: a dict of metrics.</p>\n</blockquote>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">gw_mod</span><span class=\"p\">:</span> <span class=\"n\">shimmer</span><span class=\"o\">.</span><span class=\"n\">modules</span><span class=\"o\">.</span><span class=\"n\">gw_module</span><span class=\"o\">.</span><span class=\"n\">GWModuleBase</span>,</span><span class=\"param\">\t<span class=\"n\">selection_mod</span><span class=\"p\">:</span> <span class=\"n\">shimmer</span><span class=\"o\">.</span><span class=\"n\">modules</span><span class=\"o\">.</span><span class=\"n\">selection</span><span class=\"o\">.</span><span class=\"n\">SelectionBase</span>,</span><span class=\"param\">\t<span class=\"n\">domain_mods</span><span class=\"p\">:</span> <span class=\"n\">collections</span><span class=\"o\">.</span><span class=\"n\">abc</span><span class=\"o\">.</span><span class=\"n\">Mapping</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"n\">shimmer</span><span class=\"o\">.</span><span class=\"n\">modules</span><span class=\"o\">.</span><span class=\"n\">domain</span><span class=\"o\">.</span><span class=\"n\">DomainModule</span><span class=\"p\">]</span>,</span><span class=\"param\">\t<span class=\"n\">latent_domains</span><span class=\"p\">:</span> <span class=\"n\">collections</span><span class=\"o\">.</span><span class=\"n\">abc</span><span class=\"o\">.</span><span class=\"n\">Mapping</span><span class=\"p\">[</span><span class=\"nb\">frozenset</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">],</span> <span class=\"n\">collections</span><span class=\"o\">.</span><span class=\"n\">abc</span><span class=\"o\">.</span><span class=\"n\">Mapping</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">Tensor</span><span class=\"p\">]]</span></span><span class=\"return-annotation\">) -> <span class=\"nb\">dict</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">Tensor</span><span class=\"p\">]</span>:</span></span>", "funcdef": "def"}, "shimmer.modules.losses.contrastive_loss": {"fullname": "shimmer.modules.losses.contrastive_loss", "modulename": "shimmer.modules.losses", "qualname": "contrastive_loss", "kind": "function", "doc": "<p>Computes the contrastive loss.</p>\n\n<h6 id=\"this-return-multiple-metrics\">This return multiple metrics:</h6>\n\n<blockquote>\n  <ul>\n  <li><code>contrastive_{domain_1}_and_{domain_2}</code> with the contrastive\n  between 2 domains;</li>\n  <li><code>contrastive_{domain_1}_and_{domain_2}_{metric}</code> with\n  additional metrics provided by the domain_mod's\n  <code>compute_cont_loss</code> output;</li>\n  <li><code>contrastives</code> with the average value of all\n  <code>contrastive_{domain_1}_and_{domain_2}</code> values.</li>\n  </ul>\n</blockquote>\n\n<h6 id=\"arguments\">Arguments:</h6>\n\n<ul>\n<li><strong>gw_mod (<code>GWModuleBase</code>):</strong>  The GWModule to use</li>\n<li><strong>latent_domains (<code>LatentsDomainGroupsT</code>):</strong>  the latent unimodal groups</li>\n<li><strong>contrastive_fn (<code>ContrastiveLossType</code>):</strong>  the contrastive function to apply</li>\n</ul>\n\n<h6 id=\"returns\">Returns:</h6>\n\n<blockquote>\n  <p><code>dict[str, torch.Tensor]</code>: a dict of metrics.</p>\n</blockquote>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">gw_mod</span><span class=\"p\">:</span> <span class=\"n\">shimmer</span><span class=\"o\">.</span><span class=\"n\">modules</span><span class=\"o\">.</span><span class=\"n\">gw_module</span><span class=\"o\">.</span><span class=\"n\">GWModuleBase</span>,</span><span class=\"param\">\t<span class=\"n\">latent_domains</span><span class=\"p\">:</span> <span class=\"n\">collections</span><span class=\"o\">.</span><span class=\"n\">abc</span><span class=\"o\">.</span><span class=\"n\">Mapping</span><span class=\"p\">[</span><span class=\"nb\">frozenset</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">],</span> <span class=\"n\">collections</span><span class=\"o\">.</span><span class=\"n\">abc</span><span class=\"o\">.</span><span class=\"n\">Mapping</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">Tensor</span><span class=\"p\">]]</span>,</span><span class=\"param\">\t<span class=\"n\">contrastive_fn</span><span class=\"p\">:</span> <span class=\"n\">collections</span><span class=\"o\">.</span><span class=\"n\">abc</span><span class=\"o\">.</span><span class=\"n\">Callable</span><span class=\"p\">[[</span><span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">Tensor</span><span class=\"p\">,</span> <span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">Tensor</span><span class=\"p\">],</span> <span class=\"n\">shimmer</span><span class=\"o\">.</span><span class=\"n\">modules</span><span class=\"o\">.</span><span class=\"n\">domain</span><span class=\"o\">.</span><span class=\"n\">LossOutput</span><span class=\"p\">]</span></span><span class=\"return-annotation\">) -> <span class=\"nb\">dict</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">Tensor</span><span class=\"p\">]</span>:</span></span>", "funcdef": "def"}, "shimmer.modules.losses.contrastive_loss_bayesian": {"fullname": "shimmer.modules.losses.contrastive_loss_bayesian", "modulename": "shimmer.modules.losses", "qualname": "contrastive_loss_bayesian", "kind": "function", "doc": "<p>Computes the contrastive loss with a Bayesian based uncertainty prediction.</p>\n\n<h6 id=\"this-return-multiple-metrics\">This return multiple metrics:</h6>\n\n<blockquote>\n  <ul>\n  <li><code>contrastive_{domain_1}_and_{domain_2}</code> with the contrastive\n  between 2 domains;</li>\n  <li><code>contrastive_{domain_1}_and_{domain_2}_{metric}</code> with\n  additional metrics provided by the domain_mod's\n  <code>compute_cont_loss</code> output;</li>\n  <li><code>contrastives</code> with the average value of all\n  <code>contrastive_{domain_1}_and_{domain_2}</code> values.</li>\n  </ul>\n</blockquote>\n\n<h6 id=\"arguments\">Arguments:</h6>\n\n<ul>\n<li><strong>gw_mod (<code>GWModuleBayesian</code>):</strong>  The GWModule to use</li>\n<li><strong>latent_domains (<code>LatentsDomainGroupsT</code>):</strong>  the latent unimodal groups</li>\n<li><strong>contrastive_fn (<code>ContrastiveLossBayesianType</code>):</strong>  the contrastive function\nto apply</li>\n</ul>\n\n<h6 id=\"returns\">Returns:</h6>\n\n<blockquote>\n  <p><code>dict[str, torch.Tensor]</code>: a dict of metrics.</p>\n</blockquote>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">gw_mod</span><span class=\"p\">:</span> <span class=\"n\">shimmer</span><span class=\"o\">.</span><span class=\"n\">modules</span><span class=\"o\">.</span><span class=\"n\">gw_module</span><span class=\"o\">.</span><span class=\"n\">GWModuleBayesian</span>,</span><span class=\"param\">\t<span class=\"n\">latent_domains</span><span class=\"p\">:</span> <span class=\"n\">collections</span><span class=\"o\">.</span><span class=\"n\">abc</span><span class=\"o\">.</span><span class=\"n\">Mapping</span><span class=\"p\">[</span><span class=\"nb\">frozenset</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">],</span> <span class=\"n\">collections</span><span class=\"o\">.</span><span class=\"n\">abc</span><span class=\"o\">.</span><span class=\"n\">Mapping</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">Tensor</span><span class=\"p\">]]</span>,</span><span class=\"param\">\t<span class=\"n\">contrastive_fn</span><span class=\"p\">:</span> <span class=\"n\">collections</span><span class=\"o\">.</span><span class=\"n\">abc</span><span class=\"o\">.</span><span class=\"n\">Callable</span><span class=\"p\">[[</span><span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">Tensor</span><span class=\"p\">,</span> <span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">Tensor</span><span class=\"p\">],</span> <span class=\"n\">shimmer</span><span class=\"o\">.</span><span class=\"n\">modules</span><span class=\"o\">.</span><span class=\"n\">domain</span><span class=\"o\">.</span><span class=\"n\">LossOutput</span><span class=\"p\">]</span></span><span class=\"return-annotation\">) -> <span class=\"nb\">dict</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">Tensor</span><span class=\"p\">]</span>:</span></span>", "funcdef": "def"}, "shimmer.modules.losses.LossCoefs": {"fullname": "shimmer.modules.losses.LossCoefs", "modulename": "shimmer.modules.losses", "qualname": "LossCoefs", "kind": "class", "doc": "<p>Dict of loss coefficients used in the GWLosses.</p>\n\n<p>If one is not provided, the coefficient is assumed to be 0 and will not be logged.\nIf the loss is excplicitely set to 0, it will be logged, but not take part in\nthe total loss.</p>\n", "bases": "typing.TypedDict"}, "shimmer.modules.losses.LossCoefs.demi_cycles": {"fullname": "shimmer.modules.losses.LossCoefs.demi_cycles", "modulename": "shimmer.modules.losses", "qualname": "LossCoefs.demi_cycles", "kind": "variable", "doc": "<p>Demi-cycle loss coefficient.</p>\n", "annotation": ": float"}, "shimmer.modules.losses.LossCoefs.cycles": {"fullname": "shimmer.modules.losses.LossCoefs.cycles", "modulename": "shimmer.modules.losses", "qualname": "LossCoefs.cycles", "kind": "variable", "doc": "<p>Cycle loss coefficient.</p>\n", "annotation": ": float"}, "shimmer.modules.losses.LossCoefs.translations": {"fullname": "shimmer.modules.losses.LossCoefs.translations", "modulename": "shimmer.modules.losses", "qualname": "LossCoefs.translations", "kind": "variable", "doc": "<p>Translation loss coefficient.</p>\n", "annotation": ": float"}, "shimmer.modules.losses.LossCoefs.contrastives": {"fullname": "shimmer.modules.losses.LossCoefs.contrastives", "modulename": "shimmer.modules.losses", "qualname": "LossCoefs.contrastives", "kind": "variable", "doc": "<p>Contrastive loss coefficient.</p>\n", "annotation": ": float"}, "shimmer.modules.losses.GWLosses2Domains": {"fullname": "shimmer.modules.losses.GWLosses2Domains", "modulename": "shimmer.modules.losses", "qualname": "GWLosses2Domains", "kind": "class", "doc": "<p>Implementation of <code>GWLossesBase</code> used for <code>GWModule</code>.</p>\n", "bases": "GWLossesBase"}, "shimmer.modules.losses.GWLosses2Domains.__init__": {"fullname": "shimmer.modules.losses.GWLosses2Domains.__init__", "modulename": "shimmer.modules.losses", "qualname": "GWLosses2Domains.__init__", "kind": "function", "doc": "<p>Main loss module to use with the GlobalWorkspace</p>\n\n<h6 id=\"arguments\">Arguments:</h6>\n\n<ul>\n<li><strong>gw_mod (<code>GWModule</code>):</strong>  the GWModule</li>\n<li><strong>selection_mod (<code>SelectionBase</code>):</strong>  selection module</li>\n<li><strong>domain_mods (<code>dict[str, DomainModule]</code>):</strong>  a dict where the key is the\ndomain name and value is the DomainModule</li>\n<li><strong>loss_coefs (<code>LossCoefs</code>):</strong>  loss coefficients. LossCoefs object, or a\nmapping to float with correct keys.</li>\n<li><strong>contrastive_fn (<code>ContrastiveLossType</code>):</strong>  the contrastive function to use\nin contrastive loss</li>\n</ul>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">gw_mod</span><span class=\"p\">:</span> <span class=\"n\">shimmer</span><span class=\"o\">.</span><span class=\"n\">modules</span><span class=\"o\">.</span><span class=\"n\">gw_module</span><span class=\"o\">.</span><span class=\"n\">GWModule</span>,</span><span class=\"param\">\t<span class=\"n\">selection_mod</span><span class=\"p\">:</span> <span class=\"n\">shimmer</span><span class=\"o\">.</span><span class=\"n\">modules</span><span class=\"o\">.</span><span class=\"n\">selection</span><span class=\"o\">.</span><span class=\"n\">SelectionBase</span>,</span><span class=\"param\">\t<span class=\"n\">domain_mods</span><span class=\"p\">:</span> <span class=\"nb\">dict</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"n\">shimmer</span><span class=\"o\">.</span><span class=\"n\">modules</span><span class=\"o\">.</span><span class=\"n\">domain</span><span class=\"o\">.</span><span class=\"n\">DomainModule</span><span class=\"p\">]</span>,</span><span class=\"param\">\t<span class=\"n\">loss_coefs</span><span class=\"p\">:</span> <span class=\"n\">shimmer</span><span class=\"o\">.</span><span class=\"n\">modules</span><span class=\"o\">.</span><span class=\"n\">losses</span><span class=\"o\">.</span><span class=\"n\">LossCoefs</span>,</span><span class=\"param\">\t<span class=\"n\">contrastive_fn</span><span class=\"p\">:</span> <span class=\"n\">collections</span><span class=\"o\">.</span><span class=\"n\">abc</span><span class=\"o\">.</span><span class=\"n\">Callable</span><span class=\"p\">[[</span><span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">Tensor</span><span class=\"p\">,</span> <span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">Tensor</span><span class=\"p\">],</span> <span class=\"n\">shimmer</span><span class=\"o\">.</span><span class=\"n\">modules</span><span class=\"o\">.</span><span class=\"n\">domain</span><span class=\"o\">.</span><span class=\"n\">LossOutput</span><span class=\"p\">]</span></span>)</span>"}, "shimmer.modules.losses.GWLosses2Domains.gw_mod": {"fullname": "shimmer.modules.losses.GWLosses2Domains.gw_mod", "modulename": "shimmer.modules.losses", "qualname": "GWLosses2Domains.gw_mod", "kind": "variable", "doc": "<p></p>\n"}, "shimmer.modules.losses.GWLosses2Domains.selection_mod": {"fullname": "shimmer.modules.losses.GWLosses2Domains.selection_mod", "modulename": "shimmer.modules.losses", "qualname": "GWLosses2Domains.selection_mod", "kind": "variable", "doc": "<p></p>\n"}, "shimmer.modules.losses.GWLosses2Domains.domain_mods": {"fullname": "shimmer.modules.losses.GWLosses2Domains.domain_mods", "modulename": "shimmer.modules.losses", "qualname": "GWLosses2Domains.domain_mods", "kind": "variable", "doc": "<p></p>\n"}, "shimmer.modules.losses.GWLosses2Domains.loss_coefs": {"fullname": "shimmer.modules.losses.GWLosses2Domains.loss_coefs", "modulename": "shimmer.modules.losses", "qualname": "GWLosses2Domains.loss_coefs", "kind": "variable", "doc": "<p></p>\n"}, "shimmer.modules.losses.GWLosses2Domains.contrastive_fn": {"fullname": "shimmer.modules.losses.GWLosses2Domains.contrastive_fn", "modulename": "shimmer.modules.losses", "qualname": "GWLosses2Domains.contrastive_fn", "kind": "variable", "doc": "<p></p>\n"}, "shimmer.modules.losses.GWLosses2Domains.demi_cycle_loss": {"fullname": "shimmer.modules.losses.GWLosses2Domains.demi_cycle_loss", "modulename": "shimmer.modules.losses", "qualname": "GWLosses2Domains.demi_cycle_loss", "kind": "function", "doc": "<p>Computes the demi-cycle loss.</p>\n\n<p>See <code>shimmer.modules.losses.demi_cycle_loss</code>.</p>\n\n<h6 id=\"arguments\">Arguments:</h6>\n\n<ul>\n<li><strong>latent_domains (<code>LatentsDomainGroupsT</code>):</strong>  the latent unimodal groups</li>\n</ul>\n\n<h6 id=\"returns\">Returns:</h6>\n\n<blockquote>\n  <p><code>dict[str, torch.Tensor]</code>: a dict of metrics.</p>\n</blockquote>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"bp\">self</span>,</span><span class=\"param\">\t<span class=\"n\">latent_domains</span><span class=\"p\">:</span> <span class=\"n\">collections</span><span class=\"o\">.</span><span class=\"n\">abc</span><span class=\"o\">.</span><span class=\"n\">Mapping</span><span class=\"p\">[</span><span class=\"nb\">frozenset</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">],</span> <span class=\"n\">collections</span><span class=\"o\">.</span><span class=\"n\">abc</span><span class=\"o\">.</span><span class=\"n\">Mapping</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">Tensor</span><span class=\"p\">]]</span></span><span class=\"return-annotation\">) -> <span class=\"nb\">dict</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">Tensor</span><span class=\"p\">]</span>:</span></span>", "funcdef": "def"}, "shimmer.modules.losses.GWLosses2Domains.cycle_loss": {"fullname": "shimmer.modules.losses.GWLosses2Domains.cycle_loss", "modulename": "shimmer.modules.losses", "qualname": "GWLosses2Domains.cycle_loss", "kind": "function", "doc": "<p>Computes the cycle loss.</p>\n\n<p>See <code>shimmer.modules.losses.cycle_loss</code>.</p>\n\n<h6 id=\"arguments\">Arguments:</h6>\n\n<ul>\n<li><strong>latent_domains (<code>LatentsDomainGroupsT</code>):</strong>  the latent unimodal groups</li>\n</ul>\n\n<h6 id=\"returns\">Returns:</h6>\n\n<blockquote>\n  <p><code>dict[str, torch.Tensor]</code>: a dict of metrics.</p>\n</blockquote>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"bp\">self</span>,</span><span class=\"param\">\t<span class=\"n\">latent_domains</span><span class=\"p\">:</span> <span class=\"n\">collections</span><span class=\"o\">.</span><span class=\"n\">abc</span><span class=\"o\">.</span><span class=\"n\">Mapping</span><span class=\"p\">[</span><span class=\"nb\">frozenset</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">],</span> <span class=\"n\">collections</span><span class=\"o\">.</span><span class=\"n\">abc</span><span class=\"o\">.</span><span class=\"n\">Mapping</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">Tensor</span><span class=\"p\">]]</span></span><span class=\"return-annotation\">) -> <span class=\"nb\">dict</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">Tensor</span><span class=\"p\">]</span>:</span></span>", "funcdef": "def"}, "shimmer.modules.losses.GWLosses2Domains.translation_loss": {"fullname": "shimmer.modules.losses.GWLosses2Domains.translation_loss", "modulename": "shimmer.modules.losses", "qualname": "GWLosses2Domains.translation_loss", "kind": "function", "doc": "<p>Computes the translation loss.</p>\n\n<p>See <code>shimmer.modules.losses.translation_loss</code>.</p>\n\n<h6 id=\"arguments\">Arguments:</h6>\n\n<ul>\n<li><strong>latent_domains (<code>LatentsDomainGroupsT</code>):</strong>  the latent unimodal groups</li>\n</ul>\n\n<h6 id=\"returns\">Returns:</h6>\n\n<blockquote>\n  <p><code>dict[str, torch.Tensor]</code>: a dict of metrics.</p>\n</blockquote>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"bp\">self</span>,</span><span class=\"param\">\t<span class=\"n\">latent_domains</span><span class=\"p\">:</span> <span class=\"n\">collections</span><span class=\"o\">.</span><span class=\"n\">abc</span><span class=\"o\">.</span><span class=\"n\">Mapping</span><span class=\"p\">[</span><span class=\"nb\">frozenset</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">],</span> <span class=\"n\">collections</span><span class=\"o\">.</span><span class=\"n\">abc</span><span class=\"o\">.</span><span class=\"n\">Mapping</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">Tensor</span><span class=\"p\">]]</span></span><span class=\"return-annotation\">) -> <span class=\"nb\">dict</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">Tensor</span><span class=\"p\">]</span>:</span></span>", "funcdef": "def"}, "shimmer.modules.losses.GWLosses2Domains.contrastive_loss": {"fullname": "shimmer.modules.losses.GWLosses2Domains.contrastive_loss", "modulename": "shimmer.modules.losses", "qualname": "GWLosses2Domains.contrastive_loss", "kind": "function", "doc": "<p>Computes the contrastive loss.</p>\n\n<p>See <code>shimmer.modules.losses.contrastive_loss</code>.</p>\n\n<h6 id=\"arguments\">Arguments:</h6>\n\n<ul>\n<li><strong>latent_domains (<code>LatentsDomainGroupsT</code>):</strong>  the latent unimodal groups</li>\n</ul>\n\n<h6 id=\"returns\">Returns:</h6>\n\n<blockquote>\n  <p><code>dict[str, torch.Tensor]</code>: a dict of metrics.</p>\n</blockquote>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"bp\">self</span>,</span><span class=\"param\">\t<span class=\"n\">latent_domains</span><span class=\"p\">:</span> <span class=\"n\">collections</span><span class=\"o\">.</span><span class=\"n\">abc</span><span class=\"o\">.</span><span class=\"n\">Mapping</span><span class=\"p\">[</span><span class=\"nb\">frozenset</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">],</span> <span class=\"n\">collections</span><span class=\"o\">.</span><span class=\"n\">abc</span><span class=\"o\">.</span><span class=\"n\">Mapping</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">Tensor</span><span class=\"p\">]]</span></span><span class=\"return-annotation\">) -> <span class=\"nb\">dict</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">Tensor</span><span class=\"p\">]</span>:</span></span>", "funcdef": "def"}, "shimmer.modules.losses.GWLosses2Domains.step": {"fullname": "shimmer.modules.losses.GWLosses2Domains.step", "modulename": "shimmer.modules.losses", "qualname": "GWLosses2Domains.step", "kind": "function", "doc": "<p>Computes and returns the losses</p>\n\n<h6 id=\"contains\">Contains:</h6>\n\n<blockquote>\n  <ul>\n  <li>Demi-cycle metrics (see <code>GWLosses.demi_cycle_loss</code>)</li>\n  <li>Cycle metrics (see <code>GWLosses.cycle_loss</code>)</li>\n  <li>Translation metrics (see <code>GWLosses.translation_loss</code>)</li>\n  <li>Contrastive metrics (see <code>GWLosses.contrastive_loss</code>)</li>\n  </ul>\n</blockquote>\n\n<h6 id=\"arguments\">Arguments:</h6>\n\n<ul>\n<li><strong>domain_latents (<code>LatentsDomainGroupsT</code>):</strong>  All latent groups</li>\n<li><strong>mode (<code>ModelModeT</code>):</strong>  model mode</li>\n</ul>\n\n<h6 id=\"returns\">Returns:</h6>\n\n<blockquote>\n  <p><code>LossOutput</code>: the losses</p>\n</blockquote>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"bp\">self</span>,</span><span class=\"param\">\t<span class=\"n\">domain_latents</span><span class=\"p\">:</span> <span class=\"n\">collections</span><span class=\"o\">.</span><span class=\"n\">abc</span><span class=\"o\">.</span><span class=\"n\">Mapping</span><span class=\"p\">[</span><span class=\"nb\">frozenset</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">],</span> <span class=\"n\">collections</span><span class=\"o\">.</span><span class=\"n\">abc</span><span class=\"o\">.</span><span class=\"n\">Mapping</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">Tensor</span><span class=\"p\">]]</span>,</span><span class=\"param\">\t<span class=\"n\">mode</span><span class=\"p\">:</span> <span class=\"n\">Literal</span><span class=\"p\">[</span><span class=\"s1\">&#39;train&#39;</span><span class=\"p\">,</span> <span class=\"s1\">&#39;val&#39;</span><span class=\"p\">,</span> <span class=\"s1\">&#39;test&#39;</span><span class=\"p\">,</span> <span class=\"s1\">&#39;val/ood&#39;</span><span class=\"p\">,</span> <span class=\"s1\">&#39;test/ood&#39;</span><span class=\"p\">]</span></span><span class=\"return-annotation\">) -> <span class=\"n\">shimmer</span><span class=\"o\">.</span><span class=\"n\">modules</span><span class=\"o\">.</span><span class=\"n\">domain</span><span class=\"o\">.</span><span class=\"n\">LossOutput</span>:</span></span>", "funcdef": "def"}, "shimmer.modules.losses.generate_partitions": {"fullname": "shimmer.modules.losses.generate_partitions", "modulename": "shimmer.modules.losses", "qualname": "generate_partitions", "kind": "function", "doc": "<p>Generates all possible partitions of zeros and ones for <code>n</code> elements,\nexcluding the all-zeros partition.</p>\n\n<h6 id=\"arguments\">Arguments:</h6>\n\n<ul>\n<li><strong>n (<code>int</code>):</strong>  The number of modalities to generate partitions for.</li>\n</ul>\n\n<h6 id=\"yields\">Yields:</h6>\n\n<blockquote>\n  <p><code>tuple[int, ...]</code>: A partition of zeros and ones, excluding the\n  all-zeros partition.</p>\n</blockquote>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">n</span><span class=\"p\">:</span> <span class=\"nb\">int</span></span><span class=\"return-annotation\">) -> <span class=\"n\">collections</span><span class=\"o\">.</span><span class=\"n\">abc</span><span class=\"o\">.</span><span class=\"n\">Generator</span><span class=\"p\">[</span><span class=\"nb\">tuple</span><span class=\"p\">[</span><span class=\"nb\">int</span><span class=\"p\">,</span> <span class=\"o\">...</span><span class=\"p\">],</span> <span class=\"kc\">None</span><span class=\"p\">,</span> <span class=\"kc\">None</span><span class=\"p\">]</span>:</span></span>", "funcdef": "def"}, "shimmer.modules.losses.broadcast_loss": {"fullname": "shimmer.modules.losses.broadcast_loss", "modulename": "shimmer.modules.losses", "qualname": "broadcast_loss", "kind": "function", "doc": "<p>Computes broadcast loss including demi-cycle, cycle, and translation losses.</p>\n\n<h6 id=\"arguments\">Arguments:</h6>\n\n<ul>\n<li><strong>gw_mod (<code>shimmer.modules.gw_module.GWModuleBase</code>):</strong>  The GWModule to use</li>\n<li><strong>selection_mod (<code>shimmer.modules.selection.SelectionBase</code>):</strong>  Selection mod to use</li>\n<li><strong>domain_mods (<code>Mapping[str, DomainModule]</code>):</strong>  the domain modules</li>\n<li><strong>latent_domains:</strong>  The latent domain representations.</li>\n</ul>\n\n<h6 id=\"returns\">Returns:</h6>\n\n<blockquote>\n  <p>A dictionary with the total loss and additional metrics.</p>\n</blockquote>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">gw_mod</span><span class=\"p\">:</span> <span class=\"n\">shimmer</span><span class=\"o\">.</span><span class=\"n\">modules</span><span class=\"o\">.</span><span class=\"n\">gw_module</span><span class=\"o\">.</span><span class=\"n\">GWModuleBase</span>,</span><span class=\"param\">\t<span class=\"n\">selection_mod</span><span class=\"p\">:</span> <span class=\"n\">shimmer</span><span class=\"o\">.</span><span class=\"n\">modules</span><span class=\"o\">.</span><span class=\"n\">selection</span><span class=\"o\">.</span><span class=\"n\">SelectionBase</span>,</span><span class=\"param\">\t<span class=\"n\">domain_mods</span><span class=\"p\">:</span> <span class=\"n\">collections</span><span class=\"o\">.</span><span class=\"n\">abc</span><span class=\"o\">.</span><span class=\"n\">Mapping</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"n\">shimmer</span><span class=\"o\">.</span><span class=\"n\">modules</span><span class=\"o\">.</span><span class=\"n\">domain</span><span class=\"o\">.</span><span class=\"n\">DomainModule</span><span class=\"p\">]</span>,</span><span class=\"param\">\t<span class=\"n\">latent_domains</span><span class=\"p\">:</span> <span class=\"n\">collections</span><span class=\"o\">.</span><span class=\"n\">abc</span><span class=\"o\">.</span><span class=\"n\">Mapping</span><span class=\"p\">[</span><span class=\"nb\">frozenset</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">],</span> <span class=\"n\">collections</span><span class=\"o\">.</span><span class=\"n\">abc</span><span class=\"o\">.</span><span class=\"n\">Mapping</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">Tensor</span><span class=\"p\">]]</span></span><span class=\"return-annotation\">) -> <span class=\"nb\">dict</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">Tensor</span><span class=\"p\">]</span>:</span></span>", "funcdef": "def"}, "shimmer.modules.losses.BroadcastLossCoefs": {"fullname": "shimmer.modules.losses.BroadcastLossCoefs", "modulename": "shimmer.modules.losses", "qualname": "BroadcastLossCoefs", "kind": "class", "doc": "<p>Dict of loss coefficients used in the GWLossesFusion.</p>\n\n<p>If one is not provided, the coefficient is assumed to be 0 and will not be logged.\nIf the loss is excplicitely set to 0, it will be logged, but not take part in\nthe total loss.</p>\n", "bases": "typing.TypedDict"}, "shimmer.modules.losses.BroadcastLossCoefs.contrastives": {"fullname": "shimmer.modules.losses.BroadcastLossCoefs.contrastives", "modulename": "shimmer.modules.losses", "qualname": "BroadcastLossCoefs.contrastives", "kind": "variable", "doc": "<p>Contrastive loss coefficient.</p>\n", "annotation": ": float"}, "shimmer.modules.losses.BroadcastLossCoefs.fused": {"fullname": "shimmer.modules.losses.BroadcastLossCoefs.fused", "modulename": "shimmer.modules.losses", "qualname": "BroadcastLossCoefs.fused", "kind": "variable", "doc": "<p>fused loss coefficient (encode multiple domains and decode to one of them).</p>\n", "annotation": ": float"}, "shimmer.modules.losses.BroadcastLossCoefs.demi_cycles": {"fullname": "shimmer.modules.losses.BroadcastLossCoefs.demi_cycles", "modulename": "shimmer.modules.losses", "qualname": "BroadcastLossCoefs.demi_cycles", "kind": "variable", "doc": "<p>demi_cycles loss coefficient. Demi-cycles are always one-to-one</p>\n", "annotation": ": float"}, "shimmer.modules.losses.BroadcastLossCoefs.cycles": {"fullname": "shimmer.modules.losses.BroadcastLossCoefs.cycles", "modulename": "shimmer.modules.losses", "qualname": "BroadcastLossCoefs.cycles", "kind": "variable", "doc": "<p>cycles loss coefficient. Cycles can be many-to-one</p>\n", "annotation": ": float"}, "shimmer.modules.losses.BroadcastLossCoefs.translations": {"fullname": "shimmer.modules.losses.BroadcastLossCoefs.translations", "modulename": "shimmer.modules.losses", "qualname": "BroadcastLossCoefs.translations", "kind": "variable", "doc": "<p>translation loss coefficient. Translation, like cycles, can be many-to-one.</p>\n", "annotation": ": float"}, "shimmer.modules.losses.GWLosses": {"fullname": "shimmer.modules.losses.GWLosses", "modulename": "shimmer.modules.losses", "qualname": "GWLosses", "kind": "class", "doc": "<p>Implementation of <code>GWLossesBase</code> for fusion-based models.</p>\n", "bases": "GWLossesBase"}, "shimmer.modules.losses.GWLosses.__init__": {"fullname": "shimmer.modules.losses.GWLosses.__init__", "modulename": "shimmer.modules.losses", "qualname": "GWLosses.__init__", "kind": "function", "doc": "<p>Initializes the loss computation module for a Global Workspace Fusion model.</p>\n\n<h6 id=\"arguments\">Arguments:</h6>\n\n<ul>\n<li><strong>gw_mod:</strong>  The GWModule for the global workspace.</li>\n<li><strong>selection_mod:</strong>  The selection mechanism for the model.</li>\n<li><strong>domain_mods:</strong>  A mapping of domain names to their respective DomainModule.</li>\n<li><strong>loss_coefs (<code>BroadcastLossCoefs</code>):</strong>  coefs for the losses</li>\n<li><strong>contrastive_fn:</strong>  The function used for computing contrastive loss.</li>\n</ul>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">gw_mod</span><span class=\"p\">:</span> <span class=\"n\">shimmer</span><span class=\"o\">.</span><span class=\"n\">modules</span><span class=\"o\">.</span><span class=\"n\">gw_module</span><span class=\"o\">.</span><span class=\"n\">GWModule</span>,</span><span class=\"param\">\t<span class=\"n\">selection_mod</span><span class=\"p\">:</span> <span class=\"n\">shimmer</span><span class=\"o\">.</span><span class=\"n\">modules</span><span class=\"o\">.</span><span class=\"n\">selection</span><span class=\"o\">.</span><span class=\"n\">SelectionBase</span>,</span><span class=\"param\">\t<span class=\"n\">domain_mods</span><span class=\"p\">:</span> <span class=\"nb\">dict</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"n\">shimmer</span><span class=\"o\">.</span><span class=\"n\">modules</span><span class=\"o\">.</span><span class=\"n\">domain</span><span class=\"o\">.</span><span class=\"n\">DomainModule</span><span class=\"p\">]</span>,</span><span class=\"param\">\t<span class=\"n\">loss_coefs</span><span class=\"p\">:</span> <span class=\"n\">shimmer</span><span class=\"o\">.</span><span class=\"n\">modules</span><span class=\"o\">.</span><span class=\"n\">losses</span><span class=\"o\">.</span><span class=\"n\">BroadcastLossCoefs</span>,</span><span class=\"param\">\t<span class=\"n\">contrastive_fn</span><span class=\"p\">:</span> <span class=\"n\">collections</span><span class=\"o\">.</span><span class=\"n\">abc</span><span class=\"o\">.</span><span class=\"n\">Callable</span><span class=\"p\">[[</span><span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">Tensor</span><span class=\"p\">,</span> <span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">Tensor</span><span class=\"p\">],</span> <span class=\"n\">shimmer</span><span class=\"o\">.</span><span class=\"n\">modules</span><span class=\"o\">.</span><span class=\"n\">domain</span><span class=\"o\">.</span><span class=\"n\">LossOutput</span><span class=\"p\">]</span></span>)</span>"}, "shimmer.modules.losses.GWLosses.gw_mod": {"fullname": "shimmer.modules.losses.GWLosses.gw_mod", "modulename": "shimmer.modules.losses", "qualname": "GWLosses.gw_mod", "kind": "variable", "doc": "<p></p>\n"}, "shimmer.modules.losses.GWLosses.selection_mod": {"fullname": "shimmer.modules.losses.GWLosses.selection_mod", "modulename": "shimmer.modules.losses", "qualname": "GWLosses.selection_mod", "kind": "variable", "doc": "<p></p>\n"}, "shimmer.modules.losses.GWLosses.domain_mods": {"fullname": "shimmer.modules.losses.GWLosses.domain_mods", "modulename": "shimmer.modules.losses", "qualname": "GWLosses.domain_mods", "kind": "variable", "doc": "<p></p>\n"}, "shimmer.modules.losses.GWLosses.loss_coefs": {"fullname": "shimmer.modules.losses.GWLosses.loss_coefs", "modulename": "shimmer.modules.losses", "qualname": "GWLosses.loss_coefs", "kind": "variable", "doc": "<p></p>\n"}, "shimmer.modules.losses.GWLosses.contrastive_fn": {"fullname": "shimmer.modules.losses.GWLosses.contrastive_fn", "modulename": "shimmer.modules.losses", "qualname": "GWLosses.contrastive_fn", "kind": "variable", "doc": "<p></p>\n"}, "shimmer.modules.losses.GWLosses.contrastive_loss": {"fullname": "shimmer.modules.losses.GWLosses.contrastive_loss", "modulename": "shimmer.modules.losses", "qualname": "GWLosses.contrastive_loss", "kind": "function", "doc": "<p>Computes the contrastive loss for the given latent domains.</p>\n\n<h6 id=\"arguments\">Arguments:</h6>\n\n<ul>\n<li><strong>latent_domains:</strong>  The latent domain representations.</li>\n</ul>\n\n<h6 id=\"returns\">Returns:</h6>\n\n<blockquote>\n  <p>A dictionary of contrastive loss metrics.</p>\n</blockquote>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"bp\">self</span>,</span><span class=\"param\">\t<span class=\"n\">latent_domains</span><span class=\"p\">:</span> <span class=\"n\">collections</span><span class=\"o\">.</span><span class=\"n\">abc</span><span class=\"o\">.</span><span class=\"n\">Mapping</span><span class=\"p\">[</span><span class=\"nb\">frozenset</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">],</span> <span class=\"n\">collections</span><span class=\"o\">.</span><span class=\"n\">abc</span><span class=\"o\">.</span><span class=\"n\">Mapping</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">Tensor</span><span class=\"p\">]]</span></span><span class=\"return-annotation\">) -> <span class=\"nb\">dict</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">Tensor</span><span class=\"p\">]</span>:</span></span>", "funcdef": "def"}, "shimmer.modules.losses.GWLosses.broadcast_loss": {"fullname": "shimmer.modules.losses.GWLosses.broadcast_loss", "modulename": "shimmer.modules.losses", "qualname": "GWLosses.broadcast_loss", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"bp\">self</span>,</span><span class=\"param\">\t<span class=\"n\">latent_domains</span><span class=\"p\">:</span> <span class=\"n\">collections</span><span class=\"o\">.</span><span class=\"n\">abc</span><span class=\"o\">.</span><span class=\"n\">Mapping</span><span class=\"p\">[</span><span class=\"nb\">frozenset</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">],</span> <span class=\"n\">collections</span><span class=\"o\">.</span><span class=\"n\">abc</span><span class=\"o\">.</span><span class=\"n\">Mapping</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">Tensor</span><span class=\"p\">]]</span></span><span class=\"return-annotation\">) -> <span class=\"nb\">dict</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">Tensor</span><span class=\"p\">]</span>:</span></span>", "funcdef": "def"}, "shimmer.modules.losses.GWLosses.step": {"fullname": "shimmer.modules.losses.GWLosses.step", "modulename": "shimmer.modules.losses", "qualname": "GWLosses.step", "kind": "function", "doc": "<p>Performs a step of loss computation.</p>\n\n<h6 id=\"arguments\">Arguments:</h6>\n\n<ul>\n<li><strong>domain_latents:</strong>  Latent representations for all domains.</li>\n<li><strong>mode:</strong>  The mode in which the model is currently operating.</li>\n</ul>\n\n<h6 id=\"returns\">Returns:</h6>\n\n<blockquote>\n  <p>A LossOutput object containing the loss and metrics for this step.</p>\n</blockquote>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"bp\">self</span>,</span><span class=\"param\">\t<span class=\"n\">domain_latents</span><span class=\"p\">:</span> <span class=\"n\">collections</span><span class=\"o\">.</span><span class=\"n\">abc</span><span class=\"o\">.</span><span class=\"n\">Mapping</span><span class=\"p\">[</span><span class=\"nb\">frozenset</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">],</span> <span class=\"n\">collections</span><span class=\"o\">.</span><span class=\"n\">abc</span><span class=\"o\">.</span><span class=\"n\">Mapping</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">Tensor</span><span class=\"p\">]]</span>,</span><span class=\"param\">\t<span class=\"n\">mode</span><span class=\"p\">:</span> <span class=\"n\">Literal</span><span class=\"p\">[</span><span class=\"s1\">&#39;train&#39;</span><span class=\"p\">,</span> <span class=\"s1\">&#39;val&#39;</span><span class=\"p\">,</span> <span class=\"s1\">&#39;test&#39;</span><span class=\"p\">,</span> <span class=\"s1\">&#39;val/ood&#39;</span><span class=\"p\">,</span> <span class=\"s1\">&#39;test/ood&#39;</span><span class=\"p\">]</span></span><span class=\"return-annotation\">) -> <span class=\"n\">shimmer</span><span class=\"o\">.</span><span class=\"n\">modules</span><span class=\"o\">.</span><span class=\"n\">domain</span><span class=\"o\">.</span><span class=\"n\">LossOutput</span>:</span></span>", "funcdef": "def"}, "shimmer.modules.losses.GWLossesBayesian": {"fullname": "shimmer.modules.losses.GWLossesBayesian", "modulename": "shimmer.modules.losses", "qualname": "GWLossesBayesian", "kind": "class", "doc": "<p>Implementation of <code>GWLossesBase</code> used for <code>GWModuleBayesian</code>.</p>\n", "bases": "GWLossesBase"}, "shimmer.modules.losses.GWLossesBayesian.__init__": {"fullname": "shimmer.modules.losses.GWLossesBayesian.__init__", "modulename": "shimmer.modules.losses", "qualname": "GWLossesBayesian.__init__", "kind": "function", "doc": "<p>Loss module with uncertainty prediction to use with the GlobalWorkspaceBayesian</p>\n\n<h6 id=\"arguments\">Arguments:</h6>\n\n<ul>\n<li><strong>gw_mod (<code>GWModuleBayesian</code>):</strong>  the GWModule</li>\n<li><strong>selection_mod (<code>SelectionBase</code>):</strong>  selection module</li>\n<li><strong>domain_mods (<code>dict[str, DomainModule]</code>):</strong>  a dict where the key is the\ndomain name and value is the DomainModule</li>\n<li><strong>loss_coefs (<code>BroadcastLossCoefs</code>):</strong>  loss coefficients</li>\n<li><strong>contrastive_fn (<code>ContrastiveLossType</code>):</strong>  the contrastive function\nto use in contrastive loss</li>\n<li><strong>use_normalized_constrastive (<code>bool</code>):</strong>  whether to use the normalized cont\nloss by the precision coefs</li>\n</ul>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">gw_mod</span><span class=\"p\">:</span> <span class=\"n\">shimmer</span><span class=\"o\">.</span><span class=\"n\">modules</span><span class=\"o\">.</span><span class=\"n\">gw_module</span><span class=\"o\">.</span><span class=\"n\">GWModuleBayesian</span>,</span><span class=\"param\">\t<span class=\"n\">selection_mod</span><span class=\"p\">:</span> <span class=\"n\">shimmer</span><span class=\"o\">.</span><span class=\"n\">modules</span><span class=\"o\">.</span><span class=\"n\">selection</span><span class=\"o\">.</span><span class=\"n\">SelectionBase</span>,</span><span class=\"param\">\t<span class=\"n\">domain_mods</span><span class=\"p\">:</span> <span class=\"nb\">dict</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"n\">shimmer</span><span class=\"o\">.</span><span class=\"n\">modules</span><span class=\"o\">.</span><span class=\"n\">domain</span><span class=\"o\">.</span><span class=\"n\">DomainModule</span><span class=\"p\">]</span>,</span><span class=\"param\">\t<span class=\"n\">loss_coefs</span><span class=\"p\">:</span> <span class=\"n\">shimmer</span><span class=\"o\">.</span><span class=\"n\">modules</span><span class=\"o\">.</span><span class=\"n\">losses</span><span class=\"o\">.</span><span class=\"n\">BroadcastLossCoefs</span>,</span><span class=\"param\">\t<span class=\"n\">contrastive_fn</span><span class=\"p\">:</span> <span class=\"n\">collections</span><span class=\"o\">.</span><span class=\"n\">abc</span><span class=\"o\">.</span><span class=\"n\">Callable</span><span class=\"p\">[[</span><span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">Tensor</span><span class=\"p\">,</span> <span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">Tensor</span><span class=\"p\">],</span> <span class=\"n\">shimmer</span><span class=\"o\">.</span><span class=\"n\">modules</span><span class=\"o\">.</span><span class=\"n\">domain</span><span class=\"o\">.</span><span class=\"n\">LossOutput</span><span class=\"p\">]</span>,</span><span class=\"param\">\t<span class=\"n\">use_normalized_constrastive</span><span class=\"p\">:</span> <span class=\"nb\">bool</span> <span class=\"o\">=</span> <span class=\"kc\">True</span></span>)</span>"}, "shimmer.modules.losses.GWLossesBayesian.gw_mod": {"fullname": "shimmer.modules.losses.GWLossesBayesian.gw_mod", "modulename": "shimmer.modules.losses", "qualname": "GWLossesBayesian.gw_mod", "kind": "variable", "doc": "<p>The GWModule.</p>\n"}, "shimmer.modules.losses.GWLossesBayesian.selection_mod": {"fullname": "shimmer.modules.losses.GWLossesBayesian.selection_mod", "modulename": "shimmer.modules.losses", "qualname": "GWLossesBayesian.selection_mod", "kind": "variable", "doc": "<p>Selection module</p>\n"}, "shimmer.modules.losses.GWLossesBayesian.domain_mods": {"fullname": "shimmer.modules.losses.GWLossesBayesian.domain_mods", "modulename": "shimmer.modules.losses", "qualname": "GWLossesBayesian.domain_mods", "kind": "variable", "doc": "<p>Domain modules linked to the GW.</p>\n"}, "shimmer.modules.losses.GWLossesBayesian.loss_coefs": {"fullname": "shimmer.modules.losses.GWLossesBayesian.loss_coefs", "modulename": "shimmer.modules.losses", "qualname": "GWLossesBayesian.loss_coefs", "kind": "variable", "doc": "<p>The loss coefficients.</p>\n"}, "shimmer.modules.losses.GWLossesBayesian.contrastive_fn": {"fullname": "shimmer.modules.losses.GWLossesBayesian.contrastive_fn", "modulename": "shimmer.modules.losses", "qualname": "GWLossesBayesian.contrastive_fn", "kind": "variable", "doc": "<p>Contrastive loss to use.</p>\n"}, "shimmer.modules.losses.GWLossesBayesian.use_normalized_constrastive": {"fullname": "shimmer.modules.losses.GWLossesBayesian.use_normalized_constrastive", "modulename": "shimmer.modules.losses", "qualname": "GWLossesBayesian.use_normalized_constrastive", "kind": "variable", "doc": "<p></p>\n"}, "shimmer.modules.losses.GWLossesBayesian.contrastive_loss": {"fullname": "shimmer.modules.losses.GWLossesBayesian.contrastive_loss", "modulename": "shimmer.modules.losses", "qualname": "GWLossesBayesian.contrastive_loss", "kind": "function", "doc": "<p>Contrastive loss.</p>\n\n<h6 id=\"arguments\">Arguments:</h6>\n\n<ul>\n<li><strong>latent_domains (<code>LatentsDomainGroupsT</code>):</strong>  the latent unimodal groups</li>\n</ul>\n\n<h6 id=\"returns\">Returns:</h6>\n\n<blockquote>\n  <p><code>dict[str, torch.Tensor]</code>: a dict of metrics.</p>\n</blockquote>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"bp\">self</span>,</span><span class=\"param\">\t<span class=\"n\">latent_domains</span><span class=\"p\">:</span> <span class=\"n\">collections</span><span class=\"o\">.</span><span class=\"n\">abc</span><span class=\"o\">.</span><span class=\"n\">Mapping</span><span class=\"p\">[</span><span class=\"nb\">frozenset</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">],</span> <span class=\"n\">collections</span><span class=\"o\">.</span><span class=\"n\">abc</span><span class=\"o\">.</span><span class=\"n\">Mapping</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">Tensor</span><span class=\"p\">]]</span></span><span class=\"return-annotation\">) -> <span class=\"nb\">dict</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">Tensor</span><span class=\"p\">]</span>:</span></span>", "funcdef": "def"}, "shimmer.modules.losses.GWLossesBayesian.broadcast_loss": {"fullname": "shimmer.modules.losses.GWLossesBayesian.broadcast_loss", "modulename": "shimmer.modules.losses", "qualname": "GWLossesBayesian.broadcast_loss", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"bp\">self</span>,</span><span class=\"param\">\t<span class=\"n\">latent_domains</span><span class=\"p\">:</span> <span class=\"n\">collections</span><span class=\"o\">.</span><span class=\"n\">abc</span><span class=\"o\">.</span><span class=\"n\">Mapping</span><span class=\"p\">[</span><span class=\"nb\">frozenset</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">],</span> <span class=\"n\">collections</span><span class=\"o\">.</span><span class=\"n\">abc</span><span class=\"o\">.</span><span class=\"n\">Mapping</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">Tensor</span><span class=\"p\">]]</span></span><span class=\"return-annotation\">) -> <span class=\"nb\">dict</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">Tensor</span><span class=\"p\">]</span>:</span></span>", "funcdef": "def"}, "shimmer.modules.losses.GWLossesBayesian.step": {"fullname": "shimmer.modules.losses.GWLossesBayesian.step", "modulename": "shimmer.modules.losses", "qualname": "GWLossesBayesian.step", "kind": "function", "doc": "<p>Performs a step of loss computation.</p>\n\n<h6 id=\"arguments\">Arguments:</h6>\n\n<ul>\n<li><strong>domain_latents:</strong>  Latent representations for all domains.</li>\n<li><strong>mode:</strong>  The mode in which the model is currently operating.</li>\n</ul>\n\n<h6 id=\"returns\">Returns:</h6>\n\n<blockquote>\n  <p>A LossOutput object containing the loss and metrics for this step.</p>\n</blockquote>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"bp\">self</span>,</span><span class=\"param\">\t<span class=\"n\">domain_latents</span><span class=\"p\">:</span> <span class=\"n\">collections</span><span class=\"o\">.</span><span class=\"n\">abc</span><span class=\"o\">.</span><span class=\"n\">Mapping</span><span class=\"p\">[</span><span class=\"nb\">frozenset</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">],</span> <span class=\"n\">collections</span><span class=\"o\">.</span><span class=\"n\">abc</span><span class=\"o\">.</span><span class=\"n\">Mapping</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">Tensor</span><span class=\"p\">]]</span>,</span><span class=\"param\">\t<span class=\"n\">mode</span><span class=\"p\">:</span> <span class=\"n\">Literal</span><span class=\"p\">[</span><span class=\"s1\">&#39;train&#39;</span><span class=\"p\">,</span> <span class=\"s1\">&#39;val&#39;</span><span class=\"p\">,</span> <span class=\"s1\">&#39;test&#39;</span><span class=\"p\">,</span> <span class=\"s1\">&#39;val/ood&#39;</span><span class=\"p\">,</span> <span class=\"s1\">&#39;test/ood&#39;</span><span class=\"p\">]</span></span><span class=\"return-annotation\">) -> <span class=\"n\">shimmer</span><span class=\"o\">.</span><span class=\"n\">modules</span><span class=\"o\">.</span><span class=\"n\">domain</span><span class=\"o\">.</span><span class=\"n\">LossOutput</span>:</span></span>", "funcdef": "def"}, "shimmer.modules.contrastive_loss": {"fullname": "shimmer.modules.contrastive_loss", "modulename": "shimmer.modules.contrastive_loss", "kind": "module", "doc": "<p>Various contrastive loss definitions</p>\n"}, "shimmer.modules.contrastive_loss.ContrastiveLossType": {"fullname": "shimmer.modules.contrastive_loss.ContrastiveLossType", "modulename": "shimmer.modules.contrastive_loss", "qualname": "ContrastiveLossType", "kind": "variable", "doc": "<p>Contrastive loss function type.</p>\n\n<p>A function taking the prediction and targets and returning a LossOutput.</p>\n", "default_value": "collections.abc.Callable[[torch.Tensor, torch.Tensor], shimmer.modules.domain.LossOutput]"}, "shimmer.modules.contrastive_loss.ContrastiveLossBayesianType": {"fullname": "shimmer.modules.contrastive_loss.ContrastiveLossBayesianType", "modulename": "shimmer.modules.contrastive_loss", "qualname": "ContrastiveLossBayesianType", "kind": "variable", "doc": "<p>Contrastive loss function type for GlobalWorkspaceBayesian.</p>\n\n<p>A function taking the prediction mean, prediction std, target mean and target std and\n    returns a LossOutput.</p>\n", "default_value": "collections.abc.Callable[[torch.Tensor, torch.Tensor, torch.Tensor, torch.Tensor], shimmer.modules.domain.LossOutput]"}, "shimmer.modules.contrastive_loss.info_nce": {"fullname": "shimmer.modules.contrastive_loss.info_nce", "modulename": "shimmer.modules.contrastive_loss", "qualname": "info_nce", "kind": "function", "doc": "<p>InfoNCE loss</p>\n\n<h6 id=\"arguments\">Arguments:</h6>\n\n<ul>\n<li><strong>x (<code>torch.Tensor</code>):</strong>  prediction</li>\n<li><strong>y (<code>torch.Tensor</code>):</strong>  target</li>\n<li><strong>logit_scale (<code>torch.Tensor</code>):</strong>  logit scale</li>\n<li><strong>reduction (<code>Literal[\"mean\", \"sum\", \"none\"]</code>):</strong>  reduction to apply</li>\n</ul>\n\n<p>Returns: the InfoNCE loss</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">x</span><span class=\"p\">:</span> <span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">Tensor</span>,</span><span class=\"param\">\t<span class=\"n\">y</span><span class=\"p\">:</span> <span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">Tensor</span>,</span><span class=\"param\">\t<span class=\"n\">logit_scale</span><span class=\"p\">:</span> <span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">Tensor</span>,</span><span class=\"param\">\t<span class=\"n\">reduction</span><span class=\"p\">:</span> <span class=\"n\">Literal</span><span class=\"p\">[</span><span class=\"s1\">&#39;mean&#39;</span><span class=\"p\">,</span> <span class=\"s1\">&#39;sum&#39;</span><span class=\"p\">,</span> <span class=\"s1\">&#39;none&#39;</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"s1\">&#39;mean&#39;</span></span><span class=\"return-annotation\">) -> <span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">Tensor</span>:</span></span>", "funcdef": "def"}, "shimmer.modules.contrastive_loss.contrastive_loss": {"fullname": "shimmer.modules.contrastive_loss.contrastive_loss", "modulename": "shimmer.modules.contrastive_loss", "qualname": "contrastive_loss", "kind": "function", "doc": "<p>CLIP-like contrastive loss</p>\n\n<h6 id=\"arguments\">Arguments:</h6>\n\n<ul>\n<li><strong>x (<code>torch.Tensor</code>):</strong>  prediction</li>\n<li><strong>y (<code>torch.Tensor</code>):</strong>  target</li>\n<li><strong>logit_scale (<code>torch.Tensor</code>):</strong>  logit scale</li>\n<li><strong>reduction (<code>Literal[\"mean\", \"sum\", \"none\"]</code>):</strong>  reduction to apply</li>\n</ul>\n\n<p>Returns: the contrastive loss</p>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">x</span><span class=\"p\">:</span> <span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">Tensor</span>,</span><span class=\"param\">\t<span class=\"n\">y</span><span class=\"p\">:</span> <span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">Tensor</span>,</span><span class=\"param\">\t<span class=\"n\">logit_scale</span><span class=\"p\">:</span> <span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">Tensor</span>,</span><span class=\"param\">\t<span class=\"n\">reduction</span><span class=\"p\">:</span> <span class=\"n\">Literal</span><span class=\"p\">[</span><span class=\"s1\">&#39;mean&#39;</span><span class=\"p\">,</span> <span class=\"s1\">&#39;sum&#39;</span><span class=\"p\">,</span> <span class=\"s1\">&#39;none&#39;</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"s1\">&#39;mean&#39;</span></span><span class=\"return-annotation\">) -> <span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">Tensor</span>:</span></span>", "funcdef": "def"}, "shimmer.modules.contrastive_loss.ContrastiveLoss": {"fullname": "shimmer.modules.contrastive_loss.ContrastiveLoss", "modulename": "shimmer.modules.contrastive_loss", "qualname": "ContrastiveLoss", "kind": "class", "doc": "<p>CLIP-like ContrastiveLoss torch module.</p>\n", "bases": "torch.nn.modules.module.Module"}, "shimmer.modules.contrastive_loss.ContrastiveLoss.__init__": {"fullname": "shimmer.modules.contrastive_loss.ContrastiveLoss.__init__", "modulename": "shimmer.modules.contrastive_loss", "qualname": "ContrastiveLoss.__init__", "kind": "function", "doc": "<p>Initializes a contrastive loss.</p>\n\n<h6 id=\"arguments\">Arguments:</h6>\n\n<ul>\n<li><strong>logit_scale (<code>torch.Tensor</code>):</strong>  logit_scale tensor.</li>\n<li><strong>reduction (<code>Literal[\"mean\", \"sum\", \"none\"]</code>):</strong>  reduction to apply to the\nloss. Defaults to <code>\"mean\"</code>.</li>\n<li><strong>learn_logit_scale (<code>torch.Tensor</code>):</strong>  whether to learn the <code>logit_scale</code>\nparameter. Defaults to <code>False</code>.</li>\n</ul>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">logit_scale</span><span class=\"p\">:</span> <span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">Tensor</span>,</span><span class=\"param\">\t<span class=\"n\">reduction</span><span class=\"p\">:</span> <span class=\"n\">Literal</span><span class=\"p\">[</span><span class=\"s1\">&#39;mean&#39;</span><span class=\"p\">,</span> <span class=\"s1\">&#39;sum&#39;</span><span class=\"p\">,</span> <span class=\"s1\">&#39;none&#39;</span><span class=\"p\">]</span> <span class=\"o\">=</span> <span class=\"s1\">&#39;mean&#39;</span>,</span><span class=\"param\">\t<span class=\"n\">learn_logit_scale</span><span class=\"p\">:</span> <span class=\"nb\">bool</span> <span class=\"o\">=</span> <span class=\"kc\">False</span></span>)</span>"}, "shimmer.modules.contrastive_loss.ContrastiveLoss.learn_logit_scale": {"fullname": "shimmer.modules.contrastive_loss.ContrastiveLoss.learn_logit_scale", "modulename": "shimmer.modules.contrastive_loss", "qualname": "ContrastiveLoss.learn_logit_scale", "kind": "variable", "doc": "<p></p>\n"}, "shimmer.modules.contrastive_loss.ContrastiveLoss.reduction": {"fullname": "shimmer.modules.contrastive_loss.ContrastiveLoss.reduction", "modulename": "shimmer.modules.contrastive_loss", "qualname": "ContrastiveLoss.reduction", "kind": "variable", "doc": "<p></p>\n", "annotation": ": Literal[&#x27;mean&#x27;, &#x27;sum&#x27;, &#x27;none&#x27;]"}, "shimmer.modules.contrastive_loss.ContrastiveLoss.forward": {"fullname": "shimmer.modules.contrastive_loss.ContrastiveLoss.forward", "modulename": "shimmer.modules.contrastive_loss", "qualname": "ContrastiveLoss.forward", "kind": "function", "doc": "<p>Computes the loss.</p>\n\n<h6 id=\"arguments\">Arguments:</h6>\n\n<ul>\n<li><strong>x (<code>torch.Tensor</code>):</strong>  prediction</li>\n<li><strong>y (<code>torch.Tensor</code>):</strong>  target</li>\n</ul>\n\n<h6 id=\"returns\">Returns:</h6>\n\n<blockquote>\n  <p>LossOutput of the loss. Contains a <code>logit_scale</code> metric.</p>\n</blockquote>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"bp\">self</span>,</span><span class=\"param\">\t<span class=\"n\">x</span><span class=\"p\">:</span> <span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">Tensor</span>,</span><span class=\"param\">\t<span class=\"n\">y</span><span class=\"p\">:</span> <span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">Tensor</span></span><span class=\"return-annotation\">) -> <span class=\"n\">shimmer</span><span class=\"o\">.</span><span class=\"n\">modules</span><span class=\"o\">.</span><span class=\"n\">domain</span><span class=\"o\">.</span><span class=\"n\">LossOutput</span>:</span></span>", "funcdef": "def"}, "shimmer.dataset": {"fullname": "shimmer.dataset", "modulename": "shimmer.dataset", "kind": "module", "doc": "<p></p>\n"}, "shimmer.dataset.RepeatedDataset": {"fullname": "shimmer.dataset.RepeatedDataset", "modulename": "shimmer.dataset", "qualname": "RepeatedDataset", "kind": "class", "doc": "<p>Dataset that cycles through its items to have a size of at least min size.\nIf drop_last is True, the size will be exaclty min_size. If drop_last is False,\nthe min_size \u2264 size &lt; min_size + len(dataset).</p>\n", "bases": "typing.Generic[+T_co]"}, "shimmer.dataset.RepeatedDataset.__init__": {"fullname": "shimmer.dataset.RepeatedDataset.__init__", "modulename": "shimmer.dataset", "qualname": "RepeatedDataset.__init__", "kind": "function", "doc": "<h6 id=\"arguments\">Arguments:</h6>\n\n<ul>\n<li><strong>dataset (SizedDataset):</strong>  dataset to repeat. The dataset should have a size\n(where <code>__len__</code> is defined).</li>\n<li><strong>min_size (int):</strong>  minimum size of the final dataset</li>\n<li><strong>drop_last (bool):</strong>  whether to remove overflow when repeating the\ndataset.</li>\n</ul>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">dataset</span><span class=\"p\">:</span> <span class=\"n\">shimmer</span><span class=\"o\">.</span><span class=\"n\">dataset</span><span class=\"o\">.</span><span class=\"n\">_SizedDataset</span>,</span><span class=\"param\">\t<span class=\"n\">min_size</span><span class=\"p\">:</span> <span class=\"nb\">int</span>,</span><span class=\"param\">\t<span class=\"n\">drop_last</span><span class=\"p\">:</span> <span class=\"nb\">bool</span> <span class=\"o\">=</span> <span class=\"kc\">False</span></span>)</span>"}, "shimmer.dataset.RepeatedDataset.dataset": {"fullname": "shimmer.dataset.RepeatedDataset.dataset", "modulename": "shimmer.dataset", "qualname": "RepeatedDataset.dataset", "kind": "variable", "doc": "<p></p>\n"}, "shimmer.dataset.RepeatedDataset.dataset_size": {"fullname": "shimmer.dataset.RepeatedDataset.dataset_size", "modulename": "shimmer.dataset", "qualname": "RepeatedDataset.dataset_size", "kind": "variable", "doc": "<p></p>\n"}, "shimmer.modules.vae": {"fullname": "shimmer.modules.vae", "modulename": "shimmer.modules.vae", "kind": "module", "doc": "<p></p>\n"}, "shimmer.modules.vae.reparameterize": {"fullname": "shimmer.modules.vae.reparameterize", "modulename": "shimmer.modules.vae", "qualname": "reparameterize", "kind": "function", "doc": "<p>Reparameterization trick for VAE</p>\n\n<h6 id=\"arguments\">Arguments:</h6>\n\n<ul>\n<li><strong>mean (<code>torch.Tensor</code>):</strong>  predicted means</li>\n<li><strong>logvar (<code>torch.Tensor</code>):</strong>  predicted log variance</li>\n</ul>\n\n<h6 id=\"returns\">Returns:</h6>\n\n<blockquote>\n  <p><code>torch.Tensor</code>: a sample from normal distribution with provided\n      parameters, sampled using the reparameterization trick.</p>\n</blockquote>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">mean</span><span class=\"p\">:</span> <span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">Tensor</span>, </span><span class=\"param\"><span class=\"n\">logvar</span><span class=\"p\">:</span> <span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">Tensor</span></span><span class=\"return-annotation\">) -> <span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">Tensor</span>:</span></span>", "funcdef": "def"}, "shimmer.modules.vae.kl_divergence_loss": {"fullname": "shimmer.modules.vae.kl_divergence_loss", "modulename": "shimmer.modules.vae", "qualname": "kl_divergence_loss", "kind": "function", "doc": "<p>Computes the KL divergence loss used in VAE.</p>\n\n<h6 id=\"arguments\">Arguments:</h6>\n\n<ul>\n<li><strong>mean (<code>torch.Tensor</code>):</strong>  predicted means</li>\n<li><strong>logvar (<code>torch.Tensor</code>):</strong>  predicted logvars</li>\n</ul>\n\n<h6 id=\"returns\">Returns:</h6>\n\n<blockquote>\n  <p><code>torch.Tensor</code>: the loss</p>\n</blockquote>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">mean</span><span class=\"p\">:</span> <span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">Tensor</span>, </span><span class=\"param\"><span class=\"n\">logvar</span><span class=\"p\">:</span> <span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">Tensor</span></span><span class=\"return-annotation\">) -> <span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">Tensor</span>:</span></span>", "funcdef": "def"}, "shimmer.modules.vae.gaussian_nll": {"fullname": "shimmer.modules.vae.gaussian_nll", "modulename": "shimmer.modules.vae", "qualname": "gaussian_nll", "kind": "function", "doc": "<p>Computes gaussian nll loss used in VAE.</p>\n\n<h6 id=\"arguments\">Arguments:</h6>\n\n<ul>\n<li><strong>mu (<code>torch.Tensor</code>):</strong>  predictions</li>\n<li><strong>log_sigma (<code>torch.Tensor</code>):</strong>  log sigma</li>\n<li><strong>x (<code>torch.Tensor</code>):</strong>  targets</li>\n</ul>\n\n<h6 id=\"returns\">Returns:</h6>\n\n<blockquote>\n  <p><code>torch.Tensor</code>: the Gaussian NLL loss</p>\n</blockquote>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">mu</span><span class=\"p\">:</span> <span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">Tensor</span>,</span><span class=\"param\">\t<span class=\"n\">log_sigma</span><span class=\"p\">:</span> <span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">Tensor</span>,</span><span class=\"param\">\t<span class=\"n\">x</span><span class=\"p\">:</span> <span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">Tensor</span></span><span class=\"return-annotation\">) -> <span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">Tensor</span>:</span></span>", "funcdef": "def"}, "shimmer.modules.vae.VAEEncoder": {"fullname": "shimmer.modules.vae.VAEEncoder", "modulename": "shimmer.modules.vae", "qualname": "VAEEncoder", "kind": "class", "doc": "<p>Base class for a VAE encoder.</p>\n", "bases": "torch.nn.modules.module.Module, abc.ABC"}, "shimmer.modules.vae.VAEEncoder.forward": {"fullname": "shimmer.modules.vae.VAEEncoder.forward", "modulename": "shimmer.modules.vae", "qualname": "VAEEncoder.forward", "kind": "function", "doc": "<p>Encode representation with VAE.</p>\n\n<h6 id=\"arguments\">Arguments:</h6>\n\n<ul>\n<li><strong>x (<code>Any</code>):</strong>  Some input value</li>\n</ul>\n\n<h6 id=\"returns\">Returns:</h6>\n\n<blockquote>\n  <p><code>tuple[torch.Tensor, torch.Tensor]</code>: the mean and log variance</p>\n</blockquote>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span>, </span><span class=\"param\"><span class=\"n\">x</span><span class=\"p\">:</span> <span class=\"n\">Any</span></span><span class=\"return-annotation\">) -> <span class=\"nb\">tuple</span><span class=\"p\">[</span><span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">Tensor</span><span class=\"p\">,</span> <span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">Tensor</span><span class=\"p\">]</span>:</span></span>", "funcdef": "def"}, "shimmer.modules.vae.VAEDecoder": {"fullname": "shimmer.modules.vae.VAEDecoder", "modulename": "shimmer.modules.vae", "qualname": "VAEDecoder", "kind": "class", "doc": "<p>Base class for a VAE decoder.</p>\n", "bases": "torch.nn.modules.module.Module, abc.ABC"}, "shimmer.modules.vae.VAEDecoder.forward": {"fullname": "shimmer.modules.vae.VAEDecoder.forward", "modulename": "shimmer.modules.vae", "qualname": "VAEDecoder.forward", "kind": "function", "doc": "<p>Decode representation with VAE</p>\n\n<h6 id=\"arguments\">Arguments:</h6>\n\n<ul>\n<li><strong>x (<code>torch.Tensor</code>):</strong>  VAE latent representation representation</li>\n</ul>\n\n<h6 id=\"returns\">Returns:</h6>\n\n<blockquote>\n  <p><code>Any</code>: the reconstructed input</p>\n</blockquote>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span>, </span><span class=\"param\"><span class=\"n\">x</span><span class=\"p\">:</span> <span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">Tensor</span></span><span class=\"return-annotation\">) -> <span class=\"n\">Any</span>:</span></span>", "funcdef": "def"}, "shimmer.modules.vae.VAE": {"fullname": "shimmer.modules.vae.VAE", "modulename": "shimmer.modules.vae", "qualname": "VAE", "kind": "class", "doc": "<p>VAE module</p>\n", "bases": "torch.nn.modules.module.Module"}, "shimmer.modules.vae.VAE.__init__": {"fullname": "shimmer.modules.vae.VAE.__init__", "modulename": "shimmer.modules.vae", "qualname": "VAE.__init__", "kind": "function", "doc": "<p>Initializes a VAE.</p>\n\n<h6 id=\"arguments\">Arguments:</h6>\n\n<ul>\n<li><strong>encoder (<code>VAEEncoder</code>):</strong>  VAE encode</li>\n<li><strong>decoder (<code>VAEDecoder</code>):</strong>  VAE decoder</li>\n<li><strong>beta (<code>float</code>):</strong>  beta value for Beta-VAE. Defaults to 1.</li>\n</ul>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">encoder</span><span class=\"p\">:</span> <span class=\"n\">shimmer</span><span class=\"o\">.</span><span class=\"n\">modules</span><span class=\"o\">.</span><span class=\"n\">vae</span><span class=\"o\">.</span><span class=\"n\">VAEEncoder</span>,</span><span class=\"param\">\t<span class=\"n\">decoder</span><span class=\"p\">:</span> <span class=\"n\">shimmer</span><span class=\"o\">.</span><span class=\"n\">modules</span><span class=\"o\">.</span><span class=\"n\">vae</span><span class=\"o\">.</span><span class=\"n\">VAEDecoder</span>,</span><span class=\"param\">\t<span class=\"n\">beta</span><span class=\"p\">:</span> <span class=\"nb\">float</span> <span class=\"o\">=</span> <span class=\"mi\">1</span></span>)</span>"}, "shimmer.modules.vae.VAE.beta": {"fullname": "shimmer.modules.vae.VAE.beta", "modulename": "shimmer.modules.vae", "qualname": "VAE.beta", "kind": "variable", "doc": "<p>Beta value for Beta-VAEs</p>\n"}, "shimmer.modules.vae.VAE.encoder": {"fullname": "shimmer.modules.vae.VAE.encoder", "modulename": "shimmer.modules.vae", "qualname": "VAE.encoder", "kind": "variable", "doc": "<p>The encoder</p>\n"}, "shimmer.modules.vae.VAE.decoder": {"fullname": "shimmer.modules.vae.VAE.decoder", "modulename": "shimmer.modules.vae", "qualname": "VAE.decoder", "kind": "variable", "doc": "<p>The decoder</p>\n"}, "shimmer.modules.vae.VAE.encode": {"fullname": "shimmer.modules.vae.VAE.encode", "modulename": "shimmer.modules.vae", "qualname": "VAE.encode", "kind": "function", "doc": "<p>Encode the representation and returns the mean prediction of VAE.</p>\n\n<h6 id=\"arguments\">Arguments:</h6>\n\n<ul>\n<li><strong>x (<code>Any</code>):</strong>  Some input value</li>\n</ul>\n\n<h6 id=\"returns\">Returns:</h6>\n\n<blockquote>\n  <p><code>torch.Tensor</code>: The mean representation.</p>\n</blockquote>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span>, </span><span class=\"param\"><span class=\"n\">x</span><span class=\"p\">:</span> <span class=\"n\">Any</span></span><span class=\"return-annotation\">) -> <span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">Tensor</span>:</span></span>", "funcdef": "def"}, "shimmer.modules.vae.VAE.decode": {"fullname": "shimmer.modules.vae.VAE.decode", "modulename": "shimmer.modules.vae", "qualname": "VAE.decode", "kind": "function", "doc": "<p>Decode the VAE latent representation into input value.</p>\n\n<h6 id=\"arguments\">Arguments:</h6>\n\n<ul>\n<li><strong>z (<code>torch.Tensor</code>):</strong>  the VAE latent representation.</li>\n</ul>\n\n<h6 id=\"returns\">Returns:</h6>\n\n<blockquote>\n  <p><code>Any</code>: the reconstructed input.</p>\n</blockquote>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span>, </span><span class=\"param\"><span class=\"n\">z</span><span class=\"p\">:</span> <span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">Tensor</span></span><span class=\"return-annotation\">) -> <span class=\"n\">Any</span>:</span></span>", "funcdef": "def"}, "shimmer.modules.vae.VAE.forward": {"fullname": "shimmer.modules.vae.VAE.forward", "modulename": "shimmer.modules.vae", "qualname": "VAE.forward", "kind": "function", "doc": "<p>Encode and decodes from x.</p>\n\n<h6 id=\"arguments\">Arguments:</h6>\n\n<ul>\n<li><strong>x (<code>Any</code>):</strong>  the input data</li>\n</ul>\n\n<h6 id=\"returns\">Returns:</h6>\n\n<blockquote>\n  <p><code>tuple[tuple[torch.Tensor, torch.Tensor], Any]</code>: The\n      first tuple contains the mean and logvar of the encoded input,\n      the second item is the reconstructed input.</p>\n</blockquote>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"bp\">self</span>, </span><span class=\"param\"><span class=\"n\">x</span><span class=\"p\">:</span> <span class=\"n\">Any</span></span><span class=\"return-annotation\">) -> <span class=\"nb\">tuple</span><span class=\"p\">[</span><span class=\"nb\">tuple</span><span class=\"p\">[</span><span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">Tensor</span><span class=\"p\">,</span> <span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">Tensor</span><span class=\"p\">],</span> <span class=\"n\">typing</span><span class=\"o\">.</span><span class=\"n\">Any</span><span class=\"p\">]</span>:</span></span>", "funcdef": "def"}, "shimmer.modules.utils": {"fullname": "shimmer.modules.utils", "modulename": "shimmer.modules.utils", "kind": "module", "doc": "<p></p>\n"}, "shimmer.modules.utils.translation": {"fullname": "shimmer.modules.utils.translation", "modulename": "shimmer.modules.utils", "qualname": "translation", "kind": "function", "doc": "<p>Translate from multiple domains to one domain.</p>\n\n<h6 id=\"arguments\">Arguments:</h6>\n\n<ul>\n<li><strong>gw_module (<code>GWModuleBase</code>):</strong>  GWModule to perform the translation over</li>\n<li><strong>selection_mod (<code>SelectionBase</code>):</strong>  selection module</li>\n<li><strong>x (<code>LatentsDomainGroupT</code>):</strong>  the group of latent representations</li>\n<li><strong>to (<code>str</code>):</strong>  the domain name to encode to</li>\n</ul>\n\n<h6 id=\"returns\">Returns:</h6>\n\n<blockquote>\n  <p><code>torch.Tensor</code>: the translated unimodal representation\n      of the provided domain.</p>\n</blockquote>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">gw_module</span><span class=\"p\">:</span> <span class=\"n\">shimmer</span><span class=\"o\">.</span><span class=\"n\">modules</span><span class=\"o\">.</span><span class=\"n\">gw_module</span><span class=\"o\">.</span><span class=\"n\">GWModuleBase</span>,</span><span class=\"param\">\t<span class=\"n\">selection_mod</span><span class=\"p\">:</span> <span class=\"n\">shimmer</span><span class=\"o\">.</span><span class=\"n\">modules</span><span class=\"o\">.</span><span class=\"n\">selection</span><span class=\"o\">.</span><span class=\"n\">SelectionBase</span>,</span><span class=\"param\">\t<span class=\"n\">x</span><span class=\"p\">:</span> <span class=\"n\">collections</span><span class=\"o\">.</span><span class=\"n\">abc</span><span class=\"o\">.</span><span class=\"n\">Mapping</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">Tensor</span><span class=\"p\">]</span>,</span><span class=\"param\">\t<span class=\"n\">to</span><span class=\"p\">:</span> <span class=\"nb\">str</span></span><span class=\"return-annotation\">) -> <span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">Tensor</span>:</span></span>", "funcdef": "def"}, "shimmer.modules.utils.cycle": {"fullname": "shimmer.modules.utils.cycle", "modulename": "shimmer.modules.utils", "qualname": "cycle", "kind": "function", "doc": "<p>Do a full cycle from a group of representation through one domain.</p>\n\n<p>[Original domains] -> [GW] -> [through] -> [GW] -> [Original domains]</p>\n\n<h6 id=\"arguments\">Arguments:</h6>\n\n<ul>\n<li><strong>gw_module (<code>GWModuleBase</code>):</strong>  GWModule to perform the translation over</li>\n<li><strong>selection_mod (<code>SelectionBase</code>):</strong>  selection module</li>\n<li><strong>x (<code>LatentsDomainGroupT</code>):</strong>  group of unimodal latent representation</li>\n<li><strong>through (<code>str</code>):</strong>  domain name to cycle through</li>\n</ul>\n\n<h6 id=\"returns\">Returns:</h6>\n\n<blockquote>\n  <p><code>LatentsDomainGroupDT</code>: group of unimodal latent representation after\n      cycling.</p>\n</blockquote>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">gw_module</span><span class=\"p\">:</span> <span class=\"n\">shimmer</span><span class=\"o\">.</span><span class=\"n\">modules</span><span class=\"o\">.</span><span class=\"n\">gw_module</span><span class=\"o\">.</span><span class=\"n\">GWModuleBase</span>,</span><span class=\"param\">\t<span class=\"n\">selection_mod</span><span class=\"p\">:</span> <span class=\"n\">shimmer</span><span class=\"o\">.</span><span class=\"n\">modules</span><span class=\"o\">.</span><span class=\"n\">selection</span><span class=\"o\">.</span><span class=\"n\">SelectionBase</span>,</span><span class=\"param\">\t<span class=\"n\">x</span><span class=\"p\">:</span> <span class=\"n\">collections</span><span class=\"o\">.</span><span class=\"n\">abc</span><span class=\"o\">.</span><span class=\"n\">Mapping</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">Tensor</span><span class=\"p\">]</span>,</span><span class=\"param\">\t<span class=\"n\">through</span><span class=\"p\">:</span> <span class=\"nb\">str</span></span><span class=\"return-annotation\">) -> <span class=\"nb\">dict</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">Tensor</span><span class=\"p\">]</span>:</span></span>", "funcdef": "def"}, "shimmer.modules.utils.batch_demi_cycles": {"fullname": "shimmer.modules.utils.batch_demi_cycles", "modulename": "shimmer.modules.utils", "qualname": "batch_demi_cycles", "kind": "function", "doc": "<p>Computes demi-cycles of a batch of groups of domains.</p>\n\n<h6 id=\"arguments\">Arguments:</h6>\n\n<ul>\n<li><strong>gw_mod (<code>GWModuleBase</code>):</strong>  the GWModuleBase</li>\n<li><strong>selection_mod (<code>SelectionBase</code>):</strong>  selection module</li>\n<li><strong>latent_domains (<code>LatentsT</code>):</strong>  the batch of groups of domains</li>\n</ul>\n\n<h6 id=\"returns\">Returns:</h6>\n\n<blockquote>\n  <p><code>dict[str, torch.Tensor]</code>: demi-cycles predictions for each domain.</p>\n</blockquote>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">gw_mod</span><span class=\"p\">:</span> <span class=\"n\">shimmer</span><span class=\"o\">.</span><span class=\"n\">modules</span><span class=\"o\">.</span><span class=\"n\">gw_module</span><span class=\"o\">.</span><span class=\"n\">GWModuleBase</span>,</span><span class=\"param\">\t<span class=\"n\">selection_mod</span><span class=\"p\">:</span> <span class=\"n\">shimmer</span><span class=\"o\">.</span><span class=\"n\">modules</span><span class=\"o\">.</span><span class=\"n\">selection</span><span class=\"o\">.</span><span class=\"n\">SelectionBase</span>,</span><span class=\"param\">\t<span class=\"n\">latent_domains</span><span class=\"p\">:</span> <span class=\"n\">collections</span><span class=\"o\">.</span><span class=\"n\">abc</span><span class=\"o\">.</span><span class=\"n\">Mapping</span><span class=\"p\">[</span><span class=\"nb\">frozenset</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">],</span> <span class=\"n\">collections</span><span class=\"o\">.</span><span class=\"n\">abc</span><span class=\"o\">.</span><span class=\"n\">Mapping</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">Tensor</span><span class=\"p\">]]</span></span><span class=\"return-annotation\">) -> <span class=\"nb\">dict</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">Tensor</span><span class=\"p\">]</span>:</span></span>", "funcdef": "def"}, "shimmer.modules.utils.batch_cycles": {"fullname": "shimmer.modules.utils.batch_cycles", "modulename": "shimmer.modules.utils", "qualname": "batch_cycles", "kind": "function", "doc": "<p>Computes cycles of a batch of groups of domains.</p>\n\n<h6 id=\"arguments\">Arguments:</h6>\n\n<ul>\n<li><strong>gw_mod (<code>GWModuleBase</code>):</strong>  GWModule to use for the cycle</li>\n<li><strong>selection_mod (<code>SelectionBase</code>):</strong>  selection module</li>\n<li><strong>latent_domains (<code>LatentsT</code>):</strong>  the batch of groups of domains</li>\n<li><strong>out_domains (<code>Iterable[str]</code>):</strong>  iterable of domain names to do the cycle through.\nEach domain will be done separetely.</li>\n</ul>\n\n<h6 id=\"returns\">Returns:</h6>\n\n<blockquote>\n  <p><code>dict[tuple[str, str], torch.Tensor]</code>: cycles predictions for each\n      couple of (start domain, intermediary domain).</p>\n</blockquote>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">gw_mod</span><span class=\"p\">:</span> <span class=\"n\">shimmer</span><span class=\"o\">.</span><span class=\"n\">modules</span><span class=\"o\">.</span><span class=\"n\">gw_module</span><span class=\"o\">.</span><span class=\"n\">GWModuleBase</span>,</span><span class=\"param\">\t<span class=\"n\">selection_mod</span><span class=\"p\">:</span> <span class=\"n\">shimmer</span><span class=\"o\">.</span><span class=\"n\">modules</span><span class=\"o\">.</span><span class=\"n\">selection</span><span class=\"o\">.</span><span class=\"n\">SelectionBase</span>,</span><span class=\"param\">\t<span class=\"n\">latent_domains</span><span class=\"p\">:</span> <span class=\"n\">collections</span><span class=\"o\">.</span><span class=\"n\">abc</span><span class=\"o\">.</span><span class=\"n\">Mapping</span><span class=\"p\">[</span><span class=\"nb\">frozenset</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">],</span> <span class=\"n\">collections</span><span class=\"o\">.</span><span class=\"n\">abc</span><span class=\"o\">.</span><span class=\"n\">Mapping</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">Tensor</span><span class=\"p\">]]</span>,</span><span class=\"param\">\t<span class=\"n\">through_domains</span><span class=\"p\">:</span> <span class=\"n\">collections</span><span class=\"o\">.</span><span class=\"n\">abc</span><span class=\"o\">.</span><span class=\"n\">Iterable</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">]</span></span><span class=\"return-annotation\">) -> <span class=\"nb\">dict</span><span class=\"p\">[</span><span class=\"nb\">tuple</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"nb\">str</span><span class=\"p\">],</span> <span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">Tensor</span><span class=\"p\">]</span>:</span></span>", "funcdef": "def"}, "shimmer.modules.utils.batch_translations": {"fullname": "shimmer.modules.utils.batch_translations", "modulename": "shimmer.modules.utils", "qualname": "batch_translations", "kind": "function", "doc": "<p>Computes translations of a batch of groups of domains.</p>\n\n<h6 id=\"arguments\">Arguments:</h6>\n\n<ul>\n<li><strong>gw_mod (<code>GWModuleBase</code>):</strong>  GWModule to do the translation</li>\n<li><strong>selection_mod (<code>SelectionBase</code>):</strong>  selection module</li>\n<li><strong>latent_domains (<code>LatentsT</code>):</strong>  the batch of groups of domains</li>\n</ul>\n\n<h6 id=\"returns\">Returns:</h6>\n\n<blockquote>\n  <p><code>dict[tuple[str, str], torch.Tensor]</code>: translation predictions for each\n      couple of (start domain, target domain).</p>\n</blockquote>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">gw_mod</span><span class=\"p\">:</span> <span class=\"n\">shimmer</span><span class=\"o\">.</span><span class=\"n\">modules</span><span class=\"o\">.</span><span class=\"n\">gw_module</span><span class=\"o\">.</span><span class=\"n\">GWModuleBase</span>,</span><span class=\"param\">\t<span class=\"n\">selection_mod</span><span class=\"p\">:</span> <span class=\"n\">shimmer</span><span class=\"o\">.</span><span class=\"n\">modules</span><span class=\"o\">.</span><span class=\"n\">selection</span><span class=\"o\">.</span><span class=\"n\">SelectionBase</span>,</span><span class=\"param\">\t<span class=\"n\">latent_domains</span><span class=\"p\">:</span> <span class=\"n\">collections</span><span class=\"o\">.</span><span class=\"n\">abc</span><span class=\"o\">.</span><span class=\"n\">Mapping</span><span class=\"p\">[</span><span class=\"nb\">frozenset</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">],</span> <span class=\"n\">collections</span><span class=\"o\">.</span><span class=\"n\">abc</span><span class=\"o\">.</span><span class=\"n\">Mapping</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">Tensor</span><span class=\"p\">]]</span></span><span class=\"return-annotation\">) -> <span class=\"nb\">dict</span><span class=\"p\">[</span><span class=\"nb\">tuple</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"nb\">str</span><span class=\"p\">],</span> <span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">Tensor</span><span class=\"p\">]</span>:</span></span>", "funcdef": "def"}, "shimmer.utils": {"fullname": "shimmer.utils", "modulename": "shimmer.utils", "kind": "module", "doc": "<p></p>\n"}, "shimmer.utils.MIGRATION_DIR": {"fullname": "shimmer.utils.MIGRATION_DIR", "modulename": "shimmer.utils", "qualname": "MIGRATION_DIR", "kind": "variable", "doc": "<p></p>\n", "default_value": "PosixPath(&#x27;/home/runner/work/shimmer/shimmer/shimmer/ckpt_migrations&#x27;)"}, "shimmer.utils.group_batch_size": {"fullname": "shimmer.utils.group_batch_size", "modulename": "shimmer.utils", "qualname": "group_batch_size", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">x</span><span class=\"p\">:</span> <span class=\"n\">collections</span><span class=\"o\">.</span><span class=\"n\">abc</span><span class=\"o\">.</span><span class=\"n\">Mapping</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">Tensor</span><span class=\"p\">]</span></span><span class=\"return-annotation\">) -> <span class=\"nb\">int</span>:</span></span>", "funcdef": "def"}, "shimmer.utils.groups_batch_size": {"fullname": "shimmer.utils.groups_batch_size", "modulename": "shimmer.utils", "qualname": "groups_batch_size", "kind": "function", "doc": "<p>Get the batch size of the batch.</p>\n\n<h6 id=\"arguments\">Arguments:</h6>\n\n<ul>\n<li><strong>domain_latents (<code>LatentsDomainGroupsT</code>):</strong>  the batch of groups.</li>\n</ul>\n\n<h6 id=\"returns\">Returns:</h6>\n\n<blockquote>\n  <p>int: the batch size.</p>\n</blockquote>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">domain_latents</span><span class=\"p\">:</span> <span class=\"n\">collections</span><span class=\"o\">.</span><span class=\"n\">abc</span><span class=\"o\">.</span><span class=\"n\">Mapping</span><span class=\"p\">[</span><span class=\"nb\">frozenset</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">],</span> <span class=\"n\">collections</span><span class=\"o\">.</span><span class=\"n\">abc</span><span class=\"o\">.</span><span class=\"n\">Mapping</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">Tensor</span><span class=\"p\">]]</span></span><span class=\"return-annotation\">) -> <span class=\"nb\">int</span>:</span></span>", "funcdef": "def"}, "shimmer.utils.groups_device": {"fullname": "shimmer.utils.groups_device", "modulename": "shimmer.utils", "qualname": "groups_device", "kind": "function", "doc": "<p>Get the batch size of the batch.</p>\n\n<h6 id=\"arguments\">Arguments:</h6>\n\n<ul>\n<li><strong>domain_latents (<code>LatentsDomainGroupsT</code>):</strong>  the batch of groups.</li>\n</ul>\n\n<h6 id=\"returns\">Returns:</h6>\n\n<blockquote>\n  <p>int: the batch size.</p>\n</blockquote>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"n\">domain_latents</span><span class=\"p\">:</span> <span class=\"n\">collections</span><span class=\"o\">.</span><span class=\"n\">abc</span><span class=\"o\">.</span><span class=\"n\">Mapping</span><span class=\"p\">[</span><span class=\"nb\">frozenset</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">],</span> <span class=\"n\">collections</span><span class=\"o\">.</span><span class=\"n\">abc</span><span class=\"o\">.</span><span class=\"n\">Mapping</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">Tensor</span><span class=\"p\">]]</span></span><span class=\"return-annotation\">) -> <span class=\"nb\">int</span>:</span></span>", "funcdef": "def"}, "shimmer.utils.group_device": {"fullname": "shimmer.utils.group_device", "modulename": "shimmer.utils", "qualname": "group_device", "kind": "function", "doc": "<p></p>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">x</span><span class=\"p\">:</span> <span class=\"n\">collections</span><span class=\"o\">.</span><span class=\"n\">abc</span><span class=\"o\">.</span><span class=\"n\">Mapping</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">Tensor</span><span class=\"p\">]</span></span><span class=\"return-annotation\">) -> <span class=\"n\">torch</span><span class=\"o\">.</span><span class=\"n\">device</span>:</span></span>", "funcdef": "def"}, "shimmer.utils.migrate_model": {"fullname": "shimmer.utils.migrate_model", "modulename": "shimmer.utils", "qualname": "migrate_model", "kind": "function", "doc": "<p>Migrates a model checkpoint</p>\n\n<p>After the migration, the given checkpoint will be migrated.\nOther versions of the checkpoint will be saved under the stem-version.suffix.</p>\n\n<h6 id=\"arguments\">Arguments:</h6>\n\n<ul>\n<li><strong>ckpt_path (<code>str | PathLike</code>):</strong>   path to checkpoint</li>\n<li><strong>torch_load_kwargs:</strong>  additional args given to torch.load.</li>\n</ul>\n", "signature": "<span class=\"signature pdoc-code condensed\">(<span class=\"param\"><span class=\"n\">ckpt_path</span><span class=\"p\">:</span> <span class=\"nb\">str</span> <span class=\"o\">|</span> <span class=\"n\">os</span><span class=\"o\">.</span><span class=\"n\">PathLike</span>, </span><span class=\"param\"><span class=\"o\">**</span><span class=\"n\">torch_load_kwargs</span></span><span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, "shimmer.utils.SaveMigrations": {"fullname": "shimmer.utils.SaveMigrations", "modulename": "shimmer.utils", "qualname": "SaveMigrations", "kind": "class", "doc": "<p>Abstract base class used to build new callbacks.</p>\n\n<p>Subclass this class and override any of the relevant hooks</p>\n", "bases": "lightning.pytorch.callbacks.callback.Callback"}, "shimmer.utils.SaveMigrations.migrations": {"fullname": "shimmer.utils.SaveMigrations.migrations", "modulename": "shimmer.utils", "qualname": "SaveMigrations.migrations", "kind": "variable", "doc": "<p></p>\n"}, "shimmer.utils.SaveMigrations.on_save_checkpoint": {"fullname": "shimmer.utils.SaveMigrations.on_save_checkpoint", "modulename": "shimmer.utils", "qualname": "SaveMigrations.on_save_checkpoint", "kind": "function", "doc": "<p>Called when saving a checkpoint to give you a chance to store anything else you might want to save.</p>\n\n<h6 id=\"arguments\">Arguments:</h6>\n\n<ul>\n<li><strong>trainer:</strong>  the current <code>~lightning.pytorch.trainer.trainer.Trainer</code> instance.</li>\n<li><strong>pl_module:</strong>  the current <code>~lightning.pytorch.core.LightningModule</code> instance.</li>\n<li><strong>checkpoint:</strong>  the checkpoint dictionary that will be saved.</li>\n</ul>\n", "signature": "<span class=\"signature pdoc-code multiline\">(<span class=\"param\">\t<span class=\"bp\">self</span>,</span><span class=\"param\">\t<span class=\"n\">trainer</span><span class=\"p\">:</span> <span class=\"n\">lightning</span><span class=\"o\">.</span><span class=\"n\">pytorch</span><span class=\"o\">.</span><span class=\"n\">trainer</span><span class=\"o\">.</span><span class=\"n\">trainer</span><span class=\"o\">.</span><span class=\"n\">Trainer</span>,</span><span class=\"param\">\t<span class=\"n\">pl_module</span><span class=\"p\">:</span> <span class=\"n\">lightning</span><span class=\"o\">.</span><span class=\"n\">pytorch</span><span class=\"o\">.</span><span class=\"n\">core</span><span class=\"o\">.</span><span class=\"n\">module</span><span class=\"o\">.</span><span class=\"n\">LightningModule</span>,</span><span class=\"param\">\t<span class=\"n\">checkpoint</span><span class=\"p\">:</span> <span class=\"nb\">dict</span><span class=\"p\">[</span><span class=\"nb\">str</span><span class=\"p\">,</span> <span class=\"n\">typing</span><span class=\"o\">.</span><span class=\"n\">Any</span><span class=\"p\">]</span></span><span class=\"return-annotation\">):</span></span>", "funcdef": "def"}, "shimmer.cli.ckpt_migration": {"fullname": "shimmer.cli.ckpt_migration", "modulename": "shimmer.cli.ckpt_migration", "kind": "module", "doc": "<p></p>\n"}, "shimmer.cli.ckpt_migration.migrate_ckpt": {"fullname": "shimmer.cli.ckpt_migration.migrate_ckpt", "modulename": "shimmer.cli.ckpt_migration", "qualname": "migrate_ckpt", "kind": "variable", "doc": "<p>Script to migrate a list of checkpoints.\nThis can be called with:</p>\n\n<div class=\"pdoc-code codehilite\">\n<pre><span></span><code>shimmer<span class=\"w\"> </span>migrate-ckpt<span class=\"w\"> </span>PATH_1<span class=\"w\"> </span>PATH_2<span class=\"w\"> </span>...<span class=\"w\"> </span>PATH_N\n</code></pre>\n</div>\n\n<p>where paths point to checkpoints.</p>\n\n<p>Internally, this calls <code>shimmer.utils.migrate_model</code> for each of the given paths.</p>\n", "default_value": "&lt;Command migrate-ckpt&gt;"}}, "docInfo": {"shimmer.types": {"qualname": 0, "fullname": 2, "annotation": 0, "default_value": 0, "signature": 0, "bases": 0, "doc": 3}, "shimmer.types.RawDomainGroupT": {"qualname": 1, "fullname": 3, "annotation": 0, "default_value": 5, "signature": 0, "bases": 0, "doc": 210}, "shimmer.types.RawDomainGroupDT": {"qualname": 1, "fullname": 3, "annotation": 0, "default_value": 3, "signature": 0, "bases": 0, "doc": 165}, "shimmer.types.LatentsDomainGroupT": {"qualname": 1, "fullname": 3, "annotation": 0, "default_value": 5, "signature": 0, "bases": 0, "doc": 234}, "shimmer.types.LatentsDomainGroupDT": {"qualname": 1, "fullname": 3, "annotation": 0, "default_value": 3, "signature": 0, "bases": 0, "doc": 198}, "shimmer.types.RawDomainGroupsT": {"qualname": 1, "fullname": 3, "annotation": 0, "default_value": 8, "signature": 0, "bases": 0, "doc": 297}, "shimmer.types.RawDomainGroupsDT": {"qualname": 1, "fullname": 3, "annotation": 0, "default_value": 4, "signature": 0, "bases": 0, "doc": 297}, "shimmer.types.LatentsDomainGroupsT": {"qualname": 1, "fullname": 3, "annotation": 0, "default_value": 8, "signature": 0, "bases": 0, "doc": 401}, "shimmer.types.LatentsDomainGroupsDT": {"qualname": 1, "fullname": 3, "annotation": 0, "default_value": 4, "signature": 0, "bases": 0, "doc": 365}, "shimmer.types.ModelModeT": {"qualname": 1, "fullname": 3, "annotation": 0, "default_value": 18, "signature": 0, "bases": 0, "doc": 27}, "shimmer.modules.global_workspace": {"qualname": 0, "fullname": 4, "annotation": 0, "default_value": 0, "signature": 0, "bases": 0, "doc": 3}, "shimmer.modules.global_workspace.SchedulerArgs": {"qualname": 1, "fullname": 5, "annotation": 0, "default_value": 0, "signature": 0, "bases": 2, "doc": 10}, "shimmer.modules.global_workspace.SchedulerArgs.max_lr": {"qualname": 3, "fullname": 7, "annotation": 2, "default_value": 0, "signature": 0, "bases": 0, "doc": 5}, "shimmer.modules.global_workspace.SchedulerArgs.total_steps": {"qualname": 3, "fullname": 7, "annotation": 2, "default_value": 0, "signature": 0, "bases": 0, "doc": 6}, "shimmer.modules.global_workspace.GWPredictionsBase": {"qualname": 1, "fullname": 5, "annotation": 0, "default_value": 0, "signature": 0, "bases": 2, "doc": 13}, "shimmer.modules.global_workspace.GWPredictionsBase.states": {"qualname": 2, "fullname": 6, "annotation": 4, "default_value": 0, "signature": 0, "bases": 0, "doc": 20}, "shimmer.modules.global_workspace.GlobalWorkspaceBase": {"qualname": 1, "fullname": 5, "annotation": 0, "default_value": 0, "signature": 0, "bases": 18, "doc": 20}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.gw_mod": {"qualname": 3, "fullname": 7, "annotation": 0, "default_value": 0, "signature": 0, "bases": 0, "doc": 8}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.selection_mod": {"qualname": 3, "fullname": 7, "annotation": 0, "default_value": 0, "signature": 0, "bases": 0, "doc": 8}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.loss_mod": {"qualname": 3, "fullname": 7, "annotation": 0, "default_value": 0, "signature": 0, "bases": 0, "doc": 10}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.optim_lr": {"qualname": 3, "fullname": 7, "annotation": 0, "default_value": 0, "signature": 0, "bases": 0, "doc": 3}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.optim_weight_decay": {"qualname": 4, "fullname": 8, "annotation": 0, "default_value": 0, "signature": 0, "bases": 0, "doc": 3}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.scheduler_args": {"qualname": 3, "fullname": 7, "annotation": 0, "default_value": 0, "signature": 0, "bases": 0, "doc": 3}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.domain_mods": {"qualname": 3, "fullname": 7, "annotation": 8, "default_value": 0, "signature": 0, "bases": 0, "doc": 3}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.workspace_dim": {"qualname": 3, "fullname": 7, "annotation": 2, "default_value": 0, "signature": 0, "bases": 0, "doc": 7}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.encode_and_fuse": {"qualname": 4, "fullname": 8, "annotation": 0, "default_value": 0, "signature": 125, "bases": 0, "doc": 65}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.encode": {"qualname": 2, "fullname": 6, "annotation": 0, "default_value": 0, "signature": 108, "bases": 0, "doc": 52}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.fuse": {"qualname": 2, "fullname": 6, "annotation": 0, "default_value": 0, "signature": 161, "bases": 0, "doc": 71}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.decode": {"qualname": 2, "fullname": 6, "annotation": 0, "default_value": 0, "signature": 128, "bases": 0, "doc": 68}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.batch_gw_states": {"qualname": 4, "fullname": 8, "annotation": 0, "default_value": 0, "signature": 95, "bases": 0, "doc": 55}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.encode_domain": {"qualname": 3, "fullname": 7, "annotation": 0, "default_value": 0, "signature": 39, "bases": 0, "doc": 122}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.encode_domains": {"qualname": 3, "fullname": 7, "annotation": 0, "default_value": 0, "signature": 108, "bases": 0, "doc": 59}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.decode_domain": {"qualname": 3, "fullname": 7, "annotation": 0, "default_value": 0, "signature": 39, "bases": 0, "doc": 122}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.decode_domains": {"qualname": 3, "fullname": 7, "annotation": 0, "default_value": 0, "signature": 109, "bases": 0, "doc": 59}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.generic_step": {"qualname": 3, "fullname": 7, "annotation": 0, "default_value": 0, "signature": 143, "bases": 0, "doc": 75}, "shimmer.modules.global_workspace.freeze_domain_modules": {"qualname": 3, "fullname": 7, "annotation": 0, "default_value": 0, "signature": 85, "bases": 0, "doc": 81}, "shimmer.modules.global_workspace.GWPredictions": {"qualname": 1, "fullname": 5, "annotation": 0, "default_value": 0, "signature": 0, "bases": 2, "doc": 13}, "shimmer.modules.global_workspace.GWPredictions.demi_cycles": {"qualname": 3, "fullname": 7, "annotation": 4, "default_value": 0, "signature": 0, "bases": 0, "doc": 21}, "shimmer.modules.global_workspace.GWPredictions.cycles": {"qualname": 2, "fullname": 6, "annotation": 5, "default_value": 0, "signature": 0, "bases": 0, "doc": 34}, "shimmer.modules.global_workspace.GWPredictions.translations": {"qualname": 2, "fullname": 6, "annotation": 5, "default_value": 0, "signature": 0, "bases": 0, "doc": 37}, "shimmer.modules.global_workspace.GWPredictions.states": {"qualname": 2, "fullname": 6, "annotation": 4, "default_value": 0, "signature": 0, "bases": 0, "doc": 3}, "shimmer.modules.global_workspace.GlobalWorkspace2Domains": {"qualname": 1, "fullname": 5, "annotation": 0, "default_value": 0, "signature": 0, "bases": 17, "doc": 33}, "shimmer.modules.global_workspace.GlobalWorkspace2Domains.__init__": {"qualname": 3, "fullname": 7, "annotation": 0, "default_value": 0, "signature": 380, "bases": 0, "doc": 250}, "shimmer.modules.global_workspace.GlobalWorkspace2Domains.forward": {"qualname": 2, "fullname": 6, "annotation": 0, "default_value": 0, "signature": 94, "bases": 0, "doc": 51}, "shimmer.modules.global_workspace.GlobalWorkspace": {"qualname": 1, "fullname": 5, "annotation": 0, "default_value": 0, "signature": 0, "bases": 17, "doc": 35}, "shimmer.modules.global_workspace.GlobalWorkspace.__init__": {"qualname": 3, "fullname": 7, "annotation": 0, "default_value": 0, "signature": 400, "bases": 0, "doc": 271}, "shimmer.modules.global_workspace.GlobalWorkspace.forward": {"qualname": 2, "fullname": 6, "annotation": 0, "default_value": 0, "signature": 94, "bases": 0, "doc": 51}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian": {"qualname": 1, "fullname": 5, "annotation": 0, "default_value": 0, "signature": 0, "bases": 17, "doc": 37}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian.__init__": {"qualname": 3, "fullname": 7, "annotation": 0, "default_value": 0, "signature": 459, "bases": 0, "doc": 318}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian.forward": {"qualname": 2, "fullname": 6, "annotation": 0, "default_value": 0, "signature": 94, "bases": 0, "doc": 51}, "shimmer.modules.global_workspace.pretrained_global_workspace": {"qualname": 3, "fullname": 7, "annotation": 0, "default_value": 0, "signature": 317, "bases": 0, "doc": 264}, "shimmer.modules.domain": {"qualname": 0, "fullname": 3, "annotation": 0, "default_value": 0, "signature": 0, "bases": 0, "doc": 3}, "shimmer.modules.domain.LossOutput": {"qualname": 1, "fullname": 4, "annotation": 0, "default_value": 0, "signature": 0, "bases": 0, "doc": 37}, "shimmer.modules.domain.LossOutput.__init__": {"qualname": 3, "fullname": 6, "annotation": 0, "default_value": 0, "signature": 61, "bases": 0, "doc": 3}, "shimmer.modules.domain.LossOutput.loss": {"qualname": 2, "fullname": 5, "annotation": 3, "default_value": 0, "signature": 0, "bases": 0, "doc": 7}, "shimmer.modules.domain.LossOutput.metrics": {"qualname": 2, "fullname": 5, "annotation": 4, "default_value": 0, "signature": 0, "bases": 0, "doc": 12}, "shimmer.modules.domain.LossOutput.all": {"qualname": 2, "fullname": 5, "annotation": 4, "default_value": 0, "signature": 0, "bases": 0, "doc": 14}, "shimmer.modules.domain.DomainModule": {"qualname": 1, "fullname": 4, "annotation": 0, "default_value": 0, "signature": 0, "bases": 5, "doc": 16}, "shimmer.modules.domain.DomainModule.__init__": {"qualname": 3, "fullname": 6, "annotation": 0, "default_value": 0, "signature": 15, "bases": 0, "doc": 29}, "shimmer.modules.domain.DomainModule.latent_dim": {"qualname": 3, "fullname": 6, "annotation": 0, "default_value": 0, "signature": 0, "bases": 0, "doc": 9}, "shimmer.modules.domain.DomainModule.encode": {"qualname": 2, "fullname": 5, "annotation": 0, "default_value": 0, "signature": 29, "bases": 0, "doc": 49}, "shimmer.modules.domain.DomainModule.decode": {"qualname": 2, "fullname": 5, "annotation": 0, "default_value": 0, "signature": 29, "bases": 0, "doc": 53}, "shimmer.modules.domain.DomainModule.compute_loss": {"qualname": 3, "fullname": 6, "annotation": 0, "default_value": 0, "signature": 62, "bases": 0, "doc": 61}, "shimmer.modules.domain.DomainModule.compute_dcy_loss": {"qualname": 4, "fullname": 7, "annotation": 0, "default_value": 0, "signature": 62, "bases": 0, "doc": 75}, "shimmer.modules.domain.DomainModule.compute_cy_loss": {"qualname": 4, "fullname": 7, "annotation": 0, "default_value": 0, "signature": 62, "bases": 0, "doc": 73}, "shimmer.modules.domain.DomainModule.compute_tr_loss": {"qualname": 4, "fullname": 7, "annotation": 0, "default_value": 0, "signature": 62, "bases": 0, "doc": 73}, "shimmer.modules.domain.DomainModule.compute_broadcast_loss": {"qualname": 4, "fullname": 7, "annotation": 0, "default_value": 0, "signature": 62, "bases": 0, "doc": 74}, "shimmer.modules.gw_module": {"qualname": 0, "fullname": 4, "annotation": 0, "default_value": 0, "signature": 0, "bases": 0, "doc": 3}, "shimmer.modules.gw_module.get_n_layers": {"qualname": 3, "fullname": 7, "annotation": 0, "default_value": 0, "signature": 57, "bases": 0, "doc": 76}, "shimmer.modules.gw_module.GWDecoder": {"qualname": 1, "fullname": 5, "annotation": 0, "default_value": 0, "signature": 0, "bases": 5, "doc": 8}, "shimmer.modules.gw_module.GWDecoder.__init__": {"qualname": 3, "fullname": 7, "annotation": 0, "default_value": 0, "signature": 48, "bases": 0, "doc": 81}, "shimmer.modules.gw_module.GWDecoder.in_dim": {"qualname": 3, "fullname": 7, "annotation": 0, "default_value": 0, "signature": 0, "bases": 0, "doc": 4}, "shimmer.modules.gw_module.GWDecoder.hidden_dim": {"qualname": 3, "fullname": 7, "annotation": 0, "default_value": 0, "signature": 0, "bases": 0, "doc": 4}, "shimmer.modules.gw_module.GWDecoder.out_dim": {"qualname": 3, "fullname": 7, "annotation": 0, "default_value": 0, "signature": 0, "bases": 0, "doc": 4}, "shimmer.modules.gw_module.GWDecoder.n_layers": {"qualname": 3, "fullname": 7, "annotation": 0, "default_value": 0, "signature": 0, "bases": 0, "doc": 24}, "shimmer.modules.gw_module.GWEncoder": {"qualname": 1, "fullname": 5, "annotation": 0, "default_value": 0, "signature": 0, "bases": 1, "doc": 27}, "shimmer.modules.gw_module.GWEncoder.__init__": {"qualname": 3, "fullname": 7, "annotation": 0, "default_value": 0, "signature": 48, "bases": 0, "doc": 81}, "shimmer.modules.gw_module.GWEncoder.forward": {"qualname": 2, "fullname": 6, "annotation": 0, "default_value": 0, "signature": 34, "bases": 0, "doc": 67}, "shimmer.modules.gw_module.GWEncoderLinear": {"qualname": 1, "fullname": 5, "annotation": 0, "default_value": 0, "signature": 0, "bases": 5, "doc": 10}, "shimmer.modules.gw_module.GWEncoderLinear.forward": {"qualname": 2, "fullname": 6, "annotation": 0, "default_value": 0, "signature": 34, "bases": 0, "doc": 67}, "shimmer.modules.gw_module.GWModuleBase": {"qualname": 1, "fullname": 5, "annotation": 0, "default_value": 0, "signature": 0, "bases": 7, "doc": 58}, "shimmer.modules.gw_module.GWModuleBase.__init__": {"qualname": 3, "fullname": 7, "annotation": 0, "default_value": 0, "signature": 81, "bases": 0, "doc": 43}, "shimmer.modules.gw_module.GWModuleBase.domain_mods": {"qualname": 3, "fullname": 7, "annotation": 0, "default_value": 0, "signature": 0, "bases": 0, "doc": 7}, "shimmer.modules.gw_module.GWModuleBase.workspace_dim": {"qualname": 3, "fullname": 7, "annotation": 0, "default_value": 0, "signature": 0, "bases": 0, "doc": 6}, "shimmer.modules.gw_module.GWModuleBase.fuse": {"qualname": 2, "fullname": 6, "annotation": 0, "default_value": 0, "signature": 97, "bases": 0, "doc": 69}, "shimmer.modules.gw_module.GWModuleBase.encode": {"qualname": 2, "fullname": 6, "annotation": 0, "default_value": 0, "signature": 70, "bases": 0, "doc": 50}, "shimmer.modules.gw_module.GWModuleBase.encode_and_fuse": {"qualname": 4, "fullname": 8, "annotation": 0, "default_value": 0, "signature": 85, "bases": 0, "doc": 78}, "shimmer.modules.gw_module.GWModuleBase.decode": {"qualname": 2, "fullname": 6, "annotation": 0, "default_value": 0, "signature": 88, "bases": 0, "doc": 65}, "shimmer.modules.gw_module.GWModule": {"qualname": 1, "fullname": 5, "annotation": 0, "default_value": 0, "signature": 0, "bases": 1, "doc": 10}, "shimmer.modules.gw_module.GWModule.__init__": {"qualname": 3, "fullname": 7, "annotation": 0, "default_value": 0, "signature": 173, "bases": 0, "doc": 117}, "shimmer.modules.gw_module.GWModule.gw_encoders": {"qualname": 3, "fullname": 7, "annotation": 0, "default_value": 0, "signature": 0, "bases": 0, "doc": 6}, "shimmer.modules.gw_module.GWModule.gw_decoders": {"qualname": 3, "fullname": 7, "annotation": 0, "default_value": 0, "signature": 0, "bases": 0, "doc": 6}, "shimmer.modules.gw_module.GWModule.fuse": {"qualname": 2, "fullname": 6, "annotation": 0, "default_value": 0, "signature": 97, "bases": 0, "doc": 69}, "shimmer.modules.gw_module.GWModule.encode": {"qualname": 2, "fullname": 6, "annotation": 0, "default_value": 0, "signature": 70, "bases": 0, "doc": 50}, "shimmer.modules.gw_module.GWModule.decode": {"qualname": 2, "fullname": 6, "annotation": 0, "default_value": 0, "signature": 88, "bases": 0, "doc": 73}, "shimmer.modules.gw_module.compute_fusion_scores": {"qualname": 3, "fullname": 7, "annotation": 0, "default_value": 0, "signature": 107, "bases": 0, "doc": 119}, "shimmer.modules.gw_module.GWModuleBayesian": {"qualname": 1, "fullname": 5, "annotation": 0, "default_value": 0, "signature": 0, "bases": 1, "doc": 12}, "shimmer.modules.gw_module.GWModuleBayesian.__init__": {"qualname": 3, "fullname": 7, "annotation": 0, "default_value": 0, "signature": 232, "bases": 0, "doc": 163}, "shimmer.modules.gw_module.GWModuleBayesian.precisions": {"qualname": 2, "fullname": 6, "annotation": 0, "default_value": 0, "signature": 0, "bases": 0, "doc": 11}, "shimmer.modules.gw_module.GWModuleBayesian.sensitivity_selection": {"qualname": 3, "fullname": 7, "annotation": 0, "default_value": 0, "signature": 0, "bases": 0, "doc": 3}, "shimmer.modules.gw_module.GWModuleBayesian.sensitivity_precision": {"qualname": 3, "fullname": 7, "annotation": 0, "default_value": 0, "signature": 0, "bases": 0, "doc": 3}, "shimmer.modules.gw_module.GWModuleBayesian.precision_softmax_temp": {"qualname": 4, "fullname": 8, "annotation": 0, "default_value": 0, "signature": 0, "bases": 0, "doc": 3}, "shimmer.modules.gw_module.GWModuleBayesian.get_precision": {"qualname": 3, "fullname": 7, "annotation": 0, "default_value": 0, "signature": 44, "bases": 0, "doc": 57}, "shimmer.modules.gw_module.GWModuleBayesian.fuse": {"qualname": 2, "fullname": 6, "annotation": 0, "default_value": 0, "signature": 97, "bases": 0, "doc": 296}, "shimmer.modules.selection": {"qualname": 0, "fullname": 3, "annotation": 0, "default_value": 0, "signature": 0, "bases": 0, "doc": 3}, "shimmer.modules.selection.SelectionBase": {"qualname": 1, "fullname": 4, "annotation": 0, "default_value": 0, "signature": 0, "bases": 7, "doc": 29}, "shimmer.modules.selection.SelectionBase.update_gw_state": {"qualname": 4, "fullname": 7, "annotation": 0, "default_value": 0, "signature": 30, "bases": 0, "doc": 66}, "shimmer.modules.selection.SelectionBase.forward": {"qualname": 2, "fullname": 5, "annotation": 0, "default_value": 0, "signature": 110, "bases": 0, "doc": 202}, "shimmer.modules.selection.SingleDomainSelection": {"qualname": 1, "fullname": 4, "annotation": 0, "default_value": 0, "signature": 0, "bases": 1, "doc": 48}, "shimmer.modules.selection.SingleDomainSelection.forward": {"qualname": 2, "fullname": 5, "annotation": 0, "default_value": 0, "signature": 110, "bases": 0, "doc": 69}, "shimmer.modules.selection.FixedSharedSelection": {"qualname": 1, "fullname": 4, "annotation": 0, "default_value": 0, "signature": 0, "bases": 1, "doc": 35}, "shimmer.modules.selection.FixedSharedSelection.forward": {"qualname": 2, "fullname": 5, "annotation": 0, "default_value": 0, "signature": 110, "bases": 0, "doc": 69}, "shimmer.modules.selection.KQFixedQSelection": {"qualname": 1, "fullname": 4, "annotation": 0, "default_value": 0, "signature": 0, "bases": 1, "doc": 11}, "shimmer.modules.selection.KQFixedQSelection.__init__": {"qualname": 3, "fullname": 6, "annotation": 0, "default_value": 0, "signature": 56, "bases": 0, "doc": 62}, "shimmer.modules.selection.KQFixedQSelection.head_size": {"qualname": 3, "fullname": 6, "annotation": 0, "default_value": 0, "signature": 0, "bases": 0, "doc": 3}, "shimmer.modules.selection.KQFixedQSelection.query_layer": {"qualname": 3, "fullname": 6, "annotation": 0, "default_value": 0, "signature": 0, "bases": 0, "doc": 3}, "shimmer.modules.selection.KQFixedQSelection.key_layers": {"qualname": 3, "fullname": 6, "annotation": 0, "default_value": 0, "signature": 0, "bases": 0, "doc": 3}, "shimmer.modules.selection.KQFixedQSelection.forward": {"qualname": 2, "fullname": 5, "annotation": 0, "default_value": 0, "signature": 110, "bases": 0, "doc": 89}, "shimmer.modules.selection.RandomSelection": {"qualname": 1, "fullname": 4, "annotation": 0, "default_value": 0, "signature": 0, "bases": 1, "doc": 37}, "shimmer.modules.selection.RandomSelection.__init__": {"qualname": 3, "fullname": 6, "annotation": 0, "default_value": 0, "signature": 14, "bases": 0, "doc": 26}, "shimmer.modules.selection.RandomSelection.temperature": {"qualname": 2, "fullname": 5, "annotation": 0, "default_value": 0, "signature": 0, "bases": 0, "doc": 3}, "shimmer.modules.selection.RandomSelection.forward": {"qualname": 2, "fullname": 5, "annotation": 0, "default_value": 0, "signature": 110, "bases": 0, "doc": 88}, "shimmer.modules.selection.DynamicQueryAttention": {"qualname": 1, "fullname": 4, "annotation": 0, "default_value": 0, "signature": 0, "bases": 1, "doc": 21}, "shimmer.modules.selection.DynamicQueryAttention.__init__": {"qualname": 3, "fullname": 6, "annotation": 0, "default_value": 0, "signature": 56, "bases": 0, "doc": 62}, "shimmer.modules.selection.DynamicQueryAttention.head_size": {"qualname": 3, "fullname": 6, "annotation": 0, "default_value": 0, "signature": 0, "bases": 0, "doc": 3}, "shimmer.modules.selection.DynamicQueryAttention.query_layer": {"qualname": 3, "fullname": 6, "annotation": 0, "default_value": 0, "signature": 0, "bases": 0, "doc": 3}, "shimmer.modules.selection.DynamicQueryAttention.key_layers": {"qualname": 3, "fullname": 6, "annotation": 0, "default_value": 0, "signature": 0, "bases": 0, "doc": 3}, "shimmer.modules.selection.DynamicQueryAttention.fuse_weighted_encodings": {"qualname": 4, "fullname": 7, "annotation": 0, "default_value": 0, "signature": 87, "bases": 0, "doc": 69}, "shimmer.modules.selection.DynamicQueryAttention.forward": {"qualname": 2, "fullname": 5, "annotation": 0, "default_value": 0, "signature": 110, "bases": 0, "doc": 89}, "shimmer.modules.losses": {"qualname": 0, "fullname": 3, "annotation": 0, "default_value": 0, "signature": 0, "bases": 0, "doc": 3}, "shimmer.modules.losses.GWLossesBase": {"qualname": 1, "fullname": 4, "annotation": 0, "default_value": 0, "signature": 0, "bases": 7, "doc": 30}, "shimmer.modules.losses.GWLossesBase.step": {"qualname": 2, "fullname": 5, "annotation": 0, "default_value": 0, "signature": 154, "bases": 0, "doc": 57}, "shimmer.modules.losses.demi_cycle_loss": {"qualname": 3, "fullname": 6, "annotation": 0, "default_value": 0, "signature": 193, "bases": 0, "doc": 175}, "shimmer.modules.losses.cycle_loss": {"qualname": 2, "fullname": 5, "annotation": 0, "default_value": 0, "signature": 193, "bases": 0, "doc": 172}, "shimmer.modules.losses.translation_loss": {"qualname": 2, "fullname": 5, "annotation": 0, "default_value": 0, "signature": 193, "bases": 0, "doc": 159}, "shimmer.modules.losses.contrastive_loss": {"qualname": 2, "fullname": 5, "annotation": 0, "default_value": 0, "signature": 182, "bases": 0, "doc": 155}, "shimmer.modules.losses.contrastive_loss_bayesian": {"qualname": 3, "fullname": 6, "annotation": 0, "default_value": 0, "signature": 182, "bases": 0, "doc": 161}, "shimmer.modules.losses.LossCoefs": {"qualname": 1, "fullname": 4, "annotation": 0, "default_value": 0, "signature": 0, "bases": 2, "doc": 51}, "shimmer.modules.losses.LossCoefs.demi_cycles": {"qualname": 3, "fullname": 6, "annotation": 2, "default_value": 0, "signature": 0, "bases": 0, "doc": 7}, "shimmer.modules.losses.LossCoefs.cycles": {"qualname": 2, "fullname": 5, "annotation": 2, "default_value": 0, "signature": 0, "bases": 0, "doc": 6}, "shimmer.modules.losses.LossCoefs.translations": {"qualname": 2, "fullname": 5, "annotation": 2, "default_value": 0, "signature": 0, "bases": 0, "doc": 6}, "shimmer.modules.losses.LossCoefs.contrastives": {"qualname": 2, "fullname": 5, "annotation": 2, "default_value": 0, "signature": 0, "bases": 0, "doc": 6}, "shimmer.modules.losses.GWLosses2Domains": {"qualname": 1, "fullname": 4, "annotation": 0, "default_value": 0, "signature": 0, "bases": 1, "doc": 13}, "shimmer.modules.losses.GWLosses2Domains.__init__": {"qualname": 3, "fullname": 6, "annotation": 0, "default_value": 0, "signature": 190, "bases": 0, "doc": 107}, "shimmer.modules.losses.GWLosses2Domains.gw_mod": {"qualname": 3, "fullname": 6, "annotation": 0, "default_value": 0, "signature": 0, "bases": 0, "doc": 3}, "shimmer.modules.losses.GWLosses2Domains.selection_mod": {"qualname": 3, "fullname": 6, "annotation": 0, "default_value": 0, "signature": 0, "bases": 0, "doc": 3}, "shimmer.modules.losses.GWLosses2Domains.domain_mods": {"qualname": 3, "fullname": 6, "annotation": 0, "default_value": 0, "signature": 0, "bases": 0, "doc": 3}, "shimmer.modules.losses.GWLosses2Domains.loss_coefs": {"qualname": 3, "fullname": 6, "annotation": 0, "default_value": 0, "signature": 0, "bases": 0, "doc": 3}, "shimmer.modules.losses.GWLosses2Domains.contrastive_fn": {"qualname": 3, "fullname": 6, "annotation": 0, "default_value": 0, "signature": 0, "bases": 0, "doc": 3}, "shimmer.modules.losses.GWLosses2Domains.demi_cycle_loss": {"qualname": 4, "fullname": 7, "annotation": 0, "default_value": 0, "signature": 95, "bases": 0, "doc": 60}, "shimmer.modules.losses.GWLosses2Domains.cycle_loss": {"qualname": 3, "fullname": 6, "annotation": 0, "default_value": 0, "signature": 95, "bases": 0, "doc": 58}, "shimmer.modules.losses.GWLosses2Domains.translation_loss": {"qualname": 3, "fullname": 6, "annotation": 0, "default_value": 0, "signature": 95, "bases": 0, "doc": 58}, "shimmer.modules.losses.GWLosses2Domains.contrastive_loss": {"qualname": 3, "fullname": 6, "annotation": 0, "default_value": 0, "signature": 95, "bases": 0, "doc": 58}, "shimmer.modules.losses.GWLosses2Domains.step": {"qualname": 2, "fullname": 5, "annotation": 0, "default_value": 0, "signature": 154, "bases": 0, "doc": 109}, "shimmer.modules.losses.generate_partitions": {"qualname": 2, "fullname": 5, "annotation": 0, "default_value": 0, "signature": 58, "bases": 0, "doc": 71}, "shimmer.modules.losses.broadcast_loss": {"qualname": 2, "fullname": 5, "annotation": 0, "default_value": 0, "signature": 193, "bases": 0, "doc": 99}, "shimmer.modules.losses.BroadcastLossCoefs": {"qualname": 1, "fullname": 4, "annotation": 0, "default_value": 0, "signature": 0, "bases": 2, "doc": 51}, "shimmer.modules.losses.BroadcastLossCoefs.contrastives": {"qualname": 2, "fullname": 5, "annotation": 2, "default_value": 0, "signature": 0, "bases": 0, "doc": 6}, "shimmer.modules.losses.BroadcastLossCoefs.fused": {"qualname": 2, "fullname": 5, "annotation": 2, "default_value": 0, "signature": 0, "bases": 0, "doc": 15}, "shimmer.modules.losses.BroadcastLossCoefs.demi_cycles": {"qualname": 3, "fullname": 6, "annotation": 2, "default_value": 0, "signature": 0, "bases": 0, "doc": 13}, "shimmer.modules.losses.BroadcastLossCoefs.cycles": {"qualname": 2, "fullname": 5, "annotation": 2, "default_value": 0, "signature": 0, "bases": 0, "doc": 11}, "shimmer.modules.losses.BroadcastLossCoefs.translations": {"qualname": 2, "fullname": 5, "annotation": 2, "default_value": 0, "signature": 0, "bases": 0, "doc": 14}, "shimmer.modules.losses.GWLosses": {"qualname": 1, "fullname": 4, "annotation": 0, "default_value": 0, "signature": 0, "bases": 1, "doc": 12}, "shimmer.modules.losses.GWLosses.__init__": {"qualname": 3, "fullname": 6, "annotation": 0, "default_value": 0, "signature": 190, "bases": 0, "doc": 91}, "shimmer.modules.losses.GWLosses.gw_mod": {"qualname": 3, "fullname": 6, "annotation": 0, "default_value": 0, "signature": 0, "bases": 0, "doc": 3}, "shimmer.modules.losses.GWLosses.selection_mod": {"qualname": 3, "fullname": 6, "annotation": 0, "default_value": 0, "signature": 0, "bases": 0, "doc": 3}, "shimmer.modules.losses.GWLosses.domain_mods": {"qualname": 3, "fullname": 6, "annotation": 0, "default_value": 0, "signature": 0, "bases": 0, "doc": 3}, "shimmer.modules.losses.GWLosses.loss_coefs": {"qualname": 3, "fullname": 6, "annotation": 0, "default_value": 0, "signature": 0, "bases": 0, "doc": 3}, "shimmer.modules.losses.GWLosses.contrastive_fn": {"qualname": 3, "fullname": 6, "annotation": 0, "default_value": 0, "signature": 0, "bases": 0, "doc": 3}, "shimmer.modules.losses.GWLosses.contrastive_loss": {"qualname": 3, "fullname": 6, "annotation": 0, "default_value": 0, "signature": 95, "bases": 0, "doc": 46}, "shimmer.modules.losses.GWLosses.broadcast_loss": {"qualname": 3, "fullname": 6, "annotation": 0, "default_value": 0, "signature": 95, "bases": 0, "doc": 3}, "shimmer.modules.losses.GWLosses.step": {"qualname": 2, "fullname": 5, "annotation": 0, "default_value": 0, "signature": 154, "bases": 0, "doc": 64}, "shimmer.modules.losses.GWLossesBayesian": {"qualname": 1, "fullname": 4, "annotation": 0, "default_value": 0, "signature": 0, "bases": 1, "doc": 13}, "shimmer.modules.losses.GWLossesBayesian.__init__": {"qualname": 3, "fullname": 6, "annotation": 0, "default_value": 0, "signature": 210, "bases": 0, "doc": 120}, "shimmer.modules.losses.GWLossesBayesian.gw_mod": {"qualname": 3, "fullname": 6, "annotation": 0, "default_value": 0, "signature": 0, "bases": 0, "doc": 5}, "shimmer.modules.losses.GWLossesBayesian.selection_mod": {"qualname": 3, "fullname": 6, "annotation": 0, "default_value": 0, "signature": 0, "bases": 0, "doc": 4}, "shimmer.modules.losses.GWLossesBayesian.domain_mods": {"qualname": 3, "fullname": 6, "annotation": 0, "default_value": 0, "signature": 0, "bases": 0, "doc": 9}, "shimmer.modules.losses.GWLossesBayesian.loss_coefs": {"qualname": 3, "fullname": 6, "annotation": 0, "default_value": 0, "signature": 0, "bases": 0, "doc": 6}, "shimmer.modules.losses.GWLossesBayesian.contrastive_fn": {"qualname": 3, "fullname": 6, "annotation": 0, "default_value": 0, "signature": 0, "bases": 0, "doc": 7}, "shimmer.modules.losses.GWLossesBayesian.use_normalized_constrastive": {"qualname": 4, "fullname": 7, "annotation": 0, "default_value": 0, "signature": 0, "bases": 0, "doc": 3}, "shimmer.modules.losses.GWLossesBayesian.contrastive_loss": {"qualname": 3, "fullname": 6, "annotation": 0, "default_value": 0, "signature": 95, "bases": 0, "doc": 45}, "shimmer.modules.losses.GWLossesBayesian.broadcast_loss": {"qualname": 3, "fullname": 6, "annotation": 0, "default_value": 0, "signature": 95, "bases": 0, "doc": 3}, "shimmer.modules.losses.GWLossesBayesian.step": {"qualname": 2, "fullname": 5, "annotation": 0, "default_value": 0, "signature": 154, "bases": 0, "doc": 64}, "shimmer.modules.contrastive_loss": {"qualname": 0, "fullname": 4, "annotation": 0, "default_value": 0, "signature": 0, "bases": 0, "doc": 6}, "shimmer.modules.contrastive_loss.ContrastiveLossType": {"qualname": 1, "fullname": 5, "annotation": 0, "default_value": 10, "signature": 0, "bases": 0, "doc": 21}, "shimmer.modules.contrastive_loss.ContrastiveLossBayesianType": {"qualname": 1, "fullname": 5, "annotation": 0, "default_value": 14, "signature": 0, "bases": 0, "doc": 29}, "shimmer.modules.contrastive_loss.info_nce": {"qualname": 2, "fullname": 6, "annotation": 0, "default_value": 0, "signature": 115, "bases": 0, "doc": 68}, "shimmer.modules.contrastive_loss.contrastive_loss": {"qualname": 2, "fullname": 6, "annotation": 0, "default_value": 0, "signature": 115, "bases": 0, "doc": 70}, "shimmer.modules.contrastive_loss.ContrastiveLoss": {"qualname": 1, "fullname": 5, "annotation": 0, "default_value": 0, "signature": 0, "bases": 5, "doc": 8}, "shimmer.modules.contrastive_loss.ContrastiveLoss.__init__": {"qualname": 3, "fullname": 7, "annotation": 0, "default_value": 0, "signature": 93, "bases": 0, "doc": 83}, "shimmer.modules.contrastive_loss.ContrastiveLoss.learn_logit_scale": {"qualname": 4, "fullname": 8, "annotation": 0, "default_value": 0, "signature": 0, "bases": 0, "doc": 3}, "shimmer.modules.contrastive_loss.ContrastiveLoss.reduction": {"qualname": 2, "fullname": 6, "annotation": 12, "default_value": 0, "signature": 0, "bases": 0, "doc": 3}, "shimmer.modules.contrastive_loss.ContrastiveLoss.forward": {"qualname": 2, "fullname": 6, "annotation": 0, "default_value": 0, "signature": 62, "bases": 0, "doc": 56}, "shimmer.dataset": {"qualname": 0, "fullname": 2, "annotation": 0, "default_value": 0, "signature": 0, "bases": 0, "doc": 3}, "shimmer.dataset.RepeatedDataset": {"qualname": 1, "fullname": 3, "annotation": 0, "default_value": 0, "signature": 0, "bases": 3, "doc": 46}, "shimmer.dataset.RepeatedDataset.__init__": {"qualname": 3, "fullname": 5, "annotation": 0, "default_value": 0, "signature": 57, "bases": 0, "doc": 63}, "shimmer.dataset.RepeatedDataset.dataset": {"qualname": 2, "fullname": 4, "annotation": 0, "default_value": 0, "signature": 0, "bases": 0, "doc": 3}, "shimmer.dataset.RepeatedDataset.dataset_size": {"qualname": 3, "fullname": 5, "annotation": 0, "default_value": 0, "signature": 0, "bases": 0, "doc": 3}, "shimmer.modules.vae": {"qualname": 0, "fullname": 3, "annotation": 0, "default_value": 0, "signature": 0, "bases": 0, "doc": 3}, "shimmer.modules.vae.reparameterize": {"qualname": 1, "fullname": 4, "annotation": 0, "default_value": 0, "signature": 44, "bases": 0, "doc": 65}, "shimmer.modules.vae.kl_divergence_loss": {"qualname": 3, "fullname": 6, "annotation": 0, "default_value": 0, "signature": 44, "bases": 0, "doc": 57}, "shimmer.modules.vae.gaussian_nll": {"qualname": 2, "fullname": 5, "annotation": 0, "default_value": 0, "signature": 63, "bases": 0, "doc": 69}, "shimmer.modules.vae.VAEEncoder": {"qualname": 1, "fullname": 4, "annotation": 0, "default_value": 0, "signature": 0, "bases": 7, "doc": 9}, "shimmer.modules.vae.VAEEncoder.forward": {"qualname": 2, "fullname": 5, "annotation": 0, "default_value": 0, "signature": 46, "bases": 0, "doc": 46}, "shimmer.modules.vae.VAEDecoder": {"qualname": 1, "fullname": 4, "annotation": 0, "default_value": 0, "signature": 0, "bases": 7, "doc": 9}, "shimmer.modules.vae.VAEDecoder.forward": {"qualname": 2, "fullname": 5, "annotation": 0, "default_value": 0, "signature": 29, "bases": 0, "doc": 42}, "shimmer.modules.vae.VAE": {"qualname": 1, "fullname": 4, "annotation": 0, "default_value": 0, "signature": 0, "bases": 5, "doc": 4}, "shimmer.modules.vae.VAE.__init__": {"qualname": 3, "fullname": 6, "annotation": 0, "default_value": 0, "signature": 74, "bases": 0, "doc": 53}, "shimmer.modules.vae.VAE.beta": {"qualname": 2, "fullname": 5, "annotation": 0, "default_value": 0, "signature": 0, "bases": 0, "doc": 7}, "shimmer.modules.vae.VAE.encoder": {"qualname": 2, "fullname": 5, "annotation": 0, "default_value": 0, "signature": 0, "bases": 0, "doc": 4}, "shimmer.modules.vae.VAE.decoder": {"qualname": 2, "fullname": 5, "annotation": 0, "default_value": 0, "signature": 0, "bases": 0, "doc": 4}, "shimmer.modules.vae.VAE.encode": {"qualname": 2, "fullname": 5, "annotation": 0, "default_value": 0, "signature": 29, "bases": 0, "doc": 49}, "shimmer.modules.vae.VAE.decode": {"qualname": 2, "fullname": 5, "annotation": 0, "default_value": 0, "signature": 29, "bases": 0, "doc": 49}, "shimmer.modules.vae.VAE.forward": {"qualname": 2, "fullname": 5, "annotation": 0, "default_value": 0, "signature": 61, "bases": 0, "doc": 63}, "shimmer.modules.utils": {"qualname": 0, "fullname": 3, "annotation": 0, "default_value": 0, "signature": 0, "bases": 0, "doc": 3}, "shimmer.modules.utils.translation": {"qualname": 1, "fullname": 4, "annotation": 0, "default_value": 0, "signature": 118, "bases": 0, "doc": 96}, "shimmer.modules.utils.cycle": {"qualname": 1, "fullname": 4, "annotation": 0, "default_value": 0, "signature": 130, "bases": 0, "doc": 111}, "shimmer.modules.utils.batch_demi_cycles": {"qualname": 3, "fullname": 6, "annotation": 0, "default_value": 0, "signature": 144, "bases": 0, "doc": 81}, "shimmer.modules.utils.batch_cycles": {"qualname": 2, "fullname": 5, "annotation": 0, "default_value": 0, "signature": 182, "bases": 0, "doc": 115}, "shimmer.modules.utils.batch_translations": {"qualname": 2, "fullname": 5, "annotation": 0, "default_value": 0, "signature": 154, "bases": 0, "doc": 88}, "shimmer.utils": {"qualname": 0, "fullname": 2, "annotation": 0, "default_value": 0, "signature": 0, "bases": 0, "doc": 3}, "shimmer.utils.MIGRATION_DIR": {"qualname": 2, "fullname": 4, "annotation": 0, "default_value": 6, "signature": 0, "bases": 0, "doc": 3}, "shimmer.utils.group_batch_size": {"qualname": 3, "fullname": 5, "annotation": 0, "default_value": 0, "signature": 46, "bases": 0, "doc": 3}, "shimmer.utils.groups_batch_size": {"qualname": 3, "fullname": 5, "annotation": 0, "default_value": 0, "signature": 72, "bases": 0, "doc": 46}, "shimmer.utils.groups_device": {"qualname": 2, "fullname": 4, "annotation": 0, "default_value": 0, "signature": 72, "bases": 0, "doc": 46}, "shimmer.utils.group_device": {"qualname": 2, "fullname": 4, "annotation": 0, "default_value": 0, "signature": 51, "bases": 0, "doc": 3}, "shimmer.utils.migrate_model": {"qualname": 2, "fullname": 4, "annotation": 0, "default_value": 0, "signature": 37, "bases": 0, "doc": 67}, "shimmer.utils.SaveMigrations": {"qualname": 1, "fullname": 3, "annotation": 0, "default_value": 0, "signature": 0, "bases": 5, "doc": 23}, "shimmer.utils.SaveMigrations.migrations": {"qualname": 2, "fullname": 4, "annotation": 0, "default_value": 0, "signature": 0, "bases": 0, "doc": 3}, "shimmer.utils.SaveMigrations.on_save_checkpoint": {"qualname": 4, "fullname": 6, "annotation": 0, "default_value": 0, "signature": 103, "bases": 0, "doc": 74}, "shimmer.cli.ckpt_migration": {"qualname": 0, "fullname": 4, "annotation": 0, "default_value": 0, "signature": 0, "bases": 0, "doc": 3}, "shimmer.cli.ckpt_migration.migrate_ckpt": {"qualname": 2, "fullname": 6, "annotation": 0, "default_value": 7, "signature": 0, "bases": 0, "doc": 72}}, "length": 232, "save": true}, "index": {"qualname": {"root": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspace2Domains.__init__": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace.__init__": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian.__init__": {"tf": 1}, "shimmer.modules.domain.LossOutput.__init__": {"tf": 1}, "shimmer.modules.domain.DomainModule.__init__": {"tf": 1}, "shimmer.modules.gw_module.GWDecoder.__init__": {"tf": 1}, "shimmer.modules.gw_module.GWEncoder.__init__": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBase.__init__": {"tf": 1}, "shimmer.modules.gw_module.GWModule.__init__": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBayesian.__init__": {"tf": 1}, "shimmer.modules.selection.KQFixedQSelection.__init__": {"tf": 1}, "shimmer.modules.selection.RandomSelection.__init__": {"tf": 1}, "shimmer.modules.selection.DynamicQueryAttention.__init__": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.__init__": {"tf": 1}, "shimmer.modules.losses.GWLosses.__init__": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.__init__": {"tf": 1}, "shimmer.modules.contrastive_loss.ContrastiveLoss.__init__": {"tf": 1}, "shimmer.dataset.RepeatedDataset.__init__": {"tf": 1}, "shimmer.modules.vae.VAE.__init__": {"tf": 1}}, "df": 19, "r": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "w": {"docs": {}, "df": 0, "d": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "g": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "p": {"docs": {}, "df": 0, "t": {"docs": {"shimmer.types.RawDomainGroupT": {"tf": 1}}, "df": 1}, "d": {"docs": {}, "df": 0, "t": {"docs": {"shimmer.types.RawDomainGroupDT": {"tf": 1}}, "df": 1}}, "s": {"docs": {}, "df": 0, "t": {"docs": {"shimmer.types.RawDomainGroupsT": {"tf": 1}}, "df": 1}, "d": {"docs": {}, "df": 0, "t": {"docs": {"shimmer.types.RawDomainGroupsDT": {"tf": 1}}, "df": 1}}}}}}}}}}}}}}}, "n": {"docs": {}, "df": 0, "d": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "n": {"docs": {"shimmer.modules.selection.RandomSelection": {"tf": 1}, "shimmer.modules.selection.RandomSelection.__init__": {"tf": 1}, "shimmer.modules.selection.RandomSelection.temperature": {"tf": 1}, "shimmer.modules.selection.RandomSelection.forward": {"tf": 1}}, "df": 4}}}}}}}}}}}}}}, "e": {"docs": {}, "df": 0, "d": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "n": {"docs": {"shimmer.modules.contrastive_loss.ContrastiveLoss.reduction": {"tf": 1}}, "df": 1}}}}}}}, "p": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "d": {"docs": {}, "df": 0, "d": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "t": {"docs": {"shimmer.dataset.RepeatedDataset": {"tf": 1}, "shimmer.dataset.RepeatedDataset.__init__": {"tf": 1}, "shimmer.dataset.RepeatedDataset.dataset": {"tf": 1}, "shimmer.dataset.RepeatedDataset.dataset_size": {"tf": 1}}, "df": 4}}}}}}}}}}}}, "a": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "z": {"docs": {}, "df": 0, "e": {"docs": {"shimmer.modules.vae.reparameterize": {"tf": 1}}, "df": 1}}}}}}}}}}}}}}, "l": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "t": {"docs": {"shimmer.modules.domain.DomainModule.latent_dim": {"tf": 1}}, "df": 1, "s": {"docs": {}, "df": 0, "d": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "g": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "p": {"docs": {}, "df": 0, "t": {"docs": {"shimmer.types.LatentsDomainGroupT": {"tf": 1}}, "df": 1}, "d": {"docs": {}, "df": 0, "t": {"docs": {"shimmer.types.LatentsDomainGroupDT": {"tf": 1}}, "df": 1}}, "s": {"docs": {}, "df": 0, "t": {"docs": {"shimmer.types.LatentsDomainGroupsT": {"tf": 1}}, "df": 1}, "d": {"docs": {}, "df": 0, "t": {"docs": {"shimmer.types.LatentsDomainGroupsDT": {"tf": 1}}, "df": 1}}}}}}}}}}}}}}}}}}}, "y": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "r": {"docs": {"shimmer.modules.selection.KQFixedQSelection.query_layer": {"tf": 1}, "shimmer.modules.selection.DynamicQueryAttention.query_layer": {"tf": 1}}, "df": 2, "s": {"docs": {"shimmer.modules.gw_module.get_n_layers": {"tf": 1}, "shimmer.modules.gw_module.GWDecoder.n_layers": {"tf": 1}, "shimmer.modules.selection.KQFixedQSelection.key_layers": {"tf": 1}, "shimmer.modules.selection.DynamicQueryAttention.key_layers": {"tf": 1}}, "df": 4}}}}}, "r": {"docs": {"shimmer.modules.global_workspace.SchedulerArgs.max_lr": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.optim_lr": {"tf": 1}}, "df": 2}, "o": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "s": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspaceBase.loss_mod": {"tf": 1}, "shimmer.modules.domain.LossOutput.loss": {"tf": 1}, "shimmer.modules.domain.DomainModule.compute_loss": {"tf": 1}, "shimmer.modules.domain.DomainModule.compute_dcy_loss": {"tf": 1}, "shimmer.modules.domain.DomainModule.compute_cy_loss": {"tf": 1}, "shimmer.modules.domain.DomainModule.compute_tr_loss": {"tf": 1}, "shimmer.modules.domain.DomainModule.compute_broadcast_loss": {"tf": 1}, "shimmer.modules.losses.demi_cycle_loss": {"tf": 1}, "shimmer.modules.losses.cycle_loss": {"tf": 1}, "shimmer.modules.losses.translation_loss": {"tf": 1}, "shimmer.modules.losses.contrastive_loss": {"tf": 1}, "shimmer.modules.losses.contrastive_loss_bayesian": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.loss_coefs": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.demi_cycle_loss": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.cycle_loss": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.translation_loss": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.contrastive_loss": {"tf": 1}, "shimmer.modules.losses.broadcast_loss": {"tf": 1}, "shimmer.modules.losses.GWLosses.loss_coefs": {"tf": 1}, "shimmer.modules.losses.GWLosses.contrastive_loss": {"tf": 1}, "shimmer.modules.losses.GWLosses.broadcast_loss": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.loss_coefs": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.contrastive_loss": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.broadcast_loss": {"tf": 1}, "shimmer.modules.contrastive_loss.contrastive_loss": {"tf": 1}, "shimmer.modules.vae.kl_divergence_loss": {"tf": 1}}, "df": 26, "o": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "p": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "t": {"docs": {"shimmer.modules.domain.LossOutput": {"tf": 1}, "shimmer.modules.domain.LossOutput.__init__": {"tf": 1}, "shimmer.modules.domain.LossOutput.loss": {"tf": 1}, "shimmer.modules.domain.LossOutput.metrics": {"tf": 1}, "shimmer.modules.domain.LossOutput.all": {"tf": 1}}, "df": 5}}}}}}, "c": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "f": {"docs": {}, "df": 0, "s": {"docs": {"shimmer.modules.losses.LossCoefs": {"tf": 1}, "shimmer.modules.losses.LossCoefs.demi_cycles": {"tf": 1}, "shimmer.modules.losses.LossCoefs.cycles": {"tf": 1}, "shimmer.modules.losses.LossCoefs.translations": {"tf": 1}, "shimmer.modules.losses.LossCoefs.contrastives": {"tf": 1}}, "df": 5}}}}}}}, "g": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "t": {"docs": {"shimmer.modules.contrastive_loss.ContrastiveLoss.learn_logit_scale": {"tf": 1}}, "df": 1}}}}, "e": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "n": {"docs": {"shimmer.modules.contrastive_loss.ContrastiveLoss.learn_logit_scale": {"tf": 1}}, "df": 1}}}}}, "m": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "d": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspaceBase.gw_mod": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.selection_mod": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.loss_mod": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.gw_mod": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.selection_mod": {"tf": 1}, "shimmer.modules.losses.GWLosses.gw_mod": {"tf": 1}, "shimmer.modules.losses.GWLosses.selection_mod": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.gw_mod": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.selection_mod": {"tf": 1}}, "df": 9, "e": {"docs": {}, "df": 0, "l": {"docs": {"shimmer.utils.migrate_model": {"tf": 1}}, "df": 1, "m": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "d": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "t": {"docs": {"shimmer.types.ModelModeT": {"tf": 1}}, "df": 1}}}}}}}, "s": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspaceBase.domain_mods": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBase.domain_mods": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.domain_mods": {"tf": 1}, "shimmer.modules.losses.GWLosses.domain_mods": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.domain_mods": {"tf": 1}}, "df": 5}, "u": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "s": {"docs": {"shimmer.modules.global_workspace.freeze_domain_modules": {"tf": 1}}, "df": 1}}}}}}, "a": {"docs": {}, "df": 0, "x": {"docs": {"shimmer.modules.global_workspace.SchedulerArgs.max_lr": {"tf": 1}}, "df": 1}}, "e": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "s": {"docs": {"shimmer.modules.domain.LossOutput.metrics": {"tf": 1}}, "df": 1}}}}}}, "i": {"docs": {}, "df": 0, "g": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "n": {"docs": {"shimmer.utils.MIGRATION_DIR": {"tf": 1}}, "df": 1, "s": {"docs": {"shimmer.utils.SaveMigrations.migrations": {"tf": 1}}, "df": 1}}}}, "e": {"docs": {"shimmer.utils.migrate_model": {"tf": 1}, "shimmer.cli.ckpt_migration.migrate_ckpt": {"tf": 1}}, "df": 2}}}}}}}, "s": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "h": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "d": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "r": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspaceBase.scheduler_args": {"tf": 1}}, "df": 1, "a": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "g": {"docs": {}, "df": 0, "s": {"docs": {"shimmer.modules.global_workspace.SchedulerArgs": {"tf": 1}, "shimmer.modules.global_workspace.SchedulerArgs.max_lr": {"tf": 1}, "shimmer.modules.global_workspace.SchedulerArgs.total_steps": {"tf": 1}}, "df": 3}}}}}}}}}}}, "o": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "s": {"docs": {"shimmer.modules.gw_module.compute_fusion_scores": {"tf": 1}}, "df": 1}}}}, "a": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "e": {"docs": {"shimmer.modules.contrastive_loss.ContrastiveLoss.learn_logit_scale": {"tf": 1}}, "df": 1}}}}, "t": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "p": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspaceBase.generic_step": {"tf": 1}, "shimmer.modules.losses.GWLossesBase.step": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.step": {"tf": 1}, "shimmer.modules.losses.GWLosses.step": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.step": {"tf": 1}}, "df": 5, "s": {"docs": {"shimmer.modules.global_workspace.SchedulerArgs.total_steps": {"tf": 1}}, "df": 1}}}, "a": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "e": {"docs": {"shimmer.modules.selection.SelectionBase.update_gw_state": {"tf": 1}}, "df": 1, "s": {"docs": {"shimmer.modules.global_workspace.GWPredictionsBase.states": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.batch_gw_states": {"tf": 1}, "shimmer.modules.global_workspace.GWPredictions.states": {"tf": 1}}, "df": 3}}}}}, "e": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "n": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspaceBase.selection_mod": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBayesian.sensitivity_selection": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.selection_mod": {"tf": 1}, "shimmer.modules.losses.GWLosses.selection_mod": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.selection_mod": {"tf": 1}}, "df": 5, "b": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "e": {"docs": {"shimmer.modules.selection.SelectionBase": {"tf": 1}, "shimmer.modules.selection.SelectionBase.update_gw_state": {"tf": 1}, "shimmer.modules.selection.SelectionBase.forward": {"tf": 1}}, "df": 3}}}}}}}}}}}, "n": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "v": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "y": {"docs": {"shimmer.modules.gw_module.GWModuleBayesian.sensitivity_selection": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBayesian.sensitivity_precision": {"tf": 1}}, "df": 2}}}}}}}}}}, "o": {"docs": {}, "df": 0, "f": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "x": {"docs": {"shimmer.modules.gw_module.GWModuleBayesian.precision_softmax_temp": {"tf": 1}}, "df": 1}}}}}}, "i": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "g": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "d": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "n": {"docs": {"shimmer.modules.selection.SingleDomainSelection": {"tf": 1}, "shimmer.modules.selection.SingleDomainSelection.forward": {"tf": 1}}, "df": 2}}}}}}}}}}}}}}}}}}}, "z": {"docs": {}, "df": 0, "e": {"docs": {"shimmer.modules.selection.KQFixedQSelection.head_size": {"tf": 1}, "shimmer.modules.selection.DynamicQueryAttention.head_size": {"tf": 1}, "shimmer.dataset.RepeatedDataset.dataset_size": {"tf": 1}, "shimmer.utils.group_batch_size": {"tf": 1}, "shimmer.utils.groups_batch_size": {"tf": 1}}, "df": 5}}}, "a": {"docs": {}, "df": 0, "v": {"docs": {}, "df": 0, "e": {"docs": {"shimmer.utils.SaveMigrations.on_save_checkpoint": {"tf": 1}}, "df": 1, "m": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "g": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "s": {"docs": {"shimmer.utils.SaveMigrations": {"tf": 1}, "shimmer.utils.SaveMigrations.migrations": {"tf": 1}, "shimmer.utils.SaveMigrations.on_save_checkpoint": {"tf": 1}}, "df": 3}}}}}}}}}}}}}}, "t": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "l": {"docs": {"shimmer.modules.global_workspace.SchedulerArgs.total_steps": {"tf": 1}}, "df": 1}}}}, "r": {"docs": {"shimmer.modules.domain.DomainModule.compute_tr_loss": {"tf": 1}}, "df": 1, "a": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "n": {"docs": {"shimmer.modules.losses.translation_loss": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.translation_loss": {"tf": 1}, "shimmer.modules.utils.translation": {"tf": 1}}, "df": 3, "s": {"docs": {"shimmer.modules.global_workspace.GWPredictions.translations": {"tf": 1}, "shimmer.modules.losses.LossCoefs.translations": {"tf": 1}, "shimmer.modules.losses.BroadcastLossCoefs.translations": {"tf": 1}, "shimmer.modules.utils.batch_translations": {"tf": 1}}, "df": 4}}}}}}}}}}}, "e": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "p": {"docs": {"shimmer.modules.gw_module.GWModuleBayesian.precision_softmax_temp": {"tf": 1}}, "df": 1, "e": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "e": {"docs": {"shimmer.modules.selection.RandomSelection.temperature": {"tf": 1}}, "df": 1}}}}}}}}}}}, "g": {"docs": {}, "df": 0, "w": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspaceBase.gw_mod": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.batch_gw_states": {"tf": 1}, "shimmer.modules.gw_module.GWModule.gw_encoders": {"tf": 1}, "shimmer.modules.gw_module.GWModule.gw_decoders": {"tf": 1}, "shimmer.modules.selection.SelectionBase.update_gw_state": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.gw_mod": {"tf": 1}, "shimmer.modules.losses.GWLosses.gw_mod": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.gw_mod": {"tf": 1}}, "df": 8, "p": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "d": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "s": {"docs": {"shimmer.modules.global_workspace.GWPredictions": {"tf": 1}, "shimmer.modules.global_workspace.GWPredictions.demi_cycles": {"tf": 1}, "shimmer.modules.global_workspace.GWPredictions.cycles": {"tf": 1}, "shimmer.modules.global_workspace.GWPredictions.translations": {"tf": 1}, "shimmer.modules.global_workspace.GWPredictions.states": {"tf": 1}}, "df": 5, "b": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "e": {"docs": {"shimmer.modules.global_workspace.GWPredictionsBase": {"tf": 1}, "shimmer.modules.global_workspace.GWPredictionsBase.states": {"tf": 1}}, "df": 2}}}}}}}}}}}}}}}, "d": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "d": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "r": {"docs": {"shimmer.modules.gw_module.GWDecoder": {"tf": 1}, "shimmer.modules.gw_module.GWDecoder.__init__": {"tf": 1}, "shimmer.modules.gw_module.GWDecoder.in_dim": {"tf": 1}, "shimmer.modules.gw_module.GWDecoder.hidden_dim": {"tf": 1}, "shimmer.modules.gw_module.GWDecoder.out_dim": {"tf": 1}, "shimmer.modules.gw_module.GWDecoder.n_layers": {"tf": 1}}, "df": 6}}}}}}}, "e": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "d": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "r": {"docs": {"shimmer.modules.gw_module.GWEncoder": {"tf": 1}, "shimmer.modules.gw_module.GWEncoder.__init__": {"tf": 1}, "shimmer.modules.gw_module.GWEncoder.forward": {"tf": 1}}, "df": 3, "l": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "r": {"docs": {"shimmer.modules.gw_module.GWEncoderLinear": {"tf": 1}, "shimmer.modules.gw_module.GWEncoderLinear.forward": {"tf": 1}}, "df": 2}}}}}}}}}}}}}, "m": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "d": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "e": {"docs": {"shimmer.modules.gw_module.GWModule": {"tf": 1}, "shimmer.modules.gw_module.GWModule.__init__": {"tf": 1}, "shimmer.modules.gw_module.GWModule.gw_encoders": {"tf": 1}, "shimmer.modules.gw_module.GWModule.gw_decoders": {"tf": 1}, "shimmer.modules.gw_module.GWModule.fuse": {"tf": 1}, "shimmer.modules.gw_module.GWModule.encode": {"tf": 1}, "shimmer.modules.gw_module.GWModule.decode": {"tf": 1}}, "df": 7, "b": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "e": {"docs": {"shimmer.modules.gw_module.GWModuleBase": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBase.__init__": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBase.domain_mods": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBase.workspace_dim": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBase.fuse": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBase.encode": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBase.encode_and_fuse": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBase.decode": {"tf": 1}}, "df": 8}}, "y": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "n": {"docs": {"shimmer.modules.gw_module.GWModuleBayesian": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBayesian.__init__": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBayesian.precisions": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBayesian.sensitivity_selection": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBayesian.sensitivity_precision": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBayesian.precision_softmax_temp": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBayesian.get_precision": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBayesian.fuse": {"tf": 1}}, "df": 8}}}}}}}}}}}}}}, "l": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "s": {"2": {"docs": {}, "df": 0, "d": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "s": {"docs": {"shimmer.modules.losses.GWLosses2Domains": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.__init__": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.gw_mod": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.selection_mod": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.domain_mods": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.loss_coefs": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.contrastive_fn": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.demi_cycle_loss": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.cycle_loss": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.translation_loss": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.contrastive_loss": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.step": {"tf": 1}}, "df": 12}}}}}}}}, "docs": {"shimmer.modules.losses.GWLosses": {"tf": 1}, "shimmer.modules.losses.GWLosses.__init__": {"tf": 1}, "shimmer.modules.losses.GWLosses.gw_mod": {"tf": 1}, "shimmer.modules.losses.GWLosses.selection_mod": {"tf": 1}, "shimmer.modules.losses.GWLosses.domain_mods": {"tf": 1}, "shimmer.modules.losses.GWLosses.loss_coefs": {"tf": 1}, "shimmer.modules.losses.GWLosses.contrastive_fn": {"tf": 1}, "shimmer.modules.losses.GWLosses.contrastive_loss": {"tf": 1}, "shimmer.modules.losses.GWLosses.broadcast_loss": {"tf": 1}, "shimmer.modules.losses.GWLosses.step": {"tf": 1}}, "df": 10, "b": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "e": {"docs": {"shimmer.modules.losses.GWLossesBase": {"tf": 1}, "shimmer.modules.losses.GWLossesBase.step": {"tf": 1}}, "df": 2}}, "y": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "n": {"docs": {"shimmer.modules.losses.GWLossesBayesian": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.__init__": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.gw_mod": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.selection_mod": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.domain_mods": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.loss_coefs": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.contrastive_fn": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.use_normalized_constrastive": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.contrastive_loss": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.broadcast_loss": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.step": {"tf": 1}}, "df": 11}}}}}}}}}}}}}}}, "l": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "b": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "l": {"docs": {"shimmer.modules.global_workspace.pretrained_global_workspace": {"tf": 1}}, "df": 1, "w": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "k": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "p": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "e": {"2": {"docs": {}, "df": 0, "d": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "s": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspace2Domains": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace2Domains.__init__": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace2Domains.forward": {"tf": 1}}, "df": 3}}}}}}}}, "docs": {"shimmer.modules.global_workspace.GlobalWorkspace": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace.__init__": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace.forward": {"tf": 1}}, "df": 3, "b": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "e": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspaceBase": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.gw_mod": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.selection_mod": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.loss_mod": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.optim_lr": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.optim_weight_decay": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.scheduler_args": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.domain_mods": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.workspace_dim": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.encode_and_fuse": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.encode": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.fuse": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.decode": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.batch_gw_states": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.encode_domain": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.encode_domains": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.decode_domain": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.decode_domains": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.generic_step": {"tf": 1}}, "df": 19}}, "y": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "n": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspaceBayesian": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian.__init__": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian.forward": {"tf": 1}}, "df": 3}}}}}}}}}}}}}}}}}}}}}}, "e": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "c": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspaceBase.generic_step": {"tf": 1}}, "df": 1}}, "a": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "e": {"docs": {"shimmer.modules.losses.generate_partitions": {"tf": 1}}, "df": 1}}}}}}, "t": {"docs": {"shimmer.modules.gw_module.get_n_layers": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBayesian.get_precision": {"tf": 1}}, "df": 2}}, "a": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "n": {"docs": {"shimmer.modules.vae.gaussian_nll": {"tf": 1}}, "df": 1}}}}}}}, "r": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "p": {"docs": {"shimmer.utils.group_batch_size": {"tf": 1}, "shimmer.utils.group_device": {"tf": 1}}, "df": 2, "s": {"docs": {"shimmer.utils.groups_batch_size": {"tf": 1}, "shimmer.utils.groups_device": {"tf": 1}}, "df": 2}}}}}}, "o": {"docs": {}, "df": 0, "p": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "m": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspaceBase.optim_lr": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.optim_weight_decay": {"tf": 1}}, "df": 2}}}}, "u": {"docs": {}, "df": 0, "t": {"docs": {"shimmer.modules.gw_module.GWDecoder.out_dim": {"tf": 1}}, "df": 1}}, "n": {"docs": {"shimmer.utils.SaveMigrations.on_save_checkpoint": {"tf": 1}}, "df": 1}}, "w": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "g": {"docs": {}, "df": 0, "h": {"docs": {}, "df": 0, "t": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspaceBase.optim_weight_decay": {"tf": 1}}, "df": 1, "e": {"docs": {}, "df": 0, "d": {"docs": {"shimmer.modules.selection.DynamicQueryAttention.fuse_weighted_encodings": {"tf": 1}}, "df": 1}}}}}}}, "o": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "k": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "p": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "e": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspaceBase.workspace_dim": {"tf": 1}, "shimmer.modules.global_workspace.pretrained_global_workspace": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBase.workspace_dim": {"tf": 1}}, "df": 3}}}}}}}}}, "d": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "y": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspaceBase.optim_weight_decay": {"tf": 1}}, "df": 1}}, "o": {"docs": {}, "df": 0, "d": {"docs": {}, "df": 0, "e": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspaceBase.decode": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.decode_domain": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.decode_domains": {"tf": 1}, "shimmer.modules.domain.DomainModule.decode": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBase.decode": {"tf": 1}, "shimmer.modules.gw_module.GWModule.decode": {"tf": 1}, "shimmer.modules.vae.VAE.decode": {"tf": 1}}, "df": 7, "r": {"docs": {"shimmer.modules.vae.VAE.decoder": {"tf": 1}}, "df": 1, "s": {"docs": {"shimmer.modules.gw_module.GWModule.gw_decoders": {"tf": 1}}, "df": 1}}}}}}, "m": {"docs": {}, "df": 0, "i": {"docs": {"shimmer.modules.global_workspace.GWPredictions.demi_cycles": {"tf": 1}, "shimmer.modules.losses.demi_cycle_loss": {"tf": 1}, "shimmer.modules.losses.LossCoefs.demi_cycles": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.demi_cycle_loss": {"tf": 1}, "shimmer.modules.losses.BroadcastLossCoefs.demi_cycles": {"tf": 1}, "shimmer.modules.utils.batch_demi_cycles": {"tf": 1}}, "df": 6}}, "v": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "e": {"docs": {"shimmer.utils.groups_device": {"tf": 1}, "shimmer.utils.group_device": {"tf": 1}}, "df": 2}}}}}, "o": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "n": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspaceBase.domain_mods": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.encode_domain": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.decode_domain": {"tf": 1}, "shimmer.modules.global_workspace.freeze_domain_modules": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBase.domain_mods": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.domain_mods": {"tf": 1}, "shimmer.modules.losses.GWLosses.domain_mods": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.domain_mods": {"tf": 1}}, "df": 8, "s": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspaceBase.encode_domains": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.decode_domains": {"tf": 1}}, "df": 2}, "m": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "d": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "e": {"docs": {"shimmer.modules.domain.DomainModule": {"tf": 1}, "shimmer.modules.domain.DomainModule.__init__": {"tf": 1}, "shimmer.modules.domain.DomainModule.latent_dim": {"tf": 1}, "shimmer.modules.domain.DomainModule.encode": {"tf": 1}, "shimmer.modules.domain.DomainModule.decode": {"tf": 1}, "shimmer.modules.domain.DomainModule.compute_loss": {"tf": 1}, "shimmer.modules.domain.DomainModule.compute_dcy_loss": {"tf": 1}, "shimmer.modules.domain.DomainModule.compute_cy_loss": {"tf": 1}, "shimmer.modules.domain.DomainModule.compute_tr_loss": {"tf": 1}, "shimmer.modules.domain.DomainModule.compute_broadcast_loss": {"tf": 1}}, "df": 10}}}}}}}}}}}, "i": {"docs": {}, "df": 0, "m": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspaceBase.workspace_dim": {"tf": 1}, "shimmer.modules.domain.DomainModule.latent_dim": {"tf": 1}, "shimmer.modules.gw_module.GWDecoder.in_dim": {"tf": 1}, "shimmer.modules.gw_module.GWDecoder.hidden_dim": {"tf": 1}, "shimmer.modules.gw_module.GWDecoder.out_dim": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBase.workspace_dim": {"tf": 1}}, "df": 6}, "v": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "g": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "e": {"docs": {"shimmer.modules.vae.kl_divergence_loss": {"tf": 1}}, "df": 1}}}}}}}}, "r": {"docs": {"shimmer.utils.MIGRATION_DIR": {"tf": 1}}, "df": 1}}, "c": {"docs": {}, "df": 0, "y": {"docs": {"shimmer.modules.domain.DomainModule.compute_dcy_loss": {"tf": 1}}, "df": 1}}, "y": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "q": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "y": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "n": {"docs": {"shimmer.modules.selection.DynamicQueryAttention": {"tf": 1}, "shimmer.modules.selection.DynamicQueryAttention.__init__": {"tf": 1}, "shimmer.modules.selection.DynamicQueryAttention.head_size": {"tf": 1}, "shimmer.modules.selection.DynamicQueryAttention.query_layer": {"tf": 1}, "shimmer.modules.selection.DynamicQueryAttention.key_layers": {"tf": 1}, "shimmer.modules.selection.DynamicQueryAttention.fuse_weighted_encodings": {"tf": 1}, "shimmer.modules.selection.DynamicQueryAttention.forward": {"tf": 1}}, "df": 7}}}}}}}}}}}}}}}}}}}}, "a": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "t": {"docs": {"shimmer.dataset.RepeatedDataset.dataset": {"tf": 1}, "shimmer.dataset.RepeatedDataset.dataset_size": {"tf": 1}}, "df": 2}}}}}}}, "a": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "g": {"docs": {}, "df": 0, "s": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspaceBase.scheduler_args": {"tf": 1}}, "df": 1}}}, "n": {"docs": {}, "df": 0, "d": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspaceBase.encode_and_fuse": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBase.encode_and_fuse": {"tf": 1}}, "df": 2}}, "l": {"docs": {}, "df": 0, "l": {"docs": {"shimmer.modules.domain.LossOutput.all": {"tf": 1}}, "df": 1}}}, "e": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "d": {"docs": {}, "df": 0, "e": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspaceBase.encode_and_fuse": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.encode": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.encode_domain": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.encode_domains": {"tf": 1}, "shimmer.modules.domain.DomainModule.encode": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBase.encode": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBase.encode_and_fuse": {"tf": 1}, "shimmer.modules.gw_module.GWModule.encode": {"tf": 1}, "shimmer.modules.vae.VAE.encode": {"tf": 1}}, "df": 9, "r": {"docs": {"shimmer.modules.vae.VAE.encoder": {"tf": 1}}, "df": 1, "s": {"docs": {"shimmer.modules.gw_module.GWModule.gw_encoders": {"tf": 1}}, "df": 1}}}, "i": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "g": {"docs": {}, "df": 0, "s": {"docs": {"shimmer.modules.selection.DynamicQueryAttention.fuse_weighted_encodings": {"tf": 1}}, "df": 1}}}}}}}}}, "f": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "e": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspaceBase.encode_and_fuse": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.fuse": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBase.fuse": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBase.encode_and_fuse": {"tf": 1}, "shimmer.modules.gw_module.GWModule.fuse": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBayesian.fuse": {"tf": 1}, "shimmer.modules.selection.DynamicQueryAttention.fuse_weighted_encodings": {"tf": 1}}, "df": 7, "d": {"docs": {"shimmer.modules.losses.BroadcastLossCoefs.fused": {"tf": 1}}, "df": 1}}, "i": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "n": {"docs": {"shimmer.modules.gw_module.compute_fusion_scores": {"tf": 1}}, "df": 1}}}}}, "r": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "z": {"docs": {}, "df": 0, "e": {"docs": {"shimmer.modules.global_workspace.freeze_domain_modules": {"tf": 1}}, "df": 1}}}}}, "o": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "w": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "d": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspace2Domains.forward": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace.forward": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian.forward": {"tf": 1}, "shimmer.modules.gw_module.GWEncoder.forward": {"tf": 1}, "shimmer.modules.gw_module.GWEncoderLinear.forward": {"tf": 1}, "shimmer.modules.selection.SelectionBase.forward": {"tf": 1}, "shimmer.modules.selection.SingleDomainSelection.forward": {"tf": 1}, "shimmer.modules.selection.FixedSharedSelection.forward": {"tf": 1}, "shimmer.modules.selection.KQFixedQSelection.forward": {"tf": 1}, "shimmer.modules.selection.RandomSelection.forward": {"tf": 1}, "shimmer.modules.selection.DynamicQueryAttention.forward": {"tf": 1}, "shimmer.modules.contrastive_loss.ContrastiveLoss.forward": {"tf": 1}, "shimmer.modules.vae.VAEEncoder.forward": {"tf": 1}, "shimmer.modules.vae.VAEDecoder.forward": {"tf": 1}, "shimmer.modules.vae.VAE.forward": {"tf": 1}}, "df": 15}}}}}}, "i": {"docs": {}, "df": 0, "x": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "d": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "h": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "d": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "n": {"docs": {"shimmer.modules.selection.FixedSharedSelection": {"tf": 1}, "shimmer.modules.selection.FixedSharedSelection.forward": {"tf": 1}}, "df": 2}}}}}}}}}}}}}}}}}}}, "n": {"docs": {"shimmer.modules.losses.GWLosses2Domains.contrastive_fn": {"tf": 1}, "shimmer.modules.losses.GWLosses.contrastive_fn": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.contrastive_fn": {"tf": 1}}, "df": 3}}, "b": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "h": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspaceBase.batch_gw_states": {"tf": 1}, "shimmer.modules.utils.batch_demi_cycles": {"tf": 1}, "shimmer.modules.utils.batch_cycles": {"tf": 1}, "shimmer.modules.utils.batch_translations": {"tf": 1}, "shimmer.utils.group_batch_size": {"tf": 1}, "shimmer.utils.groups_batch_size": {"tf": 1}}, "df": 6}}}, "y": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "n": {"docs": {"shimmer.modules.losses.contrastive_loss_bayesian": {"tf": 1}}, "df": 1}}}}}}}, "r": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "d": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "t": {"docs": {"shimmer.modules.domain.DomainModule.compute_broadcast_loss": {"tf": 1}, "shimmer.modules.losses.broadcast_loss": {"tf": 1}, "shimmer.modules.losses.GWLosses.broadcast_loss": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.broadcast_loss": {"tf": 1}}, "df": 4, "l": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "f": {"docs": {}, "df": 0, "s": {"docs": {"shimmer.modules.losses.BroadcastLossCoefs": {"tf": 1}, "shimmer.modules.losses.BroadcastLossCoefs.contrastives": {"tf": 1}, "shimmer.modules.losses.BroadcastLossCoefs.fused": {"tf": 1}, "shimmer.modules.losses.BroadcastLossCoefs.demi_cycles": {"tf": 1}, "shimmer.modules.losses.BroadcastLossCoefs.cycles": {"tf": 1}, "shimmer.modules.losses.BroadcastLossCoefs.translations": {"tf": 1}}, "df": 6}}}}}}}}}}}}}}}}}, "e": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "a": {"docs": {"shimmer.modules.vae.VAE.beta": {"tf": 1}}, "df": 1}}}}, "c": {"docs": {}, "df": 0, "y": {"docs": {"shimmer.modules.domain.DomainModule.compute_cy_loss": {"tf": 1}}, "df": 1, "c": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "e": {"docs": {"shimmer.modules.losses.demi_cycle_loss": {"tf": 1}, "shimmer.modules.losses.cycle_loss": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.demi_cycle_loss": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.cycle_loss": {"tf": 1}, "shimmer.modules.utils.cycle": {"tf": 1}}, "df": 5, "s": {"docs": {"shimmer.modules.global_workspace.GWPredictions.demi_cycles": {"tf": 1}, "shimmer.modules.global_workspace.GWPredictions.cycles": {"tf": 1}, "shimmer.modules.losses.LossCoefs.demi_cycles": {"tf": 1}, "shimmer.modules.losses.LossCoefs.cycles": {"tf": 1}, "shimmer.modules.losses.BroadcastLossCoefs.demi_cycles": {"tf": 1}, "shimmer.modules.losses.BroadcastLossCoefs.cycles": {"tf": 1}, "shimmer.modules.utils.batch_demi_cycles": {"tf": 1}, "shimmer.modules.utils.batch_cycles": {"tf": 1}}, "df": 8}}}}}, "o": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "p": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "e": {"docs": {"shimmer.modules.domain.DomainModule.compute_loss": {"tf": 1}, "shimmer.modules.domain.DomainModule.compute_dcy_loss": {"tf": 1}, "shimmer.modules.domain.DomainModule.compute_cy_loss": {"tf": 1}, "shimmer.modules.domain.DomainModule.compute_tr_loss": {"tf": 1}, "shimmer.modules.domain.DomainModule.compute_broadcast_loss": {"tf": 1}, "shimmer.modules.gw_module.compute_fusion_scores": {"tf": 1}}, "df": 6}}}}}, "n": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "v": {"docs": {}, "df": 0, "e": {"docs": {"shimmer.modules.losses.contrastive_loss": {"tf": 1}, "shimmer.modules.losses.contrastive_loss_bayesian": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.contrastive_fn": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.contrastive_loss": {"tf": 1}, "shimmer.modules.losses.GWLosses.contrastive_fn": {"tf": 1}, "shimmer.modules.losses.GWLosses.contrastive_loss": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.contrastive_fn": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.contrastive_loss": {"tf": 1}, "shimmer.modules.contrastive_loss.contrastive_loss": {"tf": 1}}, "df": 9, "s": {"docs": {"shimmer.modules.losses.LossCoefs.contrastives": {"tf": 1}, "shimmer.modules.losses.BroadcastLossCoefs.contrastives": {"tf": 1}}, "df": 2}, "l": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "s": {"docs": {"shimmer.modules.contrastive_loss.ContrastiveLoss": {"tf": 1}, "shimmer.modules.contrastive_loss.ContrastiveLoss.__init__": {"tf": 1}, "shimmer.modules.contrastive_loss.ContrastiveLoss.learn_logit_scale": {"tf": 1}, "shimmer.modules.contrastive_loss.ContrastiveLoss.reduction": {"tf": 1}, "shimmer.modules.contrastive_loss.ContrastiveLoss.forward": {"tf": 1}}, "df": 5, "t": {"docs": {}, "df": 0, "y": {"docs": {}, "df": 0, "p": {"docs": {}, "df": 0, "e": {"docs": {"shimmer.modules.contrastive_loss.ContrastiveLossType": {"tf": 1}}, "df": 1}}}}, "b": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "y": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "y": {"docs": {}, "df": 0, "p": {"docs": {}, "df": 0, "e": {"docs": {"shimmer.modules.contrastive_loss.ContrastiveLossBayesianType": {"tf": 1}}, "df": 1}}}}}}}}}}}}}}}}}}}}}}}}, "s": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "v": {"docs": {}, "df": 0, "e": {"docs": {"shimmer.modules.losses.GWLossesBayesian.use_normalized_constrastive": {"tf": 1}}, "df": 1}}}}}}}}}}, "e": {"docs": {}, "df": 0, "f": {"docs": {}, "df": 0, "s": {"docs": {"shimmer.modules.losses.GWLosses2Domains.loss_coefs": {"tf": 1}, "shimmer.modules.losses.GWLosses.loss_coefs": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.loss_coefs": {"tf": 1}}, "df": 3}}}}, "h": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "k": {"docs": {}, "df": 0, "p": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "t": {"docs": {"shimmer.utils.SaveMigrations.on_save_checkpoint": {"tf": 1}}, "df": 1}}}}}}}}}, "k": {"docs": {}, "df": 0, "p": {"docs": {}, "df": 0, "t": {"docs": {"shimmer.cli.ckpt_migration.migrate_ckpt": {"tf": 1}}, "df": 1}}}}, "i": {"docs": {}, "df": 0, "n": {"docs": {"shimmer.modules.gw_module.GWDecoder.in_dim": {"tf": 1}}, "df": 1, "i": {"docs": {}, "df": 0, "t": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspace2Domains.__init__": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace.__init__": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian.__init__": {"tf": 1}, "shimmer.modules.domain.LossOutput.__init__": {"tf": 1}, "shimmer.modules.domain.DomainModule.__init__": {"tf": 1}, "shimmer.modules.gw_module.GWDecoder.__init__": {"tf": 1}, "shimmer.modules.gw_module.GWEncoder.__init__": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBase.__init__": {"tf": 1}, "shimmer.modules.gw_module.GWModule.__init__": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBayesian.__init__": {"tf": 1}, "shimmer.modules.selection.KQFixedQSelection.__init__": {"tf": 1}, "shimmer.modules.selection.RandomSelection.__init__": {"tf": 1}, "shimmer.modules.selection.DynamicQueryAttention.__init__": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.__init__": {"tf": 1}, "shimmer.modules.losses.GWLosses.__init__": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.__init__": {"tf": 1}, "shimmer.modules.contrastive_loss.ContrastiveLoss.__init__": {"tf": 1}, "shimmer.dataset.RepeatedDataset.__init__": {"tf": 1}, "shimmer.modules.vae.VAE.__init__": {"tf": 1}}, "df": 19}}, "f": {"docs": {}, "df": 0, "o": {"docs": {"shimmer.modules.contrastive_loss.info_nce": {"tf": 1}}, "df": 1}}}}, "p": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "d": {"docs": {"shimmer.modules.global_workspace.pretrained_global_workspace": {"tf": 1}}, "df": 1}}}}}}}, "c": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "n": {"docs": {"shimmer.modules.gw_module.GWModuleBayesian.sensitivity_precision": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBayesian.precision_softmax_temp": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBayesian.get_precision": {"tf": 1}}, "df": 3, "s": {"docs": {"shimmer.modules.gw_module.GWModuleBayesian.precisions": {"tf": 1}}, "df": 1}}}}}}}}}, "a": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "s": {"docs": {"shimmer.modules.losses.generate_partitions": {"tf": 1}}, "df": 1}}}}}}}}}}, "n": {"docs": {"shimmer.modules.gw_module.get_n_layers": {"tf": 1}, "shimmer.modules.gw_module.GWDecoder.n_layers": {"tf": 1}}, "df": 2, "o": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "z": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "d": {"docs": {"shimmer.modules.losses.GWLossesBayesian.use_normalized_constrastive": {"tf": 1}}, "df": 1}}}}}}}}}, "c": {"docs": {}, "df": 0, "e": {"docs": {"shimmer.modules.contrastive_loss.info_nce": {"tf": 1}}, "df": 1}}, "l": {"docs": {}, "df": 0, "l": {"docs": {"shimmer.modules.vae.gaussian_nll": {"tf": 1}}, "df": 1}}}, "h": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "d": {"docs": {}, "df": 0, "d": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "n": {"docs": {"shimmer.modules.gw_module.GWDecoder.hidden_dim": {"tf": 1}}, "df": 1}}}}}, "e": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "d": {"docs": {"shimmer.modules.selection.KQFixedQSelection.head_size": {"tf": 1}, "shimmer.modules.selection.DynamicQueryAttention.head_size": {"tf": 1}}, "df": 2}}}}, "u": {"docs": {}, "df": 0, "p": {"docs": {}, "df": 0, "d": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "e": {"docs": {"shimmer.modules.selection.SelectionBase.update_gw_state": {"tf": 1}}, "df": 1}}}}}, "s": {"docs": {}, "df": 0, "e": {"docs": {"shimmer.modules.losses.GWLossesBayesian.use_normalized_constrastive": {"tf": 1}}, "df": 1}}}, "k": {"docs": {}, "df": 0, "q": {"docs": {}, "df": 0, "f": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "x": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "d": {"docs": {}, "df": 0, "q": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "n": {"docs": {"shimmer.modules.selection.KQFixedQSelection": {"tf": 1}, "shimmer.modules.selection.KQFixedQSelection.__init__": {"tf": 1}, "shimmer.modules.selection.KQFixedQSelection.head_size": {"tf": 1}, "shimmer.modules.selection.KQFixedQSelection.query_layer": {"tf": 1}, "shimmer.modules.selection.KQFixedQSelection.key_layers": {"tf": 1}, "shimmer.modules.selection.KQFixedQSelection.forward": {"tf": 1}}, "df": 6}}}}}}}}}}}}}}}}, "e": {"docs": {}, "df": 0, "y": {"docs": {"shimmer.modules.selection.KQFixedQSelection.key_layers": {"tf": 1}, "shimmer.modules.selection.DynamicQueryAttention.key_layers": {"tf": 1}}, "df": 2}}, "l": {"docs": {"shimmer.modules.vae.kl_divergence_loss": {"tf": 1}}, "df": 1}}, "q": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "y": {"docs": {"shimmer.modules.selection.KQFixedQSelection.query_layer": {"tf": 1}, "shimmer.modules.selection.DynamicQueryAttention.query_layer": {"tf": 1}}, "df": 2}}}}}, "v": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "e": {"docs": {"shimmer.modules.vae.VAE": {"tf": 1}, "shimmer.modules.vae.VAE.__init__": {"tf": 1}, "shimmer.modules.vae.VAE.beta": {"tf": 1}, "shimmer.modules.vae.VAE.encoder": {"tf": 1}, "shimmer.modules.vae.VAE.decoder": {"tf": 1}, "shimmer.modules.vae.VAE.encode": {"tf": 1}, "shimmer.modules.vae.VAE.decode": {"tf": 1}, "shimmer.modules.vae.VAE.forward": {"tf": 1}}, "df": 8, "e": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "d": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "r": {"docs": {"shimmer.modules.vae.VAEEncoder": {"tf": 1}, "shimmer.modules.vae.VAEEncoder.forward": {"tf": 1}}, "df": 2}}}}}}}, "d": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "d": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "r": {"docs": {"shimmer.modules.vae.VAEDecoder": {"tf": 1}, "shimmer.modules.vae.VAEDecoder.forward": {"tf": 1}}, "df": 2}}}}}}}}}}}}, "fullname": {"root": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspace2Domains.__init__": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace.__init__": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian.__init__": {"tf": 1}, "shimmer.modules.domain.LossOutput.__init__": {"tf": 1}, "shimmer.modules.domain.DomainModule.__init__": {"tf": 1}, "shimmer.modules.gw_module.GWDecoder.__init__": {"tf": 1}, "shimmer.modules.gw_module.GWEncoder.__init__": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBase.__init__": {"tf": 1}, "shimmer.modules.gw_module.GWModule.__init__": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBayesian.__init__": {"tf": 1}, "shimmer.modules.selection.KQFixedQSelection.__init__": {"tf": 1}, "shimmer.modules.selection.RandomSelection.__init__": {"tf": 1}, "shimmer.modules.selection.DynamicQueryAttention.__init__": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.__init__": {"tf": 1}, "shimmer.modules.losses.GWLosses.__init__": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.__init__": {"tf": 1}, "shimmer.modules.contrastive_loss.ContrastiveLoss.__init__": {"tf": 1}, "shimmer.dataset.RepeatedDataset.__init__": {"tf": 1}, "shimmer.modules.vae.VAE.__init__": {"tf": 1}}, "df": 19, "s": {"docs": {}, "df": 0, "h": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "r": {"docs": {"shimmer.types": {"tf": 1}, "shimmer.types.RawDomainGroupT": {"tf": 1}, "shimmer.types.RawDomainGroupDT": {"tf": 1}, "shimmer.types.LatentsDomainGroupT": {"tf": 1}, "shimmer.types.LatentsDomainGroupDT": {"tf": 1}, "shimmer.types.RawDomainGroupsT": {"tf": 1}, "shimmer.types.RawDomainGroupsDT": {"tf": 1}, "shimmer.types.LatentsDomainGroupsT": {"tf": 1}, "shimmer.types.LatentsDomainGroupsDT": {"tf": 1}, "shimmer.types.ModelModeT": {"tf": 1}, "shimmer.modules.global_workspace": {"tf": 1}, "shimmer.modules.global_workspace.SchedulerArgs": {"tf": 1}, "shimmer.modules.global_workspace.SchedulerArgs.max_lr": {"tf": 1}, "shimmer.modules.global_workspace.SchedulerArgs.total_steps": {"tf": 1}, "shimmer.modules.global_workspace.GWPredictionsBase": {"tf": 1}, "shimmer.modules.global_workspace.GWPredictionsBase.states": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.gw_mod": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.selection_mod": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.loss_mod": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.optim_lr": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.optim_weight_decay": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.scheduler_args": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.domain_mods": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.workspace_dim": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.encode_and_fuse": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.encode": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.fuse": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.decode": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.batch_gw_states": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.encode_domain": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.encode_domains": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.decode_domain": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.decode_domains": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.generic_step": {"tf": 1}, "shimmer.modules.global_workspace.freeze_domain_modules": {"tf": 1}, "shimmer.modules.global_workspace.GWPredictions": {"tf": 1}, "shimmer.modules.global_workspace.GWPredictions.demi_cycles": {"tf": 1}, "shimmer.modules.global_workspace.GWPredictions.cycles": {"tf": 1}, "shimmer.modules.global_workspace.GWPredictions.translations": {"tf": 1}, "shimmer.modules.global_workspace.GWPredictions.states": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace2Domains": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace2Domains.__init__": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace2Domains.forward": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace.__init__": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace.forward": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian.__init__": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian.forward": {"tf": 1}, "shimmer.modules.global_workspace.pretrained_global_workspace": {"tf": 1}, "shimmer.modules.domain": {"tf": 1}, "shimmer.modules.domain.LossOutput": {"tf": 1}, "shimmer.modules.domain.LossOutput.__init__": {"tf": 1}, "shimmer.modules.domain.LossOutput.loss": {"tf": 1}, "shimmer.modules.domain.LossOutput.metrics": {"tf": 1}, "shimmer.modules.domain.LossOutput.all": {"tf": 1}, "shimmer.modules.domain.DomainModule": {"tf": 1}, "shimmer.modules.domain.DomainModule.__init__": {"tf": 1}, "shimmer.modules.domain.DomainModule.latent_dim": {"tf": 1}, "shimmer.modules.domain.DomainModule.encode": {"tf": 1}, "shimmer.modules.domain.DomainModule.decode": {"tf": 1}, "shimmer.modules.domain.DomainModule.compute_loss": {"tf": 1}, "shimmer.modules.domain.DomainModule.compute_dcy_loss": {"tf": 1}, "shimmer.modules.domain.DomainModule.compute_cy_loss": {"tf": 1}, "shimmer.modules.domain.DomainModule.compute_tr_loss": {"tf": 1}, "shimmer.modules.domain.DomainModule.compute_broadcast_loss": {"tf": 1}, "shimmer.modules.gw_module": {"tf": 1}, "shimmer.modules.gw_module.get_n_layers": {"tf": 1}, "shimmer.modules.gw_module.GWDecoder": {"tf": 1}, "shimmer.modules.gw_module.GWDecoder.__init__": {"tf": 1}, "shimmer.modules.gw_module.GWDecoder.in_dim": {"tf": 1}, "shimmer.modules.gw_module.GWDecoder.hidden_dim": {"tf": 1}, "shimmer.modules.gw_module.GWDecoder.out_dim": {"tf": 1}, "shimmer.modules.gw_module.GWDecoder.n_layers": {"tf": 1}, "shimmer.modules.gw_module.GWEncoder": {"tf": 1}, "shimmer.modules.gw_module.GWEncoder.__init__": {"tf": 1}, "shimmer.modules.gw_module.GWEncoder.forward": {"tf": 1}, "shimmer.modules.gw_module.GWEncoderLinear": {"tf": 1}, "shimmer.modules.gw_module.GWEncoderLinear.forward": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBase": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBase.__init__": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBase.domain_mods": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBase.workspace_dim": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBase.fuse": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBase.encode": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBase.encode_and_fuse": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBase.decode": {"tf": 1}, "shimmer.modules.gw_module.GWModule": {"tf": 1}, "shimmer.modules.gw_module.GWModule.__init__": {"tf": 1}, "shimmer.modules.gw_module.GWModule.gw_encoders": {"tf": 1}, "shimmer.modules.gw_module.GWModule.gw_decoders": {"tf": 1}, "shimmer.modules.gw_module.GWModule.fuse": {"tf": 1}, "shimmer.modules.gw_module.GWModule.encode": {"tf": 1}, "shimmer.modules.gw_module.GWModule.decode": {"tf": 1}, "shimmer.modules.gw_module.compute_fusion_scores": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBayesian": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBayesian.__init__": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBayesian.precisions": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBayesian.sensitivity_selection": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBayesian.sensitivity_precision": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBayesian.precision_softmax_temp": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBayesian.get_precision": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBayesian.fuse": {"tf": 1}, "shimmer.modules.selection": {"tf": 1}, "shimmer.modules.selection.SelectionBase": {"tf": 1}, "shimmer.modules.selection.SelectionBase.update_gw_state": {"tf": 1}, "shimmer.modules.selection.SelectionBase.forward": {"tf": 1}, "shimmer.modules.selection.SingleDomainSelection": {"tf": 1}, "shimmer.modules.selection.SingleDomainSelection.forward": {"tf": 1}, "shimmer.modules.selection.FixedSharedSelection": {"tf": 1}, "shimmer.modules.selection.FixedSharedSelection.forward": {"tf": 1}, "shimmer.modules.selection.KQFixedQSelection": {"tf": 1}, "shimmer.modules.selection.KQFixedQSelection.__init__": {"tf": 1}, "shimmer.modules.selection.KQFixedQSelection.head_size": {"tf": 1}, "shimmer.modules.selection.KQFixedQSelection.query_layer": {"tf": 1}, "shimmer.modules.selection.KQFixedQSelection.key_layers": {"tf": 1}, "shimmer.modules.selection.KQFixedQSelection.forward": {"tf": 1}, "shimmer.modules.selection.RandomSelection": {"tf": 1}, "shimmer.modules.selection.RandomSelection.__init__": {"tf": 1}, "shimmer.modules.selection.RandomSelection.temperature": {"tf": 1}, "shimmer.modules.selection.RandomSelection.forward": {"tf": 1}, "shimmer.modules.selection.DynamicQueryAttention": {"tf": 1}, "shimmer.modules.selection.DynamicQueryAttention.__init__": {"tf": 1}, "shimmer.modules.selection.DynamicQueryAttention.head_size": {"tf": 1}, "shimmer.modules.selection.DynamicQueryAttention.query_layer": {"tf": 1}, "shimmer.modules.selection.DynamicQueryAttention.key_layers": {"tf": 1}, "shimmer.modules.selection.DynamicQueryAttention.fuse_weighted_encodings": {"tf": 1}, "shimmer.modules.selection.DynamicQueryAttention.forward": {"tf": 1}, "shimmer.modules.losses": {"tf": 1}, "shimmer.modules.losses.GWLossesBase": {"tf": 1}, "shimmer.modules.losses.GWLossesBase.step": {"tf": 1}, "shimmer.modules.losses.demi_cycle_loss": {"tf": 1}, "shimmer.modules.losses.cycle_loss": {"tf": 1}, "shimmer.modules.losses.translation_loss": {"tf": 1}, "shimmer.modules.losses.contrastive_loss": {"tf": 1}, "shimmer.modules.losses.contrastive_loss_bayesian": {"tf": 1}, "shimmer.modules.losses.LossCoefs": {"tf": 1}, "shimmer.modules.losses.LossCoefs.demi_cycles": {"tf": 1}, "shimmer.modules.losses.LossCoefs.cycles": {"tf": 1}, "shimmer.modules.losses.LossCoefs.translations": {"tf": 1}, "shimmer.modules.losses.LossCoefs.contrastives": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.__init__": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.gw_mod": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.selection_mod": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.domain_mods": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.loss_coefs": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.contrastive_fn": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.demi_cycle_loss": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.cycle_loss": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.translation_loss": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.contrastive_loss": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.step": {"tf": 1}, "shimmer.modules.losses.generate_partitions": {"tf": 1}, "shimmer.modules.losses.broadcast_loss": {"tf": 1}, "shimmer.modules.losses.BroadcastLossCoefs": {"tf": 1}, "shimmer.modules.losses.BroadcastLossCoefs.contrastives": {"tf": 1}, "shimmer.modules.losses.BroadcastLossCoefs.fused": {"tf": 1}, "shimmer.modules.losses.BroadcastLossCoefs.demi_cycles": {"tf": 1}, "shimmer.modules.losses.BroadcastLossCoefs.cycles": {"tf": 1}, "shimmer.modules.losses.BroadcastLossCoefs.translations": {"tf": 1}, "shimmer.modules.losses.GWLosses": {"tf": 1}, "shimmer.modules.losses.GWLosses.__init__": {"tf": 1}, "shimmer.modules.losses.GWLosses.gw_mod": {"tf": 1}, "shimmer.modules.losses.GWLosses.selection_mod": {"tf": 1}, "shimmer.modules.losses.GWLosses.domain_mods": {"tf": 1}, "shimmer.modules.losses.GWLosses.loss_coefs": {"tf": 1}, "shimmer.modules.losses.GWLosses.contrastive_fn": {"tf": 1}, "shimmer.modules.losses.GWLosses.contrastive_loss": {"tf": 1}, "shimmer.modules.losses.GWLosses.broadcast_loss": {"tf": 1}, "shimmer.modules.losses.GWLosses.step": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.__init__": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.gw_mod": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.selection_mod": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.domain_mods": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.loss_coefs": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.contrastive_fn": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.use_normalized_constrastive": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.contrastive_loss": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.broadcast_loss": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.step": {"tf": 1}, "shimmer.modules.contrastive_loss": {"tf": 1}, "shimmer.modules.contrastive_loss.ContrastiveLossType": {"tf": 1}, "shimmer.modules.contrastive_loss.ContrastiveLossBayesianType": {"tf": 1}, "shimmer.modules.contrastive_loss.info_nce": {"tf": 1}, "shimmer.modules.contrastive_loss.contrastive_loss": {"tf": 1}, "shimmer.modules.contrastive_loss.ContrastiveLoss": {"tf": 1}, "shimmer.modules.contrastive_loss.ContrastiveLoss.__init__": {"tf": 1}, "shimmer.modules.contrastive_loss.ContrastiveLoss.learn_logit_scale": {"tf": 1}, "shimmer.modules.contrastive_loss.ContrastiveLoss.reduction": {"tf": 1}, "shimmer.modules.contrastive_loss.ContrastiveLoss.forward": {"tf": 1}, "shimmer.dataset": {"tf": 1}, "shimmer.dataset.RepeatedDataset": {"tf": 1}, "shimmer.dataset.RepeatedDataset.__init__": {"tf": 1}, "shimmer.dataset.RepeatedDataset.dataset": {"tf": 1}, "shimmer.dataset.RepeatedDataset.dataset_size": {"tf": 1}, "shimmer.modules.vae": {"tf": 1}, "shimmer.modules.vae.reparameterize": {"tf": 1}, "shimmer.modules.vae.kl_divergence_loss": {"tf": 1}, "shimmer.modules.vae.gaussian_nll": {"tf": 1}, "shimmer.modules.vae.VAEEncoder": {"tf": 1}, "shimmer.modules.vae.VAEEncoder.forward": {"tf": 1}, "shimmer.modules.vae.VAEDecoder": {"tf": 1}, "shimmer.modules.vae.VAEDecoder.forward": {"tf": 1}, "shimmer.modules.vae.VAE": {"tf": 1}, "shimmer.modules.vae.VAE.__init__": {"tf": 1}, "shimmer.modules.vae.VAE.beta": {"tf": 1}, "shimmer.modules.vae.VAE.encoder": {"tf": 1}, "shimmer.modules.vae.VAE.decoder": {"tf": 1}, "shimmer.modules.vae.VAE.encode": {"tf": 1}, "shimmer.modules.vae.VAE.decode": {"tf": 1}, "shimmer.modules.vae.VAE.forward": {"tf": 1}, "shimmer.modules.utils": {"tf": 1}, "shimmer.modules.utils.translation": {"tf": 1}, "shimmer.modules.utils.cycle": {"tf": 1}, "shimmer.modules.utils.batch_demi_cycles": {"tf": 1}, "shimmer.modules.utils.batch_cycles": {"tf": 1}, "shimmer.modules.utils.batch_translations": {"tf": 1}, "shimmer.utils": {"tf": 1}, "shimmer.utils.MIGRATION_DIR": {"tf": 1}, "shimmer.utils.group_batch_size": {"tf": 1}, "shimmer.utils.groups_batch_size": {"tf": 1}, "shimmer.utils.groups_device": {"tf": 1}, "shimmer.utils.group_device": {"tf": 1}, "shimmer.utils.migrate_model": {"tf": 1}, "shimmer.utils.SaveMigrations": {"tf": 1}, "shimmer.utils.SaveMigrations.migrations": {"tf": 1}, "shimmer.utils.SaveMigrations.on_save_checkpoint": {"tf": 1}, "shimmer.cli.ckpt_migration": {"tf": 1}, "shimmer.cli.ckpt_migration.migrate_ckpt": {"tf": 1}}, "df": 232}}}}}}, "c": {"docs": {}, "df": 0, "h": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "d": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "r": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspaceBase.scheduler_args": {"tf": 1}}, "df": 1, "a": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "g": {"docs": {}, "df": 0, "s": {"docs": {"shimmer.modules.global_workspace.SchedulerArgs": {"tf": 1}, "shimmer.modules.global_workspace.SchedulerArgs.max_lr": {"tf": 1}, "shimmer.modules.global_workspace.SchedulerArgs.total_steps": {"tf": 1}}, "df": 3}}}}}}}}}}}, "o": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "s": {"docs": {"shimmer.modules.gw_module.compute_fusion_scores": {"tf": 1}}, "df": 1}}}}, "a": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "e": {"docs": {"shimmer.modules.contrastive_loss.ContrastiveLoss.learn_logit_scale": {"tf": 1}}, "df": 1}}}}, "t": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "p": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspaceBase.generic_step": {"tf": 1}, "shimmer.modules.losses.GWLossesBase.step": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.step": {"tf": 1}, "shimmer.modules.losses.GWLosses.step": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.step": {"tf": 1}}, "df": 5, "s": {"docs": {"shimmer.modules.global_workspace.SchedulerArgs.total_steps": {"tf": 1}}, "df": 1}}}, "a": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "e": {"docs": {"shimmer.modules.selection.SelectionBase.update_gw_state": {"tf": 1}}, "df": 1, "s": {"docs": {"shimmer.modules.global_workspace.GWPredictionsBase.states": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.batch_gw_states": {"tf": 1}, "shimmer.modules.global_workspace.GWPredictions.states": {"tf": 1}}, "df": 3}}}}}, "e": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "n": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspaceBase.selection_mod": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBayesian.sensitivity_selection": {"tf": 1}, "shimmer.modules.selection": {"tf": 1}, "shimmer.modules.selection.SelectionBase": {"tf": 1}, "shimmer.modules.selection.SelectionBase.update_gw_state": {"tf": 1}, "shimmer.modules.selection.SelectionBase.forward": {"tf": 1}, "shimmer.modules.selection.SingleDomainSelection": {"tf": 1}, "shimmer.modules.selection.SingleDomainSelection.forward": {"tf": 1}, "shimmer.modules.selection.FixedSharedSelection": {"tf": 1}, "shimmer.modules.selection.FixedSharedSelection.forward": {"tf": 1}, "shimmer.modules.selection.KQFixedQSelection": {"tf": 1}, "shimmer.modules.selection.KQFixedQSelection.__init__": {"tf": 1}, "shimmer.modules.selection.KQFixedQSelection.head_size": {"tf": 1}, "shimmer.modules.selection.KQFixedQSelection.query_layer": {"tf": 1}, "shimmer.modules.selection.KQFixedQSelection.key_layers": {"tf": 1}, "shimmer.modules.selection.KQFixedQSelection.forward": {"tf": 1}, "shimmer.modules.selection.RandomSelection": {"tf": 1}, "shimmer.modules.selection.RandomSelection.__init__": {"tf": 1}, "shimmer.modules.selection.RandomSelection.temperature": {"tf": 1}, "shimmer.modules.selection.RandomSelection.forward": {"tf": 1}, "shimmer.modules.selection.DynamicQueryAttention": {"tf": 1}, "shimmer.modules.selection.DynamicQueryAttention.__init__": {"tf": 1}, "shimmer.modules.selection.DynamicQueryAttention.head_size": {"tf": 1}, "shimmer.modules.selection.DynamicQueryAttention.query_layer": {"tf": 1}, "shimmer.modules.selection.DynamicQueryAttention.key_layers": {"tf": 1}, "shimmer.modules.selection.DynamicQueryAttention.fuse_weighted_encodings": {"tf": 1}, "shimmer.modules.selection.DynamicQueryAttention.forward": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.selection_mod": {"tf": 1}, "shimmer.modules.losses.GWLosses.selection_mod": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.selection_mod": {"tf": 1}}, "df": 30, "b": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "e": {"docs": {"shimmer.modules.selection.SelectionBase": {"tf": 1}, "shimmer.modules.selection.SelectionBase.update_gw_state": {"tf": 1}, "shimmer.modules.selection.SelectionBase.forward": {"tf": 1}}, "df": 3}}}}}}}}}}}, "n": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "v": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "y": {"docs": {"shimmer.modules.gw_module.GWModuleBayesian.sensitivity_selection": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBayesian.sensitivity_precision": {"tf": 1}}, "df": 2}}}}}}}}}}, "o": {"docs": {}, "df": 0, "f": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "x": {"docs": {"shimmer.modules.gw_module.GWModuleBayesian.precision_softmax_temp": {"tf": 1}}, "df": 1}}}}}}, "i": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "g": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "d": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "n": {"docs": {"shimmer.modules.selection.SingleDomainSelection": {"tf": 1}, "shimmer.modules.selection.SingleDomainSelection.forward": {"tf": 1}}, "df": 2}}}}}}}}}}}}}}}}}}}, "z": {"docs": {}, "df": 0, "e": {"docs": {"shimmer.modules.selection.KQFixedQSelection.head_size": {"tf": 1}, "shimmer.modules.selection.DynamicQueryAttention.head_size": {"tf": 1}, "shimmer.dataset.RepeatedDataset.dataset_size": {"tf": 1}, "shimmer.utils.group_batch_size": {"tf": 1}, "shimmer.utils.groups_batch_size": {"tf": 1}}, "df": 5}}}, "a": {"docs": {}, "df": 0, "v": {"docs": {}, "df": 0, "e": {"docs": {"shimmer.utils.SaveMigrations.on_save_checkpoint": {"tf": 1}}, "df": 1, "m": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "g": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "s": {"docs": {"shimmer.utils.SaveMigrations": {"tf": 1}, "shimmer.utils.SaveMigrations.migrations": {"tf": 1}, "shimmer.utils.SaveMigrations.on_save_checkpoint": {"tf": 1}}, "df": 3}}}}}}}}}}}}}}, "t": {"docs": {}, "df": 0, "y": {"docs": {}, "df": 0, "p": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "s": {"docs": {"shimmer.types": {"tf": 1}, "shimmer.types.RawDomainGroupT": {"tf": 1}, "shimmer.types.RawDomainGroupDT": {"tf": 1}, "shimmer.types.LatentsDomainGroupT": {"tf": 1}, "shimmer.types.LatentsDomainGroupDT": {"tf": 1}, "shimmer.types.RawDomainGroupsT": {"tf": 1}, "shimmer.types.RawDomainGroupsDT": {"tf": 1}, "shimmer.types.LatentsDomainGroupsT": {"tf": 1}, "shimmer.types.LatentsDomainGroupsDT": {"tf": 1}, "shimmer.types.ModelModeT": {"tf": 1}}, "df": 10}}}}, "o": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "l": {"docs": {"shimmer.modules.global_workspace.SchedulerArgs.total_steps": {"tf": 1}}, "df": 1}}}}, "r": {"docs": {"shimmer.modules.domain.DomainModule.compute_tr_loss": {"tf": 1}}, "df": 1, "a": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "n": {"docs": {"shimmer.modules.losses.translation_loss": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.translation_loss": {"tf": 1}, "shimmer.modules.utils.translation": {"tf": 1}}, "df": 3, "s": {"docs": {"shimmer.modules.global_workspace.GWPredictions.translations": {"tf": 1}, "shimmer.modules.losses.LossCoefs.translations": {"tf": 1}, "shimmer.modules.losses.BroadcastLossCoefs.translations": {"tf": 1}, "shimmer.modules.utils.batch_translations": {"tf": 1}}, "df": 4}}}}}}}}}}}, "e": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "p": {"docs": {"shimmer.modules.gw_module.GWModuleBayesian.precision_softmax_temp": {"tf": 1}}, "df": 1, "e": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "e": {"docs": {"shimmer.modules.selection.RandomSelection.temperature": {"tf": 1}}, "df": 1}}}}}}}}}}}, "r": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "w": {"docs": {}, "df": 0, "d": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "g": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "p": {"docs": {}, "df": 0, "t": {"docs": {"shimmer.types.RawDomainGroupT": {"tf": 1}}, "df": 1}, "d": {"docs": {}, "df": 0, "t": {"docs": {"shimmer.types.RawDomainGroupDT": {"tf": 1}}, "df": 1}}, "s": {"docs": {}, "df": 0, "t": {"docs": {"shimmer.types.RawDomainGroupsT": {"tf": 1}}, "df": 1}, "d": {"docs": {}, "df": 0, "t": {"docs": {"shimmer.types.RawDomainGroupsDT": {"tf": 1}}, "df": 1}}}}}}}}}}}}}}}, "n": {"docs": {}, "df": 0, "d": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "n": {"docs": {"shimmer.modules.selection.RandomSelection": {"tf": 1}, "shimmer.modules.selection.RandomSelection.__init__": {"tf": 1}, "shimmer.modules.selection.RandomSelection.temperature": {"tf": 1}, "shimmer.modules.selection.RandomSelection.forward": {"tf": 1}}, "df": 4}}}}}}}}}}}}}}, "e": {"docs": {}, "df": 0, "d": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "n": {"docs": {"shimmer.modules.contrastive_loss.ContrastiveLoss.reduction": {"tf": 1}}, "df": 1}}}}}}}, "p": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "d": {"docs": {}, "df": 0, "d": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "t": {"docs": {"shimmer.dataset.RepeatedDataset": {"tf": 1}, "shimmer.dataset.RepeatedDataset.__init__": {"tf": 1}, "shimmer.dataset.RepeatedDataset.dataset": {"tf": 1}, "shimmer.dataset.RepeatedDataset.dataset_size": {"tf": 1}}, "df": 4}}}}}}}}}}}}, "a": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "z": {"docs": {}, "df": 0, "e": {"docs": {"shimmer.modules.vae.reparameterize": {"tf": 1}}, "df": 1}}}}}}}}}}}}}}, "l": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "t": {"docs": {"shimmer.modules.domain.DomainModule.latent_dim": {"tf": 1}}, "df": 1, "s": {"docs": {}, "df": 0, "d": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "g": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "p": {"docs": {}, "df": 0, "t": {"docs": {"shimmer.types.LatentsDomainGroupT": {"tf": 1}}, "df": 1}, "d": {"docs": {}, "df": 0, "t": {"docs": {"shimmer.types.LatentsDomainGroupDT": {"tf": 1}}, "df": 1}}, "s": {"docs": {}, "df": 0, "t": {"docs": {"shimmer.types.LatentsDomainGroupsT": {"tf": 1}}, "df": 1}, "d": {"docs": {}, "df": 0, "t": {"docs": {"shimmer.types.LatentsDomainGroupsDT": {"tf": 1}}, "df": 1}}}}}}}}}}}}}}}}}}}, "y": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "r": {"docs": {"shimmer.modules.selection.KQFixedQSelection.query_layer": {"tf": 1}, "shimmer.modules.selection.DynamicQueryAttention.query_layer": {"tf": 1}}, "df": 2, "s": {"docs": {"shimmer.modules.gw_module.get_n_layers": {"tf": 1}, "shimmer.modules.gw_module.GWDecoder.n_layers": {"tf": 1}, "shimmer.modules.selection.KQFixedQSelection.key_layers": {"tf": 1}, "shimmer.modules.selection.DynamicQueryAttention.key_layers": {"tf": 1}}, "df": 4}}}}}, "r": {"docs": {"shimmer.modules.global_workspace.SchedulerArgs.max_lr": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.optim_lr": {"tf": 1}}, "df": 2}, "o": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "s": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspaceBase.loss_mod": {"tf": 1}, "shimmer.modules.domain.LossOutput.loss": {"tf": 1}, "shimmer.modules.domain.DomainModule.compute_loss": {"tf": 1}, "shimmer.modules.domain.DomainModule.compute_dcy_loss": {"tf": 1}, "shimmer.modules.domain.DomainModule.compute_cy_loss": {"tf": 1}, "shimmer.modules.domain.DomainModule.compute_tr_loss": {"tf": 1}, "shimmer.modules.domain.DomainModule.compute_broadcast_loss": {"tf": 1}, "shimmer.modules.losses.demi_cycle_loss": {"tf": 1}, "shimmer.modules.losses.cycle_loss": {"tf": 1}, "shimmer.modules.losses.translation_loss": {"tf": 1}, "shimmer.modules.losses.contrastive_loss": {"tf": 1}, "shimmer.modules.losses.contrastive_loss_bayesian": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.loss_coefs": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.demi_cycle_loss": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.cycle_loss": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.translation_loss": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.contrastive_loss": {"tf": 1}, "shimmer.modules.losses.broadcast_loss": {"tf": 1}, "shimmer.modules.losses.GWLosses.loss_coefs": {"tf": 1}, "shimmer.modules.losses.GWLosses.contrastive_loss": {"tf": 1}, "shimmer.modules.losses.GWLosses.broadcast_loss": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.loss_coefs": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.contrastive_loss": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.broadcast_loss": {"tf": 1}, "shimmer.modules.contrastive_loss": {"tf": 1}, "shimmer.modules.contrastive_loss.ContrastiveLossType": {"tf": 1}, "shimmer.modules.contrastive_loss.ContrastiveLossBayesianType": {"tf": 1}, "shimmer.modules.contrastive_loss.info_nce": {"tf": 1}, "shimmer.modules.contrastive_loss.contrastive_loss": {"tf": 1.4142135623730951}, "shimmer.modules.contrastive_loss.ContrastiveLoss": {"tf": 1}, "shimmer.modules.contrastive_loss.ContrastiveLoss.__init__": {"tf": 1}, "shimmer.modules.contrastive_loss.ContrastiveLoss.learn_logit_scale": {"tf": 1}, "shimmer.modules.contrastive_loss.ContrastiveLoss.reduction": {"tf": 1}, "shimmer.modules.contrastive_loss.ContrastiveLoss.forward": {"tf": 1}, "shimmer.modules.vae.kl_divergence_loss": {"tf": 1}}, "df": 35, "o": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "p": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "t": {"docs": {"shimmer.modules.domain.LossOutput": {"tf": 1}, "shimmer.modules.domain.LossOutput.__init__": {"tf": 1}, "shimmer.modules.domain.LossOutput.loss": {"tf": 1}, "shimmer.modules.domain.LossOutput.metrics": {"tf": 1}, "shimmer.modules.domain.LossOutput.all": {"tf": 1}}, "df": 5}}}}}}, "e": {"docs": {}, "df": 0, "s": {"docs": {"shimmer.modules.losses": {"tf": 1}, "shimmer.modules.losses.GWLossesBase": {"tf": 1}, "shimmer.modules.losses.GWLossesBase.step": {"tf": 1}, "shimmer.modules.losses.demi_cycle_loss": {"tf": 1}, "shimmer.modules.losses.cycle_loss": {"tf": 1}, "shimmer.modules.losses.translation_loss": {"tf": 1}, "shimmer.modules.losses.contrastive_loss": {"tf": 1}, "shimmer.modules.losses.contrastive_loss_bayesian": {"tf": 1}, "shimmer.modules.losses.LossCoefs": {"tf": 1}, "shimmer.modules.losses.LossCoefs.demi_cycles": {"tf": 1}, "shimmer.modules.losses.LossCoefs.cycles": {"tf": 1}, "shimmer.modules.losses.LossCoefs.translations": {"tf": 1}, "shimmer.modules.losses.LossCoefs.contrastives": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.__init__": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.gw_mod": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.selection_mod": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.domain_mods": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.loss_coefs": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.contrastive_fn": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.demi_cycle_loss": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.cycle_loss": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.translation_loss": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.contrastive_loss": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.step": {"tf": 1}, "shimmer.modules.losses.generate_partitions": {"tf": 1}, "shimmer.modules.losses.broadcast_loss": {"tf": 1}, "shimmer.modules.losses.BroadcastLossCoefs": {"tf": 1}, "shimmer.modules.losses.BroadcastLossCoefs.contrastives": {"tf": 1}, "shimmer.modules.losses.BroadcastLossCoefs.fused": {"tf": 1}, "shimmer.modules.losses.BroadcastLossCoefs.demi_cycles": {"tf": 1}, "shimmer.modules.losses.BroadcastLossCoefs.cycles": {"tf": 1}, "shimmer.modules.losses.BroadcastLossCoefs.translations": {"tf": 1}, "shimmer.modules.losses.GWLosses": {"tf": 1}, "shimmer.modules.losses.GWLosses.__init__": {"tf": 1}, "shimmer.modules.losses.GWLosses.gw_mod": {"tf": 1}, "shimmer.modules.losses.GWLosses.selection_mod": {"tf": 1}, "shimmer.modules.losses.GWLosses.domain_mods": {"tf": 1}, "shimmer.modules.losses.GWLosses.loss_coefs": {"tf": 1}, "shimmer.modules.losses.GWLosses.contrastive_fn": {"tf": 1}, "shimmer.modules.losses.GWLosses.contrastive_loss": {"tf": 1}, "shimmer.modules.losses.GWLosses.broadcast_loss": {"tf": 1}, "shimmer.modules.losses.GWLosses.step": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.__init__": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.gw_mod": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.selection_mod": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.domain_mods": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.loss_coefs": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.contrastive_fn": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.use_normalized_constrastive": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.contrastive_loss": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.broadcast_loss": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.step": {"tf": 1}}, "df": 54}}, "c": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "f": {"docs": {}, "df": 0, "s": {"docs": {"shimmer.modules.losses.LossCoefs": {"tf": 1}, "shimmer.modules.losses.LossCoefs.demi_cycles": {"tf": 1}, "shimmer.modules.losses.LossCoefs.cycles": {"tf": 1}, "shimmer.modules.losses.LossCoefs.translations": {"tf": 1}, "shimmer.modules.losses.LossCoefs.contrastives": {"tf": 1}}, "df": 5}}}}}}}, "g": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "t": {"docs": {"shimmer.modules.contrastive_loss.ContrastiveLoss.learn_logit_scale": {"tf": 1}}, "df": 1}}}}, "e": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "n": {"docs": {"shimmer.modules.contrastive_loss.ContrastiveLoss.learn_logit_scale": {"tf": 1}}, "df": 1}}}}}, "m": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "d": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspaceBase.gw_mod": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.selection_mod": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.loss_mod": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.gw_mod": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.selection_mod": {"tf": 1}, "shimmer.modules.losses.GWLosses.gw_mod": {"tf": 1}, "shimmer.modules.losses.GWLosses.selection_mod": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.gw_mod": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.selection_mod": {"tf": 1}}, "df": 9, "e": {"docs": {}, "df": 0, "l": {"docs": {"shimmer.utils.migrate_model": {"tf": 1}}, "df": 1, "m": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "d": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "t": {"docs": {"shimmer.types.ModelModeT": {"tf": 1}}, "df": 1}}}}}}}, "u": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "e": {"docs": {"shimmer.modules.gw_module": {"tf": 1}, "shimmer.modules.gw_module.get_n_layers": {"tf": 1}, "shimmer.modules.gw_module.GWDecoder": {"tf": 1}, "shimmer.modules.gw_module.GWDecoder.__init__": {"tf": 1}, "shimmer.modules.gw_module.GWDecoder.in_dim": {"tf": 1}, "shimmer.modules.gw_module.GWDecoder.hidden_dim": {"tf": 1}, "shimmer.modules.gw_module.GWDecoder.out_dim": {"tf": 1}, "shimmer.modules.gw_module.GWDecoder.n_layers": {"tf": 1}, "shimmer.modules.gw_module.GWEncoder": {"tf": 1}, "shimmer.modules.gw_module.GWEncoder.__init__": {"tf": 1}, "shimmer.modules.gw_module.GWEncoder.forward": {"tf": 1}, "shimmer.modules.gw_module.GWEncoderLinear": {"tf": 1}, "shimmer.modules.gw_module.GWEncoderLinear.forward": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBase": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBase.__init__": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBase.domain_mods": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBase.workspace_dim": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBase.fuse": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBase.encode": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBase.encode_and_fuse": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBase.decode": {"tf": 1}, "shimmer.modules.gw_module.GWModule": {"tf": 1}, "shimmer.modules.gw_module.GWModule.__init__": {"tf": 1}, "shimmer.modules.gw_module.GWModule.gw_encoders": {"tf": 1}, "shimmer.modules.gw_module.GWModule.gw_decoders": {"tf": 1}, "shimmer.modules.gw_module.GWModule.fuse": {"tf": 1}, "shimmer.modules.gw_module.GWModule.encode": {"tf": 1}, "shimmer.modules.gw_module.GWModule.decode": {"tf": 1}, "shimmer.modules.gw_module.compute_fusion_scores": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBayesian": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBayesian.__init__": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBayesian.precisions": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBayesian.sensitivity_selection": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBayesian.sensitivity_precision": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBayesian.precision_softmax_temp": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBayesian.get_precision": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBayesian.fuse": {"tf": 1}}, "df": 37, "s": {"docs": {"shimmer.modules.global_workspace": {"tf": 1}, "shimmer.modules.global_workspace.SchedulerArgs": {"tf": 1}, "shimmer.modules.global_workspace.SchedulerArgs.max_lr": {"tf": 1}, "shimmer.modules.global_workspace.SchedulerArgs.total_steps": {"tf": 1}, "shimmer.modules.global_workspace.GWPredictionsBase": {"tf": 1}, "shimmer.modules.global_workspace.GWPredictionsBase.states": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.gw_mod": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.selection_mod": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.loss_mod": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.optim_lr": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.optim_weight_decay": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.scheduler_args": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.domain_mods": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.workspace_dim": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.encode_and_fuse": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.encode": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.fuse": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.decode": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.batch_gw_states": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.encode_domain": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.encode_domains": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.decode_domain": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.decode_domains": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.generic_step": {"tf": 1}, "shimmer.modules.global_workspace.freeze_domain_modules": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.GWPredictions": {"tf": 1}, "shimmer.modules.global_workspace.GWPredictions.demi_cycles": {"tf": 1}, "shimmer.modules.global_workspace.GWPredictions.cycles": {"tf": 1}, "shimmer.modules.global_workspace.GWPredictions.translations": {"tf": 1}, "shimmer.modules.global_workspace.GWPredictions.states": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace2Domains": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace2Domains.__init__": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace2Domains.forward": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace.__init__": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace.forward": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian.__init__": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian.forward": {"tf": 1}, "shimmer.modules.global_workspace.pretrained_global_workspace": {"tf": 1}, "shimmer.modules.domain": {"tf": 1}, "shimmer.modules.domain.LossOutput": {"tf": 1}, "shimmer.modules.domain.LossOutput.__init__": {"tf": 1}, "shimmer.modules.domain.LossOutput.loss": {"tf": 1}, "shimmer.modules.domain.LossOutput.metrics": {"tf": 1}, "shimmer.modules.domain.LossOutput.all": {"tf": 1}, "shimmer.modules.domain.DomainModule": {"tf": 1}, "shimmer.modules.domain.DomainModule.__init__": {"tf": 1}, "shimmer.modules.domain.DomainModule.latent_dim": {"tf": 1}, "shimmer.modules.domain.DomainModule.encode": {"tf": 1}, "shimmer.modules.domain.DomainModule.decode": {"tf": 1}, "shimmer.modules.domain.DomainModule.compute_loss": {"tf": 1}, "shimmer.modules.domain.DomainModule.compute_dcy_loss": {"tf": 1}, "shimmer.modules.domain.DomainModule.compute_cy_loss": {"tf": 1}, "shimmer.modules.domain.DomainModule.compute_tr_loss": {"tf": 1}, "shimmer.modules.domain.DomainModule.compute_broadcast_loss": {"tf": 1}, "shimmer.modules.gw_module": {"tf": 1}, "shimmer.modules.gw_module.get_n_layers": {"tf": 1}, "shimmer.modules.gw_module.GWDecoder": {"tf": 1}, "shimmer.modules.gw_module.GWDecoder.__init__": {"tf": 1}, "shimmer.modules.gw_module.GWDecoder.in_dim": {"tf": 1}, "shimmer.modules.gw_module.GWDecoder.hidden_dim": {"tf": 1}, "shimmer.modules.gw_module.GWDecoder.out_dim": {"tf": 1}, "shimmer.modules.gw_module.GWDecoder.n_layers": {"tf": 1}, "shimmer.modules.gw_module.GWEncoder": {"tf": 1}, "shimmer.modules.gw_module.GWEncoder.__init__": {"tf": 1}, "shimmer.modules.gw_module.GWEncoder.forward": {"tf": 1}, "shimmer.modules.gw_module.GWEncoderLinear": {"tf": 1}, "shimmer.modules.gw_module.GWEncoderLinear.forward": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBase": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBase.__init__": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBase.domain_mods": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBase.workspace_dim": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBase.fuse": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBase.encode": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBase.encode_and_fuse": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBase.decode": {"tf": 1}, "shimmer.modules.gw_module.GWModule": {"tf": 1}, "shimmer.modules.gw_module.GWModule.__init__": {"tf": 1}, "shimmer.modules.gw_module.GWModule.gw_encoders": {"tf": 1}, "shimmer.modules.gw_module.GWModule.gw_decoders": {"tf": 1}, "shimmer.modules.gw_module.GWModule.fuse": {"tf": 1}, "shimmer.modules.gw_module.GWModule.encode": {"tf": 1}, "shimmer.modules.gw_module.GWModule.decode": {"tf": 1}, "shimmer.modules.gw_module.compute_fusion_scores": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBayesian": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBayesian.__init__": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBayesian.precisions": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBayesian.sensitivity_selection": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBayesian.sensitivity_precision": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBayesian.precision_softmax_temp": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBayesian.get_precision": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBayesian.fuse": {"tf": 1}, "shimmer.modules.selection": {"tf": 1}, "shimmer.modules.selection.SelectionBase": {"tf": 1}, "shimmer.modules.selection.SelectionBase.update_gw_state": {"tf": 1}, "shimmer.modules.selection.SelectionBase.forward": {"tf": 1}, "shimmer.modules.selection.SingleDomainSelection": {"tf": 1}, "shimmer.modules.selection.SingleDomainSelection.forward": {"tf": 1}, "shimmer.modules.selection.FixedSharedSelection": {"tf": 1}, "shimmer.modules.selection.FixedSharedSelection.forward": {"tf": 1}, "shimmer.modules.selection.KQFixedQSelection": {"tf": 1}, "shimmer.modules.selection.KQFixedQSelection.__init__": {"tf": 1}, "shimmer.modules.selection.KQFixedQSelection.head_size": {"tf": 1}, "shimmer.modules.selection.KQFixedQSelection.query_layer": {"tf": 1}, "shimmer.modules.selection.KQFixedQSelection.key_layers": {"tf": 1}, "shimmer.modules.selection.KQFixedQSelection.forward": {"tf": 1}, "shimmer.modules.selection.RandomSelection": {"tf": 1}, "shimmer.modules.selection.RandomSelection.__init__": {"tf": 1}, "shimmer.modules.selection.RandomSelection.temperature": {"tf": 1}, "shimmer.modules.selection.RandomSelection.forward": {"tf": 1}, "shimmer.modules.selection.DynamicQueryAttention": {"tf": 1}, "shimmer.modules.selection.DynamicQueryAttention.__init__": {"tf": 1}, "shimmer.modules.selection.DynamicQueryAttention.head_size": {"tf": 1}, "shimmer.modules.selection.DynamicQueryAttention.query_layer": {"tf": 1}, "shimmer.modules.selection.DynamicQueryAttention.key_layers": {"tf": 1}, "shimmer.modules.selection.DynamicQueryAttention.fuse_weighted_encodings": {"tf": 1}, "shimmer.modules.selection.DynamicQueryAttention.forward": {"tf": 1}, "shimmer.modules.losses": {"tf": 1}, "shimmer.modules.losses.GWLossesBase": {"tf": 1}, "shimmer.modules.losses.GWLossesBase.step": {"tf": 1}, "shimmer.modules.losses.demi_cycle_loss": {"tf": 1}, "shimmer.modules.losses.cycle_loss": {"tf": 1}, "shimmer.modules.losses.translation_loss": {"tf": 1}, "shimmer.modules.losses.contrastive_loss": {"tf": 1}, "shimmer.modules.losses.contrastive_loss_bayesian": {"tf": 1}, "shimmer.modules.losses.LossCoefs": {"tf": 1}, "shimmer.modules.losses.LossCoefs.demi_cycles": {"tf": 1}, "shimmer.modules.losses.LossCoefs.cycles": {"tf": 1}, "shimmer.modules.losses.LossCoefs.translations": {"tf": 1}, "shimmer.modules.losses.LossCoefs.contrastives": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.__init__": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.gw_mod": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.selection_mod": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.domain_mods": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.loss_coefs": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.contrastive_fn": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.demi_cycle_loss": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.cycle_loss": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.translation_loss": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.contrastive_loss": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.step": {"tf": 1}, "shimmer.modules.losses.generate_partitions": {"tf": 1}, "shimmer.modules.losses.broadcast_loss": {"tf": 1}, "shimmer.modules.losses.BroadcastLossCoefs": {"tf": 1}, "shimmer.modules.losses.BroadcastLossCoefs.contrastives": {"tf": 1}, "shimmer.modules.losses.BroadcastLossCoefs.fused": {"tf": 1}, "shimmer.modules.losses.BroadcastLossCoefs.demi_cycles": {"tf": 1}, "shimmer.modules.losses.BroadcastLossCoefs.cycles": {"tf": 1}, "shimmer.modules.losses.BroadcastLossCoefs.translations": {"tf": 1}, "shimmer.modules.losses.GWLosses": {"tf": 1}, "shimmer.modules.losses.GWLosses.__init__": {"tf": 1}, "shimmer.modules.losses.GWLosses.gw_mod": {"tf": 1}, "shimmer.modules.losses.GWLosses.selection_mod": {"tf": 1}, "shimmer.modules.losses.GWLosses.domain_mods": {"tf": 1}, "shimmer.modules.losses.GWLosses.loss_coefs": {"tf": 1}, "shimmer.modules.losses.GWLosses.contrastive_fn": {"tf": 1}, "shimmer.modules.losses.GWLosses.contrastive_loss": {"tf": 1}, "shimmer.modules.losses.GWLosses.broadcast_loss": {"tf": 1}, "shimmer.modules.losses.GWLosses.step": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.__init__": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.gw_mod": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.selection_mod": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.domain_mods": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.loss_coefs": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.contrastive_fn": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.use_normalized_constrastive": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.contrastive_loss": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.broadcast_loss": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.step": {"tf": 1}, "shimmer.modules.contrastive_loss": {"tf": 1}, "shimmer.modules.contrastive_loss.ContrastiveLossType": {"tf": 1}, "shimmer.modules.contrastive_loss.ContrastiveLossBayesianType": {"tf": 1}, "shimmer.modules.contrastive_loss.info_nce": {"tf": 1}, "shimmer.modules.contrastive_loss.contrastive_loss": {"tf": 1}, "shimmer.modules.contrastive_loss.ContrastiveLoss": {"tf": 1}, "shimmer.modules.contrastive_loss.ContrastiveLoss.__init__": {"tf": 1}, "shimmer.modules.contrastive_loss.ContrastiveLoss.learn_logit_scale": {"tf": 1}, "shimmer.modules.contrastive_loss.ContrastiveLoss.reduction": {"tf": 1}, "shimmer.modules.contrastive_loss.ContrastiveLoss.forward": {"tf": 1}, "shimmer.modules.vae": {"tf": 1}, "shimmer.modules.vae.reparameterize": {"tf": 1}, "shimmer.modules.vae.kl_divergence_loss": {"tf": 1}, "shimmer.modules.vae.gaussian_nll": {"tf": 1}, "shimmer.modules.vae.VAEEncoder": {"tf": 1}, "shimmer.modules.vae.VAEEncoder.forward": {"tf": 1}, "shimmer.modules.vae.VAEDecoder": {"tf": 1}, "shimmer.modules.vae.VAEDecoder.forward": {"tf": 1}, "shimmer.modules.vae.VAE": {"tf": 1}, "shimmer.modules.vae.VAE.__init__": {"tf": 1}, "shimmer.modules.vae.VAE.beta": {"tf": 1}, "shimmer.modules.vae.VAE.encoder": {"tf": 1}, "shimmer.modules.vae.VAE.decoder": {"tf": 1}, "shimmer.modules.vae.VAE.encode": {"tf": 1}, "shimmer.modules.vae.VAE.decode": {"tf": 1}, "shimmer.modules.vae.VAE.forward": {"tf": 1}, "shimmer.modules.utils": {"tf": 1}, "shimmer.modules.utils.translation": {"tf": 1}, "shimmer.modules.utils.cycle": {"tf": 1}, "shimmer.modules.utils.batch_demi_cycles": {"tf": 1}, "shimmer.modules.utils.batch_cycles": {"tf": 1}, "shimmer.modules.utils.batch_translations": {"tf": 1}}, "df": 205}}}}, "s": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspaceBase.domain_mods": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBase.domain_mods": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.domain_mods": {"tf": 1}, "shimmer.modules.losses.GWLosses.domain_mods": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.domain_mods": {"tf": 1}}, "df": 5}}}, "a": {"docs": {}, "df": 0, "x": {"docs": {"shimmer.modules.global_workspace.SchedulerArgs.max_lr": {"tf": 1}}, "df": 1}}, "e": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "s": {"docs": {"shimmer.modules.domain.LossOutput.metrics": {"tf": 1}}, "df": 1}}}}}}, "i": {"docs": {}, "df": 0, "g": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "n": {"docs": {"shimmer.utils.MIGRATION_DIR": {"tf": 1}, "shimmer.cli.ckpt_migration": {"tf": 1}, "shimmer.cli.ckpt_migration.migrate_ckpt": {"tf": 1}}, "df": 3, "s": {"docs": {"shimmer.utils.SaveMigrations.migrations": {"tf": 1}}, "df": 1}}}}, "e": {"docs": {"shimmer.utils.migrate_model": {"tf": 1}, "shimmer.cli.ckpt_migration.migrate_ckpt": {"tf": 1}}, "df": 2}}}}}}}, "g": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "b": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "l": {"docs": {"shimmer.modules.global_workspace": {"tf": 1}, "shimmer.modules.global_workspace.SchedulerArgs": {"tf": 1}, "shimmer.modules.global_workspace.SchedulerArgs.max_lr": {"tf": 1}, "shimmer.modules.global_workspace.SchedulerArgs.total_steps": {"tf": 1}, "shimmer.modules.global_workspace.GWPredictionsBase": {"tf": 1}, "shimmer.modules.global_workspace.GWPredictionsBase.states": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.gw_mod": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.selection_mod": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.loss_mod": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.optim_lr": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.optim_weight_decay": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.scheduler_args": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.domain_mods": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.workspace_dim": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.encode_and_fuse": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.encode": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.fuse": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.decode": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.batch_gw_states": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.encode_domain": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.encode_domains": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.decode_domain": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.decode_domains": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.generic_step": {"tf": 1}, "shimmer.modules.global_workspace.freeze_domain_modules": {"tf": 1}, "shimmer.modules.global_workspace.GWPredictions": {"tf": 1}, "shimmer.modules.global_workspace.GWPredictions.demi_cycles": {"tf": 1}, "shimmer.modules.global_workspace.GWPredictions.cycles": {"tf": 1}, "shimmer.modules.global_workspace.GWPredictions.translations": {"tf": 1}, "shimmer.modules.global_workspace.GWPredictions.states": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace2Domains": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace2Domains.__init__": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace2Domains.forward": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace.__init__": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace.forward": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian.__init__": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian.forward": {"tf": 1}, "shimmer.modules.global_workspace.pretrained_global_workspace": {"tf": 1.4142135623730951}}, "df": 41, "w": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "k": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "p": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "e": {"2": {"docs": {}, "df": 0, "d": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "s": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspace2Domains": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace2Domains.__init__": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace2Domains.forward": {"tf": 1}}, "df": 3}}}}}}}}, "docs": {"shimmer.modules.global_workspace.GlobalWorkspace": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace.__init__": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace.forward": {"tf": 1}}, "df": 3, "b": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "e": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspaceBase": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.gw_mod": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.selection_mod": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.loss_mod": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.optim_lr": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.optim_weight_decay": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.scheduler_args": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.domain_mods": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.workspace_dim": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.encode_and_fuse": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.encode": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.fuse": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.decode": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.batch_gw_states": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.encode_domain": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.encode_domains": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.decode_domain": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.decode_domains": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.generic_step": {"tf": 1}}, "df": 19}}, "y": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "n": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspaceBayesian": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian.__init__": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian.forward": {"tf": 1}}, "df": 3}}}}}}}}}}}}}}}}}}}}}}, "w": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspaceBase.gw_mod": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.batch_gw_states": {"tf": 1}, "shimmer.modules.gw_module": {"tf": 1}, "shimmer.modules.gw_module.get_n_layers": {"tf": 1}, "shimmer.modules.gw_module.GWDecoder": {"tf": 1}, "shimmer.modules.gw_module.GWDecoder.__init__": {"tf": 1}, "shimmer.modules.gw_module.GWDecoder.in_dim": {"tf": 1}, "shimmer.modules.gw_module.GWDecoder.hidden_dim": {"tf": 1}, "shimmer.modules.gw_module.GWDecoder.out_dim": {"tf": 1}, "shimmer.modules.gw_module.GWDecoder.n_layers": {"tf": 1}, "shimmer.modules.gw_module.GWEncoder": {"tf": 1}, "shimmer.modules.gw_module.GWEncoder.__init__": {"tf": 1}, "shimmer.modules.gw_module.GWEncoder.forward": {"tf": 1}, "shimmer.modules.gw_module.GWEncoderLinear": {"tf": 1}, "shimmer.modules.gw_module.GWEncoderLinear.forward": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBase": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBase.__init__": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBase.domain_mods": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBase.workspace_dim": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBase.fuse": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBase.encode": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBase.encode_and_fuse": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBase.decode": {"tf": 1}, "shimmer.modules.gw_module.GWModule": {"tf": 1}, "shimmer.modules.gw_module.GWModule.__init__": {"tf": 1}, "shimmer.modules.gw_module.GWModule.gw_encoders": {"tf": 1.4142135623730951}, "shimmer.modules.gw_module.GWModule.gw_decoders": {"tf": 1.4142135623730951}, "shimmer.modules.gw_module.GWModule.fuse": {"tf": 1}, "shimmer.modules.gw_module.GWModule.encode": {"tf": 1}, "shimmer.modules.gw_module.GWModule.decode": {"tf": 1}, "shimmer.modules.gw_module.compute_fusion_scores": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBayesian": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBayesian.__init__": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBayesian.precisions": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBayesian.sensitivity_selection": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBayesian.sensitivity_precision": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBayesian.precision_softmax_temp": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBayesian.get_precision": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBayesian.fuse": {"tf": 1}, "shimmer.modules.selection.SelectionBase.update_gw_state": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.gw_mod": {"tf": 1}, "shimmer.modules.losses.GWLosses.gw_mod": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.gw_mod": {"tf": 1}}, "df": 43, "p": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "d": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "s": {"docs": {"shimmer.modules.global_workspace.GWPredictions": {"tf": 1}, "shimmer.modules.global_workspace.GWPredictions.demi_cycles": {"tf": 1}, "shimmer.modules.global_workspace.GWPredictions.cycles": {"tf": 1}, "shimmer.modules.global_workspace.GWPredictions.translations": {"tf": 1}, "shimmer.modules.global_workspace.GWPredictions.states": {"tf": 1}}, "df": 5, "b": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "e": {"docs": {"shimmer.modules.global_workspace.GWPredictionsBase": {"tf": 1}, "shimmer.modules.global_workspace.GWPredictionsBase.states": {"tf": 1}}, "df": 2}}}}}}}}}}}}}}}, "d": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "d": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "r": {"docs": {"shimmer.modules.gw_module.GWDecoder": {"tf": 1}, "shimmer.modules.gw_module.GWDecoder.__init__": {"tf": 1}, "shimmer.modules.gw_module.GWDecoder.in_dim": {"tf": 1}, "shimmer.modules.gw_module.GWDecoder.hidden_dim": {"tf": 1}, "shimmer.modules.gw_module.GWDecoder.out_dim": {"tf": 1}, "shimmer.modules.gw_module.GWDecoder.n_layers": {"tf": 1}}, "df": 6}}}}}}}, "e": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "d": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "r": {"docs": {"shimmer.modules.gw_module.GWEncoder": {"tf": 1}, "shimmer.modules.gw_module.GWEncoder.__init__": {"tf": 1}, "shimmer.modules.gw_module.GWEncoder.forward": {"tf": 1}}, "df": 3, "l": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "r": {"docs": {"shimmer.modules.gw_module.GWEncoderLinear": {"tf": 1}, "shimmer.modules.gw_module.GWEncoderLinear.forward": {"tf": 1}}, "df": 2}}}}}}}}}}}}}, "m": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "d": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "e": {"docs": {"shimmer.modules.gw_module.GWModule": {"tf": 1}, "shimmer.modules.gw_module.GWModule.__init__": {"tf": 1}, "shimmer.modules.gw_module.GWModule.gw_encoders": {"tf": 1}, "shimmer.modules.gw_module.GWModule.gw_decoders": {"tf": 1}, "shimmer.modules.gw_module.GWModule.fuse": {"tf": 1}, "shimmer.modules.gw_module.GWModule.encode": {"tf": 1}, "shimmer.modules.gw_module.GWModule.decode": {"tf": 1}}, "df": 7, "b": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "e": {"docs": {"shimmer.modules.gw_module.GWModuleBase": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBase.__init__": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBase.domain_mods": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBase.workspace_dim": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBase.fuse": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBase.encode": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBase.encode_and_fuse": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBase.decode": {"tf": 1}}, "df": 8}}, "y": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "n": {"docs": {"shimmer.modules.gw_module.GWModuleBayesian": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBayesian.__init__": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBayesian.precisions": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBayesian.sensitivity_selection": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBayesian.sensitivity_precision": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBayesian.precision_softmax_temp": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBayesian.get_precision": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBayesian.fuse": {"tf": 1}}, "df": 8}}}}}}}}}}}}}}, "l": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "s": {"2": {"docs": {}, "df": 0, "d": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "s": {"docs": {"shimmer.modules.losses.GWLosses2Domains": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.__init__": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.gw_mod": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.selection_mod": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.domain_mods": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.loss_coefs": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.contrastive_fn": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.demi_cycle_loss": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.cycle_loss": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.translation_loss": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.contrastive_loss": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.step": {"tf": 1}}, "df": 12}}}}}}}}, "docs": {"shimmer.modules.losses.GWLosses": {"tf": 1}, "shimmer.modules.losses.GWLosses.__init__": {"tf": 1}, "shimmer.modules.losses.GWLosses.gw_mod": {"tf": 1}, "shimmer.modules.losses.GWLosses.selection_mod": {"tf": 1}, "shimmer.modules.losses.GWLosses.domain_mods": {"tf": 1}, "shimmer.modules.losses.GWLosses.loss_coefs": {"tf": 1}, "shimmer.modules.losses.GWLosses.contrastive_fn": {"tf": 1}, "shimmer.modules.losses.GWLosses.contrastive_loss": {"tf": 1}, "shimmer.modules.losses.GWLosses.broadcast_loss": {"tf": 1}, "shimmer.modules.losses.GWLosses.step": {"tf": 1}}, "df": 10, "b": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "e": {"docs": {"shimmer.modules.losses.GWLossesBase": {"tf": 1}, "shimmer.modules.losses.GWLossesBase.step": {"tf": 1}}, "df": 2}}, "y": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "n": {"docs": {"shimmer.modules.losses.GWLossesBayesian": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.__init__": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.gw_mod": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.selection_mod": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.domain_mods": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.loss_coefs": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.contrastive_fn": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.use_normalized_constrastive": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.contrastive_loss": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.broadcast_loss": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.step": {"tf": 1}}, "df": 11}}}}}}}}}}}}}}}, "e": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "c": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspaceBase.generic_step": {"tf": 1}}, "df": 1}}, "a": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "e": {"docs": {"shimmer.modules.losses.generate_partitions": {"tf": 1}}, "df": 1}}}}}}, "t": {"docs": {"shimmer.modules.gw_module.get_n_layers": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBayesian.get_precision": {"tf": 1}}, "df": 2}}, "a": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "n": {"docs": {"shimmer.modules.vae.gaussian_nll": {"tf": 1}}, "df": 1}}}}}}}, "r": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "p": {"docs": {"shimmer.utils.group_batch_size": {"tf": 1}, "shimmer.utils.group_device": {"tf": 1}}, "df": 2, "s": {"docs": {"shimmer.utils.groups_batch_size": {"tf": 1}, "shimmer.utils.groups_device": {"tf": 1}}, "df": 2}}}}}}, "w": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "k": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "p": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "e": {"docs": {"shimmer.modules.global_workspace": {"tf": 1}, "shimmer.modules.global_workspace.SchedulerArgs": {"tf": 1}, "shimmer.modules.global_workspace.SchedulerArgs.max_lr": {"tf": 1}, "shimmer.modules.global_workspace.SchedulerArgs.total_steps": {"tf": 1}, "shimmer.modules.global_workspace.GWPredictionsBase": {"tf": 1}, "shimmer.modules.global_workspace.GWPredictionsBase.states": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.gw_mod": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.selection_mod": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.loss_mod": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.optim_lr": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.optim_weight_decay": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.scheduler_args": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.domain_mods": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.workspace_dim": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.encode_and_fuse": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.encode": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.fuse": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.decode": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.batch_gw_states": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.encode_domain": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.encode_domains": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.decode_domain": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.decode_domains": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.generic_step": {"tf": 1}, "shimmer.modules.global_workspace.freeze_domain_modules": {"tf": 1}, "shimmer.modules.global_workspace.GWPredictions": {"tf": 1}, "shimmer.modules.global_workspace.GWPredictions.demi_cycles": {"tf": 1}, "shimmer.modules.global_workspace.GWPredictions.cycles": {"tf": 1}, "shimmer.modules.global_workspace.GWPredictions.translations": {"tf": 1}, "shimmer.modules.global_workspace.GWPredictions.states": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace2Domains": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace2Domains.__init__": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace2Domains.forward": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace.__init__": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace.forward": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian.__init__": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian.forward": {"tf": 1}, "shimmer.modules.global_workspace.pretrained_global_workspace": {"tf": 1.4142135623730951}, "shimmer.modules.gw_module.GWModuleBase.workspace_dim": {"tf": 1}}, "df": 42}}}}}}}}, "e": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "g": {"docs": {}, "df": 0, "h": {"docs": {}, "df": 0, "t": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspaceBase.optim_weight_decay": {"tf": 1}}, "df": 1, "e": {"docs": {}, "df": 0, "d": {"docs": {"shimmer.modules.selection.DynamicQueryAttention.fuse_weighted_encodings": {"tf": 1}}, "df": 1}}}}}}}}, "o": {"docs": {}, "df": 0, "p": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "m": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspaceBase.optim_lr": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.optim_weight_decay": {"tf": 1}}, "df": 2}}}}, "u": {"docs": {}, "df": 0, "t": {"docs": {"shimmer.modules.gw_module.GWDecoder.out_dim": {"tf": 1}}, "df": 1}}, "n": {"docs": {"shimmer.utils.SaveMigrations.on_save_checkpoint": {"tf": 1}}, "df": 1}}, "d": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "y": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspaceBase.optim_weight_decay": {"tf": 1}}, "df": 1}}, "o": {"docs": {}, "df": 0, "d": {"docs": {}, "df": 0, "e": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspaceBase.decode": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.decode_domain": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.decode_domains": {"tf": 1}, "shimmer.modules.domain.DomainModule.decode": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBase.decode": {"tf": 1}, "shimmer.modules.gw_module.GWModule.decode": {"tf": 1}, "shimmer.modules.vae.VAE.decode": {"tf": 1}}, "df": 7, "r": {"docs": {"shimmer.modules.vae.VAE.decoder": {"tf": 1}}, "df": 1, "s": {"docs": {"shimmer.modules.gw_module.GWModule.gw_decoders": {"tf": 1}}, "df": 1}}}}}}, "m": {"docs": {}, "df": 0, "i": {"docs": {"shimmer.modules.global_workspace.GWPredictions.demi_cycles": {"tf": 1}, "shimmer.modules.losses.demi_cycle_loss": {"tf": 1}, "shimmer.modules.losses.LossCoefs.demi_cycles": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.demi_cycle_loss": {"tf": 1}, "shimmer.modules.losses.BroadcastLossCoefs.demi_cycles": {"tf": 1}, "shimmer.modules.utils.batch_demi_cycles": {"tf": 1}}, "df": 6}}, "v": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "e": {"docs": {"shimmer.utils.groups_device": {"tf": 1}, "shimmer.utils.group_device": {"tf": 1}}, "df": 2}}}}}, "o": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "n": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspaceBase.domain_mods": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.encode_domain": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.decode_domain": {"tf": 1}, "shimmer.modules.global_workspace.freeze_domain_modules": {"tf": 1}, "shimmer.modules.domain": {"tf": 1}, "shimmer.modules.domain.LossOutput": {"tf": 1}, "shimmer.modules.domain.LossOutput.__init__": {"tf": 1}, "shimmer.modules.domain.LossOutput.loss": {"tf": 1}, "shimmer.modules.domain.LossOutput.metrics": {"tf": 1}, "shimmer.modules.domain.LossOutput.all": {"tf": 1}, "shimmer.modules.domain.DomainModule": {"tf": 1}, "shimmer.modules.domain.DomainModule.__init__": {"tf": 1}, "shimmer.modules.domain.DomainModule.latent_dim": {"tf": 1}, "shimmer.modules.domain.DomainModule.encode": {"tf": 1}, "shimmer.modules.domain.DomainModule.decode": {"tf": 1}, "shimmer.modules.domain.DomainModule.compute_loss": {"tf": 1}, "shimmer.modules.domain.DomainModule.compute_dcy_loss": {"tf": 1}, "shimmer.modules.domain.DomainModule.compute_cy_loss": {"tf": 1}, "shimmer.modules.domain.DomainModule.compute_tr_loss": {"tf": 1}, "shimmer.modules.domain.DomainModule.compute_broadcast_loss": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBase.domain_mods": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.domain_mods": {"tf": 1}, "shimmer.modules.losses.GWLosses.domain_mods": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.domain_mods": {"tf": 1}}, "df": 24, "s": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspaceBase.encode_domains": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.decode_domains": {"tf": 1}}, "df": 2}, "m": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "d": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "e": {"docs": {"shimmer.modules.domain.DomainModule": {"tf": 1}, "shimmer.modules.domain.DomainModule.__init__": {"tf": 1}, "shimmer.modules.domain.DomainModule.latent_dim": {"tf": 1}, "shimmer.modules.domain.DomainModule.encode": {"tf": 1}, "shimmer.modules.domain.DomainModule.decode": {"tf": 1}, "shimmer.modules.domain.DomainModule.compute_loss": {"tf": 1}, "shimmer.modules.domain.DomainModule.compute_dcy_loss": {"tf": 1}, "shimmer.modules.domain.DomainModule.compute_cy_loss": {"tf": 1}, "shimmer.modules.domain.DomainModule.compute_tr_loss": {"tf": 1}, "shimmer.modules.domain.DomainModule.compute_broadcast_loss": {"tf": 1}}, "df": 10}}}}}}}}}}}, "i": {"docs": {}, "df": 0, "m": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspaceBase.workspace_dim": {"tf": 1}, "shimmer.modules.domain.DomainModule.latent_dim": {"tf": 1}, "shimmer.modules.gw_module.GWDecoder.in_dim": {"tf": 1}, "shimmer.modules.gw_module.GWDecoder.hidden_dim": {"tf": 1}, "shimmer.modules.gw_module.GWDecoder.out_dim": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBase.workspace_dim": {"tf": 1}}, "df": 6}, "v": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "g": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "e": {"docs": {"shimmer.modules.vae.kl_divergence_loss": {"tf": 1}}, "df": 1}}}}}}}}, "r": {"docs": {"shimmer.utils.MIGRATION_DIR": {"tf": 1}}, "df": 1}}, "c": {"docs": {}, "df": 0, "y": {"docs": {"shimmer.modules.domain.DomainModule.compute_dcy_loss": {"tf": 1}}, "df": 1}}, "y": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "q": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "y": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "n": {"docs": {"shimmer.modules.selection.DynamicQueryAttention": {"tf": 1}, "shimmer.modules.selection.DynamicQueryAttention.__init__": {"tf": 1}, "shimmer.modules.selection.DynamicQueryAttention.head_size": {"tf": 1}, "shimmer.modules.selection.DynamicQueryAttention.query_layer": {"tf": 1}, "shimmer.modules.selection.DynamicQueryAttention.key_layers": {"tf": 1}, "shimmer.modules.selection.DynamicQueryAttention.fuse_weighted_encodings": {"tf": 1}, "shimmer.modules.selection.DynamicQueryAttention.forward": {"tf": 1}}, "df": 7}}}}}}}}}}}}}}}}}}}}, "a": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "t": {"docs": {"shimmer.dataset": {"tf": 1}, "shimmer.dataset.RepeatedDataset": {"tf": 1}, "shimmer.dataset.RepeatedDataset.__init__": {"tf": 1}, "shimmer.dataset.RepeatedDataset.dataset": {"tf": 1.4142135623730951}, "shimmer.dataset.RepeatedDataset.dataset_size": {"tf": 1.4142135623730951}}, "df": 5}}}}}}}, "a": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "g": {"docs": {}, "df": 0, "s": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspaceBase.scheduler_args": {"tf": 1}}, "df": 1}}}, "n": {"docs": {}, "df": 0, "d": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspaceBase.encode_and_fuse": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBase.encode_and_fuse": {"tf": 1}}, "df": 2}}, "l": {"docs": {}, "df": 0, "l": {"docs": {"shimmer.modules.domain.LossOutput.all": {"tf": 1}}, "df": 1}}}, "e": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "d": {"docs": {}, "df": 0, "e": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspaceBase.encode_and_fuse": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.encode": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.encode_domain": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.encode_domains": {"tf": 1}, "shimmer.modules.domain.DomainModule.encode": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBase.encode": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBase.encode_and_fuse": {"tf": 1}, "shimmer.modules.gw_module.GWModule.encode": {"tf": 1}, "shimmer.modules.vae.VAE.encode": {"tf": 1}}, "df": 9, "r": {"docs": {"shimmer.modules.vae.VAE.encoder": {"tf": 1}}, "df": 1, "s": {"docs": {"shimmer.modules.gw_module.GWModule.gw_encoders": {"tf": 1}}, "df": 1}}}, "i": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "g": {"docs": {}, "df": 0, "s": {"docs": {"shimmer.modules.selection.DynamicQueryAttention.fuse_weighted_encodings": {"tf": 1}}, "df": 1}}}}}}}}}, "f": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "e": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspaceBase.encode_and_fuse": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.fuse": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBase.fuse": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBase.encode_and_fuse": {"tf": 1}, "shimmer.modules.gw_module.GWModule.fuse": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBayesian.fuse": {"tf": 1}, "shimmer.modules.selection.DynamicQueryAttention.fuse_weighted_encodings": {"tf": 1}}, "df": 7, "d": {"docs": {"shimmer.modules.losses.BroadcastLossCoefs.fused": {"tf": 1}}, "df": 1}}, "i": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "n": {"docs": {"shimmer.modules.gw_module.compute_fusion_scores": {"tf": 1}}, "df": 1}}}}}, "r": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "z": {"docs": {}, "df": 0, "e": {"docs": {"shimmer.modules.global_workspace.freeze_domain_modules": {"tf": 1}}, "df": 1}}}}}, "o": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "w": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "d": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspace2Domains.forward": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace.forward": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian.forward": {"tf": 1}, "shimmer.modules.gw_module.GWEncoder.forward": {"tf": 1}, "shimmer.modules.gw_module.GWEncoderLinear.forward": {"tf": 1}, "shimmer.modules.selection.SelectionBase.forward": {"tf": 1}, "shimmer.modules.selection.SingleDomainSelection.forward": {"tf": 1}, "shimmer.modules.selection.FixedSharedSelection.forward": {"tf": 1}, "shimmer.modules.selection.KQFixedQSelection.forward": {"tf": 1}, "shimmer.modules.selection.RandomSelection.forward": {"tf": 1}, "shimmer.modules.selection.DynamicQueryAttention.forward": {"tf": 1}, "shimmer.modules.contrastive_loss.ContrastiveLoss.forward": {"tf": 1}, "shimmer.modules.vae.VAEEncoder.forward": {"tf": 1}, "shimmer.modules.vae.VAEDecoder.forward": {"tf": 1}, "shimmer.modules.vae.VAE.forward": {"tf": 1}}, "df": 15}}}}}}, "i": {"docs": {}, "df": 0, "x": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "d": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "h": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "d": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "n": {"docs": {"shimmer.modules.selection.FixedSharedSelection": {"tf": 1}, "shimmer.modules.selection.FixedSharedSelection.forward": {"tf": 1}}, "df": 2}}}}}}}}}}}}}}}}}}}, "n": {"docs": {"shimmer.modules.losses.GWLosses2Domains.contrastive_fn": {"tf": 1}, "shimmer.modules.losses.GWLosses.contrastive_fn": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.contrastive_fn": {"tf": 1}}, "df": 3}}, "b": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "h": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspaceBase.batch_gw_states": {"tf": 1}, "shimmer.modules.utils.batch_demi_cycles": {"tf": 1}, "shimmer.modules.utils.batch_cycles": {"tf": 1}, "shimmer.modules.utils.batch_translations": {"tf": 1}, "shimmer.utils.group_batch_size": {"tf": 1}, "shimmer.utils.groups_batch_size": {"tf": 1}}, "df": 6}}}, "y": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "n": {"docs": {"shimmer.modules.losses.contrastive_loss_bayesian": {"tf": 1}}, "df": 1}}}}}}}, "r": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "d": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "t": {"docs": {"shimmer.modules.domain.DomainModule.compute_broadcast_loss": {"tf": 1}, "shimmer.modules.losses.broadcast_loss": {"tf": 1}, "shimmer.modules.losses.GWLosses.broadcast_loss": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.broadcast_loss": {"tf": 1}}, "df": 4, "l": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "f": {"docs": {}, "df": 0, "s": {"docs": {"shimmer.modules.losses.BroadcastLossCoefs": {"tf": 1}, "shimmer.modules.losses.BroadcastLossCoefs.contrastives": {"tf": 1}, "shimmer.modules.losses.BroadcastLossCoefs.fused": {"tf": 1}, "shimmer.modules.losses.BroadcastLossCoefs.demi_cycles": {"tf": 1}, "shimmer.modules.losses.BroadcastLossCoefs.cycles": {"tf": 1}, "shimmer.modules.losses.BroadcastLossCoefs.translations": {"tf": 1}}, "df": 6}}}}}}}}}}}}}}}}}, "e": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "a": {"docs": {"shimmer.modules.vae.VAE.beta": {"tf": 1}}, "df": 1}}}}, "c": {"docs": {}, "df": 0, "y": {"docs": {"shimmer.modules.domain.DomainModule.compute_cy_loss": {"tf": 1}}, "df": 1, "c": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "e": {"docs": {"shimmer.modules.losses.demi_cycle_loss": {"tf": 1}, "shimmer.modules.losses.cycle_loss": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.demi_cycle_loss": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.cycle_loss": {"tf": 1}, "shimmer.modules.utils.cycle": {"tf": 1}}, "df": 5, "s": {"docs": {"shimmer.modules.global_workspace.GWPredictions.demi_cycles": {"tf": 1}, "shimmer.modules.global_workspace.GWPredictions.cycles": {"tf": 1}, "shimmer.modules.losses.LossCoefs.demi_cycles": {"tf": 1}, "shimmer.modules.losses.LossCoefs.cycles": {"tf": 1}, "shimmer.modules.losses.BroadcastLossCoefs.demi_cycles": {"tf": 1}, "shimmer.modules.losses.BroadcastLossCoefs.cycles": {"tf": 1}, "shimmer.modules.utils.batch_demi_cycles": {"tf": 1}, "shimmer.modules.utils.batch_cycles": {"tf": 1}}, "df": 8}}}}}, "o": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "p": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "e": {"docs": {"shimmer.modules.domain.DomainModule.compute_loss": {"tf": 1}, "shimmer.modules.domain.DomainModule.compute_dcy_loss": {"tf": 1}, "shimmer.modules.domain.DomainModule.compute_cy_loss": {"tf": 1}, "shimmer.modules.domain.DomainModule.compute_tr_loss": {"tf": 1}, "shimmer.modules.domain.DomainModule.compute_broadcast_loss": {"tf": 1}, "shimmer.modules.gw_module.compute_fusion_scores": {"tf": 1}}, "df": 6}}}}}, "n": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "v": {"docs": {}, "df": 0, "e": {"docs": {"shimmer.modules.losses.contrastive_loss": {"tf": 1}, "shimmer.modules.losses.contrastive_loss_bayesian": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.contrastive_fn": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.contrastive_loss": {"tf": 1}, "shimmer.modules.losses.GWLosses.contrastive_fn": {"tf": 1}, "shimmer.modules.losses.GWLosses.contrastive_loss": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.contrastive_fn": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.contrastive_loss": {"tf": 1}, "shimmer.modules.contrastive_loss": {"tf": 1}, "shimmer.modules.contrastive_loss.ContrastiveLossType": {"tf": 1}, "shimmer.modules.contrastive_loss.ContrastiveLossBayesianType": {"tf": 1}, "shimmer.modules.contrastive_loss.info_nce": {"tf": 1}, "shimmer.modules.contrastive_loss.contrastive_loss": {"tf": 1.4142135623730951}, "shimmer.modules.contrastive_loss.ContrastiveLoss": {"tf": 1}, "shimmer.modules.contrastive_loss.ContrastiveLoss.__init__": {"tf": 1}, "shimmer.modules.contrastive_loss.ContrastiveLoss.learn_logit_scale": {"tf": 1}, "shimmer.modules.contrastive_loss.ContrastiveLoss.reduction": {"tf": 1}, "shimmer.modules.contrastive_loss.ContrastiveLoss.forward": {"tf": 1}}, "df": 18, "s": {"docs": {"shimmer.modules.losses.LossCoefs.contrastives": {"tf": 1}, "shimmer.modules.losses.BroadcastLossCoefs.contrastives": {"tf": 1}}, "df": 2}, "l": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "s": {"docs": {"shimmer.modules.contrastive_loss.ContrastiveLoss": {"tf": 1}, "shimmer.modules.contrastive_loss.ContrastiveLoss.__init__": {"tf": 1}, "shimmer.modules.contrastive_loss.ContrastiveLoss.learn_logit_scale": {"tf": 1}, "shimmer.modules.contrastive_loss.ContrastiveLoss.reduction": {"tf": 1}, "shimmer.modules.contrastive_loss.ContrastiveLoss.forward": {"tf": 1}}, "df": 5, "t": {"docs": {}, "df": 0, "y": {"docs": {}, "df": 0, "p": {"docs": {}, "df": 0, "e": {"docs": {"shimmer.modules.contrastive_loss.ContrastiveLossType": {"tf": 1}}, "df": 1}}}}, "b": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "y": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "y": {"docs": {}, "df": 0, "p": {"docs": {}, "df": 0, "e": {"docs": {"shimmer.modules.contrastive_loss.ContrastiveLossBayesianType": {"tf": 1}}, "df": 1}}}}}}}}}}}}}}}}}}}}}}}}, "s": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "v": {"docs": {}, "df": 0, "e": {"docs": {"shimmer.modules.losses.GWLossesBayesian.use_normalized_constrastive": {"tf": 1}}, "df": 1}}}}}}}}}}, "e": {"docs": {}, "df": 0, "f": {"docs": {}, "df": 0, "s": {"docs": {"shimmer.modules.losses.GWLosses2Domains.loss_coefs": {"tf": 1}, "shimmer.modules.losses.GWLosses.loss_coefs": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.loss_coefs": {"tf": 1}}, "df": 3}}}}, "h": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "k": {"docs": {}, "df": 0, "p": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "t": {"docs": {"shimmer.utils.SaveMigrations.on_save_checkpoint": {"tf": 1}}, "df": 1}}}}}}}}}, "l": {"docs": {}, "df": 0, "i": {"docs": {"shimmer.cli.ckpt_migration": {"tf": 1}, "shimmer.cli.ckpt_migration.migrate_ckpt": {"tf": 1}}, "df": 2}}, "k": {"docs": {}, "df": 0, "p": {"docs": {}, "df": 0, "t": {"docs": {"shimmer.cli.ckpt_migration": {"tf": 1}, "shimmer.cli.ckpt_migration.migrate_ckpt": {"tf": 1.4142135623730951}}, "df": 2}}}}, "i": {"docs": {}, "df": 0, "n": {"docs": {"shimmer.modules.gw_module.GWDecoder.in_dim": {"tf": 1}}, "df": 1, "i": {"docs": {}, "df": 0, "t": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspace2Domains.__init__": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace.__init__": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian.__init__": {"tf": 1}, "shimmer.modules.domain.LossOutput.__init__": {"tf": 1}, "shimmer.modules.domain.DomainModule.__init__": {"tf": 1}, "shimmer.modules.gw_module.GWDecoder.__init__": {"tf": 1}, "shimmer.modules.gw_module.GWEncoder.__init__": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBase.__init__": {"tf": 1}, "shimmer.modules.gw_module.GWModule.__init__": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBayesian.__init__": {"tf": 1}, "shimmer.modules.selection.KQFixedQSelection.__init__": {"tf": 1}, "shimmer.modules.selection.RandomSelection.__init__": {"tf": 1}, "shimmer.modules.selection.DynamicQueryAttention.__init__": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.__init__": {"tf": 1}, "shimmer.modules.losses.GWLosses.__init__": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.__init__": {"tf": 1}, "shimmer.modules.contrastive_loss.ContrastiveLoss.__init__": {"tf": 1}, "shimmer.dataset.RepeatedDataset.__init__": {"tf": 1}, "shimmer.modules.vae.VAE.__init__": {"tf": 1}}, "df": 19}}, "f": {"docs": {}, "df": 0, "o": {"docs": {"shimmer.modules.contrastive_loss.info_nce": {"tf": 1}}, "df": 1}}}}, "p": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "d": {"docs": {"shimmer.modules.global_workspace.pretrained_global_workspace": {"tf": 1}}, "df": 1}}}}}}}, "c": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "n": {"docs": {"shimmer.modules.gw_module.GWModuleBayesian.sensitivity_precision": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBayesian.precision_softmax_temp": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBayesian.get_precision": {"tf": 1}}, "df": 3, "s": {"docs": {"shimmer.modules.gw_module.GWModuleBayesian.precisions": {"tf": 1}}, "df": 1}}}}}}}}}, "a": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "s": {"docs": {"shimmer.modules.losses.generate_partitions": {"tf": 1}}, "df": 1}}}}}}}}}}, "n": {"docs": {"shimmer.modules.gw_module.get_n_layers": {"tf": 1}, "shimmer.modules.gw_module.GWDecoder.n_layers": {"tf": 1}}, "df": 2, "o": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "z": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "d": {"docs": {"shimmer.modules.losses.GWLossesBayesian.use_normalized_constrastive": {"tf": 1}}, "df": 1}}}}}}}}}, "c": {"docs": {}, "df": 0, "e": {"docs": {"shimmer.modules.contrastive_loss.info_nce": {"tf": 1}}, "df": 1}}, "l": {"docs": {}, "df": 0, "l": {"docs": {"shimmer.modules.vae.gaussian_nll": {"tf": 1}}, "df": 1}}}, "h": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "d": {"docs": {}, "df": 0, "d": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "n": {"docs": {"shimmer.modules.gw_module.GWDecoder.hidden_dim": {"tf": 1}}, "df": 1}}}}}, "e": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "d": {"docs": {"shimmer.modules.selection.KQFixedQSelection.head_size": {"tf": 1}, "shimmer.modules.selection.DynamicQueryAttention.head_size": {"tf": 1}}, "df": 2}}}}, "u": {"docs": {}, "df": 0, "p": {"docs": {}, "df": 0, "d": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "e": {"docs": {"shimmer.modules.selection.SelectionBase.update_gw_state": {"tf": 1}}, "df": 1}}}}}, "s": {"docs": {}, "df": 0, "e": {"docs": {"shimmer.modules.losses.GWLossesBayesian.use_normalized_constrastive": {"tf": 1}}, "df": 1}}, "t": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "s": {"docs": {"shimmer.modules.utils": {"tf": 1}, "shimmer.modules.utils.translation": {"tf": 1}, "shimmer.modules.utils.cycle": {"tf": 1}, "shimmer.modules.utils.batch_demi_cycles": {"tf": 1}, "shimmer.modules.utils.batch_cycles": {"tf": 1}, "shimmer.modules.utils.batch_translations": {"tf": 1}, "shimmer.utils": {"tf": 1}, "shimmer.utils.MIGRATION_DIR": {"tf": 1}, "shimmer.utils.group_batch_size": {"tf": 1}, "shimmer.utils.groups_batch_size": {"tf": 1}, "shimmer.utils.groups_device": {"tf": 1}, "shimmer.utils.group_device": {"tf": 1}, "shimmer.utils.migrate_model": {"tf": 1}, "shimmer.utils.SaveMigrations": {"tf": 1}, "shimmer.utils.SaveMigrations.migrations": {"tf": 1}, "shimmer.utils.SaveMigrations.on_save_checkpoint": {"tf": 1}}, "df": 16}}}}}, "k": {"docs": {}, "df": 0, "q": {"docs": {}, "df": 0, "f": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "x": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "d": {"docs": {}, "df": 0, "q": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "n": {"docs": {"shimmer.modules.selection.KQFixedQSelection": {"tf": 1}, "shimmer.modules.selection.KQFixedQSelection.__init__": {"tf": 1}, "shimmer.modules.selection.KQFixedQSelection.head_size": {"tf": 1}, "shimmer.modules.selection.KQFixedQSelection.query_layer": {"tf": 1}, "shimmer.modules.selection.KQFixedQSelection.key_layers": {"tf": 1}, "shimmer.modules.selection.KQFixedQSelection.forward": {"tf": 1}}, "df": 6}}}}}}}}}}}}}}}}, "e": {"docs": {}, "df": 0, "y": {"docs": {"shimmer.modules.selection.KQFixedQSelection.key_layers": {"tf": 1}, "shimmer.modules.selection.DynamicQueryAttention.key_layers": {"tf": 1}}, "df": 2}}, "l": {"docs": {"shimmer.modules.vae.kl_divergence_loss": {"tf": 1}}, "df": 1}}, "q": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "y": {"docs": {"shimmer.modules.selection.KQFixedQSelection.query_layer": {"tf": 1}, "shimmer.modules.selection.DynamicQueryAttention.query_layer": {"tf": 1}}, "df": 2}}}}}, "v": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "e": {"docs": {"shimmer.modules.vae": {"tf": 1}, "shimmer.modules.vae.reparameterize": {"tf": 1}, "shimmer.modules.vae.kl_divergence_loss": {"tf": 1}, "shimmer.modules.vae.gaussian_nll": {"tf": 1}, "shimmer.modules.vae.VAEEncoder": {"tf": 1}, "shimmer.modules.vae.VAEEncoder.forward": {"tf": 1}, "shimmer.modules.vae.VAEDecoder": {"tf": 1}, "shimmer.modules.vae.VAEDecoder.forward": {"tf": 1}, "shimmer.modules.vae.VAE": {"tf": 1.4142135623730951}, "shimmer.modules.vae.VAE.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.vae.VAE.beta": {"tf": 1.4142135623730951}, "shimmer.modules.vae.VAE.encoder": {"tf": 1.4142135623730951}, "shimmer.modules.vae.VAE.decoder": {"tf": 1.4142135623730951}, "shimmer.modules.vae.VAE.encode": {"tf": 1.4142135623730951}, "shimmer.modules.vae.VAE.decode": {"tf": 1.4142135623730951}, "shimmer.modules.vae.VAE.forward": {"tf": 1.4142135623730951}}, "df": 16, "e": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "d": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "r": {"docs": {"shimmer.modules.vae.VAEEncoder": {"tf": 1}, "shimmer.modules.vae.VAEEncoder.forward": {"tf": 1}}, "df": 2}}}}}}}, "d": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "d": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "r": {"docs": {"shimmer.modules.vae.VAEDecoder": {"tf": 1}, "shimmer.modules.vae.VAEDecoder.forward": {"tf": 1}}, "df": 2}}}}}}}}}}}}, "annotation": {"root": {"docs": {"shimmer.modules.global_workspace.SchedulerArgs.max_lr": {"tf": 1}, "shimmer.modules.global_workspace.SchedulerArgs.total_steps": {"tf": 1}, "shimmer.modules.global_workspace.GWPredictionsBase.states": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.domain_mods": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.workspace_dim": {"tf": 1}, "shimmer.modules.global_workspace.GWPredictions.demi_cycles": {"tf": 1}, "shimmer.modules.global_workspace.GWPredictions.cycles": {"tf": 1}, "shimmer.modules.global_workspace.GWPredictions.translations": {"tf": 1}, "shimmer.modules.global_workspace.GWPredictions.states": {"tf": 1}, "shimmer.modules.domain.LossOutput.loss": {"tf": 1}, "shimmer.modules.domain.LossOutput.metrics": {"tf": 1}, "shimmer.modules.domain.LossOutput.all": {"tf": 1}, "shimmer.modules.losses.LossCoefs.demi_cycles": {"tf": 1}, "shimmer.modules.losses.LossCoefs.cycles": {"tf": 1}, "shimmer.modules.losses.LossCoefs.translations": {"tf": 1}, "shimmer.modules.losses.LossCoefs.contrastives": {"tf": 1}, "shimmer.modules.losses.BroadcastLossCoefs.contrastives": {"tf": 1}, "shimmer.modules.losses.BroadcastLossCoefs.fused": {"tf": 1}, "shimmer.modules.losses.BroadcastLossCoefs.demi_cycles": {"tf": 1}, "shimmer.modules.losses.BroadcastLossCoefs.cycles": {"tf": 1}, "shimmer.modules.losses.BroadcastLossCoefs.translations": {"tf": 1}, "shimmer.modules.contrastive_loss.ContrastiveLoss.reduction": {"tf": 1.4142135623730951}}, "df": 22, "f": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "t": {"docs": {"shimmer.modules.global_workspace.SchedulerArgs.max_lr": {"tf": 1}, "shimmer.modules.losses.LossCoefs.demi_cycles": {"tf": 1}, "shimmer.modules.losses.LossCoefs.cycles": {"tf": 1}, "shimmer.modules.losses.LossCoefs.translations": {"tf": 1}, "shimmer.modules.losses.LossCoefs.contrastives": {"tf": 1}, "shimmer.modules.losses.BroadcastLossCoefs.contrastives": {"tf": 1}, "shimmer.modules.losses.BroadcastLossCoefs.fused": {"tf": 1}, "shimmer.modules.losses.BroadcastLossCoefs.demi_cycles": {"tf": 1}, "shimmer.modules.losses.BroadcastLossCoefs.cycles": {"tf": 1}, "shimmer.modules.losses.BroadcastLossCoefs.translations": {"tf": 1}}, "df": 10}}}}}, "i": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "t": {"docs": {"shimmer.modules.global_workspace.SchedulerArgs.total_steps": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.workspace_dim": {"tf": 1}}, "df": 2}}}, "d": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "[": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "r": {"docs": {"shimmer.modules.global_workspace.GWPredictionsBase.states": {"tf": 1}, "shimmer.modules.global_workspace.GWPredictions.demi_cycles": {"tf": 1}, "shimmer.modules.global_workspace.GWPredictions.states": {"tf": 1}, "shimmer.modules.domain.LossOutput.metrics": {"tf": 1}, "shimmer.modules.domain.LossOutput.all": {"tf": 1}}, "df": 5}}}, "t": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "p": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "[": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "r": {"docs": {"shimmer.modules.global_workspace.GWPredictions.cycles": {"tf": 1}, "shimmer.modules.global_workspace.GWPredictions.translations": {"tf": 1}}, "df": 2}}}}}}}}}}}}}, "o": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "n": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspaceBase.domain_mods": {"tf": 1}}, "df": 1, "m": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "d": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "e": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspaceBase.domain_mods": {"tf": 1}}, "df": 1}}}}}}}}}}}}, "t": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "h": {"docs": {"shimmer.modules.global_workspace.GWPredictionsBase.states": {"tf": 1}, "shimmer.modules.global_workspace.GWPredictions.demi_cycles": {"tf": 1}, "shimmer.modules.global_workspace.GWPredictions.cycles": {"tf": 1}, "shimmer.modules.global_workspace.GWPredictions.translations": {"tf": 1}, "shimmer.modules.global_workspace.GWPredictions.states": {"tf": 1}, "shimmer.modules.domain.LossOutput.loss": {"tf": 1}, "shimmer.modules.domain.LossOutput.metrics": {"tf": 1}, "shimmer.modules.domain.LossOutput.all": {"tf": 1}}, "df": 8}}}}, "e": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "r": {"docs": {"shimmer.modules.global_workspace.GWPredictionsBase.states": {"tf": 1}, "shimmer.modules.global_workspace.GWPredictions.demi_cycles": {"tf": 1}, "shimmer.modules.global_workspace.GWPredictions.cycles": {"tf": 1}, "shimmer.modules.global_workspace.GWPredictions.translations": {"tf": 1}, "shimmer.modules.global_workspace.GWPredictions.states": {"tf": 1}, "shimmer.modules.domain.LossOutput.loss": {"tf": 1}, "shimmer.modules.domain.LossOutput.metrics": {"tf": 1}, "shimmer.modules.domain.LossOutput.all": {"tf": 1}}, "df": 8}}}}}}, "c": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "s": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspaceBase.domain_mods": {"tf": 1}}, "df": 1}}}}}}}}}}}, "a": {"docs": {}, "df": 0, "b": {"docs": {}, "df": 0, "c": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspaceBase.domain_mods": {"tf": 1}}, "df": 1}}}, "m": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "p": {"docs": {}, "df": 0, "p": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "g": {"docs": {}, "df": 0, "[": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "r": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspaceBase.domain_mods": {"tf": 1}}, "df": 1}}}}}}}}}}, "o": {"docs": {}, "df": 0, "d": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "s": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspaceBase.domain_mods": {"tf": 1}}, "df": 1}}}}}}, "e": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "n": {"docs": {"shimmer.modules.contrastive_loss.ContrastiveLoss.reduction": {"tf": 1}}, "df": 1}}}}, "s": {"docs": {}, "df": 0, "h": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "r": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspaceBase.domain_mods": {"tf": 1}}, "df": 1}}}}}}, "t": {"docs": {}, "df": 0, "r": {"docs": {"shimmer.modules.global_workspace.GWPredictions.cycles": {"tf": 1}, "shimmer.modules.global_workspace.GWPredictions.translations": {"tf": 1}}, "df": 2}}, "u": {"docs": {}, "df": 0, "m": {"docs": {"shimmer.modules.contrastive_loss.ContrastiveLoss.reduction": {"tf": 1}}, "df": 1}}}, "l": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "l": {"docs": {"shimmer.modules.contrastive_loss.ContrastiveLoss.reduction": {"tf": 1}}, "df": 1}}}}}}}, "x": {"2": {"7": {"docs": {"shimmer.modules.contrastive_loss.ContrastiveLoss.reduction": {"tf": 2.449489742783178}}, "df": 1}, "docs": {}, "df": 0}, "docs": {}, "df": 0}, "n": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "e": {"docs": {"shimmer.modules.contrastive_loss.ContrastiveLoss.reduction": {"tf": 1}}, "df": 1}}}}}}, "default_value": {"root": {"docs": {"shimmer.types.ModelModeT": {"tf": 1}, "shimmer.utils.MIGRATION_DIR": {"tf": 1}, "shimmer.cli.ckpt_migration.migrate_ckpt": {"tf": 1.4142135623730951}}, "df": 3, "c": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "s": {"docs": {"shimmer.types.RawDomainGroupT": {"tf": 1}, "shimmer.types.LatentsDomainGroupT": {"tf": 1}, "shimmer.types.RawDomainGroupsT": {"tf": 1.4142135623730951}, "shimmer.types.LatentsDomainGroupsT": {"tf": 1.4142135623730951}, "shimmer.modules.contrastive_loss.ContrastiveLossType": {"tf": 1}, "shimmer.modules.contrastive_loss.ContrastiveLossBayesianType": {"tf": 1}}, "df": 6}}}}}}}}}, "m": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "d": {"docs": {"shimmer.cli.ckpt_migration.migrate_ckpt": {"tf": 1}}, "df": 1}}}}}}, "a": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "b": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "[": {"docs": {}, "df": 0, "[": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "h": {"docs": {"shimmer.modules.contrastive_loss.ContrastiveLossType": {"tf": 1}, "shimmer.modules.contrastive_loss.ContrastiveLossBayesianType": {"tf": 1}}, "df": 2}}}}}}}}}}}}}}, "k": {"docs": {}, "df": 0, "p": {"docs": {}, "df": 0, "t": {"docs": {"shimmer.cli.ckpt_migration.migrate_ckpt": {"tf": 1}}, "df": 1}}}}, "a": {"docs": {}, "df": 0, "b": {"docs": {}, "df": 0, "c": {"docs": {"shimmer.types.RawDomainGroupT": {"tf": 1}, "shimmer.types.LatentsDomainGroupT": {"tf": 1}, "shimmer.types.RawDomainGroupsT": {"tf": 1.4142135623730951}, "shimmer.types.LatentsDomainGroupsT": {"tf": 1.4142135623730951}, "shimmer.modules.contrastive_loss.ContrastiveLossType": {"tf": 1}, "shimmer.modules.contrastive_loss.ContrastiveLossBayesianType": {"tf": 1}}, "df": 6}}, "n": {"docs": {}, "df": 0, "y": {"docs": {"shimmer.types.RawDomainGroupT": {"tf": 1}, "shimmer.types.RawDomainGroupDT": {"tf": 1}, "shimmer.types.RawDomainGroupsT": {"tf": 1}, "shimmer.types.RawDomainGroupsDT": {"tf": 1}}, "df": 4}}}, "m": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "p": {"docs": {}, "df": 0, "p": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "g": {"docs": {}, "df": 0, "[": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "r": {"docs": {"shimmer.types.RawDomainGroupT": {"tf": 1}, "shimmer.types.LatentsDomainGroupT": {"tf": 1}, "shimmer.types.RawDomainGroupsT": {"tf": 1}, "shimmer.types.LatentsDomainGroupsT": {"tf": 1}}, "df": 4}}}, "f": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "z": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "[": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "r": {"docs": {"shimmer.types.RawDomainGroupsT": {"tf": 1}, "shimmer.types.LatentsDomainGroupsT": {"tf": 1}}, "df": 2}}}}}}}}}}}}}}}}}}}}, "o": {"docs": {}, "df": 0, "d": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "s": {"docs": {"shimmer.modules.contrastive_loss.ContrastiveLossType": {"tf": 1}, "shimmer.modules.contrastive_loss.ContrastiveLossBayesianType": {"tf": 1}}, "df": 2}}}}}}, "i": {"docs": {}, "df": 0, "g": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "s": {"docs": {"shimmer.utils.MIGRATION_DIR": {"tf": 1}}, "df": 1}}}}, "e": {"docs": {"shimmer.cli.ckpt_migration.migrate_ckpt": {"tf": 1}}, "df": 1}}}}}}}, "t": {"docs": {}, "df": 0, "y": {"docs": {}, "df": 0, "p": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "g": {"docs": {"shimmer.types.RawDomainGroupT": {"tf": 1}, "shimmer.types.RawDomainGroupDT": {"tf": 1}, "shimmer.types.RawDomainGroupsT": {"tf": 1}, "shimmer.types.RawDomainGroupsDT": {"tf": 1}, "shimmer.types.ModelModeT": {"tf": 1}}, "df": 5}}}}}, "o": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "h": {"docs": {"shimmer.types.LatentsDomainGroupT": {"tf": 1}, "shimmer.types.LatentsDomainGroupDT": {"tf": 1}, "shimmer.types.LatentsDomainGroupsT": {"tf": 1}, "shimmer.types.LatentsDomainGroupsDT": {"tf": 1}, "shimmer.modules.contrastive_loss.ContrastiveLossType": {"tf": 1}, "shimmer.modules.contrastive_loss.ContrastiveLossBayesianType": {"tf": 1.7320508075688772}}, "df": 6}}}}, "e": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "r": {"docs": {"shimmer.types.LatentsDomainGroupT": {"tf": 1}, "shimmer.types.LatentsDomainGroupDT": {"tf": 1}, "shimmer.types.LatentsDomainGroupsT": {"tf": 1}, "shimmer.types.LatentsDomainGroupsDT": {"tf": 1}, "shimmer.modules.contrastive_loss.ContrastiveLossType": {"tf": 1.4142135623730951}, "shimmer.modules.contrastive_loss.ContrastiveLossBayesianType": {"tf": 2}}, "df": 6}}}}, "s": {"docs": {}, "df": 0, "t": {"docs": {"shimmer.types.ModelModeT": {"tf": 1}}, "df": 1, "/": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "d": {"docs": {"shimmer.types.ModelModeT": {"tf": 1}}, "df": 1}}}}}}}, "r": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "n": {"docs": {"shimmer.types.ModelModeT": {"tf": 1}}, "df": 1}}}}}, "d": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "[": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "r": {"docs": {"shimmer.types.RawDomainGroupDT": {"tf": 1}, "shimmer.types.LatentsDomainGroupDT": {"tf": 1}, "shimmer.types.RawDomainGroupsDT": {"tf": 1}, "shimmer.types.LatentsDomainGroupsDT": {"tf": 1}}, "df": 4}}}, "f": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "z": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "[": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "r": {"docs": {"shimmer.types.RawDomainGroupsDT": {"tf": 1}, "shimmer.types.LatentsDomainGroupsDT": {"tf": 1}}, "df": 2}}}}}}}}}}}}}}}}}, "o": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "n": {"docs": {"shimmer.modules.contrastive_loss.ContrastiveLossType": {"tf": 1}, "shimmer.modules.contrastive_loss.ContrastiveLossBayesianType": {"tf": 1}}, "df": 2}}}}}}, "l": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "l": {"docs": {"shimmer.types.ModelModeT": {"tf": 1}}, "df": 1}}}}}}, "o": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "p": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "t": {"docs": {"shimmer.modules.contrastive_loss.ContrastiveLossType": {"tf": 1}, "shimmer.modules.contrastive_loss.ContrastiveLossBayesianType": {"tf": 1}}, "df": 2}}}}}}}}}, "t": {"docs": {"shimmer.cli.ckpt_migration.migrate_ckpt": {"tf": 1}}, "df": 1}}, "x": {"2": {"7": {"docs": {"shimmer.types.ModelModeT": {"tf": 3.1622776601683795}, "shimmer.utils.MIGRATION_DIR": {"tf": 1.4142135623730951}}, "df": 2}, "docs": {}, "df": 0}, "docs": {}, "df": 0}, "v": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "l": {"docs": {"shimmer.types.ModelModeT": {"tf": 1}}, "df": 1, "/": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "d": {"docs": {"shimmer.types.ModelModeT": {"tf": 1}}, "df": 1}}}}}}}, "s": {"docs": {}, "df": 0, "h": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "r": {"docs": {"shimmer.modules.contrastive_loss.ContrastiveLossType": {"tf": 1}, "shimmer.modules.contrastive_loss.ContrastiveLossBayesianType": {"tf": 1}}, "df": 2}}}}}}}, "p": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "x": {"docs": {}, "df": 0, "p": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "h": {"docs": {"shimmer.utils.MIGRATION_DIR": {"tf": 1}}, "df": 1}}}}}}}}}, "h": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "/": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "/": {"docs": {}, "df": 0, "w": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "k": {"docs": {}, "df": 0, "/": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "h": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "/": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "h": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "/": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "h": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "/": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "k": {"docs": {}, "df": 0, "p": {"docs": {}, "df": 0, "t": {"docs": {"shimmer.utils.MIGRATION_DIR": {"tf": 1}}, "df": 1}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}}, "g": {"docs": {}, "df": 0, "t": {"docs": {"shimmer.cli.ckpt_migration.migrate_ckpt": {"tf": 1}}, "df": 1}}}}, "signature": {"root": {"0": {"0": {"1": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspace2Domains.__init__": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace.__init__": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian.__init__": {"tf": 1}}, "df": 3}, "docs": {}, "df": 0}, "1": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspaceBayesian.__init__": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBayesian.__init__": {"tf": 1}}, "df": 2}, "6": {"docs": {"shimmer.modules.gw_module.compute_fusion_scores": {"tf": 1}}, "df": 1}, "docs": {"shimmer.modules.global_workspace.GlobalWorkspace2Domains.__init__": {"tf": 1.7320508075688772}, "shimmer.modules.global_workspace.GlobalWorkspace.__init__": {"tf": 2}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian.__init__": {"tf": 2}, "shimmer.modules.gw_module.compute_fusion_scores": {"tf": 1.4142135623730951}, "shimmer.modules.gw_module.GWModuleBayesian.__init__": {"tf": 1}}, "df": 5}, "1": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspaceBayesian.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.gw_module.compute_fusion_scores": {"tf": 2}, "shimmer.modules.gw_module.GWModuleBayesian.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.vae.VAE.__init__": {"tf": 1}}, "df": 4, "e": {"docs": {"shimmer.modules.gw_module.compute_fusion_scores": {"tf": 1}}, "df": 1}}, "2": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspace.__init__": {"tf": 1}, "shimmer.modules.gw_module.compute_fusion_scores": {"tf": 1.4142135623730951}}, "df": 2}, "3": {"9": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspaceBase.generic_step": {"tf": 3.1622776601683795}, "shimmer.modules.losses.GWLossesBase.step": {"tf": 3.1622776601683795}, "shimmer.modules.losses.GWLosses2Domains.step": {"tf": 3.1622776601683795}, "shimmer.modules.losses.GWLosses.step": {"tf": 3.1622776601683795}, "shimmer.modules.losses.GWLossesBayesian.step": {"tf": 3.1622776601683795}, "shimmer.modules.contrastive_loss.info_nce": {"tf": 2.8284271247461903}, "shimmer.modules.contrastive_loss.contrastive_loss": {"tf": 2.8284271247461903}, "shimmer.modules.contrastive_loss.ContrastiveLoss.__init__": {"tf": 2.8284271247461903}}, "df": 8}, "docs": {}, "df": 0}, "docs": {"shimmer.modules.global_workspace.GlobalWorkspaceBase.encode_and_fuse": {"tf": 10.04987562112089}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.encode": {"tf": 9.38083151964686}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.fuse": {"tf": 11.40175425099138}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.decode": {"tf": 10.246950765959598}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.batch_gw_states": {"tf": 8.774964387392123}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.encode_domain": {"tf": 5.656854249492381}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.encode_domains": {"tf": 9.38083151964686}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.decode_domain": {"tf": 5.656854249492381}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.decode_domains": {"tf": 9.38083151964686}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.generic_step": {"tf": 10.535653752852738}, "shimmer.modules.global_workspace.freeze_domain_modules": {"tf": 8.306623862918075}, "shimmer.modules.global_workspace.GlobalWorkspace2Domains.__init__": {"tf": 17.291616465790582}, "shimmer.modules.global_workspace.GlobalWorkspace2Domains.forward": {"tf": 8.660254037844387}, "shimmer.modules.global_workspace.GlobalWorkspace.__init__": {"tf": 17.72004514666935}, "shimmer.modules.global_workspace.GlobalWorkspace.forward": {"tf": 8.660254037844387}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian.__init__": {"tf": 18.947295321496416}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian.forward": {"tf": 8.660254037844387}, "shimmer.modules.global_workspace.pretrained_global_workspace": {"tf": 15.874507866387544}, "shimmer.modules.domain.LossOutput.__init__": {"tf": 7.0710678118654755}, "shimmer.modules.domain.DomainModule.__init__": {"tf": 3.4641016151377544}, "shimmer.modules.domain.DomainModule.encode": {"tf": 4.898979485566356}, "shimmer.modules.domain.DomainModule.decode": {"tf": 4.898979485566356}, "shimmer.modules.domain.DomainModule.compute_loss": {"tf": 7.14142842854285}, "shimmer.modules.domain.DomainModule.compute_dcy_loss": {"tf": 7.14142842854285}, "shimmer.modules.domain.DomainModule.compute_cy_loss": {"tf": 7.14142842854285}, "shimmer.modules.domain.DomainModule.compute_tr_loss": {"tf": 7.14142842854285}, "shimmer.modules.domain.DomainModule.compute_broadcast_loss": {"tf": 7.14142842854285}, "shimmer.modules.gw_module.get_n_layers": {"tf": 6.708203932499369}, "shimmer.modules.gw_module.GWDecoder.__init__": {"tf": 6}, "shimmer.modules.gw_module.GWEncoder.__init__": {"tf": 6}, "shimmer.modules.gw_module.GWEncoder.forward": {"tf": 5.291502622129181}, "shimmer.modules.gw_module.GWEncoderLinear.forward": {"tf": 5.291502622129181}, "shimmer.modules.gw_module.GWModuleBase.__init__": {"tf": 8.12403840463596}, "shimmer.modules.gw_module.GWModuleBase.fuse": {"tf": 8.888194417315589}, "shimmer.modules.gw_module.GWModuleBase.encode": {"tf": 7.615773105863909}, "shimmer.modules.gw_module.GWModuleBase.encode_and_fuse": {"tf": 8.306623862918075}, "shimmer.modules.gw_module.GWModuleBase.decode": {"tf": 8.54400374531753}, "shimmer.modules.gw_module.GWModule.__init__": {"tf": 11.74734012447073}, "shimmer.modules.gw_module.GWModule.fuse": {"tf": 8.888194417315589}, "shimmer.modules.gw_module.GWModule.encode": {"tf": 7.615773105863909}, "shimmer.modules.gw_module.GWModule.decode": {"tf": 8.54400374531753}, "shimmer.modules.gw_module.compute_fusion_scores": {"tf": 9.1104335791443}, "shimmer.modules.gw_module.GWModuleBayesian.__init__": {"tf": 13.527749258468683}, "shimmer.modules.gw_module.GWModuleBayesian.get_precision": {"tf": 6}, "shimmer.modules.gw_module.GWModuleBayesian.fuse": {"tf": 8.888194417315589}, "shimmer.modules.selection.SelectionBase.update_gw_state": {"tf": 4.898979485566356}, "shimmer.modules.selection.SelectionBase.forward": {"tf": 9.433981132056603}, "shimmer.modules.selection.SingleDomainSelection.forward": {"tf": 9.433981132056603}, "shimmer.modules.selection.FixedSharedSelection.forward": {"tf": 9.433981132056603}, "shimmer.modules.selection.KQFixedQSelection.__init__": {"tf": 6.6332495807108}, "shimmer.modules.selection.KQFixedQSelection.forward": {"tf": 9.433981132056603}, "shimmer.modules.selection.RandomSelection.__init__": {"tf": 3.4641016151377544}, "shimmer.modules.selection.RandomSelection.forward": {"tf": 9.433981132056603}, "shimmer.modules.selection.DynamicQueryAttention.__init__": {"tf": 6.6332495807108}, "shimmer.modules.selection.DynamicQueryAttention.fuse_weighted_encodings": {"tf": 8.426149773176359}, "shimmer.modules.selection.DynamicQueryAttention.forward": {"tf": 9.433981132056603}, "shimmer.modules.losses.GWLossesBase.step": {"tf": 10.908712114635714}, "shimmer.modules.losses.demi_cycle_loss": {"tf": 12.36931687685298}, "shimmer.modules.losses.cycle_loss": {"tf": 12.36931687685298}, "shimmer.modules.losses.translation_loss": {"tf": 12.36931687685298}, "shimmer.modules.losses.contrastive_loss": {"tf": 12.041594578792296}, "shimmer.modules.losses.contrastive_loss_bayesian": {"tf": 12.041594578792296}, "shimmer.modules.losses.GWLosses2Domains.__init__": {"tf": 12.24744871391589}, "shimmer.modules.losses.GWLosses2Domains.demi_cycle_loss": {"tf": 8.774964387392123}, "shimmer.modules.losses.GWLosses2Domains.cycle_loss": {"tf": 8.774964387392123}, "shimmer.modules.losses.GWLosses2Domains.translation_loss": {"tf": 8.774964387392123}, "shimmer.modules.losses.GWLosses2Domains.contrastive_loss": {"tf": 8.774964387392123}, "shimmer.modules.losses.GWLosses2Domains.step": {"tf": 10.908712114635714}, "shimmer.modules.losses.generate_partitions": {"tf": 7}, "shimmer.modules.losses.broadcast_loss": {"tf": 12.36931687685298}, "shimmer.modules.losses.GWLosses.__init__": {"tf": 12.24744871391589}, "shimmer.modules.losses.GWLosses.contrastive_loss": {"tf": 8.774964387392123}, "shimmer.modules.losses.GWLosses.broadcast_loss": {"tf": 8.774964387392123}, "shimmer.modules.losses.GWLosses.step": {"tf": 10.908712114635714}, "shimmer.modules.losses.GWLossesBayesian.__init__": {"tf": 12.84523257866513}, "shimmer.modules.losses.GWLossesBayesian.contrastive_loss": {"tf": 8.774964387392123}, "shimmer.modules.losses.GWLossesBayesian.broadcast_loss": {"tf": 8.774964387392123}, "shimmer.modules.losses.GWLossesBayesian.step": {"tf": 10.908712114635714}, "shimmer.modules.contrastive_loss.info_nce": {"tf": 9.433981132056603}, "shimmer.modules.contrastive_loss.contrastive_loss": {"tf": 9.433981132056603}, "shimmer.modules.contrastive_loss.ContrastiveLoss.__init__": {"tf": 8.366600265340756}, "shimmer.modules.contrastive_loss.ContrastiveLoss.forward": {"tf": 7.14142842854285}, "shimmer.dataset.RepeatedDataset.__init__": {"tf": 6.782329983125268}, "shimmer.modules.vae.reparameterize": {"tf": 6}, "shimmer.modules.vae.kl_divergence_loss": {"tf": 6}, "shimmer.modules.vae.gaussian_nll": {"tf": 7.14142842854285}, "shimmer.modules.vae.VAEEncoder.forward": {"tf": 6.164414002968976}, "shimmer.modules.vae.VAEDecoder.forward": {"tf": 4.898979485566356}, "shimmer.modules.vae.VAE.__init__": {"tf": 7.810249675906654}, "shimmer.modules.vae.VAE.encode": {"tf": 4.898979485566356}, "shimmer.modules.vae.VAE.decode": {"tf": 4.898979485566356}, "shimmer.modules.vae.VAE.forward": {"tf": 7.0710678118654755}, "shimmer.modules.utils.translation": {"tf": 9.695359714832659}, "shimmer.modules.utils.cycle": {"tf": 10.198039027185569}, "shimmer.modules.utils.batch_demi_cycles": {"tf": 10.677078252031311}, "shimmer.modules.utils.batch_cycles": {"tf": 12}, "shimmer.modules.utils.batch_translations": {"tf": 11.045361017187261}, "shimmer.utils.group_batch_size": {"tf": 6.164414002968976}, "shimmer.utils.groups_batch_size": {"tf": 7.615773105863909}, "shimmer.utils.groups_device": {"tf": 7.615773105863909}, "shimmer.utils.group_device": {"tf": 6.48074069840786}, "shimmer.utils.migrate_model": {"tf": 5.385164807134504}, "shimmer.utils.SaveMigrations.on_save_checkpoint": {"tf": 9.16515138991168}}, "df": 103, "s": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "f": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspaceBase.encode_and_fuse": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.encode": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.fuse": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.decode": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.batch_gw_states": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.encode_domain": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.encode_domains": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.decode_domain": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.decode_domains": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.generic_step": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace2Domains.forward": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace.forward": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian.forward": {"tf": 1}, "shimmer.modules.domain.DomainModule.encode": {"tf": 1}, "shimmer.modules.domain.DomainModule.decode": {"tf": 1}, "shimmer.modules.domain.DomainModule.compute_loss": {"tf": 1}, "shimmer.modules.domain.DomainModule.compute_dcy_loss": {"tf": 1}, "shimmer.modules.domain.DomainModule.compute_cy_loss": {"tf": 1}, "shimmer.modules.domain.DomainModule.compute_tr_loss": {"tf": 1}, "shimmer.modules.domain.DomainModule.compute_broadcast_loss": {"tf": 1}, "shimmer.modules.gw_module.GWEncoder.forward": {"tf": 1}, "shimmer.modules.gw_module.GWEncoderLinear.forward": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBase.fuse": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBase.encode": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBase.encode_and_fuse": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBase.decode": {"tf": 1}, "shimmer.modules.gw_module.GWModule.fuse": {"tf": 1}, "shimmer.modules.gw_module.GWModule.encode": {"tf": 1}, "shimmer.modules.gw_module.GWModule.decode": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBayesian.get_precision": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBayesian.fuse": {"tf": 1}, "shimmer.modules.selection.SelectionBase.update_gw_state": {"tf": 1}, "shimmer.modules.selection.SelectionBase.forward": {"tf": 1}, "shimmer.modules.selection.SingleDomainSelection.forward": {"tf": 1}, "shimmer.modules.selection.FixedSharedSelection.forward": {"tf": 1}, "shimmer.modules.selection.KQFixedQSelection.forward": {"tf": 1}, "shimmer.modules.selection.RandomSelection.forward": {"tf": 1}, "shimmer.modules.selection.DynamicQueryAttention.fuse_weighted_encodings": {"tf": 1}, "shimmer.modules.selection.DynamicQueryAttention.forward": {"tf": 1}, "shimmer.modules.losses.GWLossesBase.step": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.demi_cycle_loss": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.cycle_loss": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.translation_loss": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.contrastive_loss": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.step": {"tf": 1}, "shimmer.modules.losses.GWLosses.contrastive_loss": {"tf": 1}, "shimmer.modules.losses.GWLosses.broadcast_loss": {"tf": 1}, "shimmer.modules.losses.GWLosses.step": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.contrastive_loss": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.broadcast_loss": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.step": {"tf": 1}, "shimmer.modules.contrastive_loss.ContrastiveLoss.forward": {"tf": 1}, "shimmer.modules.vae.VAEEncoder.forward": {"tf": 1}, "shimmer.modules.vae.VAEDecoder.forward": {"tf": 1}, "shimmer.modules.vae.VAE.encode": {"tf": 1}, "shimmer.modules.vae.VAE.decode": {"tf": 1}, "shimmer.modules.vae.VAE.forward": {"tf": 1}, "shimmer.utils.SaveMigrations.on_save_checkpoint": {"tf": 1}}, "df": 58}, "e": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "n": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspaceBase.encode_and_fuse": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.fuse": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace.__init__": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian.__init__": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBase.fuse": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBase.encode_and_fuse": {"tf": 1.4142135623730951}, "shimmer.modules.gw_module.GWModule.fuse": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBayesian.__init__": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBayesian.fuse": {"tf": 1}, "shimmer.modules.losses.demi_cycle_loss": {"tf": 1.4142135623730951}, "shimmer.modules.losses.cycle_loss": {"tf": 1.4142135623730951}, "shimmer.modules.losses.translation_loss": {"tf": 1.4142135623730951}, "shimmer.modules.losses.GWLosses2Domains.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.losses.broadcast_loss": {"tf": 1.4142135623730951}, "shimmer.modules.losses.GWLosses.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.losses.GWLossesBayesian.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.utils.translation": {"tf": 1.4142135623730951}, "shimmer.modules.utils.cycle": {"tf": 1.4142135623730951}, "shimmer.modules.utils.batch_demi_cycles": {"tf": 1.4142135623730951}, "shimmer.modules.utils.batch_cycles": {"tf": 1.4142135623730951}, "shimmer.modules.utils.batch_translations": {"tf": 1.4142135623730951}}, "df": 21, "b": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "e": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspaceBase.encode_and_fuse": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBase.encode_and_fuse": {"tf": 1}, "shimmer.modules.losses.demi_cycle_loss": {"tf": 1}, "shimmer.modules.losses.cycle_loss": {"tf": 1}, "shimmer.modules.losses.translation_loss": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.__init__": {"tf": 1}, "shimmer.modules.losses.broadcast_loss": {"tf": 1}, "shimmer.modules.losses.GWLosses.__init__": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.__init__": {"tf": 1}, "shimmer.modules.utils.translation": {"tf": 1}, "shimmer.modules.utils.cycle": {"tf": 1}, "shimmer.modules.utils.batch_demi_cycles": {"tf": 1}, "shimmer.modules.utils.batch_cycles": {"tf": 1}, "shimmer.modules.utils.batch_translations": {"tf": 1}}, "df": 14}}}}}}}}}}}, "n": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "v": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "y": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspaceBayesian.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.gw_module.compute_fusion_scores": {"tf": 1.4142135623730951}, "shimmer.modules.gw_module.GWModuleBayesian.__init__": {"tf": 1.4142135623730951}}, "df": 3}}}}}}}}}}, "t": {"docs": {}, "df": 0, "r": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspaceBase.encode_and_fuse": {"tf": 1.7320508075688772}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.encode": {"tf": 2}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.fuse": {"tf": 2.23606797749979}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.decode": {"tf": 2}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.batch_gw_states": {"tf": 1.7320508075688772}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.encode_domain": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.encode_domains": {"tf": 2}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.decode_domain": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.decode_domains": {"tf": 2}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.generic_step": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.freeze_domain_modules": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.GlobalWorkspace2Domains.__init__": {"tf": 1.7320508075688772}, "shimmer.modules.global_workspace.GlobalWorkspace2Domains.forward": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.GlobalWorkspace.__init__": {"tf": 1.7320508075688772}, "shimmer.modules.global_workspace.GlobalWorkspace.forward": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian.__init__": {"tf": 1.7320508075688772}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian.forward": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.pretrained_global_workspace": {"tf": 2}, "shimmer.modules.domain.LossOutput.__init__": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBase.__init__": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBase.fuse": {"tf": 1.4142135623730951}, "shimmer.modules.gw_module.GWModuleBase.encode": {"tf": 1.4142135623730951}, "shimmer.modules.gw_module.GWModuleBase.encode_and_fuse": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBase.decode": {"tf": 1.4142135623730951}, "shimmer.modules.gw_module.GWModule.__init__": {"tf": 1.7320508075688772}, "shimmer.modules.gw_module.GWModule.fuse": {"tf": 1.4142135623730951}, "shimmer.modules.gw_module.GWModule.encode": {"tf": 1.4142135623730951}, "shimmer.modules.gw_module.GWModule.decode": {"tf": 1.4142135623730951}, "shimmer.modules.gw_module.GWModuleBayesian.__init__": {"tf": 1.7320508075688772}, "shimmer.modules.gw_module.GWModuleBayesian.get_precision": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBayesian.fuse": {"tf": 1.4142135623730951}, "shimmer.modules.selection.SelectionBase.forward": {"tf": 1.7320508075688772}, "shimmer.modules.selection.SingleDomainSelection.forward": {"tf": 1.7320508075688772}, "shimmer.modules.selection.FixedSharedSelection.forward": {"tf": 1.7320508075688772}, "shimmer.modules.selection.KQFixedQSelection.__init__": {"tf": 1}, "shimmer.modules.selection.KQFixedQSelection.forward": {"tf": 1.7320508075688772}, "shimmer.modules.selection.RandomSelection.forward": {"tf": 1.7320508075688772}, "shimmer.modules.selection.DynamicQueryAttention.__init__": {"tf": 1}, "shimmer.modules.selection.DynamicQueryAttention.fuse_weighted_encodings": {"tf": 1.4142135623730951}, "shimmer.modules.selection.DynamicQueryAttention.forward": {"tf": 1.7320508075688772}, "shimmer.modules.losses.GWLossesBase.step": {"tf": 1.4142135623730951}, "shimmer.modules.losses.demi_cycle_loss": {"tf": 2}, "shimmer.modules.losses.cycle_loss": {"tf": 2}, "shimmer.modules.losses.translation_loss": {"tf": 2}, "shimmer.modules.losses.contrastive_loss": {"tf": 1.7320508075688772}, "shimmer.modules.losses.contrastive_loss_bayesian": {"tf": 1.7320508075688772}, "shimmer.modules.losses.GWLosses2Domains.__init__": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.demi_cycle_loss": {"tf": 1.7320508075688772}, "shimmer.modules.losses.GWLosses2Domains.cycle_loss": {"tf": 1.7320508075688772}, "shimmer.modules.losses.GWLosses2Domains.translation_loss": {"tf": 1.7320508075688772}, "shimmer.modules.losses.GWLosses2Domains.contrastive_loss": {"tf": 1.7320508075688772}, "shimmer.modules.losses.GWLosses2Domains.step": {"tf": 1.4142135623730951}, "shimmer.modules.losses.broadcast_loss": {"tf": 2}, "shimmer.modules.losses.GWLosses.__init__": {"tf": 1}, "shimmer.modules.losses.GWLosses.contrastive_loss": {"tf": 1.7320508075688772}, "shimmer.modules.losses.GWLosses.broadcast_loss": {"tf": 1.7320508075688772}, "shimmer.modules.losses.GWLosses.step": {"tf": 1.4142135623730951}, "shimmer.modules.losses.GWLossesBayesian.__init__": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.contrastive_loss": {"tf": 1.7320508075688772}, "shimmer.modules.losses.GWLossesBayesian.broadcast_loss": {"tf": 1.7320508075688772}, "shimmer.modules.losses.GWLossesBayesian.step": {"tf": 1.4142135623730951}, "shimmer.modules.utils.translation": {"tf": 1.4142135623730951}, "shimmer.modules.utils.cycle": {"tf": 1.7320508075688772}, "shimmer.modules.utils.batch_demi_cycles": {"tf": 1.7320508075688772}, "shimmer.modules.utils.batch_cycles": {"tf": 2.23606797749979}, "shimmer.modules.utils.batch_translations": {"tf": 2}, "shimmer.utils.group_batch_size": {"tf": 1}, "shimmer.utils.groups_batch_size": {"tf": 1.4142135623730951}, "shimmer.utils.groups_device": {"tf": 1.4142135623730951}, "shimmer.utils.group_device": {"tf": 1}, "shimmer.utils.migrate_model": {"tf": 1}, "shimmer.utils.SaveMigrations.on_save_checkpoint": {"tf": 1}}, "df": 72}, "a": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "e": {"docs": {"shimmer.modules.selection.SelectionBase.update_gw_state": {"tf": 1}}, "df": 1}}}}, "h": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "r": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspaceBase.encode_and_fuse": {"tf": 1}, "shimmer.modules.global_workspace.freeze_domain_modules": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.GlobalWorkspace2Domains.__init__": {"tf": 2}, "shimmer.modules.global_workspace.GlobalWorkspace2Domains.forward": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace.__init__": {"tf": 2}, "shimmer.modules.global_workspace.GlobalWorkspace.forward": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian.__init__": {"tf": 2}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian.forward": {"tf": 1}, "shimmer.modules.global_workspace.pretrained_global_workspace": {"tf": 2}, "shimmer.modules.domain.DomainModule.compute_loss": {"tf": 1}, "shimmer.modules.domain.DomainModule.compute_dcy_loss": {"tf": 1}, "shimmer.modules.domain.DomainModule.compute_cy_loss": {"tf": 1}, "shimmer.modules.domain.DomainModule.compute_tr_loss": {"tf": 1}, "shimmer.modules.domain.DomainModule.compute_broadcast_loss": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBase.__init__": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBase.encode_and_fuse": {"tf": 1}, "shimmer.modules.gw_module.GWModule.__init__": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBayesian.__init__": {"tf": 1}, "shimmer.modules.losses.GWLossesBase.step": {"tf": 1}, "shimmer.modules.losses.demi_cycle_loss": {"tf": 1.7320508075688772}, "shimmer.modules.losses.cycle_loss": {"tf": 1.7320508075688772}, "shimmer.modules.losses.translation_loss": {"tf": 1.7320508075688772}, "shimmer.modules.losses.contrastive_loss": {"tf": 1.4142135623730951}, "shimmer.modules.losses.contrastive_loss_bayesian": {"tf": 1.4142135623730951}, "shimmer.modules.losses.GWLosses2Domains.__init__": {"tf": 2.23606797749979}, "shimmer.modules.losses.GWLosses2Domains.step": {"tf": 1}, "shimmer.modules.losses.broadcast_loss": {"tf": 1.7320508075688772}, "shimmer.modules.losses.GWLosses.__init__": {"tf": 2.23606797749979}, "shimmer.modules.losses.GWLosses.step": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.__init__": {"tf": 2.23606797749979}, "shimmer.modules.losses.GWLossesBayesian.step": {"tf": 1}, "shimmer.modules.contrastive_loss.ContrastiveLoss.forward": {"tf": 1}, "shimmer.dataset.RepeatedDataset.__init__": {"tf": 1}, "shimmer.modules.vae.VAE.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.utils.translation": {"tf": 1.4142135623730951}, "shimmer.modules.utils.cycle": {"tf": 1.4142135623730951}, "shimmer.modules.utils.batch_demi_cycles": {"tf": 1.4142135623730951}, "shimmer.modules.utils.batch_cycles": {"tf": 1.4142135623730951}, "shimmer.modules.utils.batch_translations": {"tf": 1.4142135623730951}}, "df": 39}}}}}}, "c": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "e": {"docs": {"shimmer.modules.gw_module.compute_fusion_scores": {"tf": 1.4142135623730951}}, "df": 1, "s": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspaceBase.fuse": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBase.fuse": {"tf": 1}, "shimmer.modules.gw_module.GWModule.fuse": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBayesian.fuse": {"tf": 1}}, "df": 4}}}}, "h": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "d": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "r": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspace2Domains.__init__": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace.__init__": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian.__init__": {"tf": 1}}, "df": 3, "a": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "g": {"docs": {}, "df": 0, "s": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspace2Domains.__init__": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace.__init__": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian.__init__": {"tf": 1}}, "df": 3}}}}}}}}}}}, "a": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "e": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspace2Domains.__init__": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace.__init__": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian.__init__": {"tf": 1}, "shimmer.modules.contrastive_loss.info_nce": {"tf": 1}, "shimmer.modules.contrastive_loss.contrastive_loss": {"tf": 1}, "shimmer.modules.contrastive_loss.ContrastiveLoss.__init__": {"tf": 1.4142135623730951}}, "df": 6}}}}, "o": {"docs": {}, "df": 0, "f": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "x": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspaceBayesian.__init__": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBayesian.__init__": {"tf": 1}}, "df": 2}}}}}}, "i": {"docs": {}, "df": 0, "z": {"docs": {}, "df": 0, "e": {"docs": {"shimmer.modules.selection.KQFixedQSelection.__init__": {"tf": 1}, "shimmer.modules.selection.DynamicQueryAttention.__init__": {"tf": 1}, "shimmer.dataset.RepeatedDataset.__init__": {"tf": 1}}, "df": 3, "d": {"docs": {}, "df": 0, "d": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "t": {"docs": {"shimmer.dataset.RepeatedDataset.__init__": {"tf": 1}}, "df": 1}}}}}}}}}}, "g": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "a": {"docs": {"shimmer.modules.vae.gaussian_nll": {"tf": 1}}, "df": 1}}}}, "u": {"docs": {}, "df": 0, "m": {"docs": {"shimmer.modules.contrastive_loss.info_nce": {"tf": 1}, "shimmer.modules.contrastive_loss.contrastive_loss": {"tf": 1}, "shimmer.modules.contrastive_loss.ContrastiveLoss.__init__": {"tf": 1}}, "df": 3}}}, "x": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspaceBase.encode_and_fuse": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.encode": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.fuse": {"tf": 1}, "shimmer.modules.domain.DomainModule.encode": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBase.fuse": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBase.encode": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBase.encode_and_fuse": {"tf": 1}, "shimmer.modules.gw_module.GWModule.fuse": {"tf": 1}, "shimmer.modules.gw_module.GWModule.encode": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBayesian.get_precision": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBayesian.fuse": {"tf": 1}, "shimmer.modules.contrastive_loss.info_nce": {"tf": 1}, "shimmer.modules.contrastive_loss.contrastive_loss": {"tf": 1}, "shimmer.modules.contrastive_loss.ContrastiveLoss.forward": {"tf": 1}, "shimmer.modules.vae.gaussian_nll": {"tf": 1}, "shimmer.modules.vae.VAEEncoder.forward": {"tf": 1}, "shimmer.modules.vae.VAEDecoder.forward": {"tf": 1}, "shimmer.modules.vae.VAE.encode": {"tf": 1}, "shimmer.modules.vae.VAE.forward": {"tf": 1}, "shimmer.modules.utils.translation": {"tf": 1}, "shimmer.modules.utils.cycle": {"tf": 1}, "shimmer.utils.group_batch_size": {"tf": 1}, "shimmer.utils.group_device": {"tf": 1}}, "df": 23}, "c": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "s": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspaceBase.encode_and_fuse": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.encode": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.fuse": {"tf": 2}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.decode": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.batch_gw_states": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.encode_domains": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.decode_domains": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.generic_step": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.freeze_domain_modules": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace2Domains.__init__": {"tf": 2}, "shimmer.modules.global_workspace.GlobalWorkspace2Domains.forward": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.GlobalWorkspace.__init__": {"tf": 2}, "shimmer.modules.global_workspace.GlobalWorkspace.forward": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian.__init__": {"tf": 2}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian.forward": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.pretrained_global_workspace": {"tf": 2}, "shimmer.modules.gw_module.GWModuleBase.__init__": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBase.fuse": {"tf": 1.4142135623730951}, "shimmer.modules.gw_module.GWModuleBase.encode": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBase.encode_and_fuse": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBase.decode": {"tf": 1}, "shimmer.modules.gw_module.GWModule.__init__": {"tf": 1.7320508075688772}, "shimmer.modules.gw_module.GWModule.fuse": {"tf": 1.4142135623730951}, "shimmer.modules.gw_module.GWModule.encode": {"tf": 1}, "shimmer.modules.gw_module.GWModule.decode": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBayesian.__init__": {"tf": 1.7320508075688772}, "shimmer.modules.gw_module.GWModuleBayesian.fuse": {"tf": 1.4142135623730951}, "shimmer.modules.selection.SelectionBase.forward": {"tf": 1.4142135623730951}, "shimmer.modules.selection.SingleDomainSelection.forward": {"tf": 1.4142135623730951}, "shimmer.modules.selection.FixedSharedSelection.forward": {"tf": 1.4142135623730951}, "shimmer.modules.selection.KQFixedQSelection.__init__": {"tf": 1}, "shimmer.modules.selection.KQFixedQSelection.forward": {"tf": 1.4142135623730951}, "shimmer.modules.selection.RandomSelection.forward": {"tf": 1.4142135623730951}, "shimmer.modules.selection.DynamicQueryAttention.__init__": {"tf": 1}, "shimmer.modules.selection.DynamicQueryAttention.fuse_weighted_encodings": {"tf": 1}, "shimmer.modules.selection.DynamicQueryAttention.forward": {"tf": 1.4142135623730951}, "shimmer.modules.losses.GWLossesBase.step": {"tf": 1.4142135623730951}, "shimmer.modules.losses.demi_cycle_loss": {"tf": 1.7320508075688772}, "shimmer.modules.losses.cycle_loss": {"tf": 1.7320508075688772}, "shimmer.modules.losses.translation_loss": {"tf": 1.7320508075688772}, "shimmer.modules.losses.contrastive_loss": {"tf": 1.7320508075688772}, "shimmer.modules.losses.contrastive_loss_bayesian": {"tf": 1.7320508075688772}, "shimmer.modules.losses.GWLosses2Domains.__init__": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.demi_cycle_loss": {"tf": 1.4142135623730951}, "shimmer.modules.losses.GWLosses2Domains.cycle_loss": {"tf": 1.4142135623730951}, "shimmer.modules.losses.GWLosses2Domains.translation_loss": {"tf": 1.4142135623730951}, "shimmer.modules.losses.GWLosses2Domains.contrastive_loss": {"tf": 1.4142135623730951}, "shimmer.modules.losses.GWLosses2Domains.step": {"tf": 1.4142135623730951}, "shimmer.modules.losses.generate_partitions": {"tf": 1}, "shimmer.modules.losses.broadcast_loss": {"tf": 1.7320508075688772}, "shimmer.modules.losses.GWLosses.__init__": {"tf": 1}, "shimmer.modules.losses.GWLosses.contrastive_loss": {"tf": 1.4142135623730951}, "shimmer.modules.losses.GWLosses.broadcast_loss": {"tf": 1.4142135623730951}, "shimmer.modules.losses.GWLosses.step": {"tf": 1.4142135623730951}, "shimmer.modules.losses.GWLossesBayesian.__init__": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.contrastive_loss": {"tf": 1.4142135623730951}, "shimmer.modules.losses.GWLossesBayesian.broadcast_loss": {"tf": 1.4142135623730951}, "shimmer.modules.losses.GWLossesBayesian.step": {"tf": 1.4142135623730951}, "shimmer.modules.utils.translation": {"tf": 1}, "shimmer.modules.utils.cycle": {"tf": 1}, "shimmer.modules.utils.batch_demi_cycles": {"tf": 1.4142135623730951}, "shimmer.modules.utils.batch_cycles": {"tf": 1.7320508075688772}, "shimmer.modules.utils.batch_translations": {"tf": 1.4142135623730951}, "shimmer.utils.group_batch_size": {"tf": 1}, "shimmer.utils.groups_batch_size": {"tf": 1.4142135623730951}, "shimmer.utils.groups_device": {"tf": 1.4142135623730951}, "shimmer.utils.group_device": {"tf": 1}}, "df": 67}}}}}}}}}, "e": {"docs": {}, "df": 0, "f": {"docs": {}, "df": 0, "s": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspace2Domains.__init__": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace.__init__": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian.__init__": {"tf": 1}, "shimmer.modules.global_workspace.pretrained_global_workspace": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.__init__": {"tf": 1}, "shimmer.modules.losses.GWLosses.__init__": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.__init__": {"tf": 1}}, "df": 7}}}, "n": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "v": {"docs": {}, "df": 0, "e": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspace2Domains.__init__": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace.__init__": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian.__init__": {"tf": 1}, "shimmer.modules.global_workspace.pretrained_global_workspace": {"tf": 1}, "shimmer.modules.losses.contrastive_loss": {"tf": 1}, "shimmer.modules.losses.contrastive_loss_bayesian": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.__init__": {"tf": 1}, "shimmer.modules.losses.GWLosses.__init__": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.__init__": {"tf": 1}}, "df": 9}}}}}}}}, "s": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "v": {"docs": {}, "df": 0, "e": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspaceBayesian.__init__": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.__init__": {"tf": 1}}, "df": 2}}}}}}}}}}, "r": {"docs": {}, "df": 0, "e": {"docs": {"shimmer.utils.SaveMigrations.on_save_checkpoint": {"tf": 1}}, "df": 1}}}, "a": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "b": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "e": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspace2Domains.__init__": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace.__init__": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian.__init__": {"tf": 1}, "shimmer.modules.global_workspace.pretrained_global_workspace": {"tf": 1}, "shimmer.modules.losses.contrastive_loss": {"tf": 1}, "shimmer.modules.losses.contrastive_loss_bayesian": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.__init__": {"tf": 1}, "shimmer.modules.losses.GWLosses.__init__": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.__init__": {"tf": 1}}, "df": 9}}}}}}}, "h": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "k": {"docs": {}, "df": 0, "p": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "t": {"docs": {"shimmer.modules.global_workspace.pretrained_global_workspace": {"tf": 1}, "shimmer.utils.SaveMigrations.on_save_checkpoint": {"tf": 1}}, "df": 2}}}}}}}}}, "k": {"docs": {}, "df": 0, "p": {"docs": {}, "df": 0, "t": {"docs": {"shimmer.utils.migrate_model": {"tf": 1}}, "df": 1}}}}, "a": {"docs": {}, "df": 0, "b": {"docs": {}, "df": 0, "c": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspaceBase.encode_and_fuse": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.encode": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.fuse": {"tf": 2}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.decode": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.batch_gw_states": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.encode_domains": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.decode_domains": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.generic_step": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.freeze_domain_modules": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace2Domains.__init__": {"tf": 2}, "shimmer.modules.global_workspace.GlobalWorkspace2Domains.forward": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.GlobalWorkspace.__init__": {"tf": 2}, "shimmer.modules.global_workspace.GlobalWorkspace.forward": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian.__init__": {"tf": 2}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian.forward": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.pretrained_global_workspace": {"tf": 2}, "shimmer.modules.gw_module.GWModuleBase.__init__": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBase.fuse": {"tf": 1.4142135623730951}, "shimmer.modules.gw_module.GWModuleBase.encode": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBase.encode_and_fuse": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBase.decode": {"tf": 1}, "shimmer.modules.gw_module.GWModule.__init__": {"tf": 1.7320508075688772}, "shimmer.modules.gw_module.GWModule.fuse": {"tf": 1.4142135623730951}, "shimmer.modules.gw_module.GWModule.encode": {"tf": 1}, "shimmer.modules.gw_module.GWModule.decode": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBayesian.__init__": {"tf": 1.7320508075688772}, "shimmer.modules.gw_module.GWModuleBayesian.fuse": {"tf": 1.4142135623730951}, "shimmer.modules.selection.SelectionBase.forward": {"tf": 1.4142135623730951}, "shimmer.modules.selection.SingleDomainSelection.forward": {"tf": 1.4142135623730951}, "shimmer.modules.selection.FixedSharedSelection.forward": {"tf": 1.4142135623730951}, "shimmer.modules.selection.KQFixedQSelection.__init__": {"tf": 1}, "shimmer.modules.selection.KQFixedQSelection.forward": {"tf": 1.4142135623730951}, "shimmer.modules.selection.RandomSelection.forward": {"tf": 1.4142135623730951}, "shimmer.modules.selection.DynamicQueryAttention.__init__": {"tf": 1}, "shimmer.modules.selection.DynamicQueryAttention.fuse_weighted_encodings": {"tf": 1}, "shimmer.modules.selection.DynamicQueryAttention.forward": {"tf": 1.4142135623730951}, "shimmer.modules.losses.GWLossesBase.step": {"tf": 1.4142135623730951}, "shimmer.modules.losses.demi_cycle_loss": {"tf": 1.7320508075688772}, "shimmer.modules.losses.cycle_loss": {"tf": 1.7320508075688772}, "shimmer.modules.losses.translation_loss": {"tf": 1.7320508075688772}, "shimmer.modules.losses.contrastive_loss": {"tf": 1.7320508075688772}, "shimmer.modules.losses.contrastive_loss_bayesian": {"tf": 1.7320508075688772}, "shimmer.modules.losses.GWLosses2Domains.__init__": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.demi_cycle_loss": {"tf": 1.4142135623730951}, "shimmer.modules.losses.GWLosses2Domains.cycle_loss": {"tf": 1.4142135623730951}, "shimmer.modules.losses.GWLosses2Domains.translation_loss": {"tf": 1.4142135623730951}, "shimmer.modules.losses.GWLosses2Domains.contrastive_loss": {"tf": 1.4142135623730951}, "shimmer.modules.losses.GWLosses2Domains.step": {"tf": 1.4142135623730951}, "shimmer.modules.losses.generate_partitions": {"tf": 1}, "shimmer.modules.losses.broadcast_loss": {"tf": 1.7320508075688772}, "shimmer.modules.losses.GWLosses.__init__": {"tf": 1}, "shimmer.modules.losses.GWLosses.contrastive_loss": {"tf": 1.4142135623730951}, "shimmer.modules.losses.GWLosses.broadcast_loss": {"tf": 1.4142135623730951}, "shimmer.modules.losses.GWLosses.step": {"tf": 1.4142135623730951}, "shimmer.modules.losses.GWLossesBayesian.__init__": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.contrastive_loss": {"tf": 1.4142135623730951}, "shimmer.modules.losses.GWLossesBayesian.broadcast_loss": {"tf": 1.4142135623730951}, "shimmer.modules.losses.GWLossesBayesian.step": {"tf": 1.4142135623730951}, "shimmer.modules.utils.translation": {"tf": 1}, "shimmer.modules.utils.cycle": {"tf": 1}, "shimmer.modules.utils.batch_demi_cycles": {"tf": 1.4142135623730951}, "shimmer.modules.utils.batch_cycles": {"tf": 1.7320508075688772}, "shimmer.modules.utils.batch_translations": {"tf": 1.4142135623730951}, "shimmer.utils.group_batch_size": {"tf": 1}, "shimmer.utils.groups_batch_size": {"tf": 1.4142135623730951}, "shimmer.utils.groups_device": {"tf": 1.4142135623730951}, "shimmer.utils.group_device": {"tf": 1}}, "df": 67}}, "n": {"docs": {}, "df": 0, "y": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspaceBase.encode_domain": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.encode_domains": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.decode_domain": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.decode_domains": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.generic_step": {"tf": 1}, "shimmer.modules.domain.DomainModule.encode": {"tf": 1}, "shimmer.modules.domain.DomainModule.decode": {"tf": 1}, "shimmer.modules.vae.VAEEncoder.forward": {"tf": 1}, "shimmer.modules.vae.VAEDecoder.forward": {"tf": 1}, "shimmer.modules.vae.VAE.encode": {"tf": 1}, "shimmer.modules.vae.VAE.decode": {"tf": 1}, "shimmer.modules.vae.VAE.forward": {"tf": 1.4142135623730951}, "shimmer.utils.SaveMigrations.on_save_checkpoint": {"tf": 1}}, "df": 13}}, "r": {"docs": {}, "df": 0, "g": {"docs": {}, "df": 0, "s": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspace2Domains.__init__": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace.__init__": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian.__init__": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBase.__init__": {"tf": 1}}, "df": 4}}}, "t": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "n": {"docs": {"shimmer.modules.selection.DynamicQueryAttention.fuse_weighted_encodings": {"tf": 1}}, "df": 1}}}}}}}}}, "m": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "p": {"docs": {}, "df": 0, "p": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "g": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspaceBase.encode_and_fuse": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.encode": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.fuse": {"tf": 2}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.decode": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.batch_gw_states": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.encode_domains": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.decode_domains": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.generic_step": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.freeze_domain_modules": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace2Domains.__init__": {"tf": 1.7320508075688772}, "shimmer.modules.global_workspace.GlobalWorkspace2Domains.forward": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.GlobalWorkspace.__init__": {"tf": 1.7320508075688772}, "shimmer.modules.global_workspace.GlobalWorkspace.forward": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian.__init__": {"tf": 1.7320508075688772}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian.forward": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.pretrained_global_workspace": {"tf": 1.7320508075688772}, "shimmer.modules.gw_module.GWModuleBase.__init__": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBase.fuse": {"tf": 1.4142135623730951}, "shimmer.modules.gw_module.GWModuleBase.encode": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBase.encode_and_fuse": {"tf": 1}, "shimmer.modules.gw_module.GWModule.__init__": {"tf": 1.7320508075688772}, "shimmer.modules.gw_module.GWModule.fuse": {"tf": 1.4142135623730951}, "shimmer.modules.gw_module.GWModule.encode": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBayesian.__init__": {"tf": 1.7320508075688772}, "shimmer.modules.gw_module.GWModuleBayesian.fuse": {"tf": 1.4142135623730951}, "shimmer.modules.selection.SelectionBase.forward": {"tf": 1.4142135623730951}, "shimmer.modules.selection.SingleDomainSelection.forward": {"tf": 1.4142135623730951}, "shimmer.modules.selection.FixedSharedSelection.forward": {"tf": 1.4142135623730951}, "shimmer.modules.selection.KQFixedQSelection.forward": {"tf": 1.4142135623730951}, "shimmer.modules.selection.RandomSelection.forward": {"tf": 1.4142135623730951}, "shimmer.modules.selection.DynamicQueryAttention.fuse_weighted_encodings": {"tf": 1}, "shimmer.modules.selection.DynamicQueryAttention.forward": {"tf": 1.4142135623730951}, "shimmer.modules.losses.GWLossesBase.step": {"tf": 1.4142135623730951}, "shimmer.modules.losses.demi_cycle_loss": {"tf": 1.7320508075688772}, "shimmer.modules.losses.cycle_loss": {"tf": 1.7320508075688772}, "shimmer.modules.losses.translation_loss": {"tf": 1.7320508075688772}, "shimmer.modules.losses.contrastive_loss": {"tf": 1.4142135623730951}, "shimmer.modules.losses.contrastive_loss_bayesian": {"tf": 1.4142135623730951}, "shimmer.modules.losses.GWLosses2Domains.demi_cycle_loss": {"tf": 1.4142135623730951}, "shimmer.modules.losses.GWLosses2Domains.cycle_loss": {"tf": 1.4142135623730951}, "shimmer.modules.losses.GWLosses2Domains.translation_loss": {"tf": 1.4142135623730951}, "shimmer.modules.losses.GWLosses2Domains.contrastive_loss": {"tf": 1.4142135623730951}, "shimmer.modules.losses.GWLosses2Domains.step": {"tf": 1.4142135623730951}, "shimmer.modules.losses.broadcast_loss": {"tf": 1.7320508075688772}, "shimmer.modules.losses.GWLosses.contrastive_loss": {"tf": 1.4142135623730951}, "shimmer.modules.losses.GWLosses.broadcast_loss": {"tf": 1.4142135623730951}, "shimmer.modules.losses.GWLosses.step": {"tf": 1.4142135623730951}, "shimmer.modules.losses.GWLossesBayesian.contrastive_loss": {"tf": 1.4142135623730951}, "shimmer.modules.losses.GWLossesBayesian.broadcast_loss": {"tf": 1.4142135623730951}, "shimmer.modules.losses.GWLossesBayesian.step": {"tf": 1.4142135623730951}, "shimmer.modules.utils.translation": {"tf": 1}, "shimmer.modules.utils.cycle": {"tf": 1}, "shimmer.modules.utils.batch_demi_cycles": {"tf": 1.4142135623730951}, "shimmer.modules.utils.batch_cycles": {"tf": 1.4142135623730951}, "shimmer.modules.utils.batch_translations": {"tf": 1.4142135623730951}, "shimmer.utils.group_batch_size": {"tf": 1}, "shimmer.utils.groups_batch_size": {"tf": 1.4142135623730951}, "shimmer.utils.groups_device": {"tf": 1.4142135623730951}, "shimmer.utils.group_device": {"tf": 1}}, "df": 59}}}}}}, "o": {"docs": {}, "df": 0, "d": {"docs": {"shimmer.modules.losses.demi_cycle_loss": {"tf": 1.4142135623730951}, "shimmer.modules.losses.cycle_loss": {"tf": 1.4142135623730951}, "shimmer.modules.losses.translation_loss": {"tf": 1.4142135623730951}, "shimmer.modules.losses.contrastive_loss": {"tf": 1}, "shimmer.modules.losses.contrastive_loss_bayesian": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.losses.broadcast_loss": {"tf": 1.4142135623730951}, "shimmer.modules.losses.GWLosses.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.losses.GWLossesBayesian.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.utils.translation": {"tf": 1}, "shimmer.modules.utils.cycle": {"tf": 1}, "shimmer.modules.utils.batch_demi_cycles": {"tf": 1.4142135623730951}, "shimmer.modules.utils.batch_cycles": {"tf": 1.4142135623730951}, "shimmer.modules.utils.batch_translations": {"tf": 1.4142135623730951}}, "df": 14, "u": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "e": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspaceBase.encode_and_fuse": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace2Domains.__init__": {"tf": 2}, "shimmer.modules.global_workspace.GlobalWorkspace.__init__": {"tf": 2}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian.__init__": {"tf": 2}, "shimmer.modules.global_workspace.pretrained_global_workspace": {"tf": 2}, "shimmer.modules.gw_module.get_n_layers": {"tf": 1.4142135623730951}, "shimmer.modules.gw_module.GWModuleBase.encode_and_fuse": {"tf": 1}, "shimmer.modules.gw_module.GWModule.__init__": {"tf": 2}, "shimmer.modules.gw_module.GWModuleBayesian.__init__": {"tf": 2}, "shimmer.modules.losses.demi_cycle_loss": {"tf": 1}, "shimmer.modules.losses.cycle_loss": {"tf": 1}, "shimmer.modules.losses.translation_loss": {"tf": 1}, "shimmer.modules.losses.contrastive_loss": {"tf": 1}, "shimmer.modules.losses.contrastive_loss_bayesian": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.__init__": {"tf": 1}, "shimmer.modules.losses.broadcast_loss": {"tf": 1}, "shimmer.modules.losses.GWLosses.__init__": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.__init__": {"tf": 1}, "shimmer.modules.utils.translation": {"tf": 1.4142135623730951}, "shimmer.modules.utils.cycle": {"tf": 1.4142135623730951}, "shimmer.modules.utils.batch_demi_cycles": {"tf": 1}, "shimmer.modules.utils.batch_cycles": {"tf": 1}, "shimmer.modules.utils.batch_translations": {"tf": 1}, "shimmer.utils.SaveMigrations.on_save_checkpoint": {"tf": 1.4142135623730951}}, "df": 24, "s": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspaceBase.encode_and_fuse": {"tf": 1}, "shimmer.modules.global_workspace.freeze_domain_modules": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.GlobalWorkspace2Domains.__init__": {"tf": 2.449489742783178}, "shimmer.modules.global_workspace.GlobalWorkspace2Domains.forward": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace.__init__": {"tf": 2.449489742783178}, "shimmer.modules.global_workspace.GlobalWorkspace.forward": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian.__init__": {"tf": 2.449489742783178}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian.forward": {"tf": 1}, "shimmer.modules.global_workspace.pretrained_global_workspace": {"tf": 2.449489742783178}, "shimmer.modules.domain.DomainModule.compute_loss": {"tf": 1}, "shimmer.modules.domain.DomainModule.compute_dcy_loss": {"tf": 1}, "shimmer.modules.domain.DomainModule.compute_cy_loss": {"tf": 1}, "shimmer.modules.domain.DomainModule.compute_tr_loss": {"tf": 1}, "shimmer.modules.domain.DomainModule.compute_broadcast_loss": {"tf": 1}, "shimmer.modules.gw_module.get_n_layers": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBase.__init__": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBase.encode_and_fuse": {"tf": 1}, "shimmer.modules.gw_module.GWModule.__init__": {"tf": 2}, "shimmer.modules.gw_module.GWModuleBayesian.__init__": {"tf": 2}, "shimmer.modules.losses.GWLossesBase.step": {"tf": 1}, "shimmer.modules.losses.demi_cycle_loss": {"tf": 1.7320508075688772}, "shimmer.modules.losses.cycle_loss": {"tf": 1.7320508075688772}, "shimmer.modules.losses.translation_loss": {"tf": 1.7320508075688772}, "shimmer.modules.losses.contrastive_loss": {"tf": 1.4142135623730951}, "shimmer.modules.losses.contrastive_loss_bayesian": {"tf": 1.4142135623730951}, "shimmer.modules.losses.GWLosses2Domains.__init__": {"tf": 2.23606797749979}, "shimmer.modules.losses.GWLosses2Domains.step": {"tf": 1}, "shimmer.modules.losses.broadcast_loss": {"tf": 1.7320508075688772}, "shimmer.modules.losses.GWLosses.__init__": {"tf": 2.23606797749979}, "shimmer.modules.losses.GWLosses.step": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.__init__": {"tf": 2.23606797749979}, "shimmer.modules.losses.GWLossesBayesian.step": {"tf": 1}, "shimmer.modules.contrastive_loss.ContrastiveLoss.forward": {"tf": 1}, "shimmer.modules.vae.VAE.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.utils.translation": {"tf": 1.4142135623730951}, "shimmer.modules.utils.cycle": {"tf": 1.4142135623730951}, "shimmer.modules.utils.batch_demi_cycles": {"tf": 1.4142135623730951}, "shimmer.modules.utils.batch_cycles": {"tf": 1.4142135623730951}, "shimmer.modules.utils.batch_translations": {"tf": 1.4142135623730951}}, "df": 39}}}}, "e": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspaceBase.generic_step": {"tf": 1}, "shimmer.modules.losses.GWLossesBase.step": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.step": {"tf": 1}, "shimmer.modules.losses.GWLosses.step": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.step": {"tf": 1}}, "df": 5}, "s": {"docs": {"shimmer.modules.global_workspace.freeze_domain_modules": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace2Domains.__init__": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace.__init__": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian.__init__": {"tf": 1}, "shimmer.modules.global_workspace.pretrained_global_workspace": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBase.__init__": {"tf": 1}, "shimmer.modules.losses.demi_cycle_loss": {"tf": 1}, "shimmer.modules.losses.cycle_loss": {"tf": 1}, "shimmer.modules.losses.translation_loss": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.__init__": {"tf": 1}, "shimmer.modules.losses.broadcast_loss": {"tf": 1}, "shimmer.modules.losses.GWLosses.__init__": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.__init__": {"tf": 1}}, "df": 13}}}, "e": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "s": {"docs": {"shimmer.modules.domain.LossOutput.__init__": {"tf": 1}}, "df": 1}}}}}, "a": {"docs": {}, "df": 0, "n": {"docs": {"shimmer.modules.contrastive_loss.info_nce": {"tf": 1.4142135623730951}, "shimmer.modules.contrastive_loss.contrastive_loss": {"tf": 1.4142135623730951}, "shimmer.modules.contrastive_loss.ContrastiveLoss.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.vae.reparameterize": {"tf": 1}, "shimmer.modules.vae.kl_divergence_loss": {"tf": 1}}, "df": 5}}}, "i": {"docs": {}, "df": 0, "n": {"docs": {"shimmer.dataset.RepeatedDataset.__init__": {"tf": 1}}, "df": 1}}, "u": {"docs": {"shimmer.modules.vae.gaussian_nll": {"tf": 1}}, "df": 1}}, "f": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "z": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "t": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspaceBase.encode_and_fuse": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.encode": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.fuse": {"tf": 1.7320508075688772}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.decode": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.batch_gw_states": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.encode_domains": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.decode_domains": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.generic_step": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace2Domains.forward": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace.forward": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian.forward": {"tf": 1}, "shimmer.modules.losses.GWLossesBase.step": {"tf": 1}, "shimmer.modules.losses.demi_cycle_loss": {"tf": 1}, "shimmer.modules.losses.cycle_loss": {"tf": 1}, "shimmer.modules.losses.translation_loss": {"tf": 1}, "shimmer.modules.losses.contrastive_loss": {"tf": 1}, "shimmer.modules.losses.contrastive_loss_bayesian": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.demi_cycle_loss": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.cycle_loss": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.translation_loss": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.contrastive_loss": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.step": {"tf": 1}, "shimmer.modules.losses.broadcast_loss": {"tf": 1}, "shimmer.modules.losses.GWLosses.contrastive_loss": {"tf": 1}, "shimmer.modules.losses.GWLosses.broadcast_loss": {"tf": 1}, "shimmer.modules.losses.GWLosses.step": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.contrastive_loss": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.broadcast_loss": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.step": {"tf": 1}, "shimmer.modules.utils.batch_demi_cycles": {"tf": 1}, "shimmer.modules.utils.batch_cycles": {"tf": 1}, "shimmer.modules.utils.batch_translations": {"tf": 1}, "shimmer.utils.groups_batch_size": {"tf": 1}, "shimmer.utils.groups_device": {"tf": 1}}, "df": 34}}}}}}}}, "l": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "t": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspace2Domains.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.GlobalWorkspace.__init__": {"tf": 1.7320508075688772}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian.__init__": {"tf": 2.23606797749979}, "shimmer.modules.gw_module.compute_fusion_scores": {"tf": 1.7320508075688772}, "shimmer.modules.gw_module.GWModuleBayesian.__init__": {"tf": 1.7320508075688772}, "shimmer.modules.selection.RandomSelection.__init__": {"tf": 1}, "shimmer.modules.vae.VAE.__init__": {"tf": 1}}, "df": 7}}}}, "a": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "e": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspace2Domains.__init__": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace.__init__": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian.__init__": {"tf": 1}, "shimmer.modules.contrastive_loss.ContrastiveLoss.__init__": {"tf": 1}, "shimmer.dataset.RepeatedDataset.__init__": {"tf": 1}}, "df": 5}}}, "c": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "y": {"docs": {"shimmer.modules.domain.LossOutput.__init__": {"tf": 1}}, "df": 1}}}}}}, "n": {"docs": {"shimmer.modules.global_workspace.pretrained_global_workspace": {"tf": 1}, "shimmer.modules.losses.contrastive_loss": {"tf": 1}, "shimmer.modules.losses.contrastive_loss_bayesian": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.__init__": {"tf": 1}, "shimmer.modules.losses.GWLosses.__init__": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.__init__": {"tf": 1}}, "df": 6}, "u": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "n": {"docs": {"shimmer.modules.selection.SelectionBase.forward": {"tf": 1}, "shimmer.modules.selection.SingleDomainSelection.forward": {"tf": 1}, "shimmer.modules.selection.FixedSharedSelection.forward": {"tf": 1}, "shimmer.modules.selection.KQFixedQSelection.forward": {"tf": 1}, "shimmer.modules.selection.RandomSelection.forward": {"tf": 1}, "shimmer.modules.selection.DynamicQueryAttention.forward": {"tf": 1}}, "df": 6}}}}}}, "t": {"docs": {}, "df": 0, "o": {"docs": {"shimmer.modules.utils.translation": {"tf": 1}}, "df": 1, "r": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "h": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspaceBase.encode_and_fuse": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.encode": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.fuse": {"tf": 1.7320508075688772}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.decode": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.batch_gw_states": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.encode_domain": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.encode_domains": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.decode_domain": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.decode_domains": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.generic_step": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace2Domains.__init__": {"tf": 2}, "shimmer.modules.global_workspace.GlobalWorkspace2Domains.forward": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace.__init__": {"tf": 2}, "shimmer.modules.global_workspace.GlobalWorkspace.forward": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian.__init__": {"tf": 2}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian.forward": {"tf": 1}, "shimmer.modules.global_workspace.pretrained_global_workspace": {"tf": 2}, "shimmer.modules.domain.LossOutput.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.domain.DomainModule.encode": {"tf": 1}, "shimmer.modules.domain.DomainModule.decode": {"tf": 1}, "shimmer.modules.domain.DomainModule.compute_loss": {"tf": 1.4142135623730951}, "shimmer.modules.domain.DomainModule.compute_dcy_loss": {"tf": 1.4142135623730951}, "shimmer.modules.domain.DomainModule.compute_cy_loss": {"tf": 1.4142135623730951}, "shimmer.modules.domain.DomainModule.compute_tr_loss": {"tf": 1.4142135623730951}, "shimmer.modules.domain.DomainModule.compute_broadcast_loss": {"tf": 1.4142135623730951}, "shimmer.modules.gw_module.get_n_layers": {"tf": 1}, "shimmer.modules.gw_module.GWEncoder.forward": {"tf": 1.4142135623730951}, "shimmer.modules.gw_module.GWEncoderLinear.forward": {"tf": 1.4142135623730951}, "shimmer.modules.gw_module.GWModuleBase.fuse": {"tf": 1.7320508075688772}, "shimmer.modules.gw_module.GWModuleBase.encode": {"tf": 1.4142135623730951}, "shimmer.modules.gw_module.GWModuleBase.encode_and_fuse": {"tf": 1.4142135623730951}, "shimmer.modules.gw_module.GWModuleBase.decode": {"tf": 1.4142135623730951}, "shimmer.modules.gw_module.GWModule.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.gw_module.GWModule.fuse": {"tf": 1.7320508075688772}, "shimmer.modules.gw_module.GWModule.encode": {"tf": 1.4142135623730951}, "shimmer.modules.gw_module.GWModule.decode": {"tf": 1.4142135623730951}, "shimmer.modules.gw_module.compute_fusion_scores": {"tf": 1.7320508075688772}, "shimmer.modules.gw_module.GWModuleBayesian.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.gw_module.GWModuleBayesian.get_precision": {"tf": 1.4142135623730951}, "shimmer.modules.gw_module.GWModuleBayesian.fuse": {"tf": 1.7320508075688772}, "shimmer.modules.selection.SelectionBase.update_gw_state": {"tf": 1}, "shimmer.modules.selection.SelectionBase.forward": {"tf": 1.7320508075688772}, "shimmer.modules.selection.SingleDomainSelection.forward": {"tf": 1.7320508075688772}, "shimmer.modules.selection.FixedSharedSelection.forward": {"tf": 1.7320508075688772}, "shimmer.modules.selection.KQFixedQSelection.forward": {"tf": 1.7320508075688772}, "shimmer.modules.selection.RandomSelection.forward": {"tf": 1.7320508075688772}, "shimmer.modules.selection.DynamicQueryAttention.fuse_weighted_encodings": {"tf": 1.7320508075688772}, "shimmer.modules.selection.DynamicQueryAttention.forward": {"tf": 1.7320508075688772}, "shimmer.modules.losses.GWLossesBase.step": {"tf": 1}, "shimmer.modules.losses.demi_cycle_loss": {"tf": 1.4142135623730951}, "shimmer.modules.losses.cycle_loss": {"tf": 1.4142135623730951}, "shimmer.modules.losses.translation_loss": {"tf": 1.4142135623730951}, "shimmer.modules.losses.contrastive_loss": {"tf": 2}, "shimmer.modules.losses.contrastive_loss_bayesian": {"tf": 2}, "shimmer.modules.losses.GWLosses2Domains.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.losses.GWLosses2Domains.demi_cycle_loss": {"tf": 1.4142135623730951}, "shimmer.modules.losses.GWLosses2Domains.cycle_loss": {"tf": 1.4142135623730951}, "shimmer.modules.losses.GWLosses2Domains.translation_loss": {"tf": 1.4142135623730951}, "shimmer.modules.losses.GWLosses2Domains.contrastive_loss": {"tf": 1.4142135623730951}, "shimmer.modules.losses.GWLosses2Domains.step": {"tf": 1}, "shimmer.modules.losses.broadcast_loss": {"tf": 1.4142135623730951}, "shimmer.modules.losses.GWLosses.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.losses.GWLosses.contrastive_loss": {"tf": 1.4142135623730951}, "shimmer.modules.losses.GWLosses.broadcast_loss": {"tf": 1.4142135623730951}, "shimmer.modules.losses.GWLosses.step": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.losses.GWLossesBayesian.contrastive_loss": {"tf": 1.4142135623730951}, "shimmer.modules.losses.GWLossesBayesian.broadcast_loss": {"tf": 1.4142135623730951}, "shimmer.modules.losses.GWLossesBayesian.step": {"tf": 1}, "shimmer.modules.contrastive_loss.info_nce": {"tf": 2}, "shimmer.modules.contrastive_loss.contrastive_loss": {"tf": 2}, "shimmer.modules.contrastive_loss.ContrastiveLoss.__init__": {"tf": 1}, "shimmer.modules.contrastive_loss.ContrastiveLoss.forward": {"tf": 1.4142135623730951}, "shimmer.modules.vae.reparameterize": {"tf": 1.7320508075688772}, "shimmer.modules.vae.kl_divergence_loss": {"tf": 1.7320508075688772}, "shimmer.modules.vae.gaussian_nll": {"tf": 2}, "shimmer.modules.vae.VAEEncoder.forward": {"tf": 1.4142135623730951}, "shimmer.modules.vae.VAEDecoder.forward": {"tf": 1}, "shimmer.modules.vae.VAE.encode": {"tf": 1}, "shimmer.modules.vae.VAE.decode": {"tf": 1}, "shimmer.modules.vae.VAE.forward": {"tf": 1.4142135623730951}, "shimmer.modules.utils.translation": {"tf": 1.4142135623730951}, "shimmer.modules.utils.cycle": {"tf": 1.4142135623730951}, "shimmer.modules.utils.batch_demi_cycles": {"tf": 1.4142135623730951}, "shimmer.modules.utils.batch_cycles": {"tf": 1.4142135623730951}, "shimmer.modules.utils.batch_translations": {"tf": 1.4142135623730951}, "shimmer.utils.group_batch_size": {"tf": 1}, "shimmer.utils.groups_batch_size": {"tf": 1}, "shimmer.utils.groups_device": {"tf": 1}, "shimmer.utils.group_device": {"tf": 1.4142135623730951}, "shimmer.utils.migrate_model": {"tf": 1}}, "df": 91}}}}, "e": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "r": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspaceBase.encode_and_fuse": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.encode": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.fuse": {"tf": 1.7320508075688772}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.decode": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.batch_gw_states": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.encode_domain": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.encode_domains": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.decode_domain": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.decode_domains": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.generic_step": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace2Domains.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.GlobalWorkspace2Domains.forward": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.GlobalWorkspace.forward": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian.forward": {"tf": 1}, "shimmer.modules.global_workspace.pretrained_global_workspace": {"tf": 1.4142135623730951}, "shimmer.modules.domain.LossOutput.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.domain.DomainModule.encode": {"tf": 1}, "shimmer.modules.domain.DomainModule.decode": {"tf": 1}, "shimmer.modules.domain.DomainModule.compute_loss": {"tf": 1.4142135623730951}, "shimmer.modules.domain.DomainModule.compute_dcy_loss": {"tf": 1.4142135623730951}, "shimmer.modules.domain.DomainModule.compute_cy_loss": {"tf": 1.4142135623730951}, "shimmer.modules.domain.DomainModule.compute_tr_loss": {"tf": 1.4142135623730951}, "shimmer.modules.domain.DomainModule.compute_broadcast_loss": {"tf": 1.4142135623730951}, "shimmer.modules.gw_module.GWEncoder.forward": {"tf": 1.4142135623730951}, "shimmer.modules.gw_module.GWEncoderLinear.forward": {"tf": 1.4142135623730951}, "shimmer.modules.gw_module.GWModuleBase.fuse": {"tf": 1.7320508075688772}, "shimmer.modules.gw_module.GWModuleBase.encode": {"tf": 1.4142135623730951}, "shimmer.modules.gw_module.GWModuleBase.encode_and_fuse": {"tf": 1.4142135623730951}, "shimmer.modules.gw_module.GWModuleBase.decode": {"tf": 1.4142135623730951}, "shimmer.modules.gw_module.GWModule.fuse": {"tf": 1.7320508075688772}, "shimmer.modules.gw_module.GWModule.encode": {"tf": 1.4142135623730951}, "shimmer.modules.gw_module.GWModule.decode": {"tf": 1.4142135623730951}, "shimmer.modules.gw_module.compute_fusion_scores": {"tf": 1.7320508075688772}, "shimmer.modules.gw_module.GWModuleBayesian.get_precision": {"tf": 1.4142135623730951}, "shimmer.modules.gw_module.GWModuleBayesian.fuse": {"tf": 1.7320508075688772}, "shimmer.modules.selection.SelectionBase.update_gw_state": {"tf": 1}, "shimmer.modules.selection.SelectionBase.forward": {"tf": 1.7320508075688772}, "shimmer.modules.selection.SingleDomainSelection.forward": {"tf": 1.7320508075688772}, "shimmer.modules.selection.FixedSharedSelection.forward": {"tf": 1.7320508075688772}, "shimmer.modules.selection.KQFixedQSelection.forward": {"tf": 1.7320508075688772}, "shimmer.modules.selection.RandomSelection.forward": {"tf": 1.7320508075688772}, "shimmer.modules.selection.DynamicQueryAttention.fuse_weighted_encodings": {"tf": 1.7320508075688772}, "shimmer.modules.selection.DynamicQueryAttention.forward": {"tf": 1.7320508075688772}, "shimmer.modules.losses.GWLossesBase.step": {"tf": 1}, "shimmer.modules.losses.demi_cycle_loss": {"tf": 1.4142135623730951}, "shimmer.modules.losses.cycle_loss": {"tf": 1.4142135623730951}, "shimmer.modules.losses.translation_loss": {"tf": 1.4142135623730951}, "shimmer.modules.losses.contrastive_loss": {"tf": 2}, "shimmer.modules.losses.contrastive_loss_bayesian": {"tf": 2}, "shimmer.modules.losses.GWLosses2Domains.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.losses.GWLosses2Domains.demi_cycle_loss": {"tf": 1.4142135623730951}, "shimmer.modules.losses.GWLosses2Domains.cycle_loss": {"tf": 1.4142135623730951}, "shimmer.modules.losses.GWLosses2Domains.translation_loss": {"tf": 1.4142135623730951}, "shimmer.modules.losses.GWLosses2Domains.contrastive_loss": {"tf": 1.4142135623730951}, "shimmer.modules.losses.GWLosses2Domains.step": {"tf": 1}, "shimmer.modules.losses.broadcast_loss": {"tf": 1.4142135623730951}, "shimmer.modules.losses.GWLosses.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.losses.GWLosses.contrastive_loss": {"tf": 1.4142135623730951}, "shimmer.modules.losses.GWLosses.broadcast_loss": {"tf": 1.4142135623730951}, "shimmer.modules.losses.GWLosses.step": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.losses.GWLossesBayesian.contrastive_loss": {"tf": 1.4142135623730951}, "shimmer.modules.losses.GWLossesBayesian.broadcast_loss": {"tf": 1.4142135623730951}, "shimmer.modules.losses.GWLossesBayesian.step": {"tf": 1}, "shimmer.modules.contrastive_loss.info_nce": {"tf": 2}, "shimmer.modules.contrastive_loss.contrastive_loss": {"tf": 2}, "shimmer.modules.contrastive_loss.ContrastiveLoss.__init__": {"tf": 1}, "shimmer.modules.contrastive_loss.ContrastiveLoss.forward": {"tf": 1.4142135623730951}, "shimmer.modules.vae.reparameterize": {"tf": 1.7320508075688772}, "shimmer.modules.vae.kl_divergence_loss": {"tf": 1.7320508075688772}, "shimmer.modules.vae.gaussian_nll": {"tf": 2}, "shimmer.modules.vae.VAEEncoder.forward": {"tf": 1.4142135623730951}, "shimmer.modules.vae.VAEDecoder.forward": {"tf": 1}, "shimmer.modules.vae.VAE.encode": {"tf": 1}, "shimmer.modules.vae.VAE.decode": {"tf": 1}, "shimmer.modules.vae.VAE.forward": {"tf": 1.4142135623730951}, "shimmer.modules.utils.translation": {"tf": 1.4142135623730951}, "shimmer.modules.utils.cycle": {"tf": 1.4142135623730951}, "shimmer.modules.utils.batch_demi_cycles": {"tf": 1.4142135623730951}, "shimmer.modules.utils.batch_cycles": {"tf": 1.4142135623730951}, "shimmer.modules.utils.batch_translations": {"tf": 1.4142135623730951}, "shimmer.utils.group_batch_size": {"tf": 1}, "shimmer.utils.groups_batch_size": {"tf": 1}, "shimmer.utils.groups_device": {"tf": 1}, "shimmer.utils.group_device": {"tf": 1}}, "df": 87}}}}, "s": {"docs": {}, "df": 0, "t": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspaceBase.generic_step": {"tf": 1}, "shimmer.modules.losses.GWLossesBase.step": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.step": {"tf": 1}, "shimmer.modules.losses.GWLosses.step": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.step": {"tf": 1}}, "df": 5, "/": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "d": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspaceBase.generic_step": {"tf": 1}, "shimmer.modules.losses.GWLossesBase.step": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.step": {"tf": 1}, "shimmer.modules.losses.GWLosses.step": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.step": {"tf": 1}}, "df": 5}}}}}}, "m": {"docs": {}, "df": 0, "p": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspaceBayesian.__init__": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBayesian.__init__": {"tf": 1}}, "df": 2, "e": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "e": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspace.__init__": {"tf": 1}, "shimmer.modules.selection.RandomSelection.__init__": {"tf": 1}}, "df": 2}}}}}}}}}}, "y": {"docs": {}, "df": 0, "p": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "g": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspaceBase.encode_domains": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.decode_domains": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.generic_step": {"tf": 1}, "shimmer.modules.vae.VAE.forward": {"tf": 1}, "shimmer.utils.SaveMigrations.on_save_checkpoint": {"tf": 1}}, "df": 5}}}}}, "r": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "n": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspaceBase.generic_step": {"tf": 1}, "shimmer.modules.losses.GWLossesBase.step": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.step": {"tf": 1}, "shimmer.modules.losses.GWLosses.step": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.step": {"tf": 1}}, "df": 5, "e": {"docs": {}, "df": 0, "r": {"docs": {"shimmer.utils.SaveMigrations.on_save_checkpoint": {"tf": 2}}, "df": 1}}}}}, "u": {"docs": {}, "df": 0, "e": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspaceBayesian.__init__": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.__init__": {"tf": 1}}, "df": 2}}}, "a": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "g": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "t": {"docs": {"shimmer.modules.domain.DomainModule.compute_loss": {"tf": 1}, "shimmer.modules.domain.DomainModule.compute_dcy_loss": {"tf": 1}, "shimmer.modules.domain.DomainModule.compute_cy_loss": {"tf": 1}, "shimmer.modules.domain.DomainModule.compute_tr_loss": {"tf": 1}, "shimmer.modules.domain.DomainModule.compute_broadcast_loss": {"tf": 1}}, "df": 5}}}}}, "u": {"docs": {}, "df": 0, "p": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "e": {"docs": {"shimmer.modules.losses.generate_partitions": {"tf": 1}, "shimmer.modules.vae.VAEEncoder.forward": {"tf": 1}, "shimmer.modules.vae.VAE.forward": {"tf": 1.4142135623730951}, "shimmer.modules.utils.batch_cycles": {"tf": 1}, "shimmer.modules.utils.batch_translations": {"tf": 1}}, "df": 5}}}}, "h": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "g": {"docs": {}, "df": 0, "h": {"docs": {"shimmer.modules.utils.cycle": {"tf": 1}, "shimmer.modules.utils.batch_cycles": {"tf": 1}}, "df": 2}}}}}}}, "d": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "t": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspaceBase.encode_and_fuse": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.encode": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.fuse": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.decode": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.batch_gw_states": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.encode_domains": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.decode_domains": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.freeze_domain_modules": {"tf": 1}, "shimmer.modules.domain.LossOutput.__init__": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBase.encode": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBase.decode": {"tf": 1}, "shimmer.modules.gw_module.GWModule.encode": {"tf": 1}, "shimmer.modules.gw_module.GWModule.decode": {"tf": 1}, "shimmer.modules.selection.SelectionBase.forward": {"tf": 1}, "shimmer.modules.selection.SingleDomainSelection.forward": {"tf": 1}, "shimmer.modules.selection.FixedSharedSelection.forward": {"tf": 1}, "shimmer.modules.selection.KQFixedQSelection.forward": {"tf": 1}, "shimmer.modules.selection.RandomSelection.forward": {"tf": 1}, "shimmer.modules.selection.DynamicQueryAttention.fuse_weighted_encodings": {"tf": 1.4142135623730951}, "shimmer.modules.selection.DynamicQueryAttention.forward": {"tf": 1}, "shimmer.modules.losses.demi_cycle_loss": {"tf": 1}, "shimmer.modules.losses.cycle_loss": {"tf": 1}, "shimmer.modules.losses.translation_loss": {"tf": 1}, "shimmer.modules.losses.contrastive_loss": {"tf": 1}, "shimmer.modules.losses.contrastive_loss_bayesian": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.__init__": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.demi_cycle_loss": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.cycle_loss": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.translation_loss": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.contrastive_loss": {"tf": 1}, "shimmer.modules.losses.broadcast_loss": {"tf": 1}, "shimmer.modules.losses.GWLosses.__init__": {"tf": 1}, "shimmer.modules.losses.GWLosses.contrastive_loss": {"tf": 1}, "shimmer.modules.losses.GWLosses.broadcast_loss": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.__init__": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.contrastive_loss": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.broadcast_loss": {"tf": 1}, "shimmer.modules.utils.cycle": {"tf": 1}, "shimmer.modules.utils.batch_demi_cycles": {"tf": 1}, "shimmer.modules.utils.batch_cycles": {"tf": 1}, "shimmer.modules.utils.batch_translations": {"tf": 1}, "shimmer.utils.SaveMigrations.on_save_checkpoint": {"tf": 1}}, "df": 42}}, "m": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspace2Domains.__init__": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace.__init__": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian.__init__": {"tf": 1}, "shimmer.modules.global_workspace.pretrained_global_workspace": {"tf": 1}, "shimmer.modules.domain.DomainModule.__init__": {"tf": 1}, "shimmer.modules.gw_module.get_n_layers": {"tf": 1}, "shimmer.modules.gw_module.GWDecoder.__init__": {"tf": 1.7320508075688772}, "shimmer.modules.gw_module.GWEncoder.__init__": {"tf": 1.7320508075688772}, "shimmer.modules.gw_module.GWModuleBase.__init__": {"tf": 1}, "shimmer.modules.gw_module.GWModule.__init__": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBayesian.__init__": {"tf": 1}, "shimmer.modules.selection.KQFixedQSelection.__init__": {"tf": 1}, "shimmer.modules.selection.DynamicQueryAttention.__init__": {"tf": 1}}, "df": 13}}, "o": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "n": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspaceBase.encode_domain": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.decode_domain": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.decode_domains": {"tf": 1}, "shimmer.modules.global_workspace.freeze_domain_modules": {"tf": 1.7320508075688772}, "shimmer.modules.global_workspace.GlobalWorkspace2Domains.__init__": {"tf": 1.7320508075688772}, "shimmer.modules.global_workspace.GlobalWorkspace.__init__": {"tf": 1.7320508075688772}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian.__init__": {"tf": 1.7320508075688772}, "shimmer.modules.global_workspace.pretrained_global_workspace": {"tf": 1.7320508075688772}, "shimmer.modules.domain.DomainModule.compute_loss": {"tf": 1}, "shimmer.modules.domain.DomainModule.compute_dcy_loss": {"tf": 1}, "shimmer.modules.domain.DomainModule.compute_cy_loss": {"tf": 1}, "shimmer.modules.domain.DomainModule.compute_tr_loss": {"tf": 1}, "shimmer.modules.domain.DomainModule.compute_broadcast_loss": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBase.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.gw_module.GWModule.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.gw_module.GWModuleBayesian.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.gw_module.GWModuleBayesian.get_precision": {"tf": 1}, "shimmer.modules.selection.KQFixedQSelection.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.selection.DynamicQueryAttention.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.losses.GWLossesBase.step": {"tf": 1.4142135623730951}, "shimmer.modules.losses.demi_cycle_loss": {"tf": 1.4142135623730951}, "shimmer.modules.losses.cycle_loss": {"tf": 1.4142135623730951}, "shimmer.modules.losses.translation_loss": {"tf": 1.4142135623730951}, "shimmer.modules.losses.contrastive_loss": {"tf": 1}, "shimmer.modules.losses.contrastive_loss_bayesian": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.__init__": {"tf": 1.7320508075688772}, "shimmer.modules.losses.GWLosses2Domains.step": {"tf": 1.4142135623730951}, "shimmer.modules.losses.broadcast_loss": {"tf": 1.4142135623730951}, "shimmer.modules.losses.GWLosses.__init__": {"tf": 1.7320508075688772}, "shimmer.modules.losses.GWLosses.step": {"tf": 1.4142135623730951}, "shimmer.modules.losses.GWLossesBayesian.__init__": {"tf": 1.7320508075688772}, "shimmer.modules.losses.GWLossesBayesian.step": {"tf": 1.4142135623730951}, "shimmer.modules.contrastive_loss.ContrastiveLoss.forward": {"tf": 1}, "shimmer.utils.groups_batch_size": {"tf": 1}, "shimmer.utils.groups_device": {"tf": 1}}, "df": 35, "s": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspaceBase.decode": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.batch_gw_states": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace2Domains.forward": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace.forward": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian.forward": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBase.decode": {"tf": 1}, "shimmer.modules.gw_module.GWModule.decode": {"tf": 1}, "shimmer.modules.selection.SelectionBase.forward": {"tf": 1}, "shimmer.modules.selection.SingleDomainSelection.forward": {"tf": 1}, "shimmer.modules.selection.FixedSharedSelection.forward": {"tf": 1}, "shimmer.modules.selection.KQFixedQSelection.forward": {"tf": 1}, "shimmer.modules.selection.RandomSelection.forward": {"tf": 1}, "shimmer.modules.selection.DynamicQueryAttention.forward": {"tf": 1}, "shimmer.modules.losses.demi_cycle_loss": {"tf": 1}, "shimmer.modules.losses.cycle_loss": {"tf": 1}, "shimmer.modules.losses.translation_loss": {"tf": 1}, "shimmer.modules.losses.contrastive_loss": {"tf": 1}, "shimmer.modules.losses.contrastive_loss_bayesian": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.demi_cycle_loss": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.cycle_loss": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.translation_loss": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.contrastive_loss": {"tf": 1}, "shimmer.modules.losses.broadcast_loss": {"tf": 1}, "shimmer.modules.losses.GWLosses.contrastive_loss": {"tf": 1}, "shimmer.modules.losses.GWLosses.broadcast_loss": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.contrastive_loss": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.broadcast_loss": {"tf": 1}, "shimmer.modules.utils.batch_demi_cycles": {"tf": 1}, "shimmer.modules.utils.batch_cycles": {"tf": 1.4142135623730951}, "shimmer.modules.utils.batch_translations": {"tf": 1}}, "df": 30}, "m": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "d": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "e": {"docs": {"shimmer.modules.global_workspace.freeze_domain_modules": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.GlobalWorkspace2Domains.__init__": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace.__init__": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian.__init__": {"tf": 1}, "shimmer.modules.global_workspace.pretrained_global_workspace": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBase.__init__": {"tf": 1}, "shimmer.modules.gw_module.GWModule.__init__": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBayesian.__init__": {"tf": 1}, "shimmer.modules.losses.demi_cycle_loss": {"tf": 1}, "shimmer.modules.losses.cycle_loss": {"tf": 1}, "shimmer.modules.losses.translation_loss": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.__init__": {"tf": 1}, "shimmer.modules.losses.broadcast_loss": {"tf": 1}, "shimmer.modules.losses.GWLosses.__init__": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.__init__": {"tf": 1}}, "df": 15}}}}}}}}}}}, "e": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "d": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "r": {"docs": {"shimmer.modules.vae.VAE.__init__": {"tf": 1}}, "df": 1, "s": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspace2Domains.__init__": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace.__init__": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian.__init__": {"tf": 1}, "shimmer.modules.global_workspace.pretrained_global_workspace": {"tf": 1}, "shimmer.modules.gw_module.GWModule.__init__": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBayesian.__init__": {"tf": 1}}, "df": 6}}}}}, "a": {"docs": {}, "df": 0, "y": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspace2Domains.__init__": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace.__init__": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian.__init__": {"tf": 1}}, "df": 3}}}, "v": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "e": {"docs": {"shimmer.utils.group_device": {"tf": 1}}, "df": 1}}}}}, "a": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "t": {"docs": {"shimmer.dataset.RepeatedDataset.__init__": {"tf": 1.4142135623730951}}, "df": 1}}}}}}, "r": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "p": {"docs": {"shimmer.dataset.RepeatedDataset.__init__": {"tf": 1}}, "df": 1}}}}, "z": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspaceBase.decode": {"tf": 1}, "shimmer.modules.domain.DomainModule.decode": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBase.decode": {"tf": 1}, "shimmer.modules.gw_module.GWModule.decode": {"tf": 1}, "shimmer.modules.vae.VAE.decode": {"tf": 1}}, "df": 5}, "i": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "b": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "e": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspaceBase.decode": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBase.decode": {"tf": 1}, "shimmer.modules.gw_module.GWModule.decode": {"tf": 1}, "shimmer.modules.selection.KQFixedQSelection.__init__": {"tf": 1}, "shimmer.modules.selection.DynamicQueryAttention.__init__": {"tf": 1}, "shimmer.modules.utils.batch_cycles": {"tf": 1}}, "df": 6}}}}}}}, "n": {"docs": {"shimmer.modules.gw_module.GWDecoder.__init__": {"tf": 1}, "shimmer.modules.gw_module.GWEncoder.__init__": {"tf": 1}}, "df": 2, "t": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspace2Domains.__init__": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace.__init__": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian.__init__": {"tf": 1}, "shimmer.modules.global_workspace.pretrained_global_workspace": {"tf": 1}, "shimmer.modules.domain.DomainModule.__init__": {"tf": 1}, "shimmer.modules.gw_module.get_n_layers": {"tf": 1.4142135623730951}, "shimmer.modules.gw_module.GWDecoder.__init__": {"tf": 2}, "shimmer.modules.gw_module.GWEncoder.__init__": {"tf": 2}, "shimmer.modules.gw_module.GWModuleBase.__init__": {"tf": 1}, "shimmer.modules.gw_module.GWModule.__init__": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBayesian.__init__": {"tf": 1}, "shimmer.modules.selection.KQFixedQSelection.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.selection.DynamicQueryAttention.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.losses.generate_partitions": {"tf": 1.4142135623730951}, "shimmer.dataset.RepeatedDataset.__init__": {"tf": 1}, "shimmer.utils.group_batch_size": {"tf": 1}, "shimmer.utils.groups_batch_size": {"tf": 1}, "shimmer.utils.groups_device": {"tf": 1}}, "df": 18}, "p": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "t": {"docs": {"shimmer.modules.gw_module.GWEncoder.forward": {"tf": 1}, "shimmer.modules.gw_module.GWEncoderLinear.forward": {"tf": 1}}, "df": 2}}}}}, "n": {"docs": {"shimmer.modules.gw_module.get_n_layers": {"tf": 1}, "shimmer.modules.gw_module.GWDecoder.__init__": {"tf": 1}, "shimmer.modules.gw_module.GWEncoder.__init__": {"tf": 1}, "shimmer.modules.losses.generate_partitions": {"tf": 1}}, "df": 4, "o": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "e": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspaceBase.decode": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.GlobalWorkspace2Domains.__init__": {"tf": 2}, "shimmer.modules.global_workspace.GlobalWorkspace.__init__": {"tf": 2}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian.__init__": {"tf": 2}, "shimmer.modules.gw_module.GWModuleBase.decode": {"tf": 1.4142135623730951}, "shimmer.modules.gw_module.GWModule.decode": {"tf": 1.4142135623730951}, "shimmer.modules.selection.SelectionBase.update_gw_state": {"tf": 1}, "shimmer.modules.losses.generate_partitions": {"tf": 1.4142135623730951}, "shimmer.modules.contrastive_loss.info_nce": {"tf": 1}, "shimmer.modules.contrastive_loss.contrastive_loss": {"tf": 1}, "shimmer.modules.contrastive_loss.ContrastiveLoss.__init__": {"tf": 1}}, "df": 11}}, "r": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "z": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "d": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspaceBayesian.__init__": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.__init__": {"tf": 1}}, "df": 2}}}}}}}}}, "a": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "e": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspaceBase.encode_domain": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.decode_domain": {"tf": 1}}, "df": 2, "s": {"docs": {"shimmer.modules.selection.KQFixedQSelection.__init__": {"tf": 1}, "shimmer.modules.selection.DynamicQueryAttention.__init__": {"tf": 1}}, "df": 2}}}}, "n": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspace2Domains.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.GlobalWorkspace.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.pretrained_global_workspace": {"tf": 1.4142135623730951}, "shimmer.modules.gw_module.get_n_layers": {"tf": 1}, "shimmer.modules.gw_module.GWModule.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.gw_module.GWModuleBayesian.__init__": {"tf": 1.4142135623730951}}, "df": 7}}, "l": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "t": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspaceBase.batch_gw_states": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace2Domains.forward": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace.forward": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian.forward": {"tf": 1}, "shimmer.modules.domain.DomainModule.__init__": {"tf": 1}, "shimmer.modules.losses.demi_cycle_loss": {"tf": 1}, "shimmer.modules.losses.cycle_loss": {"tf": 1}, "shimmer.modules.losses.translation_loss": {"tf": 1}, "shimmer.modules.losses.contrastive_loss": {"tf": 1}, "shimmer.modules.losses.contrastive_loss_bayesian": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.demi_cycle_loss": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.cycle_loss": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.translation_loss": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.contrastive_loss": {"tf": 1}, "shimmer.modules.losses.broadcast_loss": {"tf": 1}, "shimmer.modules.losses.GWLosses.contrastive_loss": {"tf": 1}, "shimmer.modules.losses.GWLosses.broadcast_loss": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.contrastive_loss": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.broadcast_loss": {"tf": 1}, "shimmer.modules.utils.batch_demi_cycles": {"tf": 1}, "shimmer.modules.utils.batch_cycles": {"tf": 1}, "shimmer.modules.utils.batch_translations": {"tf": 1}}, "df": 22, "s": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspaceBase.decode_domains": {"tf": 1}, "shimmer.modules.losses.GWLossesBase.step": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.step": {"tf": 1}, "shimmer.modules.losses.GWLosses.step": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.step": {"tf": 1}, "shimmer.utils.groups_batch_size": {"tf": 1}, "shimmer.utils.groups_device": {"tf": 1}}, "df": 7}}}}}, "y": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "s": {"docs": {"shimmer.modules.gw_module.get_n_layers": {"tf": 1}, "shimmer.modules.gw_module.GWDecoder.__init__": {"tf": 1}, "shimmer.modules.gw_module.GWEncoder.__init__": {"tf": 1}}, "df": 3}}}}, "s": {"docs": {}, "df": 0, "t": {"docs": {"shimmer.dataset.RepeatedDataset.__init__": {"tf": 1}}, "df": 1}}}, "i": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "l": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspaceBase.generic_step": {"tf": 1}, "shimmer.modules.losses.GWLossesBase.step": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.step": {"tf": 1}, "shimmer.modules.losses.GWLosses.step": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.step": {"tf": 1}, "shimmer.modules.contrastive_loss.info_nce": {"tf": 1}, "shimmer.modules.contrastive_loss.contrastive_loss": {"tf": 1}, "shimmer.modules.contrastive_loss.ContrastiveLoss.__init__": {"tf": 1}}, "df": 8}}}}}, "s": {"docs": {}, "df": 0, "t": {"docs": {"shimmer.modules.gw_module.get_n_layers": {"tf": 1}}, "df": 1}}, "g": {"docs": {}, "df": 0, "h": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "g": {"docs": {"shimmer.utils.SaveMigrations.on_save_checkpoint": {"tf": 1.4142135623730951}}, "df": 1, "m": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "d": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "e": {"docs": {"shimmer.utils.SaveMigrations.on_save_checkpoint": {"tf": 1}}, "df": 1}}}}}}}}}}}}}}, "o": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "s": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspace2Domains.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.GlobalWorkspace.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.pretrained_global_workspace": {"tf": 1}, "shimmer.modules.domain.LossOutput.__init__": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.__init__": {"tf": 1}, "shimmer.modules.losses.GWLosses.__init__": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.__init__": {"tf": 1}}, "df": 8, "e": {"docs": {}, "df": 0, "s": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspace2Domains.__init__": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace.__init__": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian.__init__": {"tf": 1}, "shimmer.modules.global_workspace.pretrained_global_workspace": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.__init__": {"tf": 1}, "shimmer.modules.losses.GWLosses.__init__": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.__init__": {"tf": 1}}, "df": 7}}, "c": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "f": {"docs": {}, "df": 0, "s": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspace2Domains.__init__": {"tf": 1}, "shimmer.modules.global_workspace.pretrained_global_workspace": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.__init__": {"tf": 1}}, "df": 3}}}}}, "o": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "p": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "t": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspace2Domains.__init__": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace.__init__": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian.__init__": {"tf": 1}, "shimmer.modules.global_workspace.pretrained_global_workspace": {"tf": 1}, "shimmer.modules.domain.DomainModule.compute_loss": {"tf": 1}, "shimmer.modules.domain.DomainModule.compute_dcy_loss": {"tf": 1}, "shimmer.modules.domain.DomainModule.compute_cy_loss": {"tf": 1}, "shimmer.modules.domain.DomainModule.compute_tr_loss": {"tf": 1}, "shimmer.modules.domain.DomainModule.compute_broadcast_loss": {"tf": 1}, "shimmer.modules.losses.GWLossesBase.step": {"tf": 1}, "shimmer.modules.losses.contrastive_loss": {"tf": 1}, "shimmer.modules.losses.contrastive_loss_bayesian": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.__init__": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.step": {"tf": 1}, "shimmer.modules.losses.GWLosses.__init__": {"tf": 1}, "shimmer.modules.losses.GWLosses.step": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.__init__": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.step": {"tf": 1}, "shimmer.modules.contrastive_loss.ContrastiveLoss.forward": {"tf": 1}}, "df": 19}}}}}}}}, "g": {"docs": {"shimmer.modules.vae.gaussian_nll": {"tf": 1}}, "df": 1, "i": {"docs": {}, "df": 0, "t": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspace2Domains.__init__": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace.__init__": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian.__init__": {"tf": 1}, "shimmer.modules.contrastive_loss.info_nce": {"tf": 1}, "shimmer.modules.contrastive_loss.contrastive_loss": {"tf": 1}, "shimmer.modules.contrastive_loss.ContrastiveLoss.__init__": {"tf": 1.4142135623730951}}, "df": 6}}, "v": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "r": {"docs": {"shimmer.modules.vae.reparameterize": {"tf": 1}, "shimmer.modules.vae.kl_divergence_loss": {"tf": 1}}, "df": 2}}}}, "a": {"docs": {}, "df": 0, "d": {"docs": {"shimmer.utils.migrate_model": {"tf": 1}}, "df": 1}}}, "r": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspace2Domains.__init__": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace.__init__": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian.__init__": {"tf": 1}}, "df": 3}, "e": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "n": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspace2Domains.__init__": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace.__init__": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian.__init__": {"tf": 1}, "shimmer.modules.contrastive_loss.ContrastiveLoss.__init__": {"tf": 1}}, "df": 4}}}}, "t": {"docs": {"shimmer.modules.domain.LossOutput.__init__": {"tf": 1}}, "df": 1}}, "b": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "h": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspaceBase.encode_domains": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.generic_step": {"tf": 1}}, "df": 2}}}}, "o": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "l": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspace2Domains.__init__": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace.__init__": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.losses.GWLossesBayesian.__init__": {"tf": 1}, "shimmer.modules.contrastive_loss.ContrastiveLoss.__init__": {"tf": 1}, "shimmer.dataset.RepeatedDataset.__init__": {"tf": 1}}, "df": 6}}}, "r": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "d": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "f": {"docs": {}, "df": 0, "s": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspace.__init__": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian.__init__": {"tf": 1}, "shimmer.modules.losses.GWLosses.__init__": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.__init__": {"tf": 1}}, "df": 4}}}}}}}}}}}}}}}}}, "e": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "a": {"docs": {"shimmer.modules.vae.VAE.__init__": {"tf": 1}}, "df": 1}}}}, "v": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "l": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspaceBase.generic_step": {"tf": 1}, "shimmer.modules.losses.GWLossesBase.step": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.step": {"tf": 1}, "shimmer.modules.losses.GWLosses.step": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.step": {"tf": 1}}, "df": 5, "/": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "d": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspaceBase.generic_step": {"tf": 1}, "shimmer.modules.losses.GWLossesBase.step": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.step": {"tf": 1}, "shimmer.modules.losses.GWLosses.step": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.step": {"tf": 1}}, "df": 5}}}}}, "e": {"docs": {"shimmer.modules.vae.VAE.__init__": {"tf": 1.4142135623730951}}, "df": 1, "e": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "d": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "r": {"docs": {"shimmer.modules.vae.VAE.__init__": {"tf": 1}}, "df": 1}}}}}}}, "d": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "d": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "r": {"docs": {"shimmer.modules.vae.VAE.__init__": {"tf": 1}}, "df": 1}}}}}}}}}}, "g": {"docs": {}, "df": 0, "w": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspace2Domains.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.GlobalWorkspace.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.pretrained_global_workspace": {"tf": 1.4142135623730951}, "shimmer.modules.gw_module.GWModule.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.gw_module.GWModuleBayesian.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.selection.SelectionBase.update_gw_state": {"tf": 1}, "shimmer.modules.losses.demi_cycle_loss": {"tf": 1.4142135623730951}, "shimmer.modules.losses.cycle_loss": {"tf": 1.4142135623730951}, "shimmer.modules.losses.translation_loss": {"tf": 1.4142135623730951}, "shimmer.modules.losses.contrastive_loss": {"tf": 1.4142135623730951}, "shimmer.modules.losses.contrastive_loss_bayesian": {"tf": 1.4142135623730951}, "shimmer.modules.losses.GWLosses2Domains.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.losses.broadcast_loss": {"tf": 1.4142135623730951}, "shimmer.modules.losses.GWLosses.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.losses.GWLossesBayesian.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.utils.translation": {"tf": 1.4142135623730951}, "shimmer.modules.utils.cycle": {"tf": 1.4142135623730951}, "shimmer.modules.utils.batch_demi_cycles": {"tf": 1.4142135623730951}, "shimmer.modules.utils.batch_cycles": {"tf": 1.4142135623730951}, "shimmer.modules.utils.batch_translations": {"tf": 1.4142135623730951}}, "df": 21, "p": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "d": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "s": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspace2Domains.forward": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace.forward": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian.forward": {"tf": 1}}, "df": 3}}}}}}}}}}}, "m": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "d": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "e": {"docs": {"shimmer.modules.losses.GWLosses2Domains.__init__": {"tf": 1}, "shimmer.modules.losses.GWLosses.__init__": {"tf": 1}}, "df": 2, "b": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "e": {"docs": {"shimmer.modules.losses.demi_cycle_loss": {"tf": 1}, "shimmer.modules.losses.cycle_loss": {"tf": 1}, "shimmer.modules.losses.translation_loss": {"tf": 1}, "shimmer.modules.losses.contrastive_loss": {"tf": 1}, "shimmer.modules.losses.broadcast_loss": {"tf": 1}, "shimmer.modules.utils.translation": {"tf": 1}, "shimmer.modules.utils.cycle": {"tf": 1}, "shimmer.modules.utils.batch_demi_cycles": {"tf": 1}, "shimmer.modules.utils.batch_cycles": {"tf": 1}, "shimmer.modules.utils.batch_translations": {"tf": 1}}, "df": 10}}, "y": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "n": {"docs": {"shimmer.modules.losses.contrastive_loss_bayesian": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.__init__": {"tf": 1}}, "df": 2}}}}}}}}}}}}}}}, "l": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "b": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "l": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspace2Domains.__init__": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace2Domains.forward": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace.__init__": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace.forward": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian.__init__": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian.forward": {"tf": 1}, "shimmer.modules.global_workspace.pretrained_global_workspace": {"tf": 1}}, "df": 7, "w": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "k": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "p": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "e": {"2": {"docs": {}, "df": 0, "d": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "s": {"docs": {"shimmer.modules.global_workspace.pretrained_global_workspace": {"tf": 1}}, "df": 1}}}}}}}}, "docs": {}, "df": 0}}}}}}}}}}}}}}, "t": {"docs": {"shimmer.modules.domain.LossOutput.__init__": {"tf": 1}}, "df": 1}, "e": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "r": {"docs": {"shimmer.modules.losses.generate_partitions": {"tf": 1}}, "df": 1}}}}}}}}}, "e": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "d": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "r": {"docs": {"shimmer.modules.vae.VAE.__init__": {"tf": 1}}, "df": 1, "s": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspace2Domains.__init__": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace.__init__": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian.__init__": {"tf": 1}, "shimmer.modules.global_workspace.pretrained_global_workspace": {"tf": 1}, "shimmer.modules.gw_module.GWModule.__init__": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBayesian.__init__": {"tf": 1}}, "df": 6}}}, "i": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "g": {"docs": {}, "df": 0, "s": {"docs": {"shimmer.modules.selection.SelectionBase.forward": {"tf": 1}, "shimmer.modules.selection.SingleDomainSelection.forward": {"tf": 1}, "shimmer.modules.selection.FixedSharedSelection.forward": {"tf": 1}, "shimmer.modules.selection.KQFixedQSelection.forward": {"tf": 1}, "shimmer.modules.selection.RandomSelection.forward": {"tf": 1}, "shimmer.modules.selection.DynamicQueryAttention.fuse_weighted_encodings": {"tf": 1}, "shimmer.modules.selection.DynamicQueryAttention.forward": {"tf": 1}}, "df": 7}}}}}}}}, "p": {"docs": {}, "df": 0, "s": {"docs": {"shimmer.modules.gw_module.compute_fusion_scores": {"tf": 1}}, "df": 1}}}, "w": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "k": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "p": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "e": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspace2Domains.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.GlobalWorkspace2Domains.forward": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.GlobalWorkspace.forward": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian.forward": {"tf": 1}, "shimmer.modules.global_workspace.pretrained_global_workspace": {"tf": 1.4142135623730951}, "shimmer.modules.gw_module.GWModuleBase.__init__": {"tf": 1}, "shimmer.modules.gw_module.GWModule.__init__": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBayesian.__init__": {"tf": 1}}, "df": 10}}}}}}}}, "e": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "g": {"docs": {}, "df": 0, "h": {"docs": {}, "df": 0, "t": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspace2Domains.__init__": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace.__init__": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian.__init__": {"tf": 1}}, "df": 3}}}}}}, "o": {"docs": {}, "df": 0, "p": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "m": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspace2Domains.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.GlobalWorkspace.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian.__init__": {"tf": 1.4142135623730951}}, "df": 3}}}}, "u": {"docs": {}, "df": 0, "t": {"docs": {"shimmer.modules.gw_module.GWDecoder.__init__": {"tf": 1}, "shimmer.modules.gw_module.GWEncoder.__init__": {"tf": 1}}, "df": 2}}, "s": {"docs": {"shimmer.utils.migrate_model": {"tf": 1}}, "df": 1}}, "p": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "e": {"docs": {"shimmer.modules.selection.SelectionBase.forward": {"tf": 1}, "shimmer.modules.selection.SingleDomainSelection.forward": {"tf": 1}, "shimmer.modules.selection.FixedSharedSelection.forward": {"tf": 1}, "shimmer.modules.selection.KQFixedQSelection.forward": {"tf": 1}, "shimmer.modules.selection.RandomSelection.forward": {"tf": 1}, "shimmer.modules.selection.DynamicQueryAttention.forward": {"tf": 1}}, "df": 6, "c": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "n": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspaceBayesian.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.gw_module.GWModuleBayesian.__init__": {"tf": 1.4142135623730951}}, "df": 2}}}}}}, "d": {"docs": {"shimmer.modules.domain.DomainModule.compute_loss": {"tf": 1}, "shimmer.modules.domain.DomainModule.compute_dcy_loss": {"tf": 1}, "shimmer.modules.domain.DomainModule.compute_cy_loss": {"tf": 1}, "shimmer.modules.domain.DomainModule.compute_tr_loss": {"tf": 1}, "shimmer.modules.domain.DomainModule.compute_broadcast_loss": {"tf": 1}}, "df": 5}}}, "a": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "h": {"docs": {"shimmer.modules.global_workspace.pretrained_global_workspace": {"tf": 1.4142135623730951}, "shimmer.utils.migrate_model": {"tf": 1}}, "df": 2, "l": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "b": {"docs": {"shimmer.modules.global_workspace.pretrained_global_workspace": {"tf": 1}}, "df": 1}, "k": {"docs": {}, "df": 0, "e": {"docs": {"shimmer.utils.migrate_model": {"tf": 1}}, "df": 1}}}}}}}, "y": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "h": {"docs": {"shimmer.utils.SaveMigrations.on_save_checkpoint": {"tf": 1.4142135623730951}}, "df": 1}}}}}}, "l": {"docs": {"shimmer.utils.SaveMigrations.on_save_checkpoint": {"tf": 1}}, "df": 1}}, "u": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "e": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspaceBayesian.__init__": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.__init__": {"tf": 1}}, "df": 2}}}, "k": {"docs": {}, "df": 0, "w": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "g": {"docs": {}, "df": 0, "s": {"docs": {"shimmer.modules.global_workspace.pretrained_global_workspace": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBase.__init__": {"tf": 1}, "shimmer.utils.migrate_model": {"tf": 1}}, "df": 3}}}}}}, "h": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "d": {"docs": {}, "df": 0, "d": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "n": {"docs": {"shimmer.modules.gw_module.get_n_layers": {"tf": 1}, "shimmer.modules.gw_module.GWDecoder.__init__": {"tf": 1}, "shimmer.modules.gw_module.GWEncoder.__init__": {"tf": 1}}, "df": 3}}}}}, "e": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "d": {"docs": {"shimmer.modules.selection.KQFixedQSelection.__init__": {"tf": 1}, "shimmer.modules.selection.DynamicQueryAttention.__init__": {"tf": 1}}, "df": 2}}}}, "y": {"docs": {"shimmer.modules.contrastive_loss.info_nce": {"tf": 1}, "shimmer.modules.contrastive_loss.contrastive_loss": {"tf": 1}, "shimmer.modules.contrastive_loss.ContrastiveLoss.forward": {"tf": 1}}, "df": 3}, "r": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "d": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "n": {"docs": {"shimmer.modules.contrastive_loss.info_nce": {"tf": 1}, "shimmer.modules.contrastive_loss.contrastive_loss": {"tf": 1}, "shimmer.modules.contrastive_loss.ContrastiveLoss.__init__": {"tf": 1}}, "df": 3}}}}}}}}}}}, "bases": {"root": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspaceBase": {"tf": 1.4142135623730951}}, "df": 1, "t": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspaceBase": {"tf": 1.7320508075688772}}, "df": 1, "y": {"docs": {}, "df": 0, "p": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "g": {"docs": {"shimmer.modules.global_workspace.SchedulerArgs": {"tf": 1}, "shimmer.modules.global_workspace.GWPredictionsBase": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase": {"tf": 1}, "shimmer.modules.losses.LossCoefs": {"tf": 1}, "shimmer.modules.losses.BroadcastLossCoefs": {"tf": 1}, "shimmer.dataset.RepeatedDataset": {"tf": 1}}, "df": 6}}}, "e": {"docs": {}, "df": 0, "d": {"docs": {}, "df": 0, "d": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "t": {"docs": {"shimmer.modules.global_workspace.SchedulerArgs": {"tf": 1}, "shimmer.modules.global_workspace.GWPredictionsBase": {"tf": 1}, "shimmer.modules.losses.LossCoefs": {"tf": 1}, "shimmer.modules.losses.BroadcastLossCoefs": {"tf": 1}}, "df": 4}}}}}}}}, "o": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "h": {"docs": {"shimmer.modules.gw_module.GWDecoder": {"tf": 1}, "shimmer.modules.gw_module.GWEncoderLinear": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBase": {"tf": 1}, "shimmer.modules.selection.SelectionBase": {"tf": 1}, "shimmer.modules.losses.GWLossesBase": {"tf": 1}, "shimmer.modules.contrastive_loss.ContrastiveLoss": {"tf": 1}, "shimmer.modules.vae.VAEEncoder": {"tf": 1}, "shimmer.modules.vae.VAEDecoder": {"tf": 1}, "shimmer.modules.vae.VAE": {"tf": 1}}, "df": 9}}}}}, "g": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "c": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspaceBase": {"tf": 1}}, "df": 1, "[": {"docs": {}, "df": 0, "+": {"docs": {}, "df": 0, "t": {"docs": {"shimmer.dataset.RepeatedDataset": {"tf": 1}}, "df": 1}}}}}}}}}, "w": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspaceBase": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace2Domains": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian": {"tf": 1}}, "df": 4, "m": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "d": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "e": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspace2Domains": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBayesian": {"tf": 1}}, "df": 3, "b": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "y": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "n": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspaceBayesian": {"tf": 1}}, "df": 1}}}}}}, "s": {"docs": {}, "df": 0, "e": {"docs": {"shimmer.modules.gw_module.GWModule": {"tf": 1}}, "df": 1}}}}}}}}}}, "l": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "s": {"2": {"docs": {}, "df": 0, "d": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "s": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspace2Domains": {"tf": 1}}, "df": 1}}}}}}}}, "docs": {"shimmer.modules.global_workspace.GlobalWorkspace": {"tf": 1}}, "df": 1, "b": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "y": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "n": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspaceBayesian": {"tf": 1}}, "df": 1}}}}}}, "s": {"docs": {}, "df": 0, "e": {"docs": {"shimmer.modules.losses.GWLosses2Domains": {"tf": 1}, "shimmer.modules.losses.GWLosses": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian": {"tf": 1}}, "df": 3}}}}}}}}}}, "d": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "d": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "r": {"docs": {"shimmer.modules.gw_module.GWEncoder": {"tf": 1}}, "df": 1}}}}}}}}, "l": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "b": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "l": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspace2Domains": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian": {"tf": 1}}, "df": 3, "w": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "k": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "p": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "b": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "[": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "h": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "r": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspace2Domains": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian": {"tf": 1}}, "df": 3}}}}}}}}}}}}}}}}}}}}}}}}}}}, "m": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "d": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspaceBase": {"tf": 1.7320508075688772}}, "df": 1, "u": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "e": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspaceBase": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace2Domains": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian": {"tf": 1}, "shimmer.modules.domain.DomainModule": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBase": {"tf": 1.4142135623730951}, "shimmer.modules.selection.SelectionBase": {"tf": 1.4142135623730951}, "shimmer.modules.losses.GWLossesBase": {"tf": 1.4142135623730951}, "shimmer.modules.contrastive_loss.ContrastiveLoss": {"tf": 1.4142135623730951}, "shimmer.modules.vae.VAEEncoder": {"tf": 1.4142135623730951}, "shimmer.modules.vae.VAEDecoder": {"tf": 1.4142135623730951}, "shimmer.modules.vae.VAE": {"tf": 1.4142135623730951}}, "df": 12, "s": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspace2Domains": {"tf": 2}, "shimmer.modules.global_workspace.GlobalWorkspace": {"tf": 2}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian": {"tf": 2}, "shimmer.modules.gw_module.GWDecoder": {"tf": 1}, "shimmer.modules.gw_module.GWEncoderLinear": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBase": {"tf": 1}, "shimmer.modules.selection.SelectionBase": {"tf": 1}, "shimmer.modules.losses.GWLossesBase": {"tf": 1}, "shimmer.modules.contrastive_loss.ContrastiveLoss": {"tf": 1}, "shimmer.modules.vae.VAEEncoder": {"tf": 1}, "shimmer.modules.vae.VAEDecoder": {"tf": 1}, "shimmer.modules.vae.VAE": {"tf": 1}}, "df": 12}}}}}}}, "s": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "n": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspaceBase": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace2Domains": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian": {"tf": 1}}, "df": 4, "b": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "e": {"docs": {"shimmer.modules.selection.SingleDomainSelection": {"tf": 1}, "shimmer.modules.selection.FixedSharedSelection": {"tf": 1}, "shimmer.modules.selection.KQFixedQSelection": {"tf": 1}, "shimmer.modules.selection.RandomSelection": {"tf": 1}, "shimmer.modules.selection.DynamicQueryAttention": {"tf": 1}}, "df": 5}}}}}}}}}}}, "q": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "l": {"docs": {"shimmer.modules.gw_module.GWDecoder": {"tf": 1}}, "df": 1}}}}}}}}}, "h": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "r": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspace2Domains": {"tf": 1.7320508075688772}, "shimmer.modules.global_workspace.GlobalWorkspace": {"tf": 1.7320508075688772}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian": {"tf": 1.7320508075688772}}, "df": 3}}}}}}, "i": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "g": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "d": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "n": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspace2Domains": {"tf": 1}}, "df": 1}}}}}}}}}}}}}}}}}}}}}, "l": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "s": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspaceBase": {"tf": 1}}, "df": 1, "e": {"docs": {}, "df": 0, "s": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspace2Domains": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian": {"tf": 1}}, "df": 3}}}}}, "i": {"docs": {}, "df": 0, "g": {"docs": {}, "df": 0, "h": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "g": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspaceBase": {"tf": 1}, "shimmer.modules.domain.DomainModule": {"tf": 1}, "shimmer.utils.SaveMigrations": {"tf": 1}}, "df": 3, "m": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "d": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "e": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspaceBase": {"tf": 1}, "shimmer.modules.domain.DomainModule": {"tf": 1}}, "df": 2}}}}}}}}}}}}}, "n": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "r": {"docs": {"shimmer.modules.gw_module.GWEncoderLinear": {"tf": 1.4142135623730951}}, "df": 1}}}}}}, "p": {"docs": {}, "df": 0, "y": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "h": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspaceBase": {"tf": 1}, "shimmer.modules.domain.DomainModule": {"tf": 1}, "shimmer.utils.SaveMigrations": {"tf": 1}}, "df": 3}}}}}}}, "c": {"docs": {}, "df": 0, "o": {"docs": {"shimmer.dataset.RepeatedDataset": {"tf": 1}}, "df": 1, "r": {"docs": {}, "df": 0, "e": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspaceBase": {"tf": 1}, "shimmer.modules.domain.DomainModule": {"tf": 1}}, "df": 2}}, "n": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "r": {"docs": {"shimmer.modules.gw_module.GWDecoder": {"tf": 1}}, "df": 1}}}}}}}}, "a": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "b": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "k": {"docs": {"shimmer.utils.SaveMigrations": {"tf": 1.4142135623730951}}, "df": 1, "s": {"docs": {"shimmer.utils.SaveMigrations": {"tf": 1}}, "df": 1}}}}}}}}}, "b": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "s": {"docs": {"shimmer.modules.global_workspace.GWPredictions": {"tf": 1}}, "df": 1}}}}}}}}, "d": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "t": {"docs": {"shimmer.modules.global_workspace.GWPredictions": {"tf": 1}}, "df": 1}}}}, "w": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "k": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "p": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "e": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspace2Domains": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian": {"tf": 1}}, "df": 3}}}}}}}}}, "r": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "d": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "n": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspace": {"tf": 1}}, "df": 1}}}}}}}}}}}}}}}, "f": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "x": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "d": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "h": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "d": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "n": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspaceBayesian": {"tf": 1}}, "df": 1}}}}}}}}}}}}}}}}}}}}, "n": {"docs": {}, "df": 0, "n": {"docs": {"shimmer.modules.gw_module.GWDecoder": {"tf": 1}, "shimmer.modules.gw_module.GWEncoderLinear": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBase": {"tf": 1}, "shimmer.modules.selection.SelectionBase": {"tf": 1}, "shimmer.modules.losses.GWLossesBase": {"tf": 1}, "shimmer.modules.contrastive_loss.ContrastiveLoss": {"tf": 1}, "shimmer.modules.vae.VAEEncoder": {"tf": 1}, "shimmer.modules.vae.VAEDecoder": {"tf": 1}, "shimmer.modules.vae.VAE": {"tf": 1}}, "df": 9}}, "a": {"docs": {}, "df": 0, "b": {"docs": {}, "df": 0, "c": {"docs": {"shimmer.modules.gw_module.GWModuleBase": {"tf": 1.4142135623730951}, "shimmer.modules.selection.SelectionBase": {"tf": 1.4142135623730951}, "shimmer.modules.losses.GWLossesBase": {"tf": 1.4142135623730951}, "shimmer.modules.vae.VAEEncoder": {"tf": 1.4142135623730951}, "shimmer.modules.vae.VAEDecoder": {"tf": 1.4142135623730951}}, "df": 5}}}}}, "doc": {"root": {"0": {"docs": {"shimmer.types.LatentsDomainGroupT": {"tf": 3}, "shimmer.types.LatentsDomainGroupDT": {"tf": 3}, "shimmer.types.LatentsDomainGroupsT": {"tf": 4}, "shimmer.types.LatentsDomainGroupsDT": {"tf": 4}, "shimmer.modules.gw_module.GWModuleBayesian.fuse": {"tf": 1.4142135623730951}, "shimmer.modules.selection.SelectionBase.forward": {"tf": 2.8284271247461903}, "shimmer.modules.selection.FixedSharedSelection": {"tf": 1}, "shimmer.modules.losses.LossCoefs": {"tf": 1.4142135623730951}, "shimmer.modules.losses.BroadcastLossCoefs": {"tf": 1.4142135623730951}}, "df": 9}, "1": {"docs": {"shimmer.types.LatentsDomainGroupT": {"tf": 1}, "shimmer.types.LatentsDomainGroupDT": {"tf": 1}, "shimmer.types.LatentsDomainGroupsT": {"tf": 1.7320508075688772}, "shimmer.types.LatentsDomainGroupsDT": {"tf": 1.7320508075688772}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian.__init__": {"tf": 1}, "shimmer.modules.gw_module.compute_fusion_scores": {"tf": 1.4142135623730951}, "shimmer.modules.gw_module.GWModuleBayesian.__init__": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBayesian.fuse": {"tf": 2.23606797749979}, "shimmer.modules.selection.SelectionBase.forward": {"tf": 1.4142135623730951}, "shimmer.modules.selection.SingleDomainSelection": {"tf": 1}, "shimmer.modules.losses.contrastive_loss": {"tf": 1.7320508075688772}, "shimmer.modules.losses.contrastive_loss_bayesian": {"tf": 1.7320508075688772}, "shimmer.modules.vae.VAE.__init__": {"tf": 1}, "shimmer.cli.ckpt_migration.migrate_ckpt": {"tf": 1}}, "df": 14, "]": {"docs": {}, "df": 0, "^": {"docs": {}, "df": 0, "{": {"docs": {}, "df": 0, "d": {"docs": {}, "df": 0, "\\": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "s": {"docs": {"shimmer.modules.gw_module.GWModuleBayesian.fuse": {"tf": 1.4142135623730951}}, "df": 1}}}}}}}}}}, "}": {"docs": {}, "df": 0, "{": {"docs": {}, "df": 0, "\\": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "g": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "a": {"docs": {"shimmer.modules.gw_module.GWModuleBayesian.fuse": {"tf": 1}}, "df": 1}}}}}}, "a": {"docs": {"shimmer.modules.gw_module.GWModuleBayesian.fuse": {"tf": 1.7320508075688772}}, "df": 1}}, "^": {"docs": {}, "df": 0, "d": {"docs": {"shimmer.modules.gw_module.GWModuleBayesian.fuse": {"tf": 1.7320508075688772}}, "df": 1}}}, "/": {"3": {"docs": {"shimmer.modules.selection.FixedSharedSelection": {"tf": 1}}, "df": 1}, "docs": {}, "df": 0}}, "2": {"docs": {"shimmer.types.LatentsDomainGroupT": {"tf": 1}, "shimmer.types.LatentsDomainGroupDT": {"tf": 1}, "shimmer.types.LatentsDomainGroupsT": {"tf": 1.4142135623730951}, "shimmer.types.LatentsDomainGroupsDT": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.GlobalWorkspace2Domains": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian.__init__": {"tf": 1}, "shimmer.modules.gw_module.GWDecoder.__init__": {"tf": 1}, "shimmer.modules.gw_module.GWDecoder.n_layers": {"tf": 1}, "shimmer.modules.gw_module.GWEncoder.__init__": {"tf": 1}, "shimmer.modules.gw_module.compute_fusion_scores": {"tf": 1.4142135623730951}, "shimmer.modules.gw_module.GWModuleBayesian.__init__": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBayesian.fuse": {"tf": 2.23606797749979}, "shimmer.modules.selection.SingleDomainSelection": {"tf": 1}, "shimmer.modules.selection.FixedSharedSelection": {"tf": 1}, "shimmer.modules.losses.contrastive_loss": {"tf": 2}, "shimmer.modules.losses.contrastive_loss_bayesian": {"tf": 2}, "shimmer.cli.ckpt_migration.migrate_ckpt": {"tf": 1}}, "df": 19, "}": {"docs": {}, "df": 0, "{": {"docs": {}, "df": 0, "\\": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "u": {"docs": {"shimmer.modules.gw_module.GWModuleBayesian.fuse": {"tf": 1}}, "df": 1}}}, "b": {"docs": {"shimmer.modules.gw_module.GWModuleBayesian.fuse": {"tf": 1.7320508075688772}}, "df": 1}}}}, "3": {"docs": {"shimmer.types.LatentsDomainGroupT": {"tf": 1}, "shimmer.types.LatentsDomainGroupDT": {"tf": 1}, "shimmer.types.LatentsDomainGroupsT": {"tf": 1.4142135623730951}, "shimmer.types.LatentsDomainGroupsDT": {"tf": 1.4142135623730951}, "shimmer.modules.gw_module.GWModuleBayesian.fuse": {"tf": 1}, "shimmer.modules.selection.SelectionBase.forward": {"tf": 1.4142135623730951}, "shimmer.modules.selection.FixedSharedSelection": {"tf": 1}}, "df": 7, "}": {"docs": {}, "df": 0, "{": {"docs": {}, "df": 0, "\\": {"docs": {}, "df": 0, "f": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "{": {"docs": {}, "df": 0, "c": {"docs": {"shimmer.modules.gw_module.GWModuleBayesian.fuse": {"tf": 1}}, "df": 1}}}}}}}}}}, "4": {"docs": {"shimmer.modules.selection.SelectionBase.forward": {"tf": 1.4142135623730951}}, "df": 1}, "5": {"0": {"docs": {"shimmer.modules.selection.SingleDomainSelection": {"tf": 1}}, "df": 1}, "docs": {"shimmer.modules.selection.FixedSharedSelection": {"tf": 1}}, "df": 1}, "6": {"docs": {"shimmer.modules.selection.SelectionBase.forward": {"tf": 1}}, "df": 1}, "8": {"docs": {"shimmer.modules.selection.SelectionBase.forward": {"tf": 1}}, "df": 1}, "9": {"docs": {"shimmer.types.LatentsDomainGroupsT": {"tf": 1}, "shimmer.types.LatentsDomainGroupsDT": {"tf": 1}}, "df": 2}, "docs": {"shimmer.types": {"tf": 1.7320508075688772}, "shimmer.types.RawDomainGroupT": {"tf": 10.816653826391969}, "shimmer.types.RawDomainGroupDT": {"tf": 9.746794344808963}, "shimmer.types.LatentsDomainGroupT": {"tf": 12.24744871391589}, "shimmer.types.LatentsDomainGroupDT": {"tf": 11.357816691600547}, "shimmer.types.RawDomainGroupsT": {"tf": 13.92838827718412}, "shimmer.types.RawDomainGroupsDT": {"tf": 13.92838827718412}, "shimmer.types.LatentsDomainGroupsT": {"tf": 16.822603841260722}, "shimmer.types.LatentsDomainGroupsDT": {"tf": 16.186414056238647}, "shimmer.types.ModelModeT": {"tf": 2.449489742783178}, "shimmer.modules.global_workspace": {"tf": 1.7320508075688772}, "shimmer.modules.global_workspace.SchedulerArgs": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.SchedulerArgs.max_lr": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.SchedulerArgs.total_steps": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.GWPredictionsBase": {"tf": 2}, "shimmer.modules.global_workspace.GWPredictionsBase.states": {"tf": 1.7320508075688772}, "shimmer.modules.global_workspace.GlobalWorkspaceBase": {"tf": 2.449489742783178}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.gw_mod": {"tf": 2.23606797749979}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.selection_mod": {"tf": 2.23606797749979}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.loss_mod": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.optim_lr": {"tf": 1.7320508075688772}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.optim_weight_decay": {"tf": 1.7320508075688772}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.scheduler_args": {"tf": 1.7320508075688772}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.domain_mods": {"tf": 1.7320508075688772}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.workspace_dim": {"tf": 1.7320508075688772}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.encode_and_fuse": {"tf": 6}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.encode": {"tf": 5.291502622129181}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.fuse": {"tf": 5.744562646538029}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.decode": {"tf": 6.164414002968976}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.batch_gw_states": {"tf": 5.196152422706632}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.encode_domain": {"tf": 8.426149773176359}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.encode_domains": {"tf": 5.291502622129181}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.decode_domain": {"tf": 8.426149773176359}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.decode_domains": {"tf": 5.291502622129181}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.generic_step": {"tf": 6.48074069840786}, "shimmer.modules.global_workspace.freeze_domain_modules": {"tf": 6.164414002968976}, "shimmer.modules.global_workspace.GWPredictions": {"tf": 2}, "shimmer.modules.global_workspace.GWPredictions.demi_cycles": {"tf": 1.7320508075688772}, "shimmer.modules.global_workspace.GWPredictions.cycles": {"tf": 1.7320508075688772}, "shimmer.modules.global_workspace.GWPredictions.translations": {"tf": 2.449489742783178}, "shimmer.modules.global_workspace.GWPredictions.states": {"tf": 1.7320508075688772}, "shimmer.modules.global_workspace.GlobalWorkspace2Domains": {"tf": 3.1622776601683795}, "shimmer.modules.global_workspace.GlobalWorkspace2Domains.__init__": {"tf": 9.695359714832659}, "shimmer.modules.global_workspace.GlobalWorkspace2Domains.forward": {"tf": 5.291502622129181}, "shimmer.modules.global_workspace.GlobalWorkspace": {"tf": 3.1622776601683795}, "shimmer.modules.global_workspace.GlobalWorkspace.__init__": {"tf": 10.14889156509222}, "shimmer.modules.global_workspace.GlobalWorkspace.forward": {"tf": 5.291502622129181}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian": {"tf": 3.1622776601683795}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian.__init__": {"tf": 11.045361017187261}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian.forward": {"tf": 5.291502622129181}, "shimmer.modules.global_workspace.pretrained_global_workspace": {"tf": 10.535653752852738}, "shimmer.modules.domain": {"tf": 1.7320508075688772}, "shimmer.modules.domain.LossOutput": {"tf": 2.6457513110645907}, "shimmer.modules.domain.LossOutput.__init__": {"tf": 1.7320508075688772}, "shimmer.modules.domain.LossOutput.loss": {"tf": 1.7320508075688772}, "shimmer.modules.domain.LossOutput.metrics": {"tf": 1.7320508075688772}, "shimmer.modules.domain.LossOutput.all": {"tf": 1.7320508075688772}, "shimmer.modules.domain.DomainModule": {"tf": 1.7320508075688772}, "shimmer.modules.domain.DomainModule.__init__": {"tf": 4}, "shimmer.modules.domain.DomainModule.latent_dim": {"tf": 1.7320508075688772}, "shimmer.modules.domain.DomainModule.encode": {"tf": 5.291502622129181}, "shimmer.modules.domain.DomainModule.decode": {"tf": 5.291502622129181}, "shimmer.modules.domain.DomainModule.compute_loss": {"tf": 5.830951894845301}, "shimmer.modules.domain.DomainModule.compute_dcy_loss": {"tf": 5.830951894845301}, "shimmer.modules.domain.DomainModule.compute_cy_loss": {"tf": 5.830951894845301}, "shimmer.modules.domain.DomainModule.compute_tr_loss": {"tf": 5.830951894845301}, "shimmer.modules.domain.DomainModule.compute_broadcast_loss": {"tf": 5.830951894845301}, "shimmer.modules.gw_module": {"tf": 1.7320508075688772}, "shimmer.modules.gw_module.get_n_layers": {"tf": 6.324555320336759}, "shimmer.modules.gw_module.GWDecoder": {"tf": 1.7320508075688772}, "shimmer.modules.gw_module.GWDecoder.__init__": {"tf": 6.4031242374328485}, "shimmer.modules.gw_module.GWDecoder.in_dim": {"tf": 1.4142135623730951}, "shimmer.modules.gw_module.GWDecoder.hidden_dim": {"tf": 1.4142135623730951}, "shimmer.modules.gw_module.GWDecoder.out_dim": {"tf": 1.4142135623730951}, "shimmer.modules.gw_module.GWDecoder.n_layers": {"tf": 2.449489742783178}, "shimmer.modules.gw_module.GWEncoder": {"tf": 2.449489742783178}, "shimmer.modules.gw_module.GWEncoder.__init__": {"tf": 6.4031242374328485}, "shimmer.modules.gw_module.GWEncoder.forward": {"tf": 3.872983346207417}, "shimmer.modules.gw_module.GWEncoderLinear": {"tf": 1.7320508075688772}, "shimmer.modules.gw_module.GWEncoderLinear.forward": {"tf": 3.872983346207417}, "shimmer.modules.gw_module.GWModuleBase": {"tf": 3.7416573867739413}, "shimmer.modules.gw_module.GWModuleBase.__init__": {"tf": 5}, "shimmer.modules.gw_module.GWModuleBase.domain_mods": {"tf": 1.7320508075688772}, "shimmer.modules.gw_module.GWModuleBase.workspace_dim": {"tf": 1.4142135623730951}, "shimmer.modules.gw_module.GWModuleBase.fuse": {"tf": 6}, "shimmer.modules.gw_module.GWModuleBase.encode": {"tf": 5.0990195135927845}, "shimmer.modules.gw_module.GWModuleBase.encode_and_fuse": {"tf": 5.916079783099616}, "shimmer.modules.gw_module.GWModuleBase.decode": {"tf": 6.164414002968976}, "shimmer.modules.gw_module.GWModule": {"tf": 2.23606797749979}, "shimmer.modules.gw_module.GWModule.__init__": {"tf": 6.4031242374328485}, "shimmer.modules.gw_module.GWModule.gw_encoders": {"tf": 1.4142135623730951}, "shimmer.modules.gw_module.GWModule.gw_decoders": {"tf": 1.4142135623730951}, "shimmer.modules.gw_module.GWModule.fuse": {"tf": 6}, "shimmer.modules.gw_module.GWModule.encode": {"tf": 5.196152422706632}, "shimmer.modules.gw_module.GWModule.decode": {"tf": 6.082762530298219}, "shimmer.modules.gw_module.compute_fusion_scores": {"tf": 7.681145747868608}, "shimmer.modules.gw_module.GWModuleBayesian": {"tf": 2.23606797749979}, "shimmer.modules.gw_module.GWModuleBayesian.__init__": {"tf": 7.874007874011811}, "shimmer.modules.gw_module.GWModuleBayesian.precisions": {"tf": 1.7320508075688772}, "shimmer.modules.gw_module.GWModuleBayesian.sensitivity_selection": {"tf": 1.7320508075688772}, "shimmer.modules.gw_module.GWModuleBayesian.sensitivity_precision": {"tf": 1.7320508075688772}, "shimmer.modules.gw_module.GWModuleBayesian.precision_softmax_temp": {"tf": 1.7320508075688772}, "shimmer.modules.gw_module.GWModuleBayesian.get_precision": {"tf": 5.744562646538029}, "shimmer.modules.gw_module.GWModuleBayesian.fuse": {"tf": 8.717797887081348}, "shimmer.modules.selection": {"tf": 1.7320508075688772}, "shimmer.modules.selection.SelectionBase": {"tf": 2.23606797749979}, "shimmer.modules.selection.SelectionBase.update_gw_state": {"tf": 4.358898943540674}, "shimmer.modules.selection.SelectionBase.forward": {"tf": 11.269427669584644}, "shimmer.modules.selection.SingleDomainSelection": {"tf": 2.449489742783178}, "shimmer.modules.selection.SingleDomainSelection.forward": {"tf": 5.830951894845301}, "shimmer.modules.selection.FixedSharedSelection": {"tf": 2.449489742783178}, "shimmer.modules.selection.FixedSharedSelection.forward": {"tf": 5.830951894845301}, "shimmer.modules.selection.KQFixedQSelection": {"tf": 1.7320508075688772}, "shimmer.modules.selection.KQFixedQSelection.__init__": {"tf": 5.385164807134504}, "shimmer.modules.selection.KQFixedQSelection.head_size": {"tf": 1.7320508075688772}, "shimmer.modules.selection.KQFixedQSelection.query_layer": {"tf": 1.7320508075688772}, "shimmer.modules.selection.KQFixedQSelection.key_layers": {"tf": 1.7320508075688772}, "shimmer.modules.selection.KQFixedQSelection.forward": {"tf": 6}, "shimmer.modules.selection.RandomSelection": {"tf": 1.7320508075688772}, "shimmer.modules.selection.RandomSelection.__init__": {"tf": 3.7416573867739413}, "shimmer.modules.selection.RandomSelection.temperature": {"tf": 1.7320508075688772}, "shimmer.modules.selection.RandomSelection.forward": {"tf": 5.291502622129181}, "shimmer.modules.selection.DynamicQueryAttention": {"tf": 1.7320508075688772}, "shimmer.modules.selection.DynamicQueryAttention.__init__": {"tf": 5.385164807134504}, "shimmer.modules.selection.DynamicQueryAttention.head_size": {"tf": 1.7320508075688772}, "shimmer.modules.selection.DynamicQueryAttention.query_layer": {"tf": 1.7320508075688772}, "shimmer.modules.selection.DynamicQueryAttention.key_layers": {"tf": 1.7320508075688772}, "shimmer.modules.selection.DynamicQueryAttention.fuse_weighted_encodings": {"tf": 5.916079783099616}, "shimmer.modules.selection.DynamicQueryAttention.forward": {"tf": 6}, "shimmer.modules.losses": {"tf": 1.7320508075688772}, "shimmer.modules.losses.GWLossesBase": {"tf": 1.7320508075688772}, "shimmer.modules.losses.GWLossesBase.step": {"tf": 5.830951894845301}, "shimmer.modules.losses.demi_cycle_loss": {"tf": 8.774964387392123}, "shimmer.modules.losses.cycle_loss": {"tf": 8.774964387392123}, "shimmer.modules.losses.translation_loss": {"tf": 8.366600265340756}, "shimmer.modules.losses.contrastive_loss": {"tf": 8.366600265340756}, "shimmer.modules.losses.contrastive_loss_bayesian": {"tf": 8.366600265340756}, "shimmer.modules.losses.LossCoefs": {"tf": 2.449489742783178}, "shimmer.modules.losses.LossCoefs.demi_cycles": {"tf": 1.7320508075688772}, "shimmer.modules.losses.LossCoefs.cycles": {"tf": 1.7320508075688772}, "shimmer.modules.losses.LossCoefs.translations": {"tf": 1.7320508075688772}, "shimmer.modules.losses.LossCoefs.contrastives": {"tf": 1.7320508075688772}, "shimmer.modules.losses.GWLosses2Domains": {"tf": 2.6457513110645907}, "shimmer.modules.losses.GWLosses2Domains.__init__": {"tf": 6.6332495807108}, "shimmer.modules.losses.GWLosses2Domains.gw_mod": {"tf": 1.7320508075688772}, "shimmer.modules.losses.GWLosses2Domains.selection_mod": {"tf": 1.7320508075688772}, "shimmer.modules.losses.GWLosses2Domains.domain_mods": {"tf": 1.7320508075688772}, "shimmer.modules.losses.GWLosses2Domains.loss_coefs": {"tf": 1.7320508075688772}, "shimmer.modules.losses.GWLosses2Domains.contrastive_fn": {"tf": 1.7320508075688772}, "shimmer.modules.losses.GWLosses2Domains.demi_cycle_loss": {"tf": 5.656854249492381}, "shimmer.modules.losses.GWLosses2Domains.cycle_loss": {"tf": 5.656854249492381}, "shimmer.modules.losses.GWLosses2Domains.translation_loss": {"tf": 5.656854249492381}, "shimmer.modules.losses.GWLosses2Domains.contrastive_loss": {"tf": 5.656854249492381}, "shimmer.modules.losses.GWLosses2Domains.step": {"tf": 7.874007874011811}, "shimmer.modules.losses.generate_partitions": {"tf": 5.5677643628300215}, "shimmer.modules.losses.broadcast_loss": {"tf": 6.6332495807108}, "shimmer.modules.losses.BroadcastLossCoefs": {"tf": 2.449489742783178}, "shimmer.modules.losses.BroadcastLossCoefs.contrastives": {"tf": 1.7320508075688772}, "shimmer.modules.losses.BroadcastLossCoefs.fused": {"tf": 1.7320508075688772}, "shimmer.modules.losses.BroadcastLossCoefs.demi_cycles": {"tf": 1.4142135623730951}, "shimmer.modules.losses.BroadcastLossCoefs.cycles": {"tf": 1.4142135623730951}, "shimmer.modules.losses.BroadcastLossCoefs.translations": {"tf": 1.7320508075688772}, "shimmer.modules.losses.GWLosses": {"tf": 2.23606797749979}, "shimmer.modules.losses.GWLosses.__init__": {"tf": 6}, "shimmer.modules.losses.GWLosses.gw_mod": {"tf": 1.7320508075688772}, "shimmer.modules.losses.GWLosses.selection_mod": {"tf": 1.7320508075688772}, "shimmer.modules.losses.GWLosses.domain_mods": {"tf": 1.7320508075688772}, "shimmer.modules.losses.GWLosses.loss_coefs": {"tf": 1.7320508075688772}, "shimmer.modules.losses.GWLosses.contrastive_fn": {"tf": 1.7320508075688772}, "shimmer.modules.losses.GWLosses.contrastive_loss": {"tf": 4.795831523312719}, "shimmer.modules.losses.GWLosses.broadcast_loss": {"tf": 1.7320508075688772}, "shimmer.modules.losses.GWLosses.step": {"tf": 5.291502622129181}, "shimmer.modules.losses.GWLossesBayesian": {"tf": 2.6457513110645907}, "shimmer.modules.losses.GWLossesBayesian.__init__": {"tf": 7.0710678118654755}, "shimmer.modules.losses.GWLossesBayesian.gw_mod": {"tf": 1.7320508075688772}, "shimmer.modules.losses.GWLossesBayesian.selection_mod": {"tf": 1.4142135623730951}, "shimmer.modules.losses.GWLossesBayesian.domain_mods": {"tf": 1.7320508075688772}, "shimmer.modules.losses.GWLossesBayesian.loss_coefs": {"tf": 1.7320508075688772}, "shimmer.modules.losses.GWLossesBayesian.contrastive_fn": {"tf": 1.7320508075688772}, "shimmer.modules.losses.GWLossesBayesian.use_normalized_constrastive": {"tf": 1.7320508075688772}, "shimmer.modules.losses.GWLossesBayesian.contrastive_loss": {"tf": 5.196152422706632}, "shimmer.modules.losses.GWLossesBayesian.broadcast_loss": {"tf": 1.7320508075688772}, "shimmer.modules.losses.GWLossesBayesian.step": {"tf": 5.291502622129181}, "shimmer.modules.contrastive_loss": {"tf": 1.4142135623730951}, "shimmer.modules.contrastive_loss.ContrastiveLossType": {"tf": 2.449489742783178}, "shimmer.modules.contrastive_loss.ContrastiveLossBayesianType": {"tf": 2.449489742783178}, "shimmer.modules.contrastive_loss.info_nce": {"tf": 6.244997998398398}, "shimmer.modules.contrastive_loss.contrastive_loss": {"tf": 6.244997998398398}, "shimmer.modules.contrastive_loss.ContrastiveLoss": {"tf": 1.7320508075688772}, "shimmer.modules.contrastive_loss.ContrastiveLoss.__init__": {"tf": 6.48074069840786}, "shimmer.modules.contrastive_loss.ContrastiveLoss.learn_logit_scale": {"tf": 1.7320508075688772}, "shimmer.modules.contrastive_loss.ContrastiveLoss.reduction": {"tf": 1.7320508075688772}, "shimmer.modules.contrastive_loss.ContrastiveLoss.forward": {"tf": 5.830951894845301}, "shimmer.dataset": {"tf": 1.7320508075688772}, "shimmer.dataset.RepeatedDataset": {"tf": 2.23606797749979}, "shimmer.dataset.RepeatedDataset.__init__": {"tf": 5.196152422706632}, "shimmer.dataset.RepeatedDataset.dataset": {"tf": 1.7320508075688772}, "shimmer.dataset.RepeatedDataset.dataset_size": {"tf": 1.7320508075688772}, "shimmer.modules.vae": {"tf": 1.7320508075688772}, "shimmer.modules.vae.reparameterize": {"tf": 5.744562646538029}, "shimmer.modules.vae.kl_divergence_loss": {"tf": 5.744562646538029}, "shimmer.modules.vae.gaussian_nll": {"tf": 6.324555320336759}, "shimmer.modules.vae.VAEEncoder": {"tf": 1.7320508075688772}, "shimmer.modules.vae.VAEEncoder.forward": {"tf": 5.0990195135927845}, "shimmer.modules.vae.VAEDecoder": {"tf": 1.7320508075688772}, "shimmer.modules.vae.VAEDecoder.forward": {"tf": 5}, "shimmer.modules.vae.VAE": {"tf": 1.4142135623730951}, "shimmer.modules.vae.VAE.__init__": {"tf": 5.5677643628300215}, "shimmer.modules.vae.VAE.beta": {"tf": 1.4142135623730951}, "shimmer.modules.vae.VAE.encoder": {"tf": 1.4142135623730951}, "shimmer.modules.vae.VAE.decoder": {"tf": 1.4142135623730951}, "shimmer.modules.vae.VAE.encode": {"tf": 5.196152422706632}, "shimmer.modules.vae.VAE.decode": {"tf": 5.291502622129181}, "shimmer.modules.vae.VAE.forward": {"tf": 5.196152422706632}, "shimmer.modules.utils": {"tf": 1.7320508075688772}, "shimmer.modules.utils.translation": {"tf": 6.928203230275509}, "shimmer.modules.utils.cycle": {"tf": 7.3484692283495345}, "shimmer.modules.utils.batch_demi_cycles": {"tf": 6.4031242374328485}, "shimmer.modules.utils.batch_cycles": {"tf": 7}, "shimmer.modules.utils.batch_translations": {"tf": 6.4031242374328485}, "shimmer.utils": {"tf": 1.7320508075688772}, "shimmer.utils.MIGRATION_DIR": {"tf": 1.7320508075688772}, "shimmer.utils.group_batch_size": {"tf": 1.7320508075688772}, "shimmer.utils.groups_batch_size": {"tf": 5.0990195135927845}, "shimmer.utils.groups_device": {"tf": 5.0990195135927845}, "shimmer.utils.group_device": {"tf": 1.7320508075688772}, "shimmer.utils.migrate_model": {"tf": 4.898979485566356}, "shimmer.utils.SaveMigrations": {"tf": 2.23606797749979}, "shimmer.utils.SaveMigrations.migrations": {"tf": 1.7320508075688772}, "shimmer.utils.SaveMigrations.on_save_checkpoint": {"tf": 5.291502622129181}, "shimmer.cli.ckpt_migration": {"tf": 1.7320508075688772}, "shimmer.cli.ckpt_migration.migrate_ckpt": {"tf": 5.744562646538029}}, "df": 232, "m": {"docs": {"shimmer.modules.gw_module.GWModuleBayesian.fuse": {"tf": 2.23606797749979}}, "df": 1, "a": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "h": {"docs": {"shimmer.modules.selection.KQFixedQSelection.forward": {"tf": 1}, "shimmer.modules.selection.DynamicQueryAttention.forward": {"tf": 1}}, "df": 2, "e": {"docs": {}, "df": 0, "d": {"docs": {"shimmer.types.RawDomainGroupT": {"tf": 1.4142135623730951}, "shimmer.types.RawDomainGroupDT": {"tf": 1}, "shimmer.types.LatentsDomainGroupT": {"tf": 1}, "shimmer.types.LatentsDomainGroupDT": {"tf": 1}, "shimmer.types.RawDomainGroupsT": {"tf": 1}, "shimmer.types.RawDomainGroupsDT": {"tf": 1}, "shimmer.types.LatentsDomainGroupsT": {"tf": 1}, "shimmer.types.LatentsDomainGroupsDT": {"tf": 1}}, "df": 8}}}}}, "p": {"docs": {}, "df": 0, "p": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "g": {"docs": {"shimmer.types.RawDomainGroupT": {"tf": 1.7320508075688772}, "shimmer.types.RawDomainGroupDT": {"tf": 1}, "shimmer.types.LatentsDomainGroupT": {"tf": 1.4142135623730951}, "shimmer.types.RawDomainGroupsT": {"tf": 1}, "shimmer.types.RawDomainGroupsDT": {"tf": 1}, "shimmer.types.LatentsDomainGroupsT": {"tf": 1.4142135623730951}, "shimmer.types.LatentsDomainGroupsDT": {"tf": 1}, "shimmer.modules.global_workspace.freeze_domain_modules": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace2Domains.__init__": {"tf": 1.7320508075688772}, "shimmer.modules.global_workspace.GlobalWorkspace.__init__": {"tf": 1.7320508075688772}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian.__init__": {"tf": 1.7320508075688772}, "shimmer.modules.global_workspace.pretrained_global_workspace": {"tf": 1.7320508075688772}, "shimmer.modules.gw_module.GWModule.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.gw_module.GWModuleBayesian.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.losses.GWLosses2Domains.__init__": {"tf": 1}, "shimmer.modules.losses.GWLosses.__init__": {"tf": 1}}, "df": 16, "s": {"docs": {"shimmer.types.RawDomainGroupT": {"tf": 1}, "shimmer.types.LatentsDomainGroupT": {"tf": 1}, "shimmer.types.LatentsDomainGroupsT": {"tf": 1}}, "df": 3}, "[": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "r": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspaceBase.encode_and_fuse": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.fuse": {"tf": 1}, "shimmer.modules.global_workspace.freeze_domain_modules": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace2Domains.__init__": {"tf": 1.7320508075688772}, "shimmer.modules.global_workspace.GlobalWorkspace.__init__": {"tf": 1.7320508075688772}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian.__init__": {"tf": 1.7320508075688772}, "shimmer.modules.global_workspace.pretrained_global_workspace": {"tf": 1.7320508075688772}, "shimmer.modules.gw_module.GWModuleBase.__init__": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBase.fuse": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBase.encode_and_fuse": {"tf": 1}, "shimmer.modules.gw_module.GWModule.__init__": {"tf": 1.7320508075688772}, "shimmer.modules.gw_module.GWModule.fuse": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBayesian.__init__": {"tf": 1.7320508075688772}, "shimmer.modules.gw_module.GWModuleBayesian.fuse": {"tf": 1}, "shimmer.modules.losses.demi_cycle_loss": {"tf": 1}, "shimmer.modules.losses.cycle_loss": {"tf": 1}, "shimmer.modules.losses.translation_loss": {"tf": 1}, "shimmer.modules.losses.broadcast_loss": {"tf": 1}}, "df": 18}}}, "f": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "z": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "[": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "r": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspaceBase.fuse": {"tf": 1}}, "df": 1}}}}}}}}}}}}}}}}}}}, "x": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspace2Domains": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian": {"tf": 1}}, "df": 2, "i": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "m": {"docs": {"shimmer.modules.global_workspace.SchedulerArgs.max_lr": {"tf": 1}}, "df": 1}}}}}, "k": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "s": {"docs": {"shimmer.modules.gw_module.get_n_layers": {"tf": 1}}, "df": 1}}}, "y": {"docs": {"shimmer.modules.selection.SelectionBase.update_gw_state": {"tf": 1}}, "df": 1}, "i": {"docs": {}, "df": 0, "n": {"docs": {"shimmer.modules.losses.GWLosses2Domains.__init__": {"tf": 1}}, "df": 1}}, "n": {"docs": {}, "df": 0, "y": {"docs": {"shimmer.modules.losses.BroadcastLossCoefs.cycles": {"tf": 1}, "shimmer.modules.losses.BroadcastLossCoefs.translations": {"tf": 1}}, "df": 2}}}, "u": {"docs": {"shimmer.modules.gw_module.GWModuleBayesian.fuse": {"tf": 1}, "shimmer.modules.vae.gaussian_nll": {"tf": 1}}, "df": 2, "l": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "p": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "e": {"docs": {"shimmer.types.RawDomainGroupT": {"tf": 1}, "shimmer.types.RawDomainGroupDT": {"tf": 1}, "shimmer.types.LatentsDomainGroupT": {"tf": 1}, "shimmer.types.LatentsDomainGroupDT": {"tf": 1}, "shimmer.modules.gw_module.GWModule.decode": {"tf": 1}, "shimmer.modules.selection.SingleDomainSelection": {"tf": 1}, "shimmer.modules.losses.demi_cycle_loss": {"tf": 1}, "shimmer.modules.losses.cycle_loss": {"tf": 1}, "shimmer.modules.losses.translation_loss": {"tf": 1}, "shimmer.modules.losses.contrastive_loss": {"tf": 1}, "shimmer.modules.losses.contrastive_loss_bayesian": {"tf": 1}, "shimmer.modules.losses.BroadcastLossCoefs.fused": {"tf": 1}, "shimmer.modules.utils.translation": {"tf": 1}}, "df": 13}}}}}}}, "o": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "e": {"docs": {"shimmer.types.RawDomainGroupT": {"tf": 1}, "shimmer.types.LatentsDomainGroupT": {"tf": 1}, "shimmer.types.LatentsDomainGroupsT": {"tf": 1}, "shimmer.modules.global_workspace.GWPredictions.cycles": {"tf": 1}, "shimmer.modules.global_workspace.GWPredictions.translations": {"tf": 1}}, "df": 5}}, "d": {"docs": {"shimmer.modules.losses.demi_cycle_loss": {"tf": 2}, "shimmer.modules.losses.cycle_loss": {"tf": 2}, "shimmer.modules.losses.translation_loss": {"tf": 1.4142135623730951}, "shimmer.modules.losses.contrastive_loss": {"tf": 1.4142135623730951}, "shimmer.modules.losses.contrastive_loss_bayesian": {"tf": 1.4142135623730951}, "shimmer.modules.losses.GWLosses2Domains.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.losses.broadcast_loss": {"tf": 1.7320508075688772}, "shimmer.modules.losses.GWLosses.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.losses.GWLossesBayesian.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.utils.translation": {"tf": 1}, "shimmer.modules.utils.cycle": {"tf": 1}, "shimmer.modules.utils.batch_demi_cycles": {"tf": 1.4142135623730951}, "shimmer.modules.utils.batch_cycles": {"tf": 1.4142135623730951}, "shimmer.modules.utils.batch_translations": {"tf": 1.4142135623730951}}, "df": 14, "e": {"docs": {"shimmer.types.ModelModeT": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.generic_step": {"tf": 1}, "shimmer.modules.global_workspace.freeze_domain_modules": {"tf": 1}, "shimmer.modules.losses.GWLossesBase.step": {"tf": 1.4142135623730951}, "shimmer.modules.losses.GWLosses2Domains.step": {"tf": 1.4142135623730951}, "shimmer.modules.losses.GWLosses.step": {"tf": 1.4142135623730951}, "shimmer.modules.losses.GWLossesBayesian.step": {"tf": 1.4142135623730951}}, "df": 7, "l": {"docs": {"shimmer.modules.global_workspace.GWPredictions.demi_cycles": {"tf": 1}, "shimmer.modules.global_workspace.GWPredictions.cycles": {"tf": 1}, "shimmer.modules.global_workspace.GWPredictions.translations": {"tf": 1}, "shimmer.modules.domain.DomainModule.compute_loss": {"tf": 1}, "shimmer.modules.domain.DomainModule.compute_dcy_loss": {"tf": 1}, "shimmer.modules.domain.DomainModule.compute_cy_loss": {"tf": 1}, "shimmer.modules.domain.DomainModule.compute_tr_loss": {"tf": 1}, "shimmer.modules.domain.DomainModule.compute_broadcast_loss": {"tf": 1}, "shimmer.modules.losses.GWLossesBase.step": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.step": {"tf": 1}, "shimmer.modules.losses.GWLosses.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.losses.GWLosses.step": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.step": {"tf": 1}, "shimmer.utils.migrate_model": {"tf": 1}, "shimmer.cli.ckpt_migration.migrate_ckpt": {"tf": 1}}, "df": 15, "m": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "d": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "t": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspaceBase.generic_step": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.step": {"tf": 1}}, "df": 2}}}}}, "s": {"docs": {"shimmer.modules.losses.GWLosses": {"tf": 1}}, "df": 1}}}, "u": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "e": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspaceBase": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.loss_mod": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace2Domains.__init__": {"tf": 2}, "shimmer.modules.global_workspace.GlobalWorkspace.__init__": {"tf": 2.23606797749979}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian.__init__": {"tf": 2}, "shimmer.modules.global_workspace.pretrained_global_workspace": {"tf": 2}, "shimmer.modules.domain.DomainModule.__init__": {"tf": 1}, "shimmer.modules.domain.DomainModule.latent_dim": {"tf": 1}, "shimmer.modules.gw_module.get_n_layers": {"tf": 1}, "shimmer.modules.gw_module.GWEncoder.forward": {"tf": 1}, "shimmer.modules.gw_module.GWEncoderLinear.forward": {"tf": 1}, "shimmer.modules.gw_module.GWModule": {"tf": 1}, "shimmer.modules.gw_module.GWModule.__init__": {"tf": 2}, "shimmer.modules.gw_module.GWModule.gw_encoders": {"tf": 1}, "shimmer.modules.gw_module.GWModule.gw_decoders": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBayesian.__init__": {"tf": 2}, "shimmer.modules.selection.SingleDomainSelection.forward": {"tf": 1}, "shimmer.modules.selection.FixedSharedSelection.forward": {"tf": 1}, "shimmer.modules.losses.GWLossesBase": {"tf": 1}, "shimmer.modules.losses.demi_cycle_loss": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.losses.broadcast_loss": {"tf": 1}, "shimmer.modules.losses.GWLosses.__init__": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.losses.GWLossesBayesian.selection_mod": {"tf": 1}, "shimmer.modules.contrastive_loss.ContrastiveLoss": {"tf": 1}, "shimmer.modules.vae.VAE": {"tf": 1}, "shimmer.modules.utils.translation": {"tf": 1.4142135623730951}, "shimmer.modules.utils.cycle": {"tf": 1.4142135623730951}, "shimmer.modules.utils.batch_demi_cycles": {"tf": 1}, "shimmer.modules.utils.batch_cycles": {"tf": 1}, "shimmer.modules.utils.batch_translations": {"tf": 1}, "shimmer.utils.SaveMigrations.on_save_checkpoint": {"tf": 1}}, "df": 33, "s": {"docs": {"shimmer.modules.global_workspace.freeze_domain_modules": {"tf": 1.7320508075688772}, "shimmer.modules.domain.DomainModule": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBase.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.gw_module.GWModuleBase.domain_mods": {"tf": 1}, "shimmer.modules.gw_module.GWModule.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.gw_module.GWModuleBayesian.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.selection.SelectionBase": {"tf": 1}, "shimmer.modules.losses.demi_cycle_loss": {"tf": 1.7320508075688772}, "shimmer.modules.losses.cycle_loss": {"tf": 1.4142135623730951}, "shimmer.modules.losses.translation_loss": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.demi_cycle_loss": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.cycle_loss": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.translation_loss": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.contrastive_loss": {"tf": 1}, "shimmer.modules.losses.broadcast_loss": {"tf": 1.7320508075688772}, "shimmer.modules.losses.GWLossesBayesian.domain_mods": {"tf": 1}}, "df": 16}, "d": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "t": {"docs": {"shimmer.modules.global_workspace.freeze_domain_modules": {"tf": 1.4142135623730951}}, "df": 1}}}}}}}, "s": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspaceBase.encode_domain": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.decode_domain": {"tf": 1}, "shimmer.modules.global_workspace.freeze_domain_modules": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace2Domains.__init__": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace.__init__": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian.__init__": {"tf": 1}, "shimmer.modules.global_workspace.pretrained_global_workspace": {"tf": 1}, "shimmer.modules.losses.demi_cycle_loss": {"tf": 1}, "shimmer.modules.losses.cycle_loss": {"tf": 1}, "shimmer.modules.losses.translation_loss": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.__init__": {"tf": 1}, "shimmer.modules.losses.broadcast_loss": {"tf": 1}, "shimmer.modules.losses.GWLosses.__init__": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.__init__": {"tf": 1}}, "df": 14}, "a": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "y": {"docs": {"shimmer.modules.domain.DomainModule.compute_loss": {"tf": 1}}, "df": 1}, "i": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "s": {"docs": {"shimmer.modules.selection.RandomSelection": {"tf": 1}, "shimmer.modules.losses.generate_partitions": {"tf": 1}}, "df": 2}}}}}}}, "i": {"docs": {}, "df": 0, "f": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "d": {"docs": {"shimmer.modules.selection.RandomSelection": {"tf": 1}}, "df": 1}}}}}}}, "e": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "h": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "d": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspaceBase.encode_domain": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.decode_domain": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace2Domains": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian": {"tf": 1}, "shimmer.modules.selection.SelectionBase.update_gw_state": {"tf": 1}, "shimmer.modules.selection.SelectionBase.forward": {"tf": 1}}, "df": 7, "s": {"docs": {"shimmer.modules.gw_module.GWModuleBase.encode_and_fuse": {"tf": 1}}, "df": 1}}}}, "r": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "c": {"docs": {"shimmer.modules.losses.demi_cycle_loss": {"tf": 1}, "shimmer.modules.losses.cycle_loss": {"tf": 1}, "shimmer.modules.losses.translation_loss": {"tf": 1}, "shimmer.modules.losses.contrastive_loss": {"tf": 1}, "shimmer.modules.losses.contrastive_loss_bayesian": {"tf": 1}, "shimmer.modules.contrastive_loss.ContrastiveLoss.forward": {"tf": 1}}, "df": 6, "s": {"docs": {"shimmer.modules.domain.LossOutput": {"tf": 1}, "shimmer.modules.domain.LossOutput.metrics": {"tf": 1}, "shimmer.modules.domain.LossOutput.all": {"tf": 1}, "shimmer.modules.domain.DomainModule.compute_loss": {"tf": 1}, "shimmer.modules.domain.DomainModule.compute_dcy_loss": {"tf": 1}, "shimmer.modules.domain.DomainModule.compute_cy_loss": {"tf": 1}, "shimmer.modules.domain.DomainModule.compute_tr_loss": {"tf": 1}, "shimmer.modules.domain.DomainModule.compute_broadcast_loss": {"tf": 1}, "shimmer.modules.losses.demi_cycle_loss": {"tf": 1.7320508075688772}, "shimmer.modules.losses.cycle_loss": {"tf": 1.7320508075688772}, "shimmer.modules.losses.translation_loss": {"tf": 1.7320508075688772}, "shimmer.modules.losses.contrastive_loss": {"tf": 1.7320508075688772}, "shimmer.modules.losses.contrastive_loss_bayesian": {"tf": 1.7320508075688772}, "shimmer.modules.losses.GWLosses2Domains.demi_cycle_loss": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.cycle_loss": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.translation_loss": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.contrastive_loss": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.step": {"tf": 2}, "shimmer.modules.losses.broadcast_loss": {"tf": 1}, "shimmer.modules.losses.GWLosses.contrastive_loss": {"tf": 1}, "shimmer.modules.losses.GWLosses.step": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.contrastive_loss": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.step": {"tf": 1}}, "df": 23}}}}}, "r": {"docs": {}, "df": 0, "g": {"docs": {}, "df": 0, "e": {"docs": {"shimmer.modules.gw_module.GWModuleBase.fuse": {"tf": 1}, "shimmer.modules.gw_module.GWModule.fuse": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBayesian.fuse": {"tf": 1.4142135623730951}}, "df": 3, "d": {"docs": {"shimmer.modules.gw_module.GWModuleBase.fuse": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBase.encode_and_fuse": {"tf": 1}, "shimmer.modules.gw_module.GWModule.fuse": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBayesian.fuse": {"tf": 1}}, "df": 4}}}}, "c": {"docs": {}, "df": 0, "h": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "m": {"docs": {"shimmer.modules.selection.SelectionBase": {"tf": 1}, "shimmer.modules.selection.SingleDomainSelection": {"tf": 1}, "shimmer.modules.selection.FixedSharedSelection": {"tf": 1}, "shimmer.modules.losses.GWLosses.__init__": {"tf": 1}}, "df": 4, "s": {"docs": {"shimmer.modules.selection.SelectionBase": {"tf": 1}}, "df": 1}}}}}}}}, "a": {"docs": {}, "df": 0, "n": {"docs": {"shimmer.modules.contrastive_loss.ContrastiveLossBayesianType": {"tf": 1.4142135623730951}, "shimmer.modules.contrastive_loss.info_nce": {"tf": 1}, "shimmer.modules.contrastive_loss.contrastive_loss": {"tf": 1}, "shimmer.modules.contrastive_loss.ContrastiveLoss.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.vae.reparameterize": {"tf": 1}, "shimmer.modules.vae.kl_divergence_loss": {"tf": 1}, "shimmer.modules.vae.VAEEncoder.forward": {"tf": 1}, "shimmer.modules.vae.VAE.encode": {"tf": 1.4142135623730951}, "shimmer.modules.vae.VAE.forward": {"tf": 1}}, "df": 9, "s": {"docs": {"shimmer.modules.vae.reparameterize": {"tf": 1}, "shimmer.modules.vae.kl_divergence_loss": {"tf": 1}}, "df": 2}}}}, "i": {"docs": {}, "df": 0, "n": {"docs": {"shimmer.dataset.RepeatedDataset": {"tf": 2}, "shimmer.dataset.RepeatedDataset.__init__": {"tf": 1}}, "df": 2, "i": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "m": {"docs": {"shimmer.dataset.RepeatedDataset.__init__": {"tf": 1}}, "df": 1}}}}}, "g": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "e": {"docs": {"shimmer.cli.ckpt_migration.migrate_ckpt": {"tf": 1.7320508075688772}}, "df": 1, "s": {"docs": {"shimmer.utils.migrate_model": {"tf": 1}}, "df": 1}, "d": {"docs": {"shimmer.utils.migrate_model": {"tf": 1}}, "df": 1}}, "i": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "n": {"docs": {"shimmer.utils.migrate_model": {"tf": 1}}, "df": 1}}}}}}, "h": {"docs": {}, "df": 0, "t": {"docs": {"shimmer.utils.SaveMigrations.on_save_checkpoint": {"tf": 1}}, "df": 1}}}}}, "r": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "w": {"docs": {"shimmer.types.RawDomainGroupT": {"tf": 1}, "shimmer.types.RawDomainGroupDT": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.encode_domains": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.decode_domain": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.decode_domains": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.generic_step": {"tf": 1}}, "df": 6, "d": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "g": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "p": {"docs": {}, "df": 0, "t": {"docs": {"shimmer.types.RawDomainGroupT": {"tf": 1}, "shimmer.types.RawDomainGroupDT": {"tf": 1.4142135623730951}, "shimmer.types.RawDomainGroupsT": {"tf": 1}, "shimmer.types.RawDomainGroupsDT": {"tf": 1}}, "df": 4}, "d": {"docs": {}, "df": 0, "t": {"docs": {"shimmer.types.RawDomainGroupT": {"tf": 1}, "shimmer.types.RawDomainGroupDT": {"tf": 1}}, "df": 2}}, "s": {"docs": {}, "df": 0, "d": {"docs": {}, "df": 0, "t": {"docs": {"shimmer.types.RawDomainGroupsT": {"tf": 1}, "shimmer.types.RawDomainGroupsDT": {"tf": 1}}, "df": 2}}, "t": {"docs": {"shimmer.types.RawDomainGroupsT": {"tf": 1}, "shimmer.types.RawDomainGroupsDT": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.encode_domains": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.generic_step": {"tf": 1}}, "df": 4}}}}}}}}}}}}}}, "b": {"docs": {}, "df": 0, "b": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "t": {"docs": {"shimmer.types.RawDomainGroupsT": {"tf": 1}, "shimmer.types.RawDomainGroupsDT": {"tf": 1}}, "df": 2}}}}, "t": {"docs": {}, "df": 0, "e": {"docs": {"shimmer.modules.global_workspace.SchedulerArgs.max_lr": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace2Domains.__init__": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace.__init__": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian.__init__": {"tf": 1}}, "df": 4}}, "n": {"docs": {}, "df": 0, "d": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "m": {"docs": {"shimmer.modules.selection.RandomSelection": {"tf": 1}}, "df": 1, "s": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "n": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspace.__init__": {"tf": 1}}, "df": 1}}}}}}}}}}}, "n": {"docs": {"shimmer.modules.selection.SelectionBase.forward": {"tf": 1.4142135623730951}}, "df": 1}}}, "i": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "e": {"docs": {"shimmer.modules.selection.SelectionBase.update_gw_state": {"tf": 1}}, "df": 1, "s": {"docs": {"shimmer.modules.global_workspace.pretrained_global_workspace": {"tf": 1}}, "df": 1}}}}}, "e": {"docs": {}, "df": 0, "p": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "t": {"docs": {"shimmer.types.RawDomainGroupT": {"tf": 1}, "shimmer.modules.global_workspace.GWPredictionsBase.states": {"tf": 1}}, "df": 2, "a": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "n": {"docs": {"shimmer.types.LatentsDomainGroupT": {"tf": 1}, "shimmer.types.LatentsDomainGroupDT": {"tf": 1}, "shimmer.modules.global_workspace.GWPredictionsBase.states": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.encode_and_fuse": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.encode": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.fuse": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.decode": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.encode_domain": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.decode_domain": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.decode_domains": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace2Domains.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.GlobalWorkspace.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.pretrained_global_workspace": {"tf": 1.4142135623730951}, "shimmer.modules.domain.DomainModule.encode": {"tf": 1.4142135623730951}, "shimmer.modules.domain.DomainModule.decode": {"tf": 1.4142135623730951}, "shimmer.modules.gw_module.GWModuleBase.fuse": {"tf": 1.4142135623730951}, "shimmer.modules.gw_module.GWModuleBase.encode": {"tf": 1.4142135623730951}, "shimmer.modules.gw_module.GWModuleBase.encode_and_fuse": {"tf": 1.7320508075688772}, "shimmer.modules.gw_module.GWModuleBase.decode": {"tf": 1.4142135623730951}, "shimmer.modules.gw_module.GWModule.__init__": {"tf": 1.7320508075688772}, "shimmer.modules.gw_module.GWModule.fuse": {"tf": 1.4142135623730951}, "shimmer.modules.gw_module.GWModule.encode": {"tf": 1.7320508075688772}, "shimmer.modules.gw_module.GWModule.decode": {"tf": 1.7320508075688772}, "shimmer.modules.gw_module.GWModuleBayesian.__init__": {"tf": 1.7320508075688772}, "shimmer.modules.gw_module.GWModuleBayesian.fuse": {"tf": 1.4142135623730951}, "shimmer.modules.selection.DynamicQueryAttention.fuse_weighted_encodings": {"tf": 1}, "shimmer.modules.vae.VAEEncoder.forward": {"tf": 1}, "shimmer.modules.vae.VAEDecoder.forward": {"tf": 1.7320508075688772}, "shimmer.modules.vae.VAE.encode": {"tf": 1.4142135623730951}, "shimmer.modules.vae.VAE.decode": {"tf": 1.4142135623730951}, "shimmer.modules.utils.translation": {"tf": 1}, "shimmer.modules.utils.cycle": {"tf": 1.7320508075688772}}, "df": 33, "s": {"docs": {"shimmer.types.LatentsDomainGroupT": {"tf": 1}, "shimmer.types.LatentsDomainGroupDT": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.encode_and_fuse": {"tf": 1.7320508075688772}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.encode": {"tf": 1.7320508075688772}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.fuse": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.decode": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.encode_domains": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.GlobalWorkspace2Domains.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.GlobalWorkspace.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.pretrained_global_workspace": {"tf": 1.4142135623730951}, "shimmer.modules.gw_module.GWModuleBase": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBase.encode": {"tf": 1.4142135623730951}, "shimmer.modules.gw_module.GWModuleBase.encode_and_fuse": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBase.decode": {"tf": 1}, "shimmer.modules.gw_module.GWModule.__init__": {"tf": 1}, "shimmer.modules.gw_module.GWModule.encode": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBayesian.__init__": {"tf": 1}, "shimmer.modules.selection.SelectionBase.forward": {"tf": 1}, "shimmer.modules.selection.SingleDomainSelection.forward": {"tf": 1}, "shimmer.modules.selection.FixedSharedSelection.forward": {"tf": 1}, "shimmer.modules.selection.KQFixedQSelection.forward": {"tf": 1}, "shimmer.modules.selection.RandomSelection.forward": {"tf": 1}, "shimmer.modules.selection.DynamicQueryAttention.forward": {"tf": 1}, "shimmer.modules.losses.broadcast_loss": {"tf": 1}, "shimmer.modules.losses.GWLosses.contrastive_loss": {"tf": 1}, "shimmer.modules.losses.GWLosses.step": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.step": {"tf": 1}, "shimmer.modules.utils.translation": {"tf": 1}}, "df": 29}}}}}}}}}}, "n": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "n": {"docs": {"shimmer.modules.gw_module.GWModuleBase.fuse": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBase.encode_and_fuse": {"tf": 1}, "shimmer.modules.gw_module.GWModule.fuse": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBayesian.fuse": {"tf": 1}}, "df": 4}}}}}}}}}}}, "e": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "t": {"docs": {"shimmer.dataset.RepeatedDataset.__init__": {"tf": 1}}, "df": 1, "i": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "g": {"docs": {"shimmer.dataset.RepeatedDataset.__init__": {"tf": 1}}, "df": 1}}}}}}, "a": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "z": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "n": {"docs": {"shimmer.modules.vae.reparameterize": {"tf": 1.4142135623730951}}, "df": 1}}}}}}}}}}}}}}}}, "t": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "n": {"docs": {"shimmer.types.RawDomainGroupDT": {"tf": 1}, "shimmer.types.LatentsDomainGroupDT": {"tf": 1}, "shimmer.types.RawDomainGroupsT": {"tf": 1}, "shimmer.types.RawDomainGroupsDT": {"tf": 1}, "shimmer.types.LatentsDomainGroupsDT": {"tf": 1}, "shimmer.modules.selection.SingleDomainSelection": {"tf": 1}, "shimmer.modules.losses.demi_cycle_loss": {"tf": 1}, "shimmer.modules.losses.cycle_loss": {"tf": 1}, "shimmer.modules.losses.translation_loss": {"tf": 1}, "shimmer.modules.losses.contrastive_loss": {"tf": 1}, "shimmer.modules.losses.contrastive_loss_bayesian": {"tf": 1}}, "df": 11, "s": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspaceBase.encode_and_fuse": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.encode": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.fuse": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.decode": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.batch_gw_states": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.encode_domain": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.encode_domains": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.decode_domain": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.decode_domains": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.generic_step": {"tf": 1}, "shimmer.modules.global_workspace.freeze_domain_modules": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace2Domains.forward": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace.forward": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian.forward": {"tf": 1}, "shimmer.modules.global_workspace.pretrained_global_workspace": {"tf": 1}, "shimmer.modules.domain.LossOutput.all": {"tf": 1}, "shimmer.modules.domain.DomainModule.encode": {"tf": 1}, "shimmer.modules.domain.DomainModule.decode": {"tf": 1}, "shimmer.modules.gw_module.get_n_layers": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBase.fuse": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBase.encode": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBase.encode_and_fuse": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBase.decode": {"tf": 1}, "shimmer.modules.gw_module.GWModule.fuse": {"tf": 1}, "shimmer.modules.gw_module.GWModule.encode": {"tf": 1}, "shimmer.modules.gw_module.GWModule.decode": {"tf": 1}, "shimmer.modules.gw_module.compute_fusion_scores": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBayesian.get_precision": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBayesian.fuse": {"tf": 1}, "shimmer.modules.selection.SelectionBase.forward": {"tf": 1}, "shimmer.modules.selection.SingleDomainSelection.forward": {"tf": 1}, "shimmer.modules.selection.FixedSharedSelection.forward": {"tf": 1}, "shimmer.modules.selection.KQFixedQSelection.forward": {"tf": 1}, "shimmer.modules.selection.RandomSelection.forward": {"tf": 1}, "shimmer.modules.selection.DynamicQueryAttention.fuse_weighted_encodings": {"tf": 1}, "shimmer.modules.selection.DynamicQueryAttention.forward": {"tf": 1}, "shimmer.modules.losses.GWLossesBase.step": {"tf": 1}, "shimmer.modules.losses.demi_cycle_loss": {"tf": 1}, "shimmer.modules.losses.cycle_loss": {"tf": 1}, "shimmer.modules.losses.translation_loss": {"tf": 1}, "shimmer.modules.losses.contrastive_loss": {"tf": 1}, "shimmer.modules.losses.contrastive_loss_bayesian": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.demi_cycle_loss": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.cycle_loss": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.translation_loss": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.contrastive_loss": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.step": {"tf": 1.4142135623730951}, "shimmer.modules.losses.broadcast_loss": {"tf": 1}, "shimmer.modules.losses.GWLosses.contrastive_loss": {"tf": 1}, "shimmer.modules.losses.GWLosses.step": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.contrastive_loss": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.step": {"tf": 1}, "shimmer.modules.contrastive_loss.ContrastiveLossBayesianType": {"tf": 1}, "shimmer.modules.contrastive_loss.info_nce": {"tf": 1}, "shimmer.modules.contrastive_loss.contrastive_loss": {"tf": 1}, "shimmer.modules.contrastive_loss.ContrastiveLoss.forward": {"tf": 1}, "shimmer.modules.vae.reparameterize": {"tf": 1}, "shimmer.modules.vae.kl_divergence_loss": {"tf": 1}, "shimmer.modules.vae.gaussian_nll": {"tf": 1}, "shimmer.modules.vae.VAEEncoder.forward": {"tf": 1}, "shimmer.modules.vae.VAEDecoder.forward": {"tf": 1}, "shimmer.modules.vae.VAE.encode": {"tf": 1.4142135623730951}, "shimmer.modules.vae.VAE.decode": {"tf": 1}, "shimmer.modules.vae.VAE.forward": {"tf": 1}, "shimmer.modules.utils.translation": {"tf": 1}, "shimmer.modules.utils.cycle": {"tf": 1}, "shimmer.modules.utils.batch_demi_cycles": {"tf": 1}, "shimmer.modules.utils.batch_cycles": {"tf": 1}, "shimmer.modules.utils.batch_translations": {"tf": 1}, "shimmer.utils.groups_batch_size": {"tf": 1}, "shimmer.utils.groups_device": {"tf": 1}}, "df": 71}, "e": {"docs": {}, "df": 0, "d": {"docs": {"shimmer.modules.domain.LossOutput": {"tf": 1}, "shimmer.modules.selection.RandomSelection.forward": {"tf": 1}}, "df": 2}}, "i": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "g": {"docs": {"shimmer.modules.contrastive_loss.ContrastiveLossType": {"tf": 1}}, "df": 1}}}}}}}, "s": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "s": {"docs": {"shimmer.modules.domain.DomainModule.compute_loss": {"tf": 1}, "shimmer.modules.domain.DomainModule.compute_dcy_loss": {"tf": 1}, "shimmer.modules.domain.DomainModule.compute_cy_loss": {"tf": 1}, "shimmer.modules.domain.DomainModule.compute_tr_loss": {"tf": 1}, "shimmer.modules.domain.DomainModule.compute_broadcast_loss": {"tf": 1}}, "df": 5}}}}, "p": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "v": {"docs": {}, "df": 0, "e": {"docs": {"shimmer.modules.losses.GWLosses.__init__": {"tf": 1}}, "df": 1}}}}}}}}, "l": {"docs": {}, "df": 0, "u": {"docs": {"shimmer.modules.gw_module.get_n_layers": {"tf": 1.4142135623730951}}, "df": 1}, "e": {"docs": {}, "df": 0, "v": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "t": {"docs": {"shimmer.utils.SaveMigrations": {"tf": 1}}, "df": 1}}}}}}, "c": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "p": {"docs": {}, "df": 0, "e": {"docs": {"shimmer.modules.gw_module.GWEncoder.forward": {"tf": 1}, "shimmer.modules.gw_module.GWEncoderLinear.forward": {"tf": 1}}, "df": 2}}}, "o": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "d": {"docs": {"shimmer.modules.vae.VAEDecoder.forward": {"tf": 1}, "shimmer.modules.vae.VAE.decode": {"tf": 1}, "shimmer.modules.vae.VAE.forward": {"tf": 1}}, "df": 3}}}}}}}}}}}, "g": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "d": {"docs": {"shimmer.modules.gw_module.GWEncoder.forward": {"tf": 1}, "shimmer.modules.gw_module.GWEncoderLinear.forward": {"tf": 1}}, "df": 2}}}}}}}}, "d": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "n": {"docs": {"shimmer.modules.contrastive_loss.info_nce": {"tf": 1.4142135623730951}, "shimmer.modules.contrastive_loss.contrastive_loss": {"tf": 1.4142135623730951}, "shimmer.modules.contrastive_loss.ContrastiveLoss.__init__": {"tf": 1.4142135623730951}}, "df": 3}}}}}}}, "m": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "v": {"docs": {}, "df": 0, "e": {"docs": {"shimmer.dataset.RepeatedDataset.__init__": {"tf": 1}}, "df": 1}}}}}, "o": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "e": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspace2Domains.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.GlobalWorkspace.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.pretrained_global_workspace": {"tf": 1.4142135623730951}}, "df": 4}}}, "u": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "g": {"docs": {"shimmer.modules.gw_module.GWEncoder.forward": {"tf": 1}, "shimmer.modules.gw_module.GWEncoderLinear.forward": {"tf": 1}}, "df": 2}}}}}}}, "u": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "d": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "l": {"docs": {"shimmer.types.RawDomainGroupT": {"tf": 1}, "shimmer.types.RawDomainGroupDT": {"tf": 1}, "shimmer.types.LatentsDomainGroupT": {"tf": 1}, "shimmer.types.LatentsDomainGroupDT": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.decode": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.encode_domain": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.encode_domains": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.decode_domain": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.decode_domains": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.generic_step": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace2Domains.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.GlobalWorkspace.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.pretrained_global_workspace": {"tf": 1.4142135623730951}, "shimmer.modules.domain.DomainModule.__init__": {"tf": 1}, "shimmer.modules.domain.DomainModule.encode": {"tf": 1.4142135623730951}, "shimmer.modules.domain.DomainModule.decode": {"tf": 1.4142135623730951}, "shimmer.modules.gw_module.GWModuleBase": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBase.domain_mods": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBase.decode": {"tf": 1}, "shimmer.modules.gw_module.GWModule.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.gw_module.GWModule.decode": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBayesian.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.selection.SelectionBase.forward": {"tf": 1}, "shimmer.modules.selection.SingleDomainSelection.forward": {"tf": 1}, "shimmer.modules.selection.FixedSharedSelection.forward": {"tf": 1}, "shimmer.modules.selection.KQFixedQSelection.forward": {"tf": 1}, "shimmer.modules.selection.RandomSelection.forward": {"tf": 1}, "shimmer.modules.selection.DynamicQueryAttention.fuse_weighted_encodings": {"tf": 1}, "shimmer.modules.selection.DynamicQueryAttention.forward": {"tf": 1}, "shimmer.modules.losses.demi_cycle_loss": {"tf": 1}, "shimmer.modules.losses.cycle_loss": {"tf": 1}, "shimmer.modules.losses.translation_loss": {"tf": 1}, "shimmer.modules.losses.contrastive_loss": {"tf": 1}, "shimmer.modules.losses.contrastive_loss_bayesian": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.demi_cycle_loss": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.cycle_loss": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.translation_loss": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.contrastive_loss": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.contrastive_loss": {"tf": 1}, "shimmer.modules.utils.translation": {"tf": 1}, "shimmer.modules.utils.cycle": {"tf": 1.4142135623730951}}, "df": 42}}}}}, "f": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "m": {"docs": {"shimmer.modules.selection.SingleDomainSelection": {"tf": 1}, "shimmer.modules.selection.RandomSelection": {"tf": 1.4142135623730951}, "shimmer.modules.selection.RandomSelection.__init__": {"tf": 1}, "shimmer.modules.selection.RandomSelection.forward": {"tf": 1.4142135623730951}}, "df": 4}}}}}, "p": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "d": {"docs": {"shimmer.types.RawDomainGroupsT": {"tf": 1}, "shimmer.types.RawDomainGroupsDT": {"tf": 1}, "shimmer.types.LatentsDomainGroupsT": {"tf": 1}, "shimmer.types.LatentsDomainGroupsDT": {"tf": 1}}, "df": 4}}}}}}, "c": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "y": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspaceBayesian": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBayesian": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBayesian.fuse": {"tf": 1}, "shimmer.modules.losses.contrastive_loss_bayesian": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.__init__": {"tf": 1}}, "df": 5}, "i": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "s": {"docs": {"shimmer.modules.gw_module.GWModuleBayesian.fuse": {"tf": 1}}, "df": 1}}}}}}}}}}}, "s": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "b": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "y": {"docs": {"shimmer.modules.gw_module.compute_fusion_scores": {"tf": 1}}, "df": 1}}}}}}}}}, "d": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "r": {"docs": {"shimmer.utils.migrate_model": {"tf": 1}}, "df": 1}}}}, "s": {"docs": {}, "df": 0, "e": {"docs": {"shimmer.types.RawDomainGroupT": {"tf": 1}, "shimmer.types.RawDomainGroupDT": {"tf": 1}, "shimmer.types.LatentsDomainGroupT": {"tf": 1}, "shimmer.types.LatentsDomainGroupDT": {"tf": 1}, "shimmer.types.RawDomainGroupsT": {"tf": 1}, "shimmer.types.RawDomainGroupsDT": {"tf": 1}, "shimmer.types.LatentsDomainGroupsT": {"tf": 1}, "shimmer.types.LatentsDomainGroupsDT": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian.__init__": {"tf": 1.7320508075688772}, "shimmer.modules.domain.LossOutput": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBase.fuse": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBase.encode_and_fuse": {"tf": 1}, "shimmer.modules.gw_module.GWModule.fuse": {"tf": 1}, "shimmer.modules.gw_module.GWModule.decode": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBayesian.__init__": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBayesian.fuse": {"tf": 1}, "shimmer.modules.losses.demi_cycle_loss": {"tf": 1.4142135623730951}, "shimmer.modules.losses.cycle_loss": {"tf": 1.4142135623730951}, "shimmer.modules.losses.translation_loss": {"tf": 1}, "shimmer.modules.losses.contrastive_loss": {"tf": 1}, "shimmer.modules.losses.contrastive_loss_bayesian": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.losses.broadcast_loss": {"tf": 1.4142135623730951}, "shimmer.modules.losses.GWLossesBayesian.__init__": {"tf": 2}, "shimmer.modules.losses.GWLossesBayesian.contrastive_fn": {"tf": 1}, "shimmer.modules.utils.batch_cycles": {"tf": 1}}, "df": 26, "s": {"docs": {"shimmer.types.RawDomainGroupT": {"tf": 1}, "shimmer.types.RawDomainGroupDT": {"tf": 1}, "shimmer.types.LatentsDomainGroupT": {"tf": 1}, "shimmer.types.LatentsDomainGroupDT": {"tf": 1}, "shimmer.types.RawDomainGroupsT": {"tf": 1}, "shimmer.types.RawDomainGroupsDT": {"tf": 1}, "shimmer.types.LatentsDomainGroupsT": {"tf": 1}, "shimmer.types.LatentsDomainGroupsDT": {"tf": 1}}, "df": 8}, "d": {"docs": {"shimmer.types.RawDomainGroupT": {"tf": 1}, "shimmer.types.RawDomainGroupDT": {"tf": 1}, "shimmer.types.LatentsDomainGroupT": {"tf": 1}, "shimmer.types.LatentsDomainGroupDT": {"tf": 1}, "shimmer.types.RawDomainGroupsT": {"tf": 1}, "shimmer.types.RawDomainGroupsDT": {"tf": 1}, "shimmer.types.LatentsDomainGroupsT": {"tf": 1}, "shimmer.types.LatentsDomainGroupsDT": {"tf": 1}, "shimmer.types.ModelModeT": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.generic_step": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace2Domains": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace2Domains.__init__": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace.__init__": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian.__init__": {"tf": 1}, "shimmer.modules.global_workspace.pretrained_global_workspace": {"tf": 1}, "shimmer.modules.domain.LossOutput": {"tf": 1.4142135623730951}, "shimmer.modules.domain.LossOutput.loss": {"tf": 1}, "shimmer.modules.domain.LossOutput.metrics": {"tf": 1}, "shimmer.modules.gw_module.GWEncoder": {"tf": 1}, "shimmer.modules.gw_module.GWEncoderLinear": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBase.fuse": {"tf": 1}, "shimmer.modules.gw_module.GWModule.fuse": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBayesian.fuse": {"tf": 1}, "shimmer.modules.selection.SelectionBase.update_gw_state": {"tf": 1}, "shimmer.modules.selection.RandomSelection.forward": {"tf": 1}, "shimmer.modules.losses.GWLossesBase": {"tf": 1}, "shimmer.modules.losses.LossCoefs": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains": {"tf": 1}, "shimmer.modules.losses.BroadcastLossCoefs": {"tf": 1}, "shimmer.modules.losses.GWLosses.__init__": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian": {"tf": 1}, "shimmer.modules.vae.kl_divergence_loss": {"tf": 1}, "shimmer.modules.vae.gaussian_nll": {"tf": 1}, "shimmer.utils.SaveMigrations": {"tf": 1}}, "df": 36}}, "i": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "g": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspace2Domains.__init__": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace.__init__": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian.__init__": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBase": {"tf": 1}, "shimmer.modules.gw_module.compute_fusion_scores": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBayesian.fuse": {"tf": 1.4142135623730951}, "shimmer.modules.selection.RandomSelection": {"tf": 1}, "shimmer.modules.selection.DynamicQueryAttention.fuse_weighted_encodings": {"tf": 1}, "shimmer.modules.vae.reparameterize": {"tf": 1}}, "df": 9}}}}, "p": {"docs": {}, "df": 0, "d": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "e": {"docs": {"shimmer.modules.selection.SelectionBase.update_gw_state": {"tf": 1}}, "df": 1, "d": {"docs": {"shimmer.modules.selection.DynamicQueryAttention": {"tf": 1}}, "df": 1}}}}}}, "t": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "z": {"docs": {}, "df": 0, "e": {"docs": {"shimmer.modules.selection.RandomSelection": {"tf": 1}}, "df": 1}}}, "s": {"docs": {"shimmer.cli.ckpt_migration.migrate_ckpt": {"tf": 1}}, "df": 1}}}}}, "d": {"docs": {"shimmer.modules.gw_module.GWModuleBayesian.fuse": {"tf": 1.7320508075688772}}, "df": 1, "a": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "a": {"docs": {"shimmer.types.RawDomainGroupT": {"tf": 1.4142135623730951}, "shimmer.types.RawDomainGroupDT": {"tf": 1.4142135623730951}, "shimmer.types.RawDomainGroupsT": {"tf": 1}, "shimmer.types.RawDomainGroupsDT": {"tf": 1}, "shimmer.types.LatentsDomainGroupsT": {"tf": 1}, "shimmer.types.LatentsDomainGroupsDT": {"tf": 1}, "shimmer.types.ModelModeT": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.encode_domain": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.encode_domains": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.decode_domain": {"tf": 1.7320508075688772}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.decode_domains": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.generic_step": {"tf": 1}, "shimmer.modules.domain.DomainModule.encode": {"tf": 1.4142135623730951}, "shimmer.modules.domain.DomainModule.decode": {"tf": 1.7320508075688772}, "shimmer.modules.vae.VAE.forward": {"tf": 1}}, "df": 15, "c": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "s": {"docs": {"shimmer.modules.domain.LossOutput": {"tf": 1}}, "df": 1}}}}}, "s": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "t": {"docs": {"shimmer.dataset.RepeatedDataset": {"tf": 1.4142135623730951}, "shimmer.dataset.RepeatedDataset.__init__": {"tf": 2.23606797749979}}, "df": 2}}}}}}, "o": {"docs": {"shimmer.modules.utils.cycle": {"tf": 1}, "shimmer.modules.utils.batch_cycles": {"tf": 1}, "shimmer.modules.utils.batch_translations": {"tf": 1}}, "df": 3, "m": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "n": {"docs": {"shimmer.types.RawDomainGroupT": {"tf": 1.4142135623730951}, "shimmer.types.RawDomainGroupDT": {"tf": 1}, "shimmer.types.LatentsDomainGroupT": {"tf": 1.4142135623730951}, "shimmer.types.LatentsDomainGroupDT": {"tf": 1}, "shimmer.types.LatentsDomainGroupsT": {"tf": 1}, "shimmer.modules.global_workspace.GWPredictionsBase.states": {"tf": 1.7320508075688772}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.encode_and_fuse": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.encode": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.batch_gw_states": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.encode_domain": {"tf": 2.8284271247461903}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.encode_domains": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.decode_domain": {"tf": 2.8284271247461903}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.decode_domains": {"tf": 1}, "shimmer.modules.global_workspace.freeze_domain_modules": {"tf": 1.7320508075688772}, "shimmer.modules.global_workspace.GWPredictions.demi_cycles": {"tf": 1.7320508075688772}, "shimmer.modules.global_workspace.GWPredictions.cycles": {"tf": 2.23606797749979}, "shimmer.modules.global_workspace.GWPredictions.translations": {"tf": 2.23606797749979}, "shimmer.modules.global_workspace.GlobalWorkspace2Domains.__init__": {"tf": 2}, "shimmer.modules.global_workspace.GlobalWorkspace": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace.__init__": {"tf": 2}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian.__init__": {"tf": 2}, "shimmer.modules.global_workspace.pretrained_global_workspace": {"tf": 2}, "shimmer.modules.domain.DomainModule": {"tf": 1}, "shimmer.modules.domain.DomainModule.encode": {"tf": 1.4142135623730951}, "shimmer.modules.domain.DomainModule.decode": {"tf": 1.7320508075688772}, "shimmer.modules.gw_module.GWModuleBase.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.gw_module.GWModuleBase.domain_mods": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBase.encode": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBase.encode_and_fuse": {"tf": 1}, "shimmer.modules.gw_module.GWModule.__init__": {"tf": 2}, "shimmer.modules.gw_module.GWModule.encode": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBayesian.__init__": {"tf": 2}, "shimmer.modules.gw_module.GWModuleBayesian.precisions": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBayesian.get_precision": {"tf": 1.4142135623730951}, "shimmer.modules.selection.SelectionBase.forward": {"tf": 1}, "shimmer.modules.selection.SingleDomainSelection": {"tf": 1.4142135623730951}, "shimmer.modules.selection.SingleDomainSelection.forward": {"tf": 1}, "shimmer.modules.selection.FixedSharedSelection.forward": {"tf": 1}, "shimmer.modules.selection.KQFixedQSelection.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.selection.KQFixedQSelection.forward": {"tf": 1}, "shimmer.modules.selection.RandomSelection": {"tf": 1}, "shimmer.modules.selection.RandomSelection.forward": {"tf": 1.7320508075688772}, "shimmer.modules.selection.DynamicQueryAttention.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.selection.DynamicQueryAttention.fuse_weighted_encodings": {"tf": 1}, "shimmer.modules.selection.DynamicQueryAttention.forward": {"tf": 1}, "shimmer.modules.losses.GWLossesBase.step": {"tf": 1}, "shimmer.modules.losses.demi_cycle_loss": {"tf": 2.6457513110645907}, "shimmer.modules.losses.cycle_loss": {"tf": 3.1622776601683795}, "shimmer.modules.losses.translation_loss": {"tf": 3.3166247903554}, "shimmer.modules.losses.contrastive_loss": {"tf": 2.6457513110645907}, "shimmer.modules.losses.contrastive_loss_bayesian": {"tf": 2.6457513110645907}, "shimmer.modules.losses.GWLosses2Domains.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.losses.GWLosses2Domains.step": {"tf": 1}, "shimmer.modules.losses.broadcast_loss": {"tf": 1.7320508075688772}, "shimmer.modules.losses.GWLosses.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.losses.GWLosses.contrastive_loss": {"tf": 1}, "shimmer.modules.losses.GWLosses.step": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.losses.GWLossesBayesian.domain_mods": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.step": {"tf": 1}, "shimmer.modules.utils.translation": {"tf": 1.7320508075688772}, "shimmer.modules.utils.cycle": {"tf": 1.4142135623730951}, "shimmer.modules.utils.batch_demi_cycles": {"tf": 1}, "shimmer.modules.utils.batch_cycles": {"tf": 2}, "shimmer.modules.utils.batch_translations": {"tf": 1.4142135623730951}, "shimmer.utils.groups_batch_size": {"tf": 1}, "shimmer.utils.groups_device": {"tf": 1}}, "df": 67, "s": {"docs": {"shimmer.types.RawDomainGroupT": {"tf": 1.4142135623730951}, "shimmer.types.RawDomainGroupDT": {"tf": 1.4142135623730951}, "shimmer.types.LatentsDomainGroupT": {"tf": 1.4142135623730951}, "shimmer.types.LatentsDomainGroupDT": {"tf": 1.4142135623730951}, "shimmer.types.RawDomainGroupsT": {"tf": 1}, "shimmer.types.RawDomainGroupsDT": {"tf": 1}, "shimmer.types.LatentsDomainGroupsT": {"tf": 1}, "shimmer.types.LatentsDomainGroupsDT": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.decode": {"tf": 1.7320508075688772}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.batch_gw_states": {"tf": 1.7320508075688772}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.encode_domains": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.decode_domains": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.GlobalWorkspace2Domains": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace2Domains.__init__": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace2Domains.forward": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.GlobalWorkspace.__init__": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace.forward": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian.__init__": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian.forward": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.pretrained_global_workspace": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBase.fuse": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBase.decode": {"tf": 1.7320508075688772}, "shimmer.modules.gw_module.GWModule.fuse": {"tf": 1}, "shimmer.modules.gw_module.GWModule.decode": {"tf": 2}, "shimmer.modules.gw_module.GWModuleBayesian.fuse": {"tf": 1.4142135623730951}, "shimmer.modules.selection.SelectionBase": {"tf": 1}, "shimmer.modules.selection.SelectionBase.forward": {"tf": 1}, "shimmer.modules.selection.SingleDomainSelection": {"tf": 1.4142135623730951}, "shimmer.modules.selection.SingleDomainSelection.forward": {"tf": 1}, "shimmer.modules.selection.FixedSharedSelection": {"tf": 1.7320508075688772}, "shimmer.modules.selection.FixedSharedSelection.forward": {"tf": 1}, "shimmer.modules.selection.KQFixedQSelection.__init__": {"tf": 1}, "shimmer.modules.selection.KQFixedQSelection.forward": {"tf": 1}, "shimmer.modules.selection.RandomSelection.forward": {"tf": 1}, "shimmer.modules.selection.DynamicQueryAttention.__init__": {"tf": 1}, "shimmer.modules.selection.DynamicQueryAttention.forward": {"tf": 1}, "shimmer.modules.losses.demi_cycle_loss": {"tf": 1}, "shimmer.modules.losses.cycle_loss": {"tf": 1}, "shimmer.modules.losses.translation_loss": {"tf": 1}, "shimmer.modules.losses.contrastive_loss": {"tf": 1.4142135623730951}, "shimmer.modules.losses.contrastive_loss_bayesian": {"tf": 1.4142135623730951}, "shimmer.modules.losses.GWLosses2Domains.demi_cycle_loss": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.cycle_loss": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.translation_loss": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.contrastive_loss": {"tf": 1}, "shimmer.modules.losses.broadcast_loss": {"tf": 1}, "shimmer.modules.losses.BroadcastLossCoefs.fused": {"tf": 1}, "shimmer.modules.losses.GWLosses.contrastive_loss": {"tf": 1.4142135623730951}, "shimmer.modules.losses.GWLosses.step": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.contrastive_loss": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.step": {"tf": 1}, "shimmer.modules.utils.translation": {"tf": 1}, "shimmer.modules.utils.cycle": {"tf": 1.4142135623730951}, "shimmer.modules.utils.batch_demi_cycles": {"tf": 1.7320508075688772}, "shimmer.modules.utils.batch_cycles": {"tf": 2}, "shimmer.modules.utils.batch_translations": {"tf": 1.7320508075688772}}, "df": 57}, "m": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "d": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "e": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspaceBase.encode_domain": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.decode_domain": {"tf": 1}, "shimmer.modules.global_workspace.freeze_domain_modules": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.GlobalWorkspace2Domains.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.GlobalWorkspace.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.pretrained_global_workspace": {"tf": 1.4142135623730951}, "shimmer.modules.domain.DomainModule": {"tf": 1}, "shimmer.modules.domain.DomainModule.__init__": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBase.__init__": {"tf": 1}, "shimmer.modules.gw_module.GWModule.__init__": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBayesian.__init__": {"tf": 1}, "shimmer.modules.losses.demi_cycle_loss": {"tf": 1}, "shimmer.modules.losses.cycle_loss": {"tf": 1}, "shimmer.modules.losses.translation_loss": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.losses.broadcast_loss": {"tf": 1}, "shimmer.modules.losses.GWLosses.__init__": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.__init__": {"tf": 1.4142135623730951}}, "df": 19}}}}}}}}}}, "g": {"docs": {"shimmer.types.RawDomainGroupT": {"tf": 1}, "shimmer.types.RawDomainGroupDT": {"tf": 1}, "shimmer.types.RawDomainGroupsT": {"tf": 1}, "shimmer.types.RawDomainGroupsDT": {"tf": 1}}, "df": 4}, "t": {"docs": {"shimmer.modules.selection.KQFixedQSelection.forward": {"tf": 1}, "shimmer.modules.selection.DynamicQueryAttention.forward": {"tf": 1}}, "df": 2}, "e": {"docs": {}, "df": 0, "s": {"docs": {"shimmer.modules.selection.KQFixedQSelection.forward": {"tf": 1}, "shimmer.modules.selection.DynamicQueryAttention.forward": {"tf": 1}}, "df": 2}}, "n": {"docs": {}, "df": 0, "e": {"docs": {"shimmer.modules.utils.batch_cycles": {"tf": 1}}, "df": 1}}}, "e": {"docs": {}, "df": 0, "f": {"docs": {"shimmer.types.RawDomainGroupT": {"tf": 1}, "shimmer.types.RawDomainGroupDT": {"tf": 1}, "shimmer.types.LatentsDomainGroupT": {"tf": 1}, "shimmer.types.LatentsDomainGroupDT": {"tf": 1}, "shimmer.types.RawDomainGroupsT": {"tf": 1}, "shimmer.types.RawDomainGroupsDT": {"tf": 1}, "shimmer.types.LatentsDomainGroupsT": {"tf": 1}, "shimmer.types.LatentsDomainGroupsDT": {"tf": 1}}, "df": 8, "a": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "t": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspace2Domains.__init__": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace.__init__": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian.__init__": {"tf": 1}, "shimmer.modules.selection.SelectionBase.update_gw_state": {"tf": 1}}, "df": 4, "s": {"docs": {"shimmer.modules.gw_module.GWModule.decode": {"tf": 1}, "shimmer.modules.contrastive_loss.ContrastiveLoss.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.vae.VAE.__init__": {"tf": 1}}, "df": 3}}}}}, "i": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "e": {"docs": {"shimmer.modules.gw_module.GWEncoder.forward": {"tf": 1}, "shimmer.modules.gw_module.GWEncoderLinear.forward": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBase": {"tf": 1}}, "df": 3, "s": {"docs": {"shimmer.modules.domain.DomainModule": {"tf": 1}}, "df": 1}, "d": {"docs": {"shimmer.modules.gw_module.GWEncoder.forward": {"tf": 1}, "shimmer.modules.gw_module.GWEncoderLinear.forward": {"tf": 1}, "shimmer.modules.selection.SelectionBase.update_gw_state": {"tf": 1}, "shimmer.dataset.RepeatedDataset.__init__": {"tf": 1}}, "df": 4}}, "i": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "s": {"docs": {"shimmer.modules.contrastive_loss": {"tf": 1}}, "df": 1}}}}}}}}}, "c": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "d": {"docs": {}, "df": 0, "e": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspaceBase.decode": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.decode_domain": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.decode_domains": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace2Domains.__init__": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace.__init__": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian.__init__": {"tf": 1}, "shimmer.modules.global_workspace.pretrained_global_workspace": {"tf": 1}, "shimmer.modules.domain.DomainModule.decode": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBase.decode": {"tf": 1.4142135623730951}, "shimmer.modules.gw_module.GWModule.decode": {"tf": 1}, "shimmer.modules.losses.BroadcastLossCoefs.fused": {"tf": 1}, "shimmer.modules.vae.VAEDecoder.forward": {"tf": 1}, "shimmer.modules.vae.VAE.decode": {"tf": 1}}, "df": 13, "d": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspaceBase.decode": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBase.decode": {"tf": 1}, "shimmer.modules.gw_module.GWModule.decode": {"tf": 1}}, "df": 3}, "s": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspaceBase.decode_domain": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.decode_domains": {"tf": 1}, "shimmer.modules.gw_module.GWModule.__init__": {"tf": 1}, "shimmer.modules.gw_module.GWModule.decode": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBayesian.__init__": {"tf": 1}, "shimmer.modules.vae.VAE.forward": {"tf": 1}}, "df": 6}, "r": {"docs": {"shimmer.modules.gw_module.GWDecoder": {"tf": 1}, "shimmer.modules.gw_module.GWDecoder.__init__": {"tf": 1}, "shimmer.modules.gw_module.GWEncoder": {"tf": 1}, "shimmer.modules.vae.VAEDecoder": {"tf": 1}, "shimmer.modules.vae.VAE.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.vae.VAE.decoder": {"tf": 1}}, "df": 6, "s": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspace2Domains.__init__": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace.__init__": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian.__init__": {"tf": 1}, "shimmer.modules.global_workspace.pretrained_global_workspace": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBase": {"tf": 1}, "shimmer.modules.gw_module.GWModule.__init__": {"tf": 1}, "shimmer.modules.gw_module.GWModule.gw_decoders": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBayesian.__init__": {"tf": 1}}, "df": 8}}}, "i": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "g": {"docs": {"shimmer.modules.gw_module.GWModuleBase": {"tf": 1}}, "df": 1}}}}}, "a": {"docs": {}, "df": 0, "y": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspace2Domains.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.GlobalWorkspace.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian.__init__": {"tf": 1.4142135623730951}}, "df": 3}}}, "m": {"docs": {}, "df": 0, "i": {"docs": {"shimmer.modules.global_workspace.GWPredictions.demi_cycles": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace2Domains.forward": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace.forward": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian.forward": {"tf": 1}, "shimmer.modules.domain.DomainModule.compute_dcy_loss": {"tf": 1.4142135623730951}, "shimmer.modules.losses.GWLossesBase": {"tf": 1}, "shimmer.modules.losses.demi_cycle_loss": {"tf": 2.449489742783178}, "shimmer.modules.losses.LossCoefs.demi_cycles": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.demi_cycle_loss": {"tf": 1.4142135623730951}, "shimmer.modules.losses.GWLosses2Domains.step": {"tf": 1.4142135623730951}, "shimmer.modules.losses.broadcast_loss": {"tf": 1}, "shimmer.modules.losses.BroadcastLossCoefs.demi_cycles": {"tf": 1.4142135623730951}, "shimmer.modules.utils.batch_demi_cycles": {"tf": 1.4142135623730951}}, "df": 13}}, "t": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "c": {"docs": {"shimmer.modules.selection.FixedSharedSelection": {"tf": 1}}, "df": 1}}}}}, "e": {"docs": {}, "df": 0, "s": {"docs": {"shimmer.modules.selection.RandomSelection.forward": {"tf": 1}}, "df": 1}}}}}}}}}, "i": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "t": {"docs": {"shimmer.types.RawDomainGroupDT": {"tf": 1}, "shimmer.types.LatentsDomainGroupDT": {"tf": 1.4142135623730951}, "shimmer.types.RawDomainGroupsT": {"tf": 1}, "shimmer.types.RawDomainGroupsDT": {"tf": 1}, "shimmer.types.LatentsDomainGroupsDT": {"tf": 1}, "shimmer.modules.domain.LossOutput.all": {"tf": 1}, "shimmer.modules.selection.DynamicQueryAttention.fuse_weighted_encodings": {"tf": 1}, "shimmer.modules.losses.demi_cycle_loss": {"tf": 1}, "shimmer.modules.losses.cycle_loss": {"tf": 1}, "shimmer.modules.losses.translation_loss": {"tf": 1}, "shimmer.modules.losses.contrastive_loss": {"tf": 1}, "shimmer.modules.losses.contrastive_loss_bayesian": {"tf": 1}, "shimmer.modules.losses.LossCoefs": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.__init__": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.demi_cycle_loss": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.cycle_loss": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.translation_loss": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.contrastive_loss": {"tf": 1}, "shimmer.modules.losses.BroadcastLossCoefs": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.__init__": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.contrastive_loss": {"tf": 1}}, "df": 21, "[": {"docs": {}, "df": 0, "f": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "z": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "[": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "r": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspaceBase.encode_and_fuse": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.fuse": {"tf": 1}}, "df": 2}}}}}}}}}}}}}, "s": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "r": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspaceBase.decode": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.batch_gw_states": {"tf": 1}, "shimmer.modules.global_workspace.freeze_domain_modules": {"tf": 1}, "shimmer.modules.selection.SelectionBase.forward": {"tf": 1}, "shimmer.modules.selection.SingleDomainSelection.forward": {"tf": 1}, "shimmer.modules.selection.FixedSharedSelection.forward": {"tf": 1}, "shimmer.modules.selection.KQFixedQSelection.forward": {"tf": 1}, "shimmer.modules.selection.RandomSelection.forward": {"tf": 1}, "shimmer.modules.selection.DynamicQueryAttention.fuse_weighted_encodings": {"tf": 1}, "shimmer.modules.selection.DynamicQueryAttention.forward": {"tf": 1}, "shimmer.modules.losses.demi_cycle_loss": {"tf": 1}, "shimmer.modules.losses.cycle_loss": {"tf": 1}, "shimmer.modules.losses.translation_loss": {"tf": 1}, "shimmer.modules.losses.contrastive_loss": {"tf": 1}, "shimmer.modules.losses.contrastive_loss_bayesian": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.__init__": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.demi_cycle_loss": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.cycle_loss": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.translation_loss": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.contrastive_loss": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.__init__": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.contrastive_loss": {"tf": 1}, "shimmer.modules.utils.batch_demi_cycles": {"tf": 1}}, "df": 23}}}, "t": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "p": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "[": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "r": {"docs": {"shimmer.modules.utils.batch_cycles": {"tf": 1}, "shimmer.modules.utils.batch_translations": {"tf": 1}}, "df": 2}}}}}}}}}}, "i": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "y": {"docs": {"shimmer.modules.losses.broadcast_loss": {"tf": 1}, "shimmer.modules.losses.GWLosses.contrastive_loss": {"tf": 1}, "shimmer.utils.SaveMigrations.on_save_checkpoint": {"tf": 1}}, "df": 3}}}}}}}}, "f": {"docs": {}, "df": 0, "f": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "t": {"docs": {"shimmer.types.RawDomainGroupsT": {"tf": 1}, "shimmer.types.RawDomainGroupsDT": {"tf": 1}, "shimmer.types.LatentsDomainGroupsT": {"tf": 1}, "shimmer.types.LatentsDomainGroupsDT": {"tf": 1}, "shimmer.modules.domain.DomainModule.compute_dcy_loss": {"tf": 1}, "shimmer.modules.domain.DomainModule.compute_cy_loss": {"tf": 1}, "shimmer.modules.domain.DomainModule.compute_tr_loss": {"tf": 1}, "shimmer.modules.domain.DomainModule.compute_broadcast_loss": {"tf": 1}, "shimmer.modules.losses.GWLossesBase": {"tf": 1}}, "df": 9}}}}}}}, "s": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "b": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "n": {"docs": {"shimmer.types.ModelModeT": {"tf": 1}, "shimmer.modules.selection.SingleDomainSelection": {"tf": 1}, "shimmer.modules.selection.RandomSelection": {"tf": 1}, "shimmer.modules.vae.reparameterize": {"tf": 1}}, "df": 4}}}}}}}}}}, "m": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspace2Domains.__init__": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace.__init__": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian.__init__": {"tf": 1}, "shimmer.modules.global_workspace.pretrained_global_workspace": {"tf": 1}, "shimmer.modules.domain.DomainModule.__init__": {"tf": 1}, "shimmer.modules.gw_module.get_n_layers": {"tf": 1}, "shimmer.modules.gw_module.GWDecoder.__init__": {"tf": 1.7320508075688772}, "shimmer.modules.gw_module.GWEncoder.__init__": {"tf": 1.7320508075688772}, "shimmer.modules.gw_module.GWModuleBase.__init__": {"tf": 1}, "shimmer.modules.gw_module.GWModule.__init__": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBayesian.__init__": {"tf": 1}, "shimmer.modules.selection.KQFixedQSelection.__init__": {"tf": 1}, "shimmer.modules.selection.DynamicQueryAttention.__init__": {"tf": 1}}, "df": 13, "e": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "n": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspaceBase.workspace_dim": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace2Domains.__init__": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace.__init__": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian.__init__": {"tf": 1}, "shimmer.modules.global_workspace.pretrained_global_workspace": {"tf": 1}, "shimmer.modules.domain.DomainModule.__init__": {"tf": 1}, "shimmer.modules.domain.DomainModule.latent_dim": {"tf": 1}, "shimmer.modules.gw_module.get_n_layers": {"tf": 1}, "shimmer.modules.gw_module.GWDecoder.__init__": {"tf": 1.7320508075688772}, "shimmer.modules.gw_module.GWDecoder.in_dim": {"tf": 1}, "shimmer.modules.gw_module.GWDecoder.hidden_dim": {"tf": 1}, "shimmer.modules.gw_module.GWDecoder.out_dim": {"tf": 1}, "shimmer.modules.gw_module.GWEncoder.__init__": {"tf": 1.7320508075688772}, "shimmer.modules.gw_module.GWModuleBase.__init__": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBase.workspace_dim": {"tf": 1}, "shimmer.modules.gw_module.GWModule.__init__": {"tf": 1}, "shimmer.modules.gw_module.compute_fusion_scores": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBayesian.__init__": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBayesian.fuse": {"tf": 1}, "shimmer.modules.selection.KQFixedQSelection.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.selection.DynamicQueryAttention.__init__": {"tf": 1.4142135623730951}}, "df": 21}}}}}}, "s": {"docs": {"shimmer.modules.selection.KQFixedQSelection.__init__": {"tf": 1}, "shimmer.modules.selection.DynamicQueryAttention.__init__": {"tf": 1}}, "df": 2}}, "r": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "y": {"docs": {"shimmer.modules.selection.RandomSelection.forward": {"tf": 1}}, "df": 1}}}}}}, "v": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "g": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "e": {"docs": {"shimmer.modules.vae.kl_divergence_loss": {"tf": 1}}, "df": 1}}}}}}}}}, "u": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "g": {"docs": {"shimmer.modules.domain.LossOutput.loss": {"tf": 1}, "shimmer.modules.domain.LossOutput.metrics": {"tf": 1}}, "df": 2}}}}}, "y": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "c": {"docs": {"shimmer.modules.selection.KQFixedQSelection.forward": {"tf": 1}, "shimmer.modules.selection.DynamicQueryAttention": {"tf": 1}, "shimmer.modules.selection.DynamicQueryAttention.forward": {"tf": 1}}, "df": 3}}}}}}, "c": {"docs": {}, "df": 0, "y": {"docs": {"shimmer.modules.losses.demi_cycle_loss": {"tf": 1}}, "df": 1}}, "r": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "p": {"docs": {"shimmer.dataset.RepeatedDataset": {"tf": 1.4142135623730951}, "shimmer.dataset.RepeatedDataset.__init__": {"tf": 1}}, "df": 2}}}}, "f": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "m": {"docs": {"shimmer.types.RawDomainGroupT": {"tf": 1}, "shimmer.types.RawDomainGroupDT": {"tf": 1}, "shimmer.types.LatentsDomainGroupT": {"tf": 1}, "shimmer.types.LatentsDomainGroupDT": {"tf": 1}, "shimmer.modules.global_workspace.GWPredictionsBase.states": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.encode_domain": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.decode_domain": {"tf": 1}, "shimmer.modules.global_workspace.GWPredictions.cycles": {"tf": 1}, "shimmer.modules.global_workspace.GWPredictions.translations": {"tf": 1}, "shimmer.modules.global_workspace.pretrained_global_workspace": {"tf": 1.4142135623730951}, "shimmer.modules.domain.DomainModule.decode": {"tf": 1}, "shimmer.modules.selection.SingleDomainSelection": {"tf": 1}, "shimmer.modules.losses.translation_loss": {"tf": 1}, "shimmer.modules.vae.reparameterize": {"tf": 1}, "shimmer.modules.vae.VAE.forward": {"tf": 1}, "shimmer.modules.utils.translation": {"tf": 1}, "shimmer.modules.utils.cycle": {"tf": 1}}, "df": 17}, "z": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "n": {"docs": {"shimmer.modules.global_workspace.freeze_domain_modules": {"tf": 1}}, "df": 1, "s": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "t": {"docs": {"shimmer.types.RawDomainGroupsT": {"tf": 2}, "shimmer.types.RawDomainGroupsDT": {"tf": 2}, "shimmer.types.LatentsDomainGroupsT": {"tf": 2}, "shimmer.types.LatentsDomainGroupsDT": {"tf": 2}}, "df": 4}}}}}}}, "e": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "z": {"docs": {}, "df": 0, "e": {"docs": {"shimmer.modules.global_workspace.freeze_domain_modules": {"tf": 1}}, "df": 1, "s": {"docs": {"shimmer.modules.global_workspace.freeze_domain_modules": {"tf": 1}}, "df": 1}}}}}, "a": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "{": {"1": {"docs": {}, "df": 0, "}": {"docs": {}, "df": 0, "{": {"docs": {}, "df": 0, "\\": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "m": {"docs": {"shimmer.modules.gw_module.GWModuleBayesian.fuse": {"tf": 1.7320508075688772}}, "df": 1}}, "i": {"docs": {}, "df": 0, "g": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "a": {"docs": {"shimmer.modules.gw_module.GWModuleBayesian.fuse": {"tf": 1}}, "df": 1}}}}}, "m": {"docs": {}, "df": 0, "u": {"docs": {"shimmer.modules.gw_module.GWModuleBayesian.fuse": {"tf": 1}}, "df": 1}}, "f": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "{": {"docs": {}, "df": 0, "c": {"docs": {"shimmer.modules.gw_module.GWModuleBayesian.fuse": {"tf": 1}}, "df": 1}}}}}}}}}}, "docs": {}, "df": 0, "m": {"docs": {"shimmer.modules.gw_module.GWModuleBayesian.fuse": {"tf": 1.7320508075688772}}, "df": 1}, "c": {"docs": {"shimmer.modules.gw_module.GWModuleBayesian.fuse": {"tf": 2}}, "df": 1}}}}}, "u": {"docs": {}, "df": 0, "n": {"docs": {"shimmer.types.RawDomainGroupT": {"tf": 1.4142135623730951}, "shimmer.types.RawDomainGroupDT": {"tf": 1}, "shimmer.types.LatentsDomainGroupT": {"tf": 1.4142135623730951}, "shimmer.types.LatentsDomainGroupDT": {"tf": 1}, "shimmer.types.RawDomainGroupsT": {"tf": 1}, "shimmer.types.RawDomainGroupsDT": {"tf": 1}, "shimmer.types.LatentsDomainGroupsT": {"tf": 1.4142135623730951}, "shimmer.types.LatentsDomainGroupsDT": {"tf": 1}}, "df": 8, "c": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "n": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspace2Domains.__init__": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace.__init__": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian.__init__": {"tf": 1}, "shimmer.modules.global_workspace.pretrained_global_workspace": {"tf": 1}, "shimmer.modules.gw_module.GWEncoder.forward": {"tf": 1}, "shimmer.modules.gw_module.GWEncoderLinear.forward": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBase.fuse": {"tf": 1}, "shimmer.modules.gw_module.GWModule.fuse": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBayesian.fuse": {"tf": 1.4142135623730951}, "shimmer.modules.selection.RandomSelection.forward": {"tf": 1}, "shimmer.modules.losses.contrastive_loss": {"tf": 1}, "shimmer.modules.losses.contrastive_loss_bayesian": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.__init__": {"tf": 1}, "shimmer.modules.losses.GWLosses.__init__": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.__init__": {"tf": 1}, "shimmer.modules.contrastive_loss.ContrastiveLossType": {"tf": 1.4142135623730951}, "shimmer.modules.contrastive_loss.ContrastiveLossBayesianType": {"tf": 1.4142135623730951}}, "df": 17, "s": {"docs": {"shimmer.types.RawDomainGroupT": {"tf": 1.4142135623730951}, "shimmer.types.RawDomainGroupDT": {"tf": 1.4142135623730951}, "shimmer.types.LatentsDomainGroupT": {"tf": 1.4142135623730951}, "shimmer.types.LatentsDomainGroupDT": {"tf": 1.4142135623730951}, "shimmer.types.RawDomainGroupsT": {"tf": 1.4142135623730951}, "shimmer.types.RawDomainGroupsDT": {"tf": 1.4142135623730951}, "shimmer.types.LatentsDomainGroupsT": {"tf": 1.4142135623730951}, "shimmer.types.LatentsDomainGroupsDT": {"tf": 1.4142135623730951}}, "df": 8}}}}}}}, "s": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "n": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspaceBase.encode": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.fuse": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace2Domains.__init__": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace.__init__": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian.__init__": {"tf": 1}, "shimmer.modules.global_workspace.pretrained_global_workspace": {"tf": 1}, "shimmer.modules.domain.DomainModule.compute_broadcast_loss": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBase.encode": {"tf": 1.4142135623730951}, "shimmer.modules.gw_module.GWModule.__init__": {"tf": 1}, "shimmer.modules.gw_module.GWModule.encode": {"tf": 1.4142135623730951}, "shimmer.modules.gw_module.GWModuleBayesian.__init__": {"tf": 1}, "shimmer.modules.selection.SelectionBase": {"tf": 1}, "shimmer.modules.selection.SelectionBase.forward": {"tf": 1}, "shimmer.modules.selection.KQFixedQSelection.forward": {"tf": 1}, "shimmer.modules.selection.RandomSelection.forward": {"tf": 1}, "shimmer.modules.selection.DynamicQueryAttention.forward": {"tf": 1}, "shimmer.modules.losses.GWLosses": {"tf": 1}, "shimmer.modules.losses.GWLosses.__init__": {"tf": 1}}, "df": 19}}}, "e": {"docs": {"shimmer.modules.gw_module.GWModuleBase.encode_and_fuse": {"tf": 1}, "shimmer.modules.selection.DynamicQueryAttention.fuse_weighted_encodings": {"tf": 1}}, "df": 2, "s": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspaceBase.fuse": {"tf": 1}}, "df": 1}, "d": {"docs": {"shimmer.modules.selection.DynamicQueryAttention.fuse_weighted_encodings": {"tf": 1}, "shimmer.modules.losses.BroadcastLossCoefs.fused": {"tf": 1}}, "df": 2}}}, "l": {"docs": {}, "df": 0, "l": {"docs": {"shimmer.modules.utils.cycle": {"tf": 1}}, "df": 1}}}, "o": {"docs": {}, "df": 0, "r": {"docs": {"shimmer.types.RawDomainGroupT": {"tf": 1.4142135623730951}, "shimmer.types.RawDomainGroupDT": {"tf": 1.4142135623730951}, "shimmer.types.LatentsDomainGroupT": {"tf": 1.4142135623730951}, "shimmer.types.LatentsDomainGroupDT": {"tf": 1.4142135623730951}, "shimmer.types.RawDomainGroupsT": {"tf": 1.4142135623730951}, "shimmer.types.RawDomainGroupsDT": {"tf": 1.4142135623730951}, "shimmer.types.LatentsDomainGroupsT": {"tf": 1.4142135623730951}, "shimmer.types.LatentsDomainGroupsDT": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.fuse": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.batch_gw_states": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.encode_domain": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.decode_domain": {"tf": 1}, "shimmer.modules.global_workspace.freeze_domain_modules": {"tf": 1}, "shimmer.modules.global_workspace.GWPredictions.demi_cycles": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace2Domains.__init__": {"tf": 1.7320508075688772}, "shimmer.modules.global_workspace.GlobalWorkspace2Domains.forward": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace.__init__": {"tf": 2.23606797749979}, "shimmer.modules.global_workspace.GlobalWorkspace.forward": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian.__init__": {"tf": 1.7320508075688772}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian.forward": {"tf": 1}, "shimmer.modules.global_workspace.pretrained_global_workspace": {"tf": 1.7320508075688772}, "shimmer.modules.domain.LossOutput": {"tf": 1.7320508075688772}, "shimmer.modules.domain.DomainModule": {"tf": 1}, "shimmer.modules.domain.DomainModule.compute_dcy_loss": {"tf": 1}, "shimmer.modules.domain.DomainModule.compute_cy_loss": {"tf": 1}, "shimmer.modules.domain.DomainModule.compute_tr_loss": {"tf": 1}, "shimmer.modules.domain.DomainModule.compute_broadcast_loss": {"tf": 1}, "shimmer.modules.gw_module.GWDecoder": {"tf": 1}, "shimmer.modules.gw_module.GWEncoder.forward": {"tf": 1}, "shimmer.modules.gw_module.GWEncoderLinear.forward": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBase": {"tf": 1.4142135623730951}, "shimmer.modules.gw_module.GWModule.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.gw_module.compute_fusion_scores": {"tf": 1.4142135623730951}, "shimmer.modules.gw_module.GWModuleBayesian.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.gw_module.GWModuleBayesian.precisions": {"tf": 1}, "shimmer.modules.selection.SelectionBase": {"tf": 1.4142135623730951}, "shimmer.modules.selection.SelectionBase.forward": {"tf": 1.4142135623730951}, "shimmer.modules.selection.SingleDomainSelection": {"tf": 1}, "shimmer.modules.selection.SingleDomainSelection.forward": {"tf": 1}, "shimmer.modules.selection.FixedSharedSelection": {"tf": 1.7320508075688772}, "shimmer.modules.selection.FixedSharedSelection.forward": {"tf": 1}, "shimmer.modules.selection.KQFixedQSelection.__init__": {"tf": 1}, "shimmer.modules.selection.KQFixedQSelection.forward": {"tf": 1}, "shimmer.modules.selection.RandomSelection.forward": {"tf": 1.7320508075688772}, "shimmer.modules.selection.DynamicQueryAttention.__init__": {"tf": 1}, "shimmer.modules.selection.DynamicQueryAttention.fuse_weighted_encodings": {"tf": 1}, "shimmer.modules.selection.DynamicQueryAttention.forward": {"tf": 1}, "shimmer.modules.losses.GWLossesBase": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains": {"tf": 1}, "shimmer.modules.losses.generate_partitions": {"tf": 1.4142135623730951}, "shimmer.modules.losses.GWLosses": {"tf": 1}, "shimmer.modules.losses.GWLosses.__init__": {"tf": 2.23606797749979}, "shimmer.modules.losses.GWLosses.contrastive_loss": {"tf": 1}, "shimmer.modules.losses.GWLosses.step": {"tf": 1.4142135623730951}, "shimmer.modules.losses.GWLossesBayesian": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.step": {"tf": 1.4142135623730951}, "shimmer.modules.contrastive_loss.ContrastiveLossBayesianType": {"tf": 1}, "shimmer.modules.vae.reparameterize": {"tf": 1}, "shimmer.modules.vae.VAEEncoder": {"tf": 1}, "shimmer.modules.vae.VAEDecoder": {"tf": 1}, "shimmer.modules.vae.VAE.__init__": {"tf": 1}, "shimmer.modules.vae.VAE.beta": {"tf": 1}, "shimmer.modules.utils.batch_demi_cycles": {"tf": 1}, "shimmer.modules.utils.batch_cycles": {"tf": 1.4142135623730951}, "shimmer.modules.utils.batch_translations": {"tf": 1}, "shimmer.cli.ckpt_migration.migrate_ckpt": {"tf": 1}}, "df": 66, "w": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "d": {"docs": {"shimmer.modules.gw_module.GWEncoder.forward": {"tf": 1}, "shimmer.modules.gw_module.GWEncoderLinear.forward": {"tf": 1}, "shimmer.modules.selection.SelectionBase.forward": {"tf": 1.4142135623730951}, "shimmer.modules.selection.SingleDomainSelection.forward": {"tf": 1}, "shimmer.modules.selection.FixedSharedSelection.forward": {"tf": 1}}, "df": 5}}}}, "m": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "r": {"docs": {"shimmer.modules.gw_module.GWEncoder.forward": {"tf": 1}, "shimmer.modules.gw_module.GWEncoderLinear.forward": {"tf": 1}}, "df": 2}}}}, "l": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "w": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "g": {"docs": {"shimmer.modules.gw_module.GWModuleBayesian.fuse": {"tf": 1}}, "df": 1}}}, "e": {"docs": {}, "df": 0, "d": {"docs": {"shimmer.modules.selection.RandomSelection": {"tf": 1}}, "df": 1}}}}}}, "c": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "s": {"docs": {"shimmer.modules.selection.RandomSelection": {"tf": 1}}, "df": 1}}}}}}, "l": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "v": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "r": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspace2Domains": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace": {"tf": 1}, "shimmer.modules.global_workspace.pretrained_global_workspace": {"tf": 1}}, "df": 3}}}}, "o": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "t": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspace2Domains.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.GlobalWorkspace.__init__": {"tf": 1.7320508075688772}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian.__init__": {"tf": 2.23606797749979}, "shimmer.modules.gw_module.compute_fusion_scores": {"tf": 1.7320508075688772}, "shimmer.modules.gw_module.GWModuleBayesian.__init__": {"tf": 1.7320508075688772}, "shimmer.modules.selection.RandomSelection.__init__": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.__init__": {"tf": 1}, "shimmer.modules.vae.VAE.__init__": {"tf": 1}}, "df": 8}}}}, "i": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "l": {"docs": {"shimmer.modules.gw_module.GWModuleBase.encode_and_fuse": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBayesian.fuse": {"tf": 1}, "shimmer.dataset.RepeatedDataset.__init__": {"tf": 1}}, "df": 3, "l": {"docs": {}, "df": 0, "y": {"docs": {"shimmer.modules.gw_module.GWModuleBayesian.fuse": {"tf": 1}}, "df": 1}}, "e": {"docs": {"shimmer.modules.gw_module.GWModuleBayesian.fuse": {"tf": 1}}, "df": 1}}}}, "r": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "t": {"docs": {"shimmer.modules.gw_module.compute_fusion_scores": {"tf": 1.4142135623730951}, "shimmer.modules.vae.VAE.forward": {"tf": 1}}, "df": 2}}}, "x": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "d": {"docs": {"shimmer.modules.selection.KQFixedQSelection": {"tf": 1}}, "df": 1}}}}, "a": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "s": {"docs": {"shimmer.modules.selection.RandomSelection": {"tf": 1}, "shimmer.modules.selection.RandomSelection.__init__": {"tf": 1}}, "df": 2}}}}}, "l": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "e": {"docs": {"shimmer.modules.contrastive_loss.ContrastiveLoss.__init__": {"tf": 1}, "shimmer.dataset.RepeatedDataset": {"tf": 1}}, "df": 2}}}}, "n": {"docs": {"shimmer.modules.losses.contrastive_loss": {"tf": 1}, "shimmer.modules.losses.contrastive_loss_bayesian": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.__init__": {"tf": 1}, "shimmer.modules.losses.GWLosses.__init__": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.__init__": {"tf": 1}}, "df": 5}}, "k": {"docs": {"shimmer.modules.gw_module.GWModuleBayesian.fuse": {"tf": 3}}, "df": 1, "e": {"docs": {}, "df": 0, "y": {"docs": {"shimmer.modules.global_workspace.GWPredictionsBase.states": {"tf": 1}, "shimmer.modules.domain.LossOutput.all": {"tf": 1}, "shimmer.modules.selection.KQFixedQSelection": {"tf": 1}, "shimmer.modules.selection.KQFixedQSelection.__init__": {"tf": 1}, "shimmer.modules.selection.DynamicQueryAttention": {"tf": 1}, "shimmer.modules.selection.DynamicQueryAttention.__init__": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.__init__": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.__init__": {"tf": 1}}, "df": 8, "s": {"docs": {"shimmer.types.RawDomainGroupT": {"tf": 1}, "shimmer.types.RawDomainGroupDT": {"tf": 1}, "shimmer.types.LatentsDomainGroupT": {"tf": 1}, "shimmer.types.LatentsDomainGroupDT": {"tf": 1}, "shimmer.types.RawDomainGroupsT": {"tf": 1}, "shimmer.types.RawDomainGroupsDT": {"tf": 1}, "shimmer.types.LatentsDomainGroupsT": {"tf": 1}, "shimmer.types.LatentsDomainGroupsDT": {"tf": 1}, "shimmer.modules.global_workspace.GWPredictions.cycles": {"tf": 1}, "shimmer.modules.global_workspace.GWPredictions.translations": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace2Domains.__init__": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace.__init__": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian.__init__": {"tf": 1}, "shimmer.modules.global_workspace.pretrained_global_workspace": {"tf": 1}, "shimmer.modules.gw_module.GWModule.decode": {"tf": 1}, "shimmer.modules.selection.KQFixedQSelection.forward": {"tf": 1}, "shimmer.modules.selection.DynamicQueryAttention.forward": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.__init__": {"tf": 1}}, "df": 18}}, "e": {"docs": {}, "df": 0, "p": {"docs": {}, "df": 0, "s": {"docs": {"shimmer.modules.domain.LossOutput": {"tf": 1}}, "df": 1}}}}, "w": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "g": {"docs": {}, "df": 0, "s": {"docs": {"shimmer.modules.global_workspace.pretrained_global_workspace": {"tf": 1}, "shimmer.utils.migrate_model": {"tf": 1}}, "df": 2}}}}}, "i": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "d": {"docs": {"shimmer.modules.gw_module.GWModuleBayesian.fuse": {"tf": 1}}, "df": 1}}}, "^": {"2": {"docs": {"shimmer.modules.gw_module.GWModuleBayesian.fuse": {"tf": 2.449489742783178}}, "df": 1}, "docs": {}, "df": 0}, "l": {"docs": {"shimmer.modules.vae.kl_divergence_loss": {"tf": 1}}, "df": 1}}, "o": {"docs": {}, "df": 0, "f": {"docs": {"shimmer.types.RawDomainGroupT": {"tf": 1.4142135623730951}, "shimmer.types.RawDomainGroupDT": {"tf": 1.7320508075688772}, "shimmer.types.LatentsDomainGroupT": {"tf": 1.4142135623730951}, "shimmer.types.LatentsDomainGroupDT": {"tf": 1.4142135623730951}, "shimmer.types.RawDomainGroupsT": {"tf": 2}, "shimmer.types.RawDomainGroupsDT": {"tf": 2}, "shimmer.types.LatentsDomainGroupsT": {"tf": 1.4142135623730951}, "shimmer.types.LatentsDomainGroupsDT": {"tf": 1.4142135623730951}, "shimmer.types.ModelModeT": {"tf": 1}, "shimmer.modules.global_workspace.SchedulerArgs": {"tf": 1}, "shimmer.modules.global_workspace.SchedulerArgs.total_steps": {"tf": 1}, "shimmer.modules.global_workspace.GWPredictionsBase": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.loss_mod": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.workspace_dim": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.encode_and_fuse": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.encode": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.fuse": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.decode": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.batch_gw_states": {"tf": 2.23606797749979}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.encode_domains": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.decode_domains": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.generic_step": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.freeze_domain_modules": {"tf": 1}, "shimmer.modules.global_workspace.GWPredictions": {"tf": 1}, "shimmer.modules.global_workspace.GWPredictions.demi_cycles": {"tf": 1}, "shimmer.modules.global_workspace.GWPredictions.cycles": {"tf": 1}, "shimmer.modules.global_workspace.GWPredictions.translations": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace2Domains": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace2Domains.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.GlobalWorkspace2Domains.forward": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.GlobalWorkspace.forward": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian.__init__": {"tf": 1.7320508075688772}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian.forward": {"tf": 1}, "shimmer.modules.global_workspace.pretrained_global_workspace": {"tf": 1.7320508075688772}, "shimmer.modules.domain.LossOutput": {"tf": 1}, "shimmer.modules.domain.DomainModule": {"tf": 1}, "shimmer.modules.domain.DomainModule.__init__": {"tf": 1}, "shimmer.modules.domain.DomainModule.latent_dim": {"tf": 1}, "shimmer.modules.domain.DomainModule.encode": {"tf": 1}, "shimmer.modules.domain.DomainModule.decode": {"tf": 1}, "shimmer.modules.domain.DomainModule.compute_loss": {"tf": 1}, "shimmer.modules.domain.DomainModule.compute_dcy_loss": {"tf": 1}, "shimmer.modules.domain.DomainModule.compute_cy_loss": {"tf": 1}, "shimmer.modules.domain.DomainModule.compute_tr_loss": {"tf": 1}, "shimmer.modules.domain.DomainModule.compute_broadcast_loss": {"tf": 1}, "shimmer.modules.gw_module.get_n_layers": {"tf": 2}, "shimmer.modules.gw_module.GWDecoder.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.gw_module.GWDecoder.n_layers": {"tf": 1.4142135623730951}, "shimmer.modules.gw_module.GWEncoder.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.gw_module.GWEncoder.forward": {"tf": 1.4142135623730951}, "shimmer.modules.gw_module.GWEncoderLinear.forward": {"tf": 1.4142135623730951}, "shimmer.modules.gw_module.GWModuleBase.__init__": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBase.workspace_dim": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBase.fuse": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBase.decode": {"tf": 1}, "shimmer.modules.gw_module.GWModule.__init__": {"tf": 1}, "shimmer.modules.gw_module.GWModule.fuse": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBayesian.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.gw_module.GWModuleBayesian.get_precision": {"tf": 1.7320508075688772}, "shimmer.modules.gw_module.GWModuleBayesian.fuse": {"tf": 2.23606797749979}, "shimmer.modules.selection.SelectionBase.update_gw_state": {"tf": 1}, "shimmer.modules.selection.SelectionBase.forward": {"tf": 1.4142135623730951}, "shimmer.modules.selection.SingleDomainSelection": {"tf": 1.4142135623730951}, "shimmer.modules.selection.SingleDomainSelection.forward": {"tf": 1}, "shimmer.modules.selection.FixedSharedSelection.forward": {"tf": 1}, "shimmer.modules.selection.KQFixedQSelection.__init__": {"tf": 1.7320508075688772}, "shimmer.modules.selection.KQFixedQSelection.forward": {"tf": 1.4142135623730951}, "shimmer.modules.selection.RandomSelection.__init__": {"tf": 1}, "shimmer.modules.selection.RandomSelection.forward": {"tf": 1.4142135623730951}, "shimmer.modules.selection.DynamicQueryAttention.__init__": {"tf": 1.7320508075688772}, "shimmer.modules.selection.DynamicQueryAttention.forward": {"tf": 1.4142135623730951}, "shimmer.modules.losses.GWLossesBase": {"tf": 1}, "shimmer.modules.losses.demi_cycle_loss": {"tf": 1.7320508075688772}, "shimmer.modules.losses.cycle_loss": {"tf": 1.7320508075688772}, "shimmer.modules.losses.translation_loss": {"tf": 1.4142135623730951}, "shimmer.modules.losses.contrastive_loss": {"tf": 1.4142135623730951}, "shimmer.modules.losses.contrastive_loss_bayesian": {"tf": 1.4142135623730951}, "shimmer.modules.losses.LossCoefs": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.demi_cycle_loss": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.cycle_loss": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.translation_loss": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.contrastive_loss": {"tf": 1}, "shimmer.modules.losses.generate_partitions": {"tf": 1.7320508075688772}, "shimmer.modules.losses.BroadcastLossCoefs": {"tf": 1}, "shimmer.modules.losses.BroadcastLossCoefs.fused": {"tf": 1}, "shimmer.modules.losses.GWLosses": {"tf": 1}, "shimmer.modules.losses.GWLosses.__init__": {"tf": 1}, "shimmer.modules.losses.GWLosses.contrastive_loss": {"tf": 1}, "shimmer.modules.losses.GWLosses.step": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.contrastive_loss": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.step": {"tf": 1}, "shimmer.modules.contrastive_loss.ContrastiveLoss.forward": {"tf": 1}, "shimmer.dataset.RepeatedDataset": {"tf": 1}, "shimmer.dataset.RepeatedDataset.__init__": {"tf": 1}, "shimmer.modules.vae.VAE.encode": {"tf": 1}, "shimmer.modules.vae.VAE.forward": {"tf": 1}, "shimmer.modules.utils.translation": {"tf": 1.4142135623730951}, "shimmer.modules.utils.cycle": {"tf": 1.7320508075688772}, "shimmer.modules.utils.batch_demi_cycles": {"tf": 2.23606797749979}, "shimmer.modules.utils.batch_cycles": {"tf": 2.6457513110645907}, "shimmer.modules.utils.batch_translations": {"tf": 2.449489742783178}, "shimmer.utils.groups_batch_size": {"tf": 1.4142135623730951}, "shimmer.utils.groups_device": {"tf": 1.4142135623730951}, "shimmer.utils.migrate_model": {"tf": 1}, "shimmer.utils.SaveMigrations": {"tf": 1}, "shimmer.cli.ckpt_migration.migrate_ckpt": {"tf": 1.4142135623730951}}, "df": 110}, "u": {"docs": {}, "df": 0, "t": {"docs": {"shimmer.types.ModelModeT": {"tf": 1}, "shimmer.modules.gw_module.GWDecoder.__init__": {"tf": 1}, "shimmer.modules.gw_module.GWEncoder.__init__": {"tf": 1}, "shimmer.modules.utils.batch_cycles": {"tf": 1}}, "df": 4, "p": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "t": {"docs": {"shimmer.types.RawDomainGroupDT": {"tf": 1}, "shimmer.modules.global_workspace.GWPredictionsBase": {"tf": 1}, "shimmer.modules.global_workspace.freeze_domain_modules": {"tf": 1}, "shimmer.modules.global_workspace.GWPredictions": {"tf": 1}, "shimmer.modules.gw_module.GWDecoder.__init__": {"tf": 1}, "shimmer.modules.gw_module.GWDecoder.out_dim": {"tf": 1}, "shimmer.modules.gw_module.GWEncoder.__init__": {"tf": 1}, "shimmer.modules.losses.demi_cycle_loss": {"tf": 1}, "shimmer.modules.losses.cycle_loss": {"tf": 1}, "shimmer.modules.losses.translation_loss": {"tf": 1}, "shimmer.modules.losses.contrastive_loss": {"tf": 1}, "shimmer.modules.losses.contrastive_loss_bayesian": {"tf": 1}}, "df": 12, "s": {"docs": {"shimmer.types.RawDomainGroupT": {"tf": 1}, "shimmer.types.RawDomainGroupDT": {"tf": 1}, "shimmer.types.LatentsDomainGroupT": {"tf": 1}, "shimmer.types.LatentsDomainGroupDT": {"tf": 1}, "shimmer.types.RawDomainGroupsT": {"tf": 1}, "shimmer.types.RawDomainGroupsDT": {"tf": 1}, "shimmer.types.LatentsDomainGroupsT": {"tf": 1}, "shimmer.types.LatentsDomainGroupsDT": {"tf": 1}}, "df": 8}}}}}}, "t": {"docs": {}, "df": 0, "h": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "r": {"docs": {"shimmer.types.RawDomainGroupT": {"tf": 1}, "shimmer.types.LatentsDomainGroupT": {"tf": 1}, "shimmer.types.LatentsDomainGroupsT": {"tf": 1}, "shimmer.utils.migrate_model": {"tf": 1}}, "df": 4}}}}, "r": {"docs": {"shimmer.types.ModelModeT": {"tf": 1.4142135623730951}, "shimmer.modules.losses.GWLosses2Domains.__init__": {"tf": 1}}, "df": 2, "i": {"docs": {}, "df": 0, "g": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "l": {"docs": {"shimmer.modules.domain.DomainModule.decode": {"tf": 1}, "shimmer.modules.utils.cycle": {"tf": 1.4142135623730951}}, "df": 2}}}}}}}, "n": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspaceBase.generic_step": {"tf": 1}, "shimmer.modules.global_workspace.GWPredictions.demi_cycles": {"tf": 1}, "shimmer.modules.global_workspace.GWPredictions.cycles": {"tf": 1}, "shimmer.modules.global_workspace.GWPredictions.translations": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace2Domains.forward": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace.forward": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian.forward": {"tf": 1}, "shimmer.modules.selection.RandomSelection": {"tf": 1}, "shimmer.modules.selection.RandomSelection.forward": {"tf": 1}, "shimmer.modules.selection.DynamicQueryAttention": {"tf": 1}}, "df": 10, "e": {"docs": {"shimmer.modules.global_workspace.GWPredictionsBase.states": {"tf": 1}, "shimmer.modules.global_workspace.GWPredictions.demi_cycles": {"tf": 1}, "shimmer.modules.global_workspace.GWPredictions.cycles": {"tf": 1.7320508075688772}, "shimmer.modules.global_workspace.GWPredictions.translations": {"tf": 1.7320508075688772}, "shimmer.modules.gw_module.GWDecoder.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.gw_module.GWDecoder.n_layers": {"tf": 1.4142135623730951}, "shimmer.modules.gw_module.GWEncoder.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.gw_module.GWEncoder.forward": {"tf": 1}, "shimmer.modules.gw_module.GWEncoderLinear.forward": {"tf": 1}, "shimmer.modules.losses.LossCoefs": {"tf": 1}, "shimmer.modules.losses.BroadcastLossCoefs": {"tf": 1}, "shimmer.modules.losses.BroadcastLossCoefs.fused": {"tf": 1}, "shimmer.modules.losses.BroadcastLossCoefs.demi_cycles": {"tf": 1.4142135623730951}, "shimmer.modules.losses.BroadcastLossCoefs.cycles": {"tf": 1}, "shimmer.modules.losses.BroadcastLossCoefs.translations": {"tf": 1}, "shimmer.modules.utils.translation": {"tf": 1}, "shimmer.modules.utils.cycle": {"tf": 1}}, "df": 17, "c": {"docs": {}, "df": 0, "y": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "e": {"docs": {"shimmer.modules.global_workspace.SchedulerArgs": {"tf": 1}}, "df": 1}}}}}, "s": {"docs": {"shimmer.modules.losses.generate_partitions": {"tf": 1.4142135623730951}}, "df": 1}}, "l": {"docs": {}, "df": 0, "y": {"docs": {"shimmer.modules.global_workspace.GWPredictionsBase.states": {"tf": 1}, "shimmer.modules.global_workspace.GWPredictions.demi_cycles": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.GWPredictions.cycles": {"tf": 1}, "shimmer.modules.global_workspace.GWPredictions.translations": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace2Domains": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian": {"tf": 1}, "shimmer.modules.domain.LossOutput": {"tf": 1}, "shimmer.modules.selection.RandomSelection": {"tf": 1}}, "df": 9}}, "c": {"docs": {}, "df": 0, "e": {"docs": {"shimmer.modules.selection.KQFixedQSelection.forward": {"tf": 1.4142135623730951}, "shimmer.modules.selection.DynamicQueryAttention.forward": {"tf": 1.4142135623730951}}, "df": 2}}}, "v": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "r": {"docs": {"shimmer.modules.utils.translation": {"tf": 1}, "shimmer.modules.utils.cycle": {"tf": 1}}, "df": 2, "r": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "d": {"docs": {}, "df": 0, "e": {"docs": {"shimmer.modules.domain.DomainModule.compute_dcy_loss": {"tf": 1}, "shimmer.modules.domain.DomainModule.compute_cy_loss": {"tf": 1}, "shimmer.modules.domain.DomainModule.compute_tr_loss": {"tf": 1}, "shimmer.modules.domain.DomainModule.compute_broadcast_loss": {"tf": 1}, "shimmer.utils.SaveMigrations": {"tf": 1}}, "df": 5, "s": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspace2Domains": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian": {"tf": 1}}, "df": 3}}, "d": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "n": {"docs": {"shimmer.modules.gw_module.GWEncoder.forward": {"tf": 1}, "shimmer.modules.gw_module.GWEncoderLinear.forward": {"tf": 1}}, "df": 2}}}}}}, "f": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "w": {"docs": {"shimmer.dataset.RepeatedDataset.__init__": {"tf": 1}}, "df": 1}}}}}}}, "p": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "m": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspace2Domains.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.GlobalWorkspace.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian.__init__": {"tf": 1.4142135623730951}}, "df": 3, "i": {"docs": {}, "df": 0, "z": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "n": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspace2Domains.__init__": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace.__init__": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian.__init__": {"tf": 1}}, "df": 3}}}}}}}}}}, "e": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "s": {"docs": {"shimmer.modules.gw_module.GWModuleBase": {"tf": 1}}, "df": 1}}}, "n": {"docs": {}, "df": 0, "g": {"docs": {"shimmer.modules.losses.GWLosses.step": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.step": {"tf": 1}}, "df": 2}}}}}}}}, "b": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "n": {"docs": {"shimmer.modules.gw_module.GWModuleBayesian.fuse": {"tf": 1.4142135623730951}}, "df": 1, "e": {"docs": {}, "df": 0, "d": {"docs": {"shimmer.modules.gw_module.GWModuleBayesian.fuse": {"tf": 1}}, "df": 1}}}}}}, "j": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "t": {"docs": {"shimmer.modules.losses.GWLosses2Domains.__init__": {"tf": 1}, "shimmer.modules.losses.GWLosses.step": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.step": {"tf": 1}}, "df": 3}}}}}, "m": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "s": {"docs": {"shimmer.modules.selection.RandomSelection": {"tf": 1}}, "df": 1}}}}}, "t": {"docs": {"shimmer.modules.selection.SelectionBase.forward": {"tf": 1.4142135623730951}}, "df": 1, "h": {"docs": {}, "df": 0, "e": {"docs": {"shimmer.types.RawDomainGroupT": {"tf": 2}, "shimmer.types.RawDomainGroupDT": {"tf": 1.4142135623730951}, "shimmer.types.LatentsDomainGroupT": {"tf": 1.4142135623730951}, "shimmer.types.LatentsDomainGroupDT": {"tf": 1.4142135623730951}, "shimmer.types.RawDomainGroupsT": {"tf": 1}, "shimmer.types.RawDomainGroupsDT": {"tf": 1}, "shimmer.types.LatentsDomainGroupsT": {"tf": 1}, "shimmer.types.LatentsDomainGroupsDT": {"tf": 1}, "shimmer.modules.global_workspace.SchedulerArgs": {"tf": 1}, "shimmer.modules.global_workspace.GWPredictionsBase": {"tf": 1}, "shimmer.modules.global_workspace.GWPredictionsBase.states": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.GlobalWorkspaceBase": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.loss_mod": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.workspace_dim": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.encode_and_fuse": {"tf": 1.7320508075688772}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.encode": {"tf": 1.7320508075688772}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.fuse": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.decode": {"tf": 1.7320508075688772}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.batch_gw_states": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.encode_domain": {"tf": 2.23606797749979}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.encode_domains": {"tf": 1.7320508075688772}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.decode_domain": {"tf": 2.23606797749979}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.decode_domains": {"tf": 1.7320508075688772}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.generic_step": {"tf": 1.7320508075688772}, "shimmer.modules.global_workspace.freeze_domain_modules": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.GWPredictions": {"tf": 1}, "shimmer.modules.global_workspace.GWPredictions.demi_cycles": {"tf": 1}, "shimmer.modules.global_workspace.GWPredictions.cycles": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.GWPredictions.translations": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.GlobalWorkspace2Domains": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace2Domains.__init__": {"tf": 2.449489742783178}, "shimmer.modules.global_workspace.GlobalWorkspace2Domains.forward": {"tf": 1.7320508075688772}, "shimmer.modules.global_workspace.GlobalWorkspace": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.GlobalWorkspace.__init__": {"tf": 2.8284271247461903}, "shimmer.modules.global_workspace.GlobalWorkspace.forward": {"tf": 1.7320508075688772}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian.__init__": {"tf": 2.8284271247461903}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian.forward": {"tf": 1.7320508075688772}, "shimmer.modules.global_workspace.pretrained_global_workspace": {"tf": 2.23606797749979}, "shimmer.modules.domain.DomainModule": {"tf": 1}, "shimmer.modules.domain.DomainModule.__init__": {"tf": 1}, "shimmer.modules.domain.DomainModule.latent_dim": {"tf": 1.4142135623730951}, "shimmer.modules.domain.DomainModule.encode": {"tf": 1.4142135623730951}, "shimmer.modules.domain.DomainModule.decode": {"tf": 1.7320508075688772}, "shimmer.modules.domain.DomainModule.compute_loss": {"tf": 1.4142135623730951}, "shimmer.modules.domain.DomainModule.compute_dcy_loss": {"tf": 2}, "shimmer.modules.domain.DomainModule.compute_cy_loss": {"tf": 2}, "shimmer.modules.domain.DomainModule.compute_tr_loss": {"tf": 2}, "shimmer.modules.domain.DomainModule.compute_broadcast_loss": {"tf": 2}, "shimmer.modules.gw_module.get_n_layers": {"tf": 1}, "shimmer.modules.gw_module.GWDecoder.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.gw_module.GWDecoder.n_layers": {"tf": 1}, "shimmer.modules.gw_module.GWEncoder": {"tf": 1.4142135623730951}, "shimmer.modules.gw_module.GWEncoder.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.gw_module.GWEncoder.forward": {"tf": 2.449489742783178}, "shimmer.modules.gw_module.GWEncoderLinear.forward": {"tf": 2.449489742783178}, "shimmer.modules.gw_module.GWModuleBase": {"tf": 1.4142135623730951}, "shimmer.modules.gw_module.GWModuleBase.__init__": {"tf": 1.7320508075688772}, "shimmer.modules.gw_module.GWModuleBase.domain_mods": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBase.workspace_dim": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBase.fuse": {"tf": 1.7320508075688772}, "shimmer.modules.gw_module.GWModuleBase.encode": {"tf": 1.7320508075688772}, "shimmer.modules.gw_module.GWModuleBase.encode_and_fuse": {"tf": 2.449489742783178}, "shimmer.modules.gw_module.GWModuleBase.decode": {"tf": 1.7320508075688772}, "shimmer.modules.gw_module.GWModule.__init__": {"tf": 1.7320508075688772}, "shimmer.modules.gw_module.GWModule.gw_encoders": {"tf": 1}, "shimmer.modules.gw_module.GWModule.gw_decoders": {"tf": 1}, "shimmer.modules.gw_module.GWModule.fuse": {"tf": 1.7320508075688772}, "shimmer.modules.gw_module.GWModule.encode": {"tf": 1.7320508075688772}, "shimmer.modules.gw_module.GWModule.decode": {"tf": 1.4142135623730951}, "shimmer.modules.gw_module.compute_fusion_scores": {"tf": 2.23606797749979}, "shimmer.modules.gw_module.GWModuleBayesian.__init__": {"tf": 1.7320508075688772}, "shimmer.modules.gw_module.GWModuleBayesian.precisions": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBayesian.get_precision": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBayesian.fuse": {"tf": 4}, "shimmer.modules.selection.SelectionBase": {"tf": 2.23606797749979}, "shimmer.modules.selection.SelectionBase.update_gw_state": {"tf": 1.7320508075688772}, "shimmer.modules.selection.SelectionBase.forward": {"tf": 2}, "shimmer.modules.selection.SingleDomainSelection": {"tf": 1.4142135623730951}, "shimmer.modules.selection.SingleDomainSelection.forward": {"tf": 2}, "shimmer.modules.selection.FixedSharedSelection": {"tf": 1}, "shimmer.modules.selection.FixedSharedSelection.forward": {"tf": 2}, "shimmer.modules.selection.KQFixedQSelection.__init__": {"tf": 1.7320508075688772}, "shimmer.modules.selection.KQFixedQSelection.forward": {"tf": 1.7320508075688772}, "shimmer.modules.selection.RandomSelection": {"tf": 1}, "shimmer.modules.selection.RandomSelection.__init__": {"tf": 1}, "shimmer.modules.selection.RandomSelection.forward": {"tf": 2.449489742783178}, "shimmer.modules.selection.DynamicQueryAttention": {"tf": 1.4142135623730951}, "shimmer.modules.selection.DynamicQueryAttention.__init__": {"tf": 1.7320508075688772}, "shimmer.modules.selection.DynamicQueryAttention.fuse_weighted_encodings": {"tf": 2.23606797749979}, "shimmer.modules.selection.DynamicQueryAttention.forward": {"tf": 1.7320508075688772}, "shimmer.modules.losses.GWLossesBase": {"tf": 1.4142135623730951}, "shimmer.modules.losses.GWLossesBase.step": {"tf": 1.4142135623730951}, "shimmer.modules.losses.demi_cycle_loss": {"tf": 2.6457513110645907}, "shimmer.modules.losses.cycle_loss": {"tf": 2.6457513110645907}, "shimmer.modules.losses.translation_loss": {"tf": 2.6457513110645907}, "shimmer.modules.losses.contrastive_loss": {"tf": 2.6457513110645907}, "shimmer.modules.losses.contrastive_loss_bayesian": {"tf": 2.6457513110645907}, "shimmer.modules.losses.LossCoefs": {"tf": 2}, "shimmer.modules.losses.GWLosses2Domains.__init__": {"tf": 2.449489742783178}, "shimmer.modules.losses.GWLosses2Domains.demi_cycle_loss": {"tf": 1.4142135623730951}, "shimmer.modules.losses.GWLosses2Domains.cycle_loss": {"tf": 1.4142135623730951}, "shimmer.modules.losses.GWLosses2Domains.translation_loss": {"tf": 1.4142135623730951}, "shimmer.modules.losses.GWLosses2Domains.contrastive_loss": {"tf": 1.4142135623730951}, "shimmer.modules.losses.GWLosses2Domains.step": {"tf": 1.4142135623730951}, "shimmer.modules.losses.generate_partitions": {"tf": 1.7320508075688772}, "shimmer.modules.losses.broadcast_loss": {"tf": 2}, "shimmer.modules.losses.BroadcastLossCoefs": {"tf": 2}, "shimmer.modules.losses.GWLosses.__init__": {"tf": 2.6457513110645907}, "shimmer.modules.losses.GWLosses.contrastive_loss": {"tf": 1.7320508075688772}, "shimmer.modules.losses.GWLosses.step": {"tf": 1.7320508075688772}, "shimmer.modules.losses.GWLossesBayesian.__init__": {"tf": 2.8284271247461903}, "shimmer.modules.losses.GWLossesBayesian.gw_mod": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.domain_mods": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.loss_coefs": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.contrastive_loss": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.step": {"tf": 1.7320508075688772}, "shimmer.modules.contrastive_loss.ContrastiveLossType": {"tf": 1}, "shimmer.modules.contrastive_loss.ContrastiveLossBayesianType": {"tf": 1}, "shimmer.modules.contrastive_loss.info_nce": {"tf": 1}, "shimmer.modules.contrastive_loss.contrastive_loss": {"tf": 1}, "shimmer.modules.contrastive_loss.ContrastiveLoss.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.contrastive_loss.ContrastiveLoss.forward": {"tf": 1.4142135623730951}, "shimmer.dataset.RepeatedDataset": {"tf": 1.4142135623730951}, "shimmer.dataset.RepeatedDataset.__init__": {"tf": 1.7320508075688772}, "shimmer.modules.vae.reparameterize": {"tf": 1}, "shimmer.modules.vae.kl_divergence_loss": {"tf": 1.4142135623730951}, "shimmer.modules.vae.gaussian_nll": {"tf": 1}, "shimmer.modules.vae.VAEEncoder.forward": {"tf": 1}, "shimmer.modules.vae.VAEDecoder.forward": {"tf": 1}, "shimmer.modules.vae.VAE.encoder": {"tf": 1}, "shimmer.modules.vae.VAE.decoder": {"tf": 1}, "shimmer.modules.vae.VAE.encode": {"tf": 1.7320508075688772}, "shimmer.modules.vae.VAE.decode": {"tf": 1.7320508075688772}, "shimmer.modules.vae.VAE.forward": {"tf": 2.449489742783178}, "shimmer.modules.utils.translation": {"tf": 2.23606797749979}, "shimmer.modules.utils.cycle": {"tf": 1}, "shimmer.modules.utils.batch_demi_cycles": {"tf": 1.4142135623730951}, "shimmer.modules.utils.batch_cycles": {"tf": 1.7320508075688772}, "shimmer.modules.utils.batch_translations": {"tf": 1.4142135623730951}, "shimmer.utils.groups_batch_size": {"tf": 2}, "shimmer.utils.groups_device": {"tf": 2}, "shimmer.utils.migrate_model": {"tf": 2}, "shimmer.utils.SaveMigrations": {"tf": 1}, "shimmer.utils.SaveMigrations.on_save_checkpoint": {"tf": 1.7320508075688772}, "shimmer.cli.ckpt_migration.migrate_ckpt": {"tf": 1}}, "df": 146, "m": {"docs": {"shimmer.modules.gw_module.GWEncoder.forward": {"tf": 1}, "shimmer.modules.gw_module.GWEncoderLinear.forward": {"tf": 1}, "shimmer.modules.selection.KQFixedQSelection.forward": {"tf": 1}, "shimmer.modules.selection.DynamicQueryAttention.forward": {"tf": 1}, "shimmer.modules.losses.BroadcastLossCoefs.fused": {"tf": 1}}, "df": 5}, "r": {"docs": {}, "df": 0, "e": {"docs": {"shimmer.modules.selection.SingleDomainSelection": {"tf": 1}}, "df": 1}}, "n": {"docs": {"shimmer.modules.selection.RandomSelection.forward": {"tf": 1}}, "df": 1}, "i": {"docs": {}, "df": 0, "r": {"docs": {"shimmer.modules.losses.GWLosses.__init__": {"tf": 1}}, "df": 1}}}, "i": {"docs": {}, "df": 0, "s": {"docs": {"shimmer.types.RawDomainGroupT": {"tf": 1.7320508075688772}, "shimmer.types.RawDomainGroupDT": {"tf": 1.4142135623730951}, "shimmer.types.LatentsDomainGroupT": {"tf": 1.4142135623730951}, "shimmer.types.LatentsDomainGroupDT": {"tf": 1}, "shimmer.types.RawDomainGroupsT": {"tf": 1.7320508075688772}, "shimmer.types.RawDomainGroupsDT": {"tf": 1.7320508075688772}, "shimmer.types.LatentsDomainGroupsT": {"tf": 1.4142135623730951}, "shimmer.types.LatentsDomainGroupsDT": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.encode_domain": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.decode_domain": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace2Domains": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian": {"tf": 1}, "shimmer.modules.domain.LossOutput": {"tf": 1}, "shimmer.modules.gw_module.GWEncoder": {"tf": 1}, "shimmer.modules.gw_module.GWEncoder.forward": {"tf": 1.4142135623730951}, "shimmer.modules.gw_module.GWEncoderLinear.forward": {"tf": 1.4142135623730951}, "shimmer.modules.gw_module.GWModuleBase": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBayesian.fuse": {"tf": 1}, "shimmer.modules.selection.SelectionBase": {"tf": 1}, "shimmer.modules.selection.SelectionBase.update_gw_state": {"tf": 1.4142135623730951}, "shimmer.modules.selection.SingleDomainSelection": {"tf": 1}, "shimmer.modules.selection.FixedSharedSelection": {"tf": 1}, "shimmer.modules.selection.KQFixedQSelection.forward": {"tf": 1}, "shimmer.modules.selection.RandomSelection": {"tf": 1}, "shimmer.modules.selection.RandomSelection.forward": {"tf": 1}, "shimmer.modules.selection.DynamicQueryAttention.forward": {"tf": 1}, "shimmer.modules.losses.GWLossesBase": {"tf": 1}, "shimmer.modules.losses.demi_cycle_loss": {"tf": 1}, "shimmer.modules.losses.cycle_loss": {"tf": 1}, "shimmer.modules.losses.translation_loss": {"tf": 1}, "shimmer.modules.losses.contrastive_loss": {"tf": 1}, "shimmer.modules.losses.contrastive_loss_bayesian": {"tf": 1}, "shimmer.modules.losses.GWLosses.step": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.step": {"tf": 1}, "shimmer.utils.SaveMigrations": {"tf": 1}, "shimmer.cli.ckpt_migration.migrate_ckpt": {"tf": 1.4142135623730951}}, "df": 38}}, "a": {"docs": {}, "df": 0, "t": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspaceBase.loss_mod": {"tf": 1}, "shimmer.modules.domain.DomainModule": {"tf": 1}, "shimmer.modules.domain.DomainModule.compute_dcy_loss": {"tf": 1}, "shimmer.modules.domain.DomainModule.compute_cy_loss": {"tf": 1}, "shimmer.modules.domain.DomainModule.compute_tr_loss": {"tf": 1}, "shimmer.modules.domain.DomainModule.compute_broadcast_loss": {"tf": 1}, "shimmer.modules.gw_module.GWModule.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.gw_module.GWModuleBayesian.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.selection.SingleDomainSelection": {"tf": 1}, "shimmer.dataset.RepeatedDataset": {"tf": 1}, "shimmer.utils.SaveMigrations.on_save_checkpoint": {"tf": 1}}, "df": 11}, "n": {"docs": {"shimmer.modules.global_workspace.GWPredictions.cycles": {"tf": 1}, "shimmer.modules.global_workspace.GWPredictions.translations": {"tf": 1}}, "df": 2}}, "r": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "g": {"docs": {}, "df": 0, "h": {"docs": {"shimmer.modules.global_workspace.GWPredictions.cycles": {"tf": 1}, "shimmer.modules.global_workspace.GWPredictions.translations": {"tf": 1}, "shimmer.modules.losses.cycle_loss": {"tf": 1.7320508075688772}, "shimmer.dataset.RepeatedDataset": {"tf": 1}, "shimmer.modules.utils.cycle": {"tf": 2}, "shimmer.modules.utils.batch_cycles": {"tf": 1}}, "df": 6}}}}}}, "y": {"docs": {}, "df": 0, "p": {"docs": {}, "df": 0, "e": {"docs": {"shimmer.types.RawDomainGroupT": {"tf": 1}, "shimmer.types.RawDomainGroupDT": {"tf": 1.4142135623730951}, "shimmer.types.LatentsDomainGroupT": {"tf": 1}, "shimmer.types.LatentsDomainGroupDT": {"tf": 1}, "shimmer.types.RawDomainGroupsT": {"tf": 1}, "shimmer.types.RawDomainGroupsDT": {"tf": 1}, "shimmer.types.LatentsDomainGroupsT": {"tf": 1}, "shimmer.types.LatentsDomainGroupsDT": {"tf": 1}, "shimmer.modules.global_workspace.freeze_domain_modules": {"tf": 1}, "shimmer.modules.global_workspace.pretrained_global_workspace": {"tf": 1}, "shimmer.modules.contrastive_loss.ContrastiveLossType": {"tf": 1}, "shimmer.modules.contrastive_loss.ContrastiveLossBayesianType": {"tf": 1}}, "df": 12, "d": {"docs": {}, "df": 0, "d": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "t": {"docs": {"shimmer.modules.global_workspace.SchedulerArgs": {"tf": 1}, "shimmer.modules.global_workspace.GWPredictionsBase": {"tf": 1}, "shimmer.modules.global_workspace.GWPredictions": {"tf": 1}}, "df": 3}}}}}, "e": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "r": {"docs": {"shimmer.modules.global_workspace.pretrained_global_workspace": {"tf": 1}}, "df": 1}}}}}, "s": {"docs": {"shimmer.modules.losses.demi_cycle_loss": {"tf": 1}}, "df": 1}}, "i": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "y": {"docs": {"shimmer.modules.losses.GWLossesBase": {"tf": 1}}, "df": 1}}}}}}}}, "o": {"docs": {"shimmer.types.RawDomainGroupT": {"tf": 1}, "shimmer.types.LatentsDomainGroupT": {"tf": 1}, "shimmer.types.LatentsDomainGroupsT": {"tf": 1}, "shimmer.modules.global_workspace.SchedulerArgs": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.decode": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.encode_domain": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.encode_domains": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.decode_domain": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.decode_domains": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.generic_step": {"tf": 1}, "shimmer.modules.global_workspace.freeze_domain_modules": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.GlobalWorkspace2Domains": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace2Domains.__init__": {"tf": 2.449489742783178}, "shimmer.modules.global_workspace.GlobalWorkspace": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace.__init__": {"tf": 2.449489742783178}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian.__init__": {"tf": 2.8284271247461903}, "shimmer.modules.global_workspace.pretrained_global_workspace": {"tf": 2.8284271247461903}, "shimmer.modules.domain.LossOutput.metrics": {"tf": 1}, "shimmer.modules.domain.DomainModule.decode": {"tf": 1}, "shimmer.modules.gw_module.GWEncoder": {"tf": 1}, "shimmer.modules.gw_module.GWEncoder.forward": {"tf": 1}, "shimmer.modules.gw_module.GWEncoderLinear.forward": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBase.fuse": {"tf": 1.7320508075688772}, "shimmer.modules.gw_module.GWModuleBase.encode": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBase.encode_and_fuse": {"tf": 1.7320508075688772}, "shimmer.modules.gw_module.GWModuleBase.decode": {"tf": 1}, "shimmer.modules.gw_module.GWModule.__init__": {"tf": 1.7320508075688772}, "shimmer.modules.gw_module.GWModule.fuse": {"tf": 1.7320508075688772}, "shimmer.modules.gw_module.GWModule.encode": {"tf": 1}, "shimmer.modules.gw_module.GWModule.decode": {"tf": 2}, "shimmer.modules.gw_module.compute_fusion_scores": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBayesian.__init__": {"tf": 2}, "shimmer.modules.gw_module.GWModuleBayesian.fuse": {"tf": 2.449489742783178}, "shimmer.modules.selection.KQFixedQSelection.__init__": {"tf": 1}, "shimmer.modules.selection.RandomSelection": {"tf": 1}, "shimmer.modules.selection.RandomSelection.__init__": {"tf": 1}, "shimmer.modules.selection.DynamicQueryAttention.__init__": {"tf": 1}, "shimmer.modules.losses.GWLossesBase": {"tf": 1}, "shimmer.modules.losses.demi_cycle_loss": {"tf": 1.4142135623730951}, "shimmer.modules.losses.cycle_loss": {"tf": 1.4142135623730951}, "shimmer.modules.losses.translation_loss": {"tf": 2.23606797749979}, "shimmer.modules.losses.contrastive_loss": {"tf": 1.4142135623730951}, "shimmer.modules.losses.contrastive_loss_bayesian": {"tf": 1.4142135623730951}, "shimmer.modules.losses.LossCoefs": {"tf": 1.4142135623730951}, "shimmer.modules.losses.GWLosses2Domains.__init__": {"tf": 1.7320508075688772}, "shimmer.modules.losses.generate_partitions": {"tf": 1}, "shimmer.modules.losses.broadcast_loss": {"tf": 1.4142135623730951}, "shimmer.modules.losses.BroadcastLossCoefs": {"tf": 1.4142135623730951}, "shimmer.modules.losses.BroadcastLossCoefs.fused": {"tf": 1}, "shimmer.modules.losses.BroadcastLossCoefs.demi_cycles": {"tf": 1}, "shimmer.modules.losses.BroadcastLossCoefs.cycles": {"tf": 1}, "shimmer.modules.losses.BroadcastLossCoefs.translations": {"tf": 1}, "shimmer.modules.losses.GWLosses.__init__": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.__init__": {"tf": 1.7320508075688772}, "shimmer.modules.losses.GWLossesBayesian.domain_mods": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.contrastive_fn": {"tf": 1}, "shimmer.modules.contrastive_loss.info_nce": {"tf": 1}, "shimmer.modules.contrastive_loss.contrastive_loss": {"tf": 1}, "shimmer.modules.contrastive_loss.ContrastiveLoss.__init__": {"tf": 2.23606797749979}, "shimmer.dataset.RepeatedDataset": {"tf": 1}, "shimmer.dataset.RepeatedDataset.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.vae.VAE.__init__": {"tf": 1}, "shimmer.modules.utils.translation": {"tf": 2.23606797749979}, "shimmer.modules.utils.cycle": {"tf": 1.4142135623730951}, "shimmer.modules.utils.batch_cycles": {"tf": 1.4142135623730951}, "shimmer.modules.utils.batch_translations": {"tf": 1}, "shimmer.utils.migrate_model": {"tf": 1.4142135623730951}, "shimmer.utils.SaveMigrations": {"tf": 1}, "shimmer.utils.SaveMigrations.on_save_checkpoint": {"tf": 1.7320508075688772}, "shimmer.cli.ckpt_migration.migrate_ckpt": {"tf": 1.4142135623730951}}, "df": 72, "r": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "h": {"docs": {"shimmer.types.LatentsDomainGroupT": {"tf": 1.7320508075688772}, "shimmer.types.LatentsDomainGroupDT": {"tf": 1.7320508075688772}, "shimmer.types.LatentsDomainGroupsT": {"tf": 2}, "shimmer.types.LatentsDomainGroupsDT": {"tf": 2}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.encode_and_fuse": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.fuse": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.decode": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.batch_gw_states": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.encode_domain": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.decode_domain": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.generic_step": {"tf": 1}, "shimmer.modules.global_workspace.freeze_domain_modules": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace2Domains.__init__": {"tf": 2}, "shimmer.modules.global_workspace.GlobalWorkspace.__init__": {"tf": 2}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian.__init__": {"tf": 2}, "shimmer.modules.global_workspace.pretrained_global_workspace": {"tf": 2}, "shimmer.modules.domain.DomainModule.encode": {"tf": 1}, "shimmer.modules.domain.DomainModule.decode": {"tf": 1}, "shimmer.modules.domain.DomainModule.compute_loss": {"tf": 1.4142135623730951}, "shimmer.modules.domain.DomainModule.compute_dcy_loss": {"tf": 1.4142135623730951}, "shimmer.modules.domain.DomainModule.compute_cy_loss": {"tf": 1.4142135623730951}, "shimmer.modules.domain.DomainModule.compute_tr_loss": {"tf": 1.4142135623730951}, "shimmer.modules.domain.DomainModule.compute_broadcast_loss": {"tf": 1.4142135623730951}, "shimmer.modules.gw_module.GWModuleBase.fuse": {"tf": 1.4142135623730951}, "shimmer.modules.gw_module.GWModuleBase.encode_and_fuse": {"tf": 1.4142135623730951}, "shimmer.modules.gw_module.GWModuleBase.decode": {"tf": 1}, "shimmer.modules.gw_module.GWModule.__init__": {"tf": 2}, "shimmer.modules.gw_module.GWModule.fuse": {"tf": 1.4142135623730951}, "shimmer.modules.gw_module.GWModule.decode": {"tf": 1}, "shimmer.modules.gw_module.compute_fusion_scores": {"tf": 1.7320508075688772}, "shimmer.modules.gw_module.GWModuleBayesian.__init__": {"tf": 2}, "shimmer.modules.gw_module.GWModuleBayesian.get_precision": {"tf": 1.4142135623730951}, "shimmer.modules.gw_module.GWModuleBayesian.fuse": {"tf": 1.4142135623730951}, "shimmer.modules.selection.SelectionBase.update_gw_state": {"tf": 1}, "shimmer.modules.selection.SelectionBase.forward": {"tf": 2.23606797749979}, "shimmer.modules.selection.SingleDomainSelection.forward": {"tf": 1.4142135623730951}, "shimmer.modules.selection.FixedSharedSelection.forward": {"tf": 1.4142135623730951}, "shimmer.modules.selection.KQFixedQSelection.forward": {"tf": 1}, "shimmer.modules.selection.RandomSelection.forward": {"tf": 1}, "shimmer.modules.selection.DynamicQueryAttention.fuse_weighted_encodings": {"tf": 1.4142135623730951}, "shimmer.modules.selection.DynamicQueryAttention.forward": {"tf": 1}, "shimmer.modules.losses.demi_cycle_loss": {"tf": 1}, "shimmer.modules.losses.cycle_loss": {"tf": 1}, "shimmer.modules.losses.translation_loss": {"tf": 1}, "shimmer.modules.losses.contrastive_loss": {"tf": 1}, "shimmer.modules.losses.contrastive_loss_bayesian": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.demi_cycle_loss": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.cycle_loss": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.translation_loss": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.contrastive_loss": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.contrastive_loss": {"tf": 1}, "shimmer.modules.contrastive_loss.info_nce": {"tf": 1.7320508075688772}, "shimmer.modules.contrastive_loss.contrastive_loss": {"tf": 1.7320508075688772}, "shimmer.modules.contrastive_loss.ContrastiveLoss": {"tf": 1}, "shimmer.modules.contrastive_loss.ContrastiveLoss.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.contrastive_loss.ContrastiveLoss.forward": {"tf": 1.4142135623730951}, "shimmer.modules.vae.reparameterize": {"tf": 1.7320508075688772}, "shimmer.modules.vae.kl_divergence_loss": {"tf": 1.7320508075688772}, "shimmer.modules.vae.gaussian_nll": {"tf": 2}, "shimmer.modules.vae.VAEEncoder.forward": {"tf": 1}, "shimmer.modules.vae.VAEDecoder.forward": {"tf": 1}, "shimmer.modules.vae.VAE.encode": {"tf": 1}, "shimmer.modules.vae.VAE.decode": {"tf": 1}, "shimmer.modules.vae.VAE.forward": {"tf": 1}, "shimmer.modules.utils.translation": {"tf": 1}, "shimmer.modules.utils.batch_demi_cycles": {"tf": 1}, "shimmer.modules.utils.batch_cycles": {"tf": 1}, "shimmer.modules.utils.batch_translations": {"tf": 1}, "shimmer.utils.migrate_model": {"tf": 1.4142135623730951}}, "df": 69}}}, "t": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "l": {"docs": {"shimmer.modules.global_workspace.SchedulerArgs.total_steps": {"tf": 1}, "shimmer.modules.gw_module.GWDecoder.__init__": {"tf": 1}, "shimmer.modules.gw_module.GWDecoder.n_layers": {"tf": 1}, "shimmer.modules.gw_module.GWEncoder.__init__": {"tf": 1}, "shimmer.modules.losses.LossCoefs": {"tf": 1}, "shimmer.modules.losses.broadcast_loss": {"tf": 1}, "shimmer.modules.losses.BroadcastLossCoefs": {"tf": 1}}, "df": 7}}}}, "e": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "r": {"docs": {"shimmer.types.LatentsDomainGroupT": {"tf": 1.7320508075688772}, "shimmer.types.LatentsDomainGroupDT": {"tf": 1.7320508075688772}, "shimmer.types.LatentsDomainGroupsT": {"tf": 2}, "shimmer.types.LatentsDomainGroupsDT": {"tf": 2}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.encode_and_fuse": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.fuse": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.decode": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.batch_gw_states": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.encode_domain": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.decode_domain": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.generic_step": {"tf": 1}, "shimmer.modules.domain.DomainModule.encode": {"tf": 1}, "shimmer.modules.domain.DomainModule.decode": {"tf": 1}, "shimmer.modules.domain.DomainModule.compute_loss": {"tf": 1.7320508075688772}, "shimmer.modules.domain.DomainModule.compute_dcy_loss": {"tf": 1.7320508075688772}, "shimmer.modules.domain.DomainModule.compute_cy_loss": {"tf": 1.7320508075688772}, "shimmer.modules.domain.DomainModule.compute_tr_loss": {"tf": 1.7320508075688772}, "shimmer.modules.domain.DomainModule.compute_broadcast_loss": {"tf": 1.7320508075688772}, "shimmer.modules.gw_module.GWModuleBase.fuse": {"tf": 1.4142135623730951}, "shimmer.modules.gw_module.GWModuleBase.encode_and_fuse": {"tf": 1.4142135623730951}, "shimmer.modules.gw_module.GWModuleBase.decode": {"tf": 1}, "shimmer.modules.gw_module.GWModule.fuse": {"tf": 1.4142135623730951}, "shimmer.modules.gw_module.GWModule.decode": {"tf": 1}, "shimmer.modules.gw_module.compute_fusion_scores": {"tf": 1.7320508075688772}, "shimmer.modules.gw_module.GWModuleBayesian.get_precision": {"tf": 1.4142135623730951}, "shimmer.modules.gw_module.GWModuleBayesian.fuse": {"tf": 1.4142135623730951}, "shimmer.modules.selection.SelectionBase.update_gw_state": {"tf": 1}, "shimmer.modules.selection.SelectionBase.forward": {"tf": 1.7320508075688772}, "shimmer.modules.selection.SingleDomainSelection.forward": {"tf": 1.4142135623730951}, "shimmer.modules.selection.FixedSharedSelection.forward": {"tf": 1.4142135623730951}, "shimmer.modules.selection.KQFixedQSelection.forward": {"tf": 1}, "shimmer.modules.selection.RandomSelection.forward": {"tf": 1}, "shimmer.modules.selection.DynamicQueryAttention.fuse_weighted_encodings": {"tf": 1.7320508075688772}, "shimmer.modules.selection.DynamicQueryAttention.forward": {"tf": 1}, "shimmer.modules.losses.demi_cycle_loss": {"tf": 1}, "shimmer.modules.losses.cycle_loss": {"tf": 1}, "shimmer.modules.losses.translation_loss": {"tf": 1}, "shimmer.modules.losses.contrastive_loss": {"tf": 1}, "shimmer.modules.losses.contrastive_loss_bayesian": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.demi_cycle_loss": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.cycle_loss": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.translation_loss": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.contrastive_loss": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.contrastive_loss": {"tf": 1}, "shimmer.modules.contrastive_loss.info_nce": {"tf": 1.7320508075688772}, "shimmer.modules.contrastive_loss.contrastive_loss": {"tf": 1.7320508075688772}, "shimmer.modules.contrastive_loss.ContrastiveLoss.__init__": {"tf": 1.7320508075688772}, "shimmer.modules.contrastive_loss.ContrastiveLoss.forward": {"tf": 1.4142135623730951}, "shimmer.modules.vae.reparameterize": {"tf": 1.7320508075688772}, "shimmer.modules.vae.kl_divergence_loss": {"tf": 1.7320508075688772}, "shimmer.modules.vae.gaussian_nll": {"tf": 2}, "shimmer.modules.vae.VAEEncoder.forward": {"tf": 1.4142135623730951}, "shimmer.modules.vae.VAEDecoder.forward": {"tf": 1}, "shimmer.modules.vae.VAE.encode": {"tf": 1}, "shimmer.modules.vae.VAE.decode": {"tf": 1}, "shimmer.modules.vae.VAE.forward": {"tf": 1.4142135623730951}, "shimmer.modules.utils.translation": {"tf": 1}, "shimmer.modules.utils.batch_demi_cycles": {"tf": 1}, "shimmer.modules.utils.batch_cycles": {"tf": 1}, "shimmer.modules.utils.batch_translations": {"tf": 1}}, "df": 60}}}}, "s": {"docs": {}, "df": 0, "t": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspaceBase.generic_step": {"tf": 1}, "shimmer.modules.losses.GWLossesBase.step": {"tf": 1}}, "df": 2, "i": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "g": {"docs": {"shimmer.types.ModelModeT": {"tf": 1}}, "df": 1}}}, "/": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "d": {"docs": {"shimmer.types.ModelModeT": {"tf": 1}, "shimmer.modules.losses.GWLossesBase.step": {"tf": 1}}, "df": 2}}}}}}, "m": {"docs": {}, "df": 0, "p": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspaceBayesian.__init__": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBayesian.__init__": {"tf": 1}}, "df": 2, "e": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "e": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspace.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian.__init__": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBayesian.__init__": {"tf": 1}, "shimmer.modules.selection.RandomSelection.__init__": {"tf": 1.4142135623730951}}, "df": 4}}}}}}}}}, "r": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "s": {"docs": {"shimmer.modules.gw_module.GWModuleBayesian.fuse": {"tf": 1}}, "df": 1}}}}, "r": {"docs": {"shimmer.modules.losses.translation_loss": {"tf": 1}}, "df": 1, "a": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "n": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspaceBase.generic_step": {"tf": 1}, "shimmer.modules.losses.GWLossesBase.step": {"tf": 1}}, "df": 2, "/": {"docs": {}, "df": 0, "v": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "l": {"docs": {"shimmer.types.ModelModeT": {"tf": 1}}, "df": 1}}}}, "i": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "g": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspaceBase.generic_step": {"tf": 1}, "shimmer.modules.domain.LossOutput": {"tf": 1}, "shimmer.modules.domain.LossOutput.loss": {"tf": 1}, "shimmer.modules.domain.LossOutput.metrics": {"tf": 1}, "shimmer.modules.domain.DomainModule.compute_loss": {"tf": 1}, "shimmer.modules.domain.DomainModule.compute_dcy_loss": {"tf": 1}, "shimmer.modules.domain.DomainModule.compute_cy_loss": {"tf": 1}, "shimmer.modules.domain.DomainModule.compute_tr_loss": {"tf": 1}, "shimmer.modules.domain.DomainModule.compute_broadcast_loss": {"tf": 1}}, "df": 9}}}, "e": {"docs": {}, "df": 0, "r": {"docs": {"shimmer.utils.SaveMigrations.on_save_checkpoint": {"tf": 2}}, "df": 1}}}}, "n": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "n": {"docs": {"shimmer.modules.global_workspace.GWPredictions.translations": {"tf": 1}, "shimmer.modules.domain.DomainModule.compute_tr_loss": {"tf": 1.4142135623730951}, "shimmer.modules.losses.GWLossesBase": {"tf": 1}, "shimmer.modules.losses.translation_loss": {"tf": 2.23606797749979}, "shimmer.modules.losses.LossCoefs.translations": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.translation_loss": {"tf": 1.4142135623730951}, "shimmer.modules.losses.GWLosses2Domains.step": {"tf": 1.4142135623730951}, "shimmer.modules.losses.broadcast_loss": {"tf": 1}, "shimmer.modules.losses.BroadcastLossCoefs.translations": {"tf": 1.4142135623730951}, "shimmer.modules.utils.translation": {"tf": 1}, "shimmer.modules.utils.cycle": {"tf": 1}, "shimmer.modules.utils.batch_translations": {"tf": 1.4142135623730951}}, "df": 12, "s": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspace2Domains.forward": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace.forward": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian.forward": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBase": {"tf": 1}, "shimmer.modules.losses.translation_loss": {"tf": 1}, "shimmer.modules.utils.batch_translations": {"tf": 1}}, "df": 6}}}}, "e": {"docs": {"shimmer.modules.utils.translation": {"tf": 1}}, "df": 1, "d": {"docs": {"shimmer.modules.utils.translation": {"tf": 1}}, "df": 1}}}}}}}, "c": {"docs": {}, "df": 0, "k": {"docs": {"shimmer.modules.domain.LossOutput": {"tf": 1}}, "df": 1}}}, "u": {"docs": {}, "df": 0, "e": {"docs": {"shimmer.dataset.RepeatedDataset": {"tf": 1}}, "df": 1}}, "i": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "k": {"docs": {"shimmer.modules.vae.reparameterize": {"tf": 1.4142135623730951}}, "df": 1}}}}, "u": {"docs": {}, "df": 0, "p": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "e": {"docs": {"shimmer.modules.global_workspace.GWPredictions.cycles": {"tf": 1}, "shimmer.modules.vae.VAE.forward": {"tf": 1}}, "df": 2, "s": {"docs": {"shimmer.modules.global_workspace.GWPredictions.translations": {"tf": 1}}, "df": 1}, "[": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "t": {"docs": {"shimmer.modules.losses.generate_partitions": {"tf": 1}}, "df": 1}}}, "t": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "h": {"docs": {"shimmer.modules.vae.VAEEncoder.forward": {"tf": 1}}, "df": 1}}}}, "u": {"docs": {}, "df": 0, "p": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "[": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "h": {"docs": {"shimmer.modules.vae.VAE.forward": {"tf": 1}}, "df": 1}}}}}}}}}}}}}}}}, "a": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "g": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "t": {"docs": {"shimmer.modules.global_workspace.GWPredictions.translations": {"tf": 1}, "shimmer.modules.domain.DomainModule.compute_loss": {"tf": 1.4142135623730951}, "shimmer.modules.domain.DomainModule.compute_dcy_loss": {"tf": 1.4142135623730951}, "shimmer.modules.domain.DomainModule.compute_cy_loss": {"tf": 1.4142135623730951}, "shimmer.modules.domain.DomainModule.compute_tr_loss": {"tf": 1.4142135623730951}, "shimmer.modules.domain.DomainModule.compute_broadcast_loss": {"tf": 1.4142135623730951}, "shimmer.modules.losses.cycle_loss": {"tf": 1.7320508075688772}, "shimmer.modules.losses.translation_loss": {"tf": 2}, "shimmer.modules.contrastive_loss.ContrastiveLossBayesianType": {"tf": 1.4142135623730951}, "shimmer.modules.contrastive_loss.info_nce": {"tf": 1}, "shimmer.modules.contrastive_loss.contrastive_loss": {"tf": 1}, "shimmer.modules.contrastive_loss.ContrastiveLoss.forward": {"tf": 1}, "shimmer.modules.utils.batch_translations": {"tf": 1}}, "df": 13, "s": {"docs": {"shimmer.modules.contrastive_loss.ContrastiveLossType": {"tf": 1}, "shimmer.modules.vae.gaussian_nll": {"tf": 1}}, "df": 2}}}}}, "n": {"docs": {}, "df": 0, "h": {"docs": {"shimmer.modules.gw_module.GWEncoder": {"tf": 1}}, "df": 1}}, "k": {"docs": {}, "df": 0, "e": {"docs": {"shimmer.modules.losses.LossCoefs": {"tf": 1}, "shimmer.modules.losses.BroadcastLossCoefs": {"tf": 1}}, "df": 2, "s": {"docs": {"shimmer.modules.gw_module.GWEncoder.forward": {"tf": 1}, "shimmer.modules.gw_module.GWEncoderLinear.forward": {"tf": 1}}, "df": 2}}, "i": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "g": {"docs": {"shimmer.modules.contrastive_loss.ContrastiveLossType": {"tf": 1}, "shimmer.modules.contrastive_loss.ContrastiveLossBayesianType": {"tf": 1}}, "df": 2}}}}}, "w": {"docs": {}, "df": 0, "o": {"docs": {"shimmer.modules.gw_module.compute_fusion_scores": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBayesian.fuse": {"tf": 1}}, "df": 2}, "i": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "e": {"docs": {"shimmer.modules.selection.KQFixedQSelection.forward": {"tf": 1}, "shimmer.modules.selection.DynamicQueryAttention.forward": {"tf": 1}}, "df": 2}}}}, "i": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "s": {"docs": {"shimmer.modules.gw_module.GWModuleBayesian.fuse": {"tf": 1}}, "df": 1}}}}}, "a": {"docs": {"shimmer.types.RawDomainGroupT": {"tf": 1.4142135623730951}, "shimmer.types.RawDomainGroupDT": {"tf": 1.4142135623730951}, "shimmer.types.RawDomainGroupsT": {"tf": 2}, "shimmer.types.RawDomainGroupsDT": {"tf": 2}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.gw_mod": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.selection_mod": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.encode_and_fuse": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.encode": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.fuse": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.batch_gw_states": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.encode_domain": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.decode_domain": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.freeze_domain_modules": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace2Domains": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.GlobalWorkspace2Domains.__init__": {"tf": 2.8284271247461903}, "shimmer.modules.global_workspace.GlobalWorkspace": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace.__init__": {"tf": 2.8284271247461903}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian": {"tf": 1.7320508075688772}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian.__init__": {"tf": 2.8284271247461903}, "shimmer.modules.global_workspace.pretrained_global_workspace": {"tf": 3}, "shimmer.modules.domain.LossOutput": {"tf": 1.4142135623730951}, "shimmer.modules.domain.LossOutput.all": {"tf": 1}, "shimmer.modules.domain.DomainModule": {"tf": 1}, "shimmer.modules.domain.DomainModule.__init__": {"tf": 1}, "shimmer.modules.domain.DomainModule.encode": {"tf": 1.4142135623730951}, "shimmer.modules.domain.DomainModule.compute_dcy_loss": {"tf": 1}, "shimmer.modules.domain.DomainModule.compute_cy_loss": {"tf": 1}, "shimmer.modules.domain.DomainModule.compute_tr_loss": {"tf": 1}, "shimmer.modules.domain.DomainModule.compute_broadcast_loss": {"tf": 1}, "shimmer.modules.gw_module.get_n_layers": {"tf": 1}, "shimmer.modules.gw_module.GWDecoder": {"tf": 1}, "shimmer.modules.gw_module.GWEncoder": {"tf": 1}, "shimmer.modules.gw_module.GWEncoderLinear": {"tf": 1}, "shimmer.modules.gw_module.GWModule.__init__": {"tf": 2.449489742783178}, "shimmer.modules.gw_module.GWModule.decode": {"tf": 1}, "shimmer.modules.gw_module.compute_fusion_scores": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBayesian": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBayesian.__init__": {"tf": 2.449489742783178}, "shimmer.modules.gw_module.GWModuleBayesian.fuse": {"tf": 2}, "shimmer.modules.selection.SingleDomainSelection": {"tf": 1.7320508075688772}, "shimmer.modules.selection.KQFixedQSelection": {"tf": 1}, "shimmer.modules.selection.KQFixedQSelection.forward": {"tf": 1}, "shimmer.modules.selection.RandomSelection": {"tf": 1.4142135623730951}, "shimmer.modules.selection.DynamicQueryAttention": {"tf": 1}, "shimmer.modules.selection.DynamicQueryAttention.forward": {"tf": 1}, "shimmer.modules.losses.demi_cycle_loss": {"tf": 1.4142135623730951}, "shimmer.modules.losses.cycle_loss": {"tf": 1.4142135623730951}, "shimmer.modules.losses.translation_loss": {"tf": 1.7320508075688772}, "shimmer.modules.losses.contrastive_loss": {"tf": 1}, "shimmer.modules.losses.contrastive_loss_bayesian": {"tf": 1.4142135623730951}, "shimmer.modules.losses.GWLosses2Domains.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.losses.GWLosses2Domains.demi_cycle_loss": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.cycle_loss": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.translation_loss": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.contrastive_loss": {"tf": 1}, "shimmer.modules.losses.generate_partitions": {"tf": 1}, "shimmer.modules.losses.broadcast_loss": {"tf": 1}, "shimmer.modules.losses.GWLosses.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.losses.GWLosses.contrastive_loss": {"tf": 1}, "shimmer.modules.losses.GWLosses.step": {"tf": 1.4142135623730951}, "shimmer.modules.losses.GWLossesBayesian.__init__": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.contrastive_loss": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.step": {"tf": 1.4142135623730951}, "shimmer.modules.contrastive_loss.ContrastiveLossType": {"tf": 1.4142135623730951}, "shimmer.modules.contrastive_loss.ContrastiveLossBayesianType": {"tf": 1.4142135623730951}, "shimmer.modules.contrastive_loss.ContrastiveLoss.__init__": {"tf": 1}, "shimmer.modules.contrastive_loss.ContrastiveLoss.forward": {"tf": 1}, "shimmer.dataset.RepeatedDataset": {"tf": 1}, "shimmer.dataset.RepeatedDataset.__init__": {"tf": 1}, "shimmer.modules.vae.reparameterize": {"tf": 1}, "shimmer.modules.vae.VAEEncoder": {"tf": 1}, "shimmer.modules.vae.VAEDecoder": {"tf": 1}, "shimmer.modules.vae.VAE.__init__": {"tf": 1}, "shimmer.modules.utils.cycle": {"tf": 1.4142135623730951}, "shimmer.modules.utils.batch_demi_cycles": {"tf": 1}, "shimmer.modules.utils.batch_cycles": {"tf": 1}, "shimmer.modules.utils.batch_translations": {"tf": 1}, "shimmer.utils.migrate_model": {"tf": 1}, "shimmer.utils.SaveMigrations.on_save_checkpoint": {"tf": 1.4142135623730951}, "shimmer.cli.ckpt_migration.migrate_ckpt": {"tf": 1}}, "df": 80, "r": {"docs": {}, "df": 0, "e": {"docs": {"shimmer.types.RawDomainGroupT": {"tf": 1.4142135623730951}, "shimmer.types.RawDomainGroupDT": {"tf": 1.4142135623730951}, "shimmer.types.LatentsDomainGroupT": {"tf": 1.4142135623730951}, "shimmer.types.LatentsDomainGroupDT": {"tf": 1.4142135623730951}, "shimmer.types.RawDomainGroupsT": {"tf": 1}, "shimmer.types.RawDomainGroupsDT": {"tf": 1}, "shimmer.types.LatentsDomainGroupsT": {"tf": 1}, "shimmer.types.LatentsDomainGroupsDT": {"tf": 1}, "shimmer.modules.global_workspace.GWPredictions.cycles": {"tf": 1}, "shimmer.modules.global_workspace.GWPredictions.translations": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace2Domains.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.GlobalWorkspace.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.pretrained_global_workspace": {"tf": 1.4142135623730951}, "shimmer.modules.losses.BroadcastLossCoefs.demi_cycles": {"tf": 1}}, "df": 15}, "g": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "s": {"docs": {"shimmer.modules.global_workspace.SchedulerArgs": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.encode_and_fuse": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.encode": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.fuse": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.decode": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.batch_gw_states": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.encode_domain": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.encode_domains": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.decode_domain": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.decode_domains": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.generic_step": {"tf": 1}, "shimmer.modules.global_workspace.freeze_domain_modules": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace2Domains.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.GlobalWorkspace2Domains.forward": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.GlobalWorkspace.forward": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian.forward": {"tf": 1}, "shimmer.modules.global_workspace.pretrained_global_workspace": {"tf": 1.4142135623730951}, "shimmer.modules.domain.DomainModule.__init__": {"tf": 1}, "shimmer.modules.domain.DomainModule.encode": {"tf": 1}, "shimmer.modules.domain.DomainModule.decode": {"tf": 1}, "shimmer.modules.domain.DomainModule.compute_loss": {"tf": 1}, "shimmer.modules.domain.DomainModule.compute_dcy_loss": {"tf": 1}, "shimmer.modules.domain.DomainModule.compute_cy_loss": {"tf": 1}, "shimmer.modules.domain.DomainModule.compute_tr_loss": {"tf": 1}, "shimmer.modules.domain.DomainModule.compute_broadcast_loss": {"tf": 1}, "shimmer.modules.gw_module.get_n_layers": {"tf": 1}, "shimmer.modules.gw_module.GWDecoder.__init__": {"tf": 1}, "shimmer.modules.gw_module.GWEncoder.__init__": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBase.__init__": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBase.fuse": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBase.encode": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBase.encode_and_fuse": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBase.decode": {"tf": 1}, "shimmer.modules.gw_module.GWModule.__init__": {"tf": 1}, "shimmer.modules.gw_module.GWModule.fuse": {"tf": 1}, "shimmer.modules.gw_module.GWModule.encode": {"tf": 1}, "shimmer.modules.gw_module.GWModule.decode": {"tf": 1}, "shimmer.modules.gw_module.compute_fusion_scores": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBayesian.__init__": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBayesian.get_precision": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBayesian.fuse": {"tf": 1}, "shimmer.modules.selection.SelectionBase.update_gw_state": {"tf": 1}, "shimmer.modules.selection.SelectionBase.forward": {"tf": 1}, "shimmer.modules.selection.SingleDomainSelection.forward": {"tf": 1}, "shimmer.modules.selection.FixedSharedSelection.forward": {"tf": 1}, "shimmer.modules.selection.KQFixedQSelection.__init__": {"tf": 1}, "shimmer.modules.selection.KQFixedQSelection.forward": {"tf": 1}, "shimmer.modules.selection.RandomSelection.__init__": {"tf": 1}, "shimmer.modules.selection.RandomSelection.forward": {"tf": 1}, "shimmer.modules.selection.DynamicQueryAttention.__init__": {"tf": 1}, "shimmer.modules.selection.DynamicQueryAttention.fuse_weighted_encodings": {"tf": 1}, "shimmer.modules.selection.DynamicQueryAttention.forward": {"tf": 1}, "shimmer.modules.losses.GWLossesBase.step": {"tf": 1}, "shimmer.modules.losses.demi_cycle_loss": {"tf": 1}, "shimmer.modules.losses.cycle_loss": {"tf": 1}, "shimmer.modules.losses.translation_loss": {"tf": 1}, "shimmer.modules.losses.contrastive_loss": {"tf": 1}, "shimmer.modules.losses.contrastive_loss_bayesian": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.__init__": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.demi_cycle_loss": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.cycle_loss": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.translation_loss": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.contrastive_loss": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.step": {"tf": 1}, "shimmer.modules.losses.generate_partitions": {"tf": 1}, "shimmer.modules.losses.broadcast_loss": {"tf": 1}, "shimmer.modules.losses.GWLosses.__init__": {"tf": 1}, "shimmer.modules.losses.GWLosses.contrastive_loss": {"tf": 1}, "shimmer.modules.losses.GWLosses.step": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.__init__": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.contrastive_loss": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.step": {"tf": 1}, "shimmer.modules.contrastive_loss.info_nce": {"tf": 1}, "shimmer.modules.contrastive_loss.contrastive_loss": {"tf": 1}, "shimmer.modules.contrastive_loss.ContrastiveLoss.__init__": {"tf": 1}, "shimmer.modules.contrastive_loss.ContrastiveLoss.forward": {"tf": 1}, "shimmer.dataset.RepeatedDataset.__init__": {"tf": 1}, "shimmer.modules.vae.reparameterize": {"tf": 1}, "shimmer.modules.vae.kl_divergence_loss": {"tf": 1}, "shimmer.modules.vae.gaussian_nll": {"tf": 1}, "shimmer.modules.vae.VAEEncoder.forward": {"tf": 1}, "shimmer.modules.vae.VAEDecoder.forward": {"tf": 1}, "shimmer.modules.vae.VAE.__init__": {"tf": 1}, "shimmer.modules.vae.VAE.encode": {"tf": 1}, "shimmer.modules.vae.VAE.decode": {"tf": 1}, "shimmer.modules.vae.VAE.forward": {"tf": 1}, "shimmer.modules.utils.translation": {"tf": 1}, "shimmer.modules.utils.cycle": {"tf": 1}, "shimmer.modules.utils.batch_demi_cycles": {"tf": 1}, "shimmer.modules.utils.batch_cycles": {"tf": 1}, "shimmer.modules.utils.batch_translations": {"tf": 1}, "shimmer.utils.groups_batch_size": {"tf": 1}, "shimmer.utils.groups_device": {"tf": 1}, "shimmer.utils.migrate_model": {"tf": 1}, "shimmer.utils.SaveMigrations.on_save_checkpoint": {"tf": 1}}, "df": 97}}}}}}, "s": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspace2Domains.__init__": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace.__init__": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian.__init__": {"tf": 1}, "shimmer.utils.migrate_model": {"tf": 1}}, "df": 4}}}, "n": {"docs": {"shimmer.modules.gw_module.GWEncoder": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBase": {"tf": 1.4142135623730951}, "shimmer.modules.gw_module.GWModule.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.gw_module.GWModuleBayesian.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.selection.SelectionBase.update_gw_state": {"tf": 1.4142135623730951}}, "df": 5, "d": {"docs": {"shimmer.types.RawDomainGroupT": {"tf": 2}, "shimmer.types.RawDomainGroupDT": {"tf": 1.4142135623730951}, "shimmer.types.LatentsDomainGroupT": {"tf": 1.7320508075688772}, "shimmer.types.LatentsDomainGroupDT": {"tf": 1.4142135623730951}, "shimmer.types.RawDomainGroupsT": {"tf": 1.4142135623730951}, "shimmer.types.RawDomainGroupsDT": {"tf": 1.4142135623730951}, "shimmer.types.LatentsDomainGroupsT": {"tf": 1.7320508075688772}, "shimmer.types.LatentsDomainGroupsDT": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.encode_domain": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.decode_domain": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.generic_step": {"tf": 1}, "shimmer.modules.global_workspace.freeze_domain_modules": {"tf": 1}, "shimmer.modules.global_workspace.GWPredictions.cycles": {"tf": 1}, "shimmer.modules.global_workspace.GWPredictions.translations": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace2Domains": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace2Domains.forward": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace.forward": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian.forward": {"tf": 1}, "shimmer.modules.domain.LossOutput": {"tf": 1}, "shimmer.modules.domain.LossOutput.all": {"tf": 1}, "shimmer.modules.domain.DomainModule.compute_loss": {"tf": 1}, "shimmer.modules.domain.DomainModule.compute_dcy_loss": {"tf": 1}, "shimmer.modules.domain.DomainModule.compute_cy_loss": {"tf": 1}, "shimmer.modules.domain.DomainModule.compute_tr_loss": {"tf": 1}, "shimmer.modules.domain.DomainModule.compute_broadcast_loss": {"tf": 1}, "shimmer.modules.gw_module.get_n_layers": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBase": {"tf": 2}, "shimmer.modules.gw_module.GWModuleBase.encode_and_fuse": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBayesian.get_precision": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBayesian.fuse": {"tf": 2.23606797749979}, "shimmer.modules.selection.SelectionBase": {"tf": 1}, "shimmer.modules.selection.SelectionBase.update_gw_state": {"tf": 1}, "shimmer.modules.selection.FixedSharedSelection": {"tf": 1}, "shimmer.modules.selection.KQFixedQSelection.__init__": {"tf": 1}, "shimmer.modules.selection.KQFixedQSelection.forward": {"tf": 1.7320508075688772}, "shimmer.modules.selection.RandomSelection": {"tf": 1}, "shimmer.modules.selection.DynamicQueryAttention.__init__": {"tf": 1}, "shimmer.modules.selection.DynamicQueryAttention.forward": {"tf": 1.7320508075688772}, "shimmer.modules.losses.contrastive_loss": {"tf": 1.7320508075688772}, "shimmer.modules.losses.contrastive_loss_bayesian": {"tf": 1.7320508075688772}, "shimmer.modules.losses.LossCoefs": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.__init__": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.step": {"tf": 1}, "shimmer.modules.losses.generate_partitions": {"tf": 1.4142135623730951}, "shimmer.modules.losses.broadcast_loss": {"tf": 1.4142135623730951}, "shimmer.modules.losses.BroadcastLossCoefs": {"tf": 1}, "shimmer.modules.losses.BroadcastLossCoefs.fused": {"tf": 1}, "shimmer.modules.losses.GWLosses.step": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.__init__": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.step": {"tf": 1}, "shimmer.modules.contrastive_loss.ContrastiveLossType": {"tf": 1.4142135623730951}, "shimmer.modules.contrastive_loss.ContrastiveLossBayesianType": {"tf": 1.4142135623730951}, "shimmer.modules.vae.VAEEncoder.forward": {"tf": 1}, "shimmer.modules.vae.VAE.encode": {"tf": 1}, "shimmer.modules.vae.VAE.forward": {"tf": 1.4142135623730951}, "shimmer.utils.SaveMigrations": {"tf": 1}}, "df": 58}, "y": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspaceBase.encode_domain": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.decode_domain": {"tf": 1}, "shimmer.modules.domain.DomainModule.encode": {"tf": 1}, "shimmer.modules.domain.DomainModule.decode": {"tf": 1}, "shimmer.modules.vae.VAEEncoder.forward": {"tf": 1}, "shimmer.modules.vae.VAEDecoder.forward": {"tf": 1}, "shimmer.modules.vae.VAE.encode": {"tf": 1}, "shimmer.modules.vae.VAE.decode": {"tf": 1}, "shimmer.modules.vae.VAE.forward": {"tf": 1.4142135623730951}, "shimmer.utils.SaveMigrations": {"tf": 1}}, "df": 10, "t": {"docs": {}, "df": 0, "h": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "g": {"docs": {"shimmer.utils.SaveMigrations.on_save_checkpoint": {"tf": 1}}, "df": 1}}}}}}, "o": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "h": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "r": {"docs": {"shimmer.modules.global_workspace.GWPredictions.cycles": {"tf": 1}, "shimmer.modules.global_workspace.GWPredictions.translations": {"tf": 1}}, "df": 2}}}}}}, "l": {"docs": {}, "df": 0, "l": {"docs": {"shimmer.types.RawDomainGroupT": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.encode_domains": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.decode_domains": {"tf": 1}, "shimmer.modules.domain.LossOutput.all": {"tf": 1}, "shimmer.modules.gw_module.GWEncoder.forward": {"tf": 1}, "shimmer.modules.gw_module.GWEncoderLinear.forward": {"tf": 1}, "shimmer.modules.gw_module.GWModule.decode": {"tf": 1}, "shimmer.modules.losses.GWLossesBase.step": {"tf": 1}, "shimmer.modules.losses.demi_cycle_loss": {"tf": 1}, "shimmer.modules.losses.cycle_loss": {"tf": 1}, "shimmer.modules.losses.translation_loss": {"tf": 1}, "shimmer.modules.losses.contrastive_loss": {"tf": 1}, "shimmer.modules.losses.contrastive_loss_bayesian": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.step": {"tf": 1}, "shimmer.modules.losses.generate_partitions": {"tf": 1.7320508075688772}, "shimmer.modules.losses.GWLosses.step": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.step": {"tf": 1}}, "df": 17, "o": {"docs": {}, "df": 0, "w": {"docs": {"shimmer.types.RawDomainGroupT": {"tf": 1}, "shimmer.types.LatentsDomainGroupT": {"tf": 1}, "shimmer.types.LatentsDomainGroupsT": {"tf": 1}}, "df": 3, "s": {"docs": {"shimmer.types.RawDomainGroupT": {"tf": 1}, "shimmer.types.LatentsDomainGroupT": {"tf": 1}, "shimmer.types.LatentsDomainGroupsT": {"tf": 1}}, "df": 3}}}}, "i": {"docs": {}, "df": 0, "g": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "t": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspace2Domains.__init__": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace.__init__": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian.__init__": {"tf": 1}, "shimmer.modules.global_workspace.pretrained_global_workspace": {"tf": 1}}, "df": 4}}}}}}}, "t": {"docs": {}, "df": 0, "h": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "g": {"docs": {}, "df": 0, "h": {"docs": {"shimmer.modules.gw_module.GWEncoder.forward": {"tf": 1}, "shimmer.modules.gw_module.GWEncoderLinear.forward": {"tf": 1}}, "df": 2}}}}}}, "w": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "y": {"docs": {}, "df": 0, "s": {"docs": {"shimmer.modules.selection.SingleDomainSelection": {"tf": 1}, "shimmer.modules.selection.FixedSharedSelection": {"tf": 1}, "shimmer.modules.losses.BroadcastLossCoefs.demi_cycles": {"tf": 1}}, "df": 3}}}}}, "b": {"docs": {}, "df": 0, "c": {"docs": {"shimmer.types.RawDomainGroupT": {"tf": 1}, "shimmer.types.LatentsDomainGroupT": {"tf": 1}, "shimmer.types.LatentsDomainGroupsT": {"tf": 1}}, "df": 3}, "s": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "t": {"docs": {"shimmer.modules.gw_module.GWModuleBase": {"tf": 1}, "shimmer.modules.losses.GWLossesBase": {"tf": 1}, "shimmer.utils.SaveMigrations": {"tf": 1}}, "df": 3, "m": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "h": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "d": {"docs": {"shimmer.modules.selection.SelectionBase.update_gw_state": {"tf": 1}}, "df": 1}}}}}}}}}}}}}, "s": {"docs": {"shimmer.modules.global_workspace.freeze_domain_modules": {"tf": 1}, "shimmer.modules.domain.LossOutput": {"tf": 1}, "shimmer.modules.selection.SelectionBase.update_gw_state": {"tf": 1.4142135623730951}}, "df": 3, "s": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "d": {"docs": {"shimmer.modules.gw_module.GWModuleBayesian.fuse": {"tf": 1}}, "df": 1}}}}}}}, "u": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "d": {"docs": {"shimmer.modules.selection.KQFixedQSelection.__init__": {"tf": 1}, "shimmer.modules.selection.DynamicQueryAttention.__init__": {"tf": 1}, "shimmer.modules.losses.LossCoefs": {"tf": 1}, "shimmer.modules.losses.BroadcastLossCoefs": {"tf": 1}}, "df": 4}}}}}}, "u": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "o": {"docs": {"shimmer.modules.global_workspace.freeze_domain_modules": {"tf": 1}}, "df": 1}}}, "c": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "y": {"docs": {"shimmer.modules.global_workspace.freeze_domain_modules": {"tf": 1}}, "df": 1}}}}}}, "r": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "s": {"docs": {"shimmer.modules.selection.RandomSelection": {"tf": 1}}, "df": 1}}}}}, "f": {"docs": {}, "df": 0, "f": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "t": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspace2Domains.__init__": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace.__init__": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian.__init__": {"tf": 1}, "shimmer.modules.global_workspace.pretrained_global_workspace": {"tf": 1}}, "df": 4}}}}, "t": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "r": {"docs": {"shimmer.modules.gw_module.GWDecoder.__init__": {"tf": 1}, "shimmer.modules.gw_module.GWDecoder.n_layers": {"tf": 1}, "shimmer.modules.gw_module.GWEncoder.__init__": {"tf": 1}, "shimmer.modules.utils.cycle": {"tf": 1}, "shimmer.utils.migrate_model": {"tf": 1}}, "df": 5, "w": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "d": {"docs": {}, "df": 0, "s": {"docs": {"shimmer.modules.gw_module.GWEncoder.forward": {"tf": 1}, "shimmer.modules.gw_module.GWEncoderLinear.forward": {"tf": 1}}, "df": 2}}}}}}}}}, "d": {"docs": {}, "df": 0, "d": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "l": {"docs": {"shimmer.modules.global_workspace.pretrained_global_workspace": {"tf": 1}, "shimmer.modules.domain.LossOutput.metrics": {"tf": 1}, "shimmer.modules.domain.DomainModule.compute_loss": {"tf": 1}, "shimmer.modules.domain.DomainModule.compute_dcy_loss": {"tf": 1}, "shimmer.modules.domain.DomainModule.compute_cy_loss": {"tf": 1}, "shimmer.modules.domain.DomainModule.compute_tr_loss": {"tf": 1}, "shimmer.modules.domain.DomainModule.compute_broadcast_loss": {"tf": 1}, "shimmer.modules.losses.demi_cycle_loss": {"tf": 1}, "shimmer.modules.losses.cycle_loss": {"tf": 1}, "shimmer.modules.losses.translation_loss": {"tf": 1}, "shimmer.modules.losses.contrastive_loss": {"tf": 1}, "shimmer.modules.losses.contrastive_loss_bayesian": {"tf": 1}, "shimmer.modules.losses.broadcast_loss": {"tf": 1}, "shimmer.utils.migrate_model": {"tf": 1}}, "df": 14}}}}}}}, "s": {"docs": {"shimmer.modules.gw_module.GWEncoder": {"tf": 1}}, "df": 1}, "e": {"docs": {}, "df": 0, "d": {"docs": {"shimmer.modules.gw_module.compute_fusion_scores": {"tf": 1}}, "df": 1}}}}, "t": {"docs": {"shimmer.modules.gw_module.GWEncoder": {"tf": 1}, "shimmer.modules.gw_module.GWEncoder.forward": {"tf": 1}, "shimmer.modules.gw_module.GWEncoderLinear.forward": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBayesian.precisions": {"tf": 1}, "shimmer.dataset.RepeatedDataset": {"tf": 1}}, "df": 5, "t": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "n": {"docs": {"shimmer.modules.gw_module.GWModuleBase.fuse": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBase.encode_and_fuse": {"tf": 1}, "shimmer.modules.gw_module.GWModule.fuse": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBayesian.fuse": {"tf": 1}, "shimmer.modules.selection.KQFixedQSelection": {"tf": 1}, "shimmer.modules.selection.KQFixedQSelection.forward": {"tf": 1}, "shimmer.modules.selection.RandomSelection": {"tf": 1.4142135623730951}, "shimmer.modules.selection.RandomSelection.forward": {"tf": 1}, "shimmer.modules.selection.DynamicQueryAttention": {"tf": 1}, "shimmer.modules.selection.DynamicQueryAttention.fuse_weighted_encodings": {"tf": 1.7320508075688772}, "shimmer.modules.selection.DynamicQueryAttention.forward": {"tf": 1}}, "df": 11}}}}}}}}, "v": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "d": {"docs": {"shimmer.modules.gw_module.compute_fusion_scores": {"tf": 1}}, "df": 1}}}, "e": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "g": {"docs": {}, "df": 0, "e": {"docs": {"shimmer.modules.losses.demi_cycle_loss": {"tf": 1}, "shimmer.modules.losses.cycle_loss": {"tf": 1}, "shimmer.modules.losses.translation_loss": {"tf": 1}, "shimmer.modules.losses.contrastive_loss": {"tf": 1}, "shimmer.modules.losses.contrastive_loss_bayesian": {"tf": 1}}, "df": 5}}}}}}, "\\": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "n": {"docs": {"shimmer.modules.gw_module.GWModuleBayesian.fuse": {"tf": 1}}, "df": 1}}}, "p": {"docs": {}, "df": 0, "p": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "d": {"docs": {"shimmer.modules.selection.RandomSelection.__init__": {"tf": 1}}, "df": 1}}}, "y": {"docs": {"shimmer.modules.losses.contrastive_loss": {"tf": 1}, "shimmer.modules.losses.contrastive_loss_bayesian": {"tf": 1}, "shimmer.modules.contrastive_loss.info_nce": {"tf": 1}, "shimmer.modules.contrastive_loss.contrastive_loss": {"tf": 1}, "shimmer.modules.contrastive_loss.ContrastiveLoss.__init__": {"tf": 1}}, "df": 5}}}}}, "n": {"docs": {"shimmer.modules.gw_module.get_n_layers": {"tf": 1.4142135623730951}, "shimmer.modules.gw_module.GWDecoder.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.gw_module.GWDecoder.n_layers": {"tf": 1}, "shimmer.modules.gw_module.GWEncoder.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.gw_module.GWModuleBayesian.fuse": {"tf": 1.7320508075688772}, "shimmer.modules.losses.generate_partitions": {"tf": 1.4142135623730951}, "shimmer.cli.ckpt_migration.migrate_ckpt": {"tf": 1}}, "df": 7, "a": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "e": {"docs": {"shimmer.modules.global_workspace.GWPredictionsBase.states": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.encode_domain": {"tf": 1.7320508075688772}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.decode_domain": {"tf": 1.7320508075688772}, "shimmer.modules.global_workspace.GlobalWorkspace2Domains.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.GlobalWorkspace.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.pretrained_global_workspace": {"tf": 1.4142135623730951}, "shimmer.modules.gw_module.GWModule.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.gw_module.GWModuleBayesian.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.losses.demi_cycle_loss": {"tf": 1.7320508075688772}, "shimmer.modules.losses.GWLosses2Domains.__init__": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.__init__": {"tf": 1}, "shimmer.modules.utils.translation": {"tf": 1}, "shimmer.modules.utils.cycle": {"tf": 1}}, "df": 14, "s": {"docs": {"shimmer.types.RawDomainGroupT": {"tf": 1}, "shimmer.types.RawDomainGroupDT": {"tf": 1}, "shimmer.types.LatentsDomainGroupT": {"tf": 1}, "shimmer.types.LatentsDomainGroupDT": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace2Domains.__init__": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace.__init__": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian.__init__": {"tf": 1}, "shimmer.modules.global_workspace.pretrained_global_workspace": {"tf": 1}, "shimmer.modules.selection.KQFixedQSelection.__init__": {"tf": 1}, "shimmer.modules.selection.DynamicQueryAttention.__init__": {"tf": 1}, "shimmer.modules.losses.GWLosses.__init__": {"tf": 1}, "shimmer.modules.utils.batch_cycles": {"tf": 1}}, "df": 12}}}}, "o": {"docs": {}, "df": 0, "t": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspace2Domains.__init__": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace.__init__": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian.__init__": {"tf": 1}, "shimmer.modules.global_workspace.pretrained_global_workspace": {"tf": 1.4142135623730951}, "shimmer.modules.domain.LossOutput.metrics": {"tf": 1}, "shimmer.modules.selection.SelectionBase.update_gw_state": {"tf": 1.7320508075688772}, "shimmer.modules.selection.RandomSelection.forward": {"tf": 1}, "shimmer.modules.losses.LossCoefs": {"tf": 1.7320508075688772}, "shimmer.modules.losses.BroadcastLossCoefs": {"tf": 1.7320508075688772}}, "df": 9, "e": {"docs": {"shimmer.types.RawDomainGroupT": {"tf": 1}, "shimmer.types.RawDomainGroupDT": {"tf": 1}, "shimmer.types.LatentsDomainGroupT": {"tf": 1}, "shimmer.types.LatentsDomainGroupDT": {"tf": 1}, "shimmer.types.RawDomainGroupsT": {"tf": 1}, "shimmer.types.RawDomainGroupsDT": {"tf": 1}, "shimmer.types.LatentsDomainGroupsT": {"tf": 1}, "shimmer.types.LatentsDomainGroupsDT": {"tf": 1}, "shimmer.modules.selection.SelectionBase.update_gw_state": {"tf": 1}}, "df": 9}}, "n": {"docs": {"shimmer.modules.gw_module.GWEncoder": {"tf": 1}}, "df": 1, "e": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspace2Domains.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.GlobalWorkspace.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.gw_module.GWModule.decode": {"tf": 1}, "shimmer.modules.contrastive_loss.info_nce": {"tf": 1}, "shimmer.modules.contrastive_loss.contrastive_loss": {"tf": 1}, "shimmer.modules.contrastive_loss.ContrastiveLoss.__init__": {"tf": 1}}, "df": 7}}, "r": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "l": {"docs": {"shimmer.modules.vae.reparameterize": {"tf": 1}}, "df": 1, "i": {"docs": {}, "df": 0, "z": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "d": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspaceBayesian.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.losses.GWLossesBayesian.__init__": {"tf": 1.4142135623730951}}, "df": 2}}}}}}}}, "w": {"docs": {"shimmer.modules.selection.KQFixedQSelection.__init__": {"tf": 1}, "shimmer.modules.selection.DynamicQueryAttention.__init__": {"tf": 1}}, "df": 2}}, "u": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "b": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "r": {"docs": {"shimmer.modules.global_workspace.SchedulerArgs.total_steps": {"tf": 1}, "shimmer.modules.gw_module.get_n_layers": {"tf": 1}, "shimmer.modules.gw_module.GWDecoder.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.gw_module.GWDecoder.n_layers": {"tf": 1.4142135623730951}, "shimmer.modules.gw_module.GWEncoder.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.gw_module.GWModuleBayesian.fuse": {"tf": 1}, "shimmer.modules.losses.generate_partitions": {"tf": 1}}, "df": 7}}}, "e": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "l": {"docs": {"shimmer.modules.gw_module.compute_fusion_scores": {"tf": 1}}, "df": 1}}}}}}}}, "n": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspace2Domains.__init__": {"tf": 2}, "shimmer.modules.global_workspace.GlobalWorkspace.__init__": {"tf": 2}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian.__init__": {"tf": 2}, "shimmer.modules.global_workspace.pretrained_global_workspace": {"tf": 2}, "shimmer.modules.gw_module.get_n_layers": {"tf": 1.4142135623730951}, "shimmer.modules.gw_module.GWModule": {"tf": 1}, "shimmer.modules.gw_module.GWModule.__init__": {"tf": 2}, "shimmer.modules.gw_module.GWModuleBayesian.__init__": {"tf": 2}}, "df": 8}, "e": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "w": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "k": {"docs": {"shimmer.modules.gw_module.GWDecoder": {"tf": 1}, "shimmer.modules.gw_module.GWEncoder": {"tf": 1}, "shimmer.modules.gw_module.GWEncoderLinear": {"tf": 1}}, "df": 3}}}}}, "e": {"docs": {}, "df": 0, "d": {"docs": {"shimmer.modules.selection.SelectionBase.update_gw_state": {"tf": 1}}, "df": 1, "s": {"docs": {"shimmer.modules.gw_module.GWEncoder.forward": {"tf": 1}, "shimmer.modules.gw_module.GWEncoderLinear.forward": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBayesian.fuse": {"tf": 1}}, "df": 3}}}, "u": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "n": {"docs": {"shimmer.modules.gw_module.GWModuleBayesian.precisions": {"tf": 1}}, "df": 1}}}}, "w": {"docs": {"shimmer.utils.SaveMigrations": {"tf": 1}}, "df": 1}}, "l": {"docs": {}, "df": 0, "l": {"docs": {"shimmer.modules.vae.gaussian_nll": {"tf": 1.4142135623730951}}, "df": 1}}}, "v": {"docs": {"shimmer.modules.selection.SelectionBase.forward": {"tf": 1.4142135623730951}}, "df": 1, "a": {"docs": {}, "df": 0, "l": {"docs": {"shimmer.modules.losses.GWLossesBase.step": {"tf": 1}}, "df": 1, "u": {"docs": {}, "df": 0, "e": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspace.__init__": {"tf": 1}, "shimmer.modules.domain.LossOutput": {"tf": 1}, "shimmer.modules.gw_module.compute_fusion_scores": {"tf": 1}, "shimmer.modules.losses.demi_cycle_loss": {"tf": 1}, "shimmer.modules.losses.cycle_loss": {"tf": 1}, "shimmer.modules.losses.translation_loss": {"tf": 1}, "shimmer.modules.losses.contrastive_loss": {"tf": 1}, "shimmer.modules.losses.contrastive_loss_bayesian": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.__init__": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.__init__": {"tf": 1}, "shimmer.modules.vae.VAEEncoder.forward": {"tf": 1}, "shimmer.modules.vae.VAE.__init__": {"tf": 1}, "shimmer.modules.vae.VAE.beta": {"tf": 1}, "shimmer.modules.vae.VAE.encode": {"tf": 1}, "shimmer.modules.vae.VAE.decode": {"tf": 1}}, "df": 15, "s": {"docs": {"shimmer.types.RawDomainGroupT": {"tf": 1.4142135623730951}, "shimmer.types.RawDomainGroupDT": {"tf": 1}, "shimmer.types.LatentsDomainGroupT": {"tf": 1}, "shimmer.types.LatentsDomainGroupDT": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace2Domains.__init__": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace.__init__": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian.__init__": {"tf": 1}, "shimmer.modules.global_workspace.pretrained_global_workspace": {"tf": 1}, "shimmer.modules.losses.demi_cycle_loss": {"tf": 1}, "shimmer.modules.losses.cycle_loss": {"tf": 1}, "shimmer.modules.losses.translation_loss": {"tf": 1}, "shimmer.modules.losses.contrastive_loss": {"tf": 1}, "shimmer.modules.losses.contrastive_loss_bayesian": {"tf": 1}}, "df": 13}}}, "i": {"docs": {}, "df": 0, "d": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "g": {"docs": {"shimmer.types.ModelModeT": {"tf": 1}}, "df": 1}}, "o": {"docs": {}, "df": 0, "n": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspaceBase.generic_step": {"tf": 1}}, "df": 1}}}}}}}, "/": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "d": {"docs": {"shimmer.types.ModelModeT": {"tf": 1}, "shimmer.modules.losses.GWLossesBase.step": {"tf": 1}}, "df": 2}}}}}, "r": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "b": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "e": {"docs": {"shimmer.modules.gw_module.GWModuleBayesian.fuse": {"tf": 1}}, "df": 1}}}, "n": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "e": {"docs": {"shimmer.modules.vae.reparameterize": {"tf": 1}, "shimmer.modules.vae.VAEEncoder.forward": {"tf": 1}}, "df": 2, "s": {"docs": {"shimmer.modules.gw_module.GWModuleBayesian.fuse": {"tf": 1}}, "df": 1}}}}}, "o": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "s": {"docs": {"shimmer.modules.contrastive_loss": {"tf": 1}}, "df": 1}}}}}, "e": {"docs": {"shimmer.modules.vae.reparameterize": {"tf": 1}, "shimmer.modules.vae.kl_divergence_loss": {"tf": 1}, "shimmer.modules.vae.gaussian_nll": {"tf": 1}, "shimmer.modules.vae.VAEEncoder": {"tf": 1}, "shimmer.modules.vae.VAEEncoder.forward": {"tf": 1}, "shimmer.modules.vae.VAEDecoder": {"tf": 1}, "shimmer.modules.vae.VAEDecoder.forward": {"tf": 1.4142135623730951}, "shimmer.modules.vae.VAE": {"tf": 1}, "shimmer.modules.vae.VAE.__init__": {"tf": 2}, "shimmer.modules.vae.VAE.encode": {"tf": 1}, "shimmer.modules.vae.VAE.decode": {"tf": 1.4142135623730951}}, "df": 11, "e": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "d": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "r": {"docs": {"shimmer.modules.vae.VAE.__init__": {"tf": 1}}, "df": 1}}}}}}}, "d": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "d": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "r": {"docs": {"shimmer.modules.vae.VAE.__init__": {"tf": 1}}, "df": 1}}}}}}}, "s": {"docs": {"shimmer.modules.vae.VAE.beta": {"tf": 1}}, "df": 1}}}, "i": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "n": {"docs": {"shimmer.types.RawDomainGroupT": {"tf": 1}, "shimmer.types.RawDomainGroupDT": {"tf": 1}, "shimmer.types.LatentsDomainGroupT": {"tf": 1}, "shimmer.types.LatentsDomainGroupDT": {"tf": 1}, "shimmer.types.RawDomainGroupsT": {"tf": 2}, "shimmer.types.RawDomainGroupsDT": {"tf": 2}, "shimmer.types.LatentsDomainGroupsT": {"tf": 2}, "shimmer.types.LatentsDomainGroupsDT": {"tf": 2}}, "df": 8}}}}}, "e": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "n": {"docs": {"shimmer.types.RawDomainGroupDT": {"tf": 1}, "shimmer.modules.selection.RandomSelection": {"tf": 1}, "shimmer.utils.migrate_model": {"tf": 1}}, "df": 3, "s": {"docs": {"shimmer.utils.migrate_model": {"tf": 1}}, "df": 1}}}}}}, "c": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "r": {"docs": {"shimmer.modules.gw_module.GWModuleBayesian.get_precision": {"tf": 1}, "shimmer.modules.selection.KQFixedQSelection": {"tf": 1}, "shimmer.modules.selection.DynamicQueryAttention": {"tf": 1.4142135623730951}}, "df": 3, "s": {"docs": {"shimmer.modules.selection.KQFixedQSelection.__init__": {"tf": 1}, "shimmer.modules.selection.DynamicQueryAttention.__init__": {"tf": 1}}, "df": 2}}}}}}}, "i": {"docs": {"shimmer.modules.gw_module.GWModuleBayesian.fuse": {"tf": 2.23606797749979}}, "df": 1, "n": {"docs": {"shimmer.types.RawDomainGroupT": {"tf": 1}, "shimmer.types.RawDomainGroupsT": {"tf": 1}, "shimmer.types.RawDomainGroupsDT": {"tf": 1}, "shimmer.types.LatentsDomainGroupsT": {"tf": 1}, "shimmer.types.LatentsDomainGroupsDT": {"tf": 1}, "shimmer.types.ModelModeT": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.encode_domains": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.decode_domains": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.generic_step": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian.__init__": {"tf": 1}, "shimmer.modules.gw_module.GWDecoder.__init__": {"tf": 1}, "shimmer.modules.gw_module.GWEncoder": {"tf": 1}, "shimmer.modules.gw_module.GWEncoder.__init__": {"tf": 1}, "shimmer.modules.gw_module.GWEncoderLinear": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBase": {"tf": 1}, "shimmer.modules.gw_module.GWModule.decode": {"tf": 1}, "shimmer.modules.gw_module.compute_fusion_scores": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBayesian.__init__": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBayesian.fuse": {"tf": 1.7320508075688772}, "shimmer.modules.selection.SelectionBase.forward": {"tf": 1.4142135623730951}, "shimmer.modules.selection.SingleDomainSelection.forward": {"tf": 1}, "shimmer.modules.selection.FixedSharedSelection.forward": {"tf": 1}, "shimmer.modules.selection.KQFixedQSelection.forward": {"tf": 1}, "shimmer.modules.selection.RandomSelection.forward": {"tf": 1.7320508075688772}, "shimmer.modules.selection.DynamicQueryAttention.fuse_weighted_encodings": {"tf": 1}, "shimmer.modules.selection.DynamicQueryAttention.forward": {"tf": 1}, "shimmer.modules.losses.LossCoefs": {"tf": 1.4142135623730951}, "shimmer.modules.losses.GWLosses2Domains.__init__": {"tf": 1}, "shimmer.modules.losses.BroadcastLossCoefs": {"tf": 1.4142135623730951}, "shimmer.modules.losses.GWLosses.step": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.__init__": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.step": {"tf": 1}, "shimmer.modules.vae.kl_divergence_loss": {"tf": 1}, "shimmer.modules.vae.gaussian_nll": {"tf": 1}}, "df": 34, "f": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "n": {"docs": {"shimmer.types.RawDomainGroupT": {"tf": 1}}, "df": 1}}}}}}}, "s": {"docs": {"shimmer.modules.gw_module.GWModuleBase.encode": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBase.encode_and_fuse": {"tf": 1}, "shimmer.modules.gw_module.GWModule.encode": {"tf": 1}}, "df": 3}, "n": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "e": {"docs": {"shimmer.modules.contrastive_loss.info_nce": {"tf": 1.4142135623730951}}, "df": 1}}}}}, "p": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "t": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspaceBase.encode_and_fuse": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.encode": {"tf": 1}, "shimmer.modules.gw_module.GWDecoder.__init__": {"tf": 1}, "shimmer.modules.gw_module.GWDecoder.in_dim": {"tf": 1}, "shimmer.modules.gw_module.GWEncoder.__init__": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBase.encode": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBase.encode_and_fuse": {"tf": 1}, "shimmer.modules.gw_module.GWModule.encode": {"tf": 1}, "shimmer.modules.selection.SingleDomainSelection.forward": {"tf": 1.4142135623730951}, "shimmer.modules.selection.FixedSharedSelection.forward": {"tf": 1.4142135623730951}, "shimmer.modules.selection.KQFixedQSelection.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.selection.DynamicQueryAttention.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.vae.VAEEncoder.forward": {"tf": 1}, "shimmer.modules.vae.VAEDecoder.forward": {"tf": 1}, "shimmer.modules.vae.VAE.encode": {"tf": 1}, "shimmer.modules.vae.VAE.decode": {"tf": 1.4142135623730951}, "shimmer.modules.vae.VAE.forward": {"tf": 1.7320508075688772}}, "df": 17, "s": {"docs": {"shimmer.types.RawDomainGroupT": {"tf": 1}, "shimmer.types.RawDomainGroupDT": {"tf": 1}, "shimmer.types.LatentsDomainGroupT": {"tf": 1}, "shimmer.types.LatentsDomainGroupDT": {"tf": 1}, "shimmer.types.RawDomainGroupsT": {"tf": 1}, "shimmer.types.RawDomainGroupsDT": {"tf": 1}, "shimmer.types.LatentsDomainGroupsT": {"tf": 1}, "shimmer.types.LatentsDomainGroupsDT": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBayesian.get_precision": {"tf": 1}}, "df": 9}}}}, "d": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "p": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "d": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "t": {"docs": {"shimmer.types.RawDomainGroupsT": {"tf": 1}, "shimmer.types.RawDomainGroupsDT": {"tf": 1}, "shimmer.types.LatentsDomainGroupsT": {"tf": 1}, "shimmer.types.LatentsDomainGroupsDT": {"tf": 1}}, "df": 4}}}}}}}}}, "t": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspace2Domains.__init__": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace.__init__": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian.__init__": {"tf": 1}, "shimmer.modules.global_workspace.pretrained_global_workspace": {"tf": 1}, "shimmer.modules.domain.DomainModule.__init__": {"tf": 1}, "shimmer.modules.gw_module.get_n_layers": {"tf": 1.4142135623730951}, "shimmer.modules.gw_module.GWDecoder.__init__": {"tf": 2}, "shimmer.modules.gw_module.GWEncoder.__init__": {"tf": 2}, "shimmer.modules.gw_module.GWModuleBase.__init__": {"tf": 1}, "shimmer.modules.gw_module.GWModule.__init__": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBayesian.__init__": {"tf": 1}, "shimmer.modules.selection.KQFixedQSelection.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.selection.DynamicQueryAttention.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.losses.generate_partitions": {"tf": 1}, "shimmer.dataset.RepeatedDataset.__init__": {"tf": 1}, "shimmer.utils.groups_batch_size": {"tf": 1}, "shimmer.utils.groups_device": {"tf": 1}}, "df": 17, "o": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspaceBase.encode_and_fuse": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.encode": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.fuse": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.decode": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.encode_domain": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.encode_domains": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.decode_domain": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.decode_domains": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace2Domains.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.GlobalWorkspace.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.pretrained_global_workspace": {"tf": 1.4142135623730951}, "shimmer.modules.domain.DomainModule.encode": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBase.decode": {"tf": 1}, "shimmer.modules.gw_module.GWModule.__init__": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBayesian.__init__": {"tf": 1}, "shimmer.modules.vae.VAE.decode": {"tf": 1}}, "df": 17}, "e": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "d": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "y": {"docs": {"shimmer.modules.global_workspace.GWPredictions.cycles": {"tf": 1}, "shimmer.modules.utils.batch_cycles": {"tf": 1}}, "df": 2}}}}}}}, "f": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "e": {"docs": {"shimmer.modules.gw_module.GWModuleBase": {"tf": 1}}, "df": 1, "s": {"docs": {"shimmer.modules.gw_module.GWModule.decode": {"tf": 1}}, "df": 1}}}}}, "n": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "l": {"docs": {"shimmer.modules.selection.SelectionBase.update_gw_state": {"tf": 1}}, "df": 1, "l": {"docs": {}, "df": 0, "y": {"docs": {"shimmer.cli.ckpt_migration.migrate_ckpt": {"tf": 1}}, "df": 1}}}}}}, "g": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "n": {"docs": {"shimmer.modules.gw_module.GWModuleBayesian.fuse": {"tf": 1}}, "df": 1}}}}}}}}, "r": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "d": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "g": {"docs": {"shimmer.modules.gw_module.GWModuleBayesian.fuse": {"tf": 1}}, "df": 1}}}}}}}}}, "s": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "n": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspace2Domains": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian": {"tf": 1}}, "df": 3}}}}}}, "e": {"docs": {"shimmer.modules.gw_module.GWEncoder.forward": {"tf": 1}, "shimmer.modules.gw_module.GWEncoderLinear.forward": {"tf": 1}, "shimmer.utils.SaveMigrations.on_save_checkpoint": {"tf": 1.4142135623730951}}, "df": 3}}}}, "e": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "d": {"docs": {"shimmer.modules.gw_module.GWEncoder.forward": {"tf": 1}, "shimmer.modules.gw_module.GWEncoderLinear.forward": {"tf": 1}}, "df": 2}}}}}, "i": {"docs": {}, "df": 0, "t": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspace2Domains": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian": {"tf": 1}}, "df": 3, "i": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "z": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "s": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspace2Domains.__init__": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace.__init__": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian.__init__": {"tf": 1}, "shimmer.modules.domain.DomainModule.__init__": {"tf": 1}, "shimmer.modules.gw_module.GWDecoder.__init__": {"tf": 1}, "shimmer.modules.gw_module.GWEncoder.__init__": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBase.__init__": {"tf": 1}, "shimmer.modules.gw_module.GWModule.__init__": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBayesian.__init__": {"tf": 1}, "shimmer.modules.losses.GWLosses.__init__": {"tf": 1}, "shimmer.modules.contrastive_loss.ContrastiveLoss.__init__": {"tf": 1}, "shimmer.modules.vae.VAE.__init__": {"tf": 1}}, "df": 12}}}}}}}}}, "c": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "d": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "g": {"docs": {"shimmer.modules.losses.broadcast_loss": {"tf": 1}}, "df": 1}}}}}}}}, "m": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "g": {"docs": {}, "df": 0, "e": {"docs": {"shimmer.types.RawDomainGroupT": {"tf": 1.4142135623730951}, "shimmer.types.RawDomainGroupDT": {"tf": 1.4142135623730951}, "shimmer.types.RawDomainGroupsT": {"tf": 2}, "shimmer.types.RawDomainGroupsDT": {"tf": 2}}, "df": 4}}}, "p": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "n": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspaceBase.gw_mod": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.selection_mod": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains": {"tf": 1}, "shimmer.modules.losses.GWLosses": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian": {"tf": 1}}, "df": 5}}}}}, "e": {"docs": {}, "df": 0, "d": {"docs": {"shimmer.modules.gw_module.GWModuleBase": {"tf": 1.4142135623730951}, "shimmer.modules.selection.SelectionBase.update_gw_state": {"tf": 1}}, "df": 2}}, "s": {"docs": {"shimmer.modules.gw_module.GWModule": {"tf": 1}}, "df": 1}}}}}}}}}, "s": {"docs": {"shimmer.types.RawDomainGroupT": {"tf": 1.4142135623730951}, "shimmer.types.RawDomainGroupDT": {"tf": 1.4142135623730951}, "shimmer.types.LatentsDomainGroupT": {"tf": 1}, "shimmer.types.LatentsDomainGroupDT": {"tf": 1}, "shimmer.types.RawDomainGroupsT": {"tf": 2}, "shimmer.types.RawDomainGroupsDT": {"tf": 2}, "shimmer.types.LatentsDomainGroupsT": {"tf": 1.4142135623730951}, "shimmer.types.LatentsDomainGroupsDT": {"tf": 1.4142135623730951}, "shimmer.types.ModelModeT": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.encode_domain": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.decode_domain": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.freeze_domain_modules": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.GlobalWorkspace2Domains": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace2Domains.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.GlobalWorkspace": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.pretrained_global_workspace": {"tf": 1.7320508075688772}, "shimmer.modules.domain.LossOutput": {"tf": 1.7320508075688772}, "shimmer.modules.domain.DomainModule.compute_dcy_loss": {"tf": 1}, "shimmer.modules.domain.DomainModule.compute_cy_loss": {"tf": 1}, "shimmer.modules.domain.DomainModule.compute_tr_loss": {"tf": 1}, "shimmer.modules.domain.DomainModule.compute_broadcast_loss": {"tf": 1}, "shimmer.modules.gw_module.GWEncoder": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBase": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBayesian.fuse": {"tf": 1.7320508075688772}, "shimmer.modules.selection.SelectionBase": {"tf": 1}, "shimmer.modules.selection.SelectionBase.update_gw_state": {"tf": 1.4142135623730951}, "shimmer.modules.selection.SingleDomainSelection": {"tf": 1}, "shimmer.modules.selection.SingleDomainSelection.forward": {"tf": 1}, "shimmer.modules.selection.FixedSharedSelection": {"tf": 1}, "shimmer.modules.selection.FixedSharedSelection.forward": {"tf": 1}, "shimmer.modules.selection.RandomSelection.forward": {"tf": 1}, "shimmer.modules.selection.DynamicQueryAttention": {"tf": 1}, "shimmer.modules.losses.GWLossesBase": {"tf": 1}, "shimmer.modules.losses.LossCoefs": {"tf": 1.7320508075688772}, "shimmer.modules.losses.GWLosses2Domains.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.losses.BroadcastLossCoefs": {"tf": 1.7320508075688772}, "shimmer.modules.losses.GWLosses.step": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.losses.GWLossesBayesian.step": {"tf": 1}, "shimmer.dataset.RepeatedDataset": {"tf": 1.4142135623730951}, "shimmer.dataset.RepeatedDataset.__init__": {"tf": 1}, "shimmer.modules.vae.VAE.forward": {"tf": 1}}, "df": 46}, "t": {"docs": {"shimmer.modules.domain.LossOutput": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBase.encode_and_fuse": {"tf": 1}, "shimmer.modules.selection.SelectionBase.update_gw_state": {"tf": 1}, "shimmer.modules.selection.FixedSharedSelection": {"tf": 1}, "shimmer.modules.losses.LossCoefs": {"tf": 1}, "shimmer.modules.losses.BroadcastLossCoefs": {"tf": 1}}, "df": 6, "e": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "b": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "e": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspaceBase.decode": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBase.decode": {"tf": 1}, "shimmer.modules.utils.batch_cycles": {"tf": 1}}, "df": 3, "[": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "r": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspaceBase.decode": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBase.decode": {"tf": 1}, "shimmer.modules.gw_module.GWModule.decode": {"tf": 1}, "shimmer.modules.selection.KQFixedQSelection.__init__": {"tf": 1}, "shimmer.modules.selection.DynamicQueryAttention.__init__": {"tf": 1}, "shimmer.modules.utils.batch_cycles": {"tf": 1}}, "df": 6}}}}}}}}}, "m": {"docs": {"shimmer.modules.selection.SelectionBase.forward": {"tf": 1}, "shimmer.modules.selection.RandomSelection.forward": {"tf": 1}, "shimmer.modules.vae.VAE.forward": {"tf": 1}}, "df": 3, "s": {"docs": {"shimmer.dataset.RepeatedDataset": {"tf": 1}}, "df": 1}}}, "s": {"docs": {"shimmer.dataset.RepeatedDataset": {"tf": 1}}, "df": 1}}, "f": {"docs": {"shimmer.modules.global_workspace.pretrained_global_workspace": {"tf": 1}, "shimmer.modules.domain.DomainModule.compute_dcy_loss": {"tf": 1}, "shimmer.modules.domain.DomainModule.compute_cy_loss": {"tf": 1}, "shimmer.modules.domain.DomainModule.compute_tr_loss": {"tf": 1}, "shimmer.modules.domain.DomainModule.compute_broadcast_loss": {"tf": 1}, "shimmer.modules.selection.SelectionBase.update_gw_state": {"tf": 1}, "shimmer.modules.selection.SingleDomainSelection": {"tf": 1}, "shimmer.modules.selection.FixedSharedSelection": {"tf": 1}, "shimmer.modules.losses.LossCoefs": {"tf": 1.4142135623730951}, "shimmer.modules.losses.BroadcastLossCoefs": {"tf": 1.4142135623730951}, "shimmer.dataset.RepeatedDataset": {"tf": 1.4142135623730951}}, "df": 11}, "g": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "s": {"docs": {"shimmer.modules.gw_module.GWEncoder.forward": {"tf": 1}, "shimmer.modules.gw_module.GWEncoderLinear.forward": {"tf": 1}}, "df": 2}}}}}}, "^": {"2": {"docs": {"shimmer.modules.gw_module.GWModuleBayesian.fuse": {"tf": 1.4142135623730951}}, "df": 1}, "docs": {}, "df": 0}}, "s": {"docs": {"shimmer.types.RawDomainGroupDT": {"tf": 1}, "shimmer.types.LatentsDomainGroupDT": {"tf": 1}, "shimmer.types.RawDomainGroupsT": {"tf": 1}, "shimmer.types.RawDomainGroupsDT": {"tf": 1}, "shimmer.types.LatentsDomainGroupsDT": {"tf": 1}, "shimmer.modules.global_workspace.GWPredictionsBase.states": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.encode_domain": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.decode_domain": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace2Domains.__init__": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace.__init__": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian.__init__": {"tf": 1}, "shimmer.modules.gw_module.GWModule.gw_encoders": {"tf": 1}, "shimmer.modules.gw_module.GWModule.gw_decoders": {"tf": 1}, "shimmer.modules.losses.demi_cycle_loss": {"tf": 1}, "shimmer.modules.losses.cycle_loss": {"tf": 1}, "shimmer.modules.losses.translation_loss": {"tf": 1}, "shimmer.modules.losses.contrastive_loss": {"tf": 1}, "shimmer.modules.losses.contrastive_loss_bayesian": {"tf": 1}}, "df": 18, "h": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "d": {"docs": {"shimmer.types.RawDomainGroupT": {"tf": 1}, "shimmer.modules.gw_module.GWEncoder.forward": {"tf": 1.4142135623730951}, "shimmer.modules.gw_module.GWEncoderLinear.forward": {"tf": 1.4142135623730951}, "shimmer.modules.gw_module.GWModuleBase": {"tf": 1}, "shimmer.modules.gw_module.compute_fusion_scores": {"tf": 1}, "shimmer.dataset.RepeatedDataset.__init__": {"tf": 1}}, "df": 6}}}}, "a": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "s": {"docs": {"shimmer.modules.selection.FixedSharedSelection": {"tf": 1}}, "df": 1}}}}, "i": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "r": {"docs": {"shimmer.modules.losses.demi_cycle_loss": {"tf": 1.7320508075688772}, "shimmer.modules.losses.cycle_loss": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.demi_cycle_loss": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.cycle_loss": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.translation_loss": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.contrastive_loss": {"tf": 1}, "shimmer.modules.losses.broadcast_loss": {"tf": 1.4142135623730951}, "shimmer.cli.ckpt_migration.migrate_ckpt": {"tf": 1.4142135623730951}}, "df": 8}}}}}}, "a": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "e": {"docs": {"shimmer.types.RawDomainGroupT": {"tf": 1}, "shimmer.modules.gw_module.compute_fusion_scores": {"tf": 1}, "shimmer.modules.selection.KQFixedQSelection.__init__": {"tf": 1}, "shimmer.modules.selection.DynamicQueryAttention.__init__": {"tf": 1}}, "df": 4}, "p": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "e": {"docs": {"shimmer.modules.vae.reparameterize": {"tf": 1}}, "df": 1, "s": {"docs": {"shimmer.modules.selection.RandomSelection.forward": {"tf": 1}}, "df": 1}, "d": {"docs": {"shimmer.modules.vae.reparameterize": {"tf": 1}}, "df": 1}}}}}, "v": {"docs": {}, "df": 0, "e": {"docs": {"shimmer.utils.SaveMigrations.on_save_checkpoint": {"tf": 1}}, "df": 1, "d": {"docs": {"shimmer.utils.migrate_model": {"tf": 1}, "shimmer.utils.SaveMigrations.on_save_checkpoint": {"tf": 1}}, "df": 2}}, "i": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "g": {"docs": {"shimmer.utils.SaveMigrations.on_save_checkpoint": {"tf": 1}}, "df": 1}}}}}, "c": {"docs": {}, "df": 0, "h": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "d": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "r": {"docs": {"shimmer.modules.global_workspace.SchedulerArgs": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace2Domains.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.GlobalWorkspace.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian.__init__": {"tf": 1.4142135623730951}}, "df": 4, "a": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "g": {"docs": {}, "df": 0, "s": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspace2Domains.__init__": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace.__init__": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian.__init__": {"tf": 1}}, "df": 3}}}}}}}}}}}, "o": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "e": {"docs": {"shimmer.modules.gw_module.GWModuleBase.fuse": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBase.encode_and_fuse": {"tf": 1}, "shimmer.modules.gw_module.GWModule.fuse": {"tf": 1}, "shimmer.modules.gw_module.compute_fusion_scores": {"tf": 2}, "shimmer.modules.gw_module.GWModuleBayesian.fuse": {"tf": 1.4142135623730951}}, "df": 5, "s": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspaceBase.encode_and_fuse": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.fuse": {"tf": 1.4142135623730951}, "shimmer.modules.gw_module.GWModuleBase.fuse": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBase.encode_and_fuse": {"tf": 1}, "shimmer.modules.gw_module.GWModule.fuse": {"tf": 1}, "shimmer.modules.gw_module.compute_fusion_scores": {"tf": 2.23606797749979}, "shimmer.modules.gw_module.GWModuleBayesian.fuse": {"tf": 2.23606797749979}, "shimmer.modules.selection.KQFixedQSelection.forward": {"tf": 1}, "shimmer.modules.selection.RandomSelection": {"tf": 1}, "shimmer.modules.selection.RandomSelection.forward": {"tf": 1}, "shimmer.modules.selection.DynamicQueryAttention.fuse_weighted_encodings": {"tf": 1.4142135623730951}, "shimmer.modules.selection.DynamicQueryAttention.forward": {"tf": 1}}, "df": 12}}}}, "a": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "e": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspace2Domains.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.GlobalWorkspace.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.pretrained_global_workspace": {"tf": 1}, "shimmer.modules.contrastive_loss.info_nce": {"tf": 1.4142135623730951}, "shimmer.modules.contrastive_loss.contrastive_loss": {"tf": 1.4142135623730951}, "shimmer.modules.contrastive_loss.ContrastiveLoss.__init__": {"tf": 2}, "shimmer.modules.contrastive_loss.ContrastiveLoss.forward": {"tf": 1}}, "df": 8, "d": {"docs": {"shimmer.modules.selection.DynamicQueryAttention": {"tf": 1}}, "df": 1}}, "i": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "g": {"docs": {"shimmer.modules.selection.RandomSelection": {"tf": 1}, "shimmer.modules.selection.RandomSelection.__init__": {"tf": 1}}, "df": 2}}}}}, "r": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "p": {"docs": {}, "df": 0, "t": {"docs": {"shimmer.cli.ckpt_migration.migrate_ckpt": {"tf": 1}}, "df": 1}}}}}, "t": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "p": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspaceBase.generic_step": {"tf": 2}, "shimmer.modules.losses.GWLosses.step": {"tf": 1.4142135623730951}, "shimmer.modules.losses.GWLossesBayesian.step": {"tf": 1.4142135623730951}}, "df": 3, "s": {"docs": {"shimmer.modules.global_workspace.SchedulerArgs.total_steps": {"tf": 1}}, "df": 1}}, "m": {"docs": {"shimmer.utils.migrate_model": {"tf": 1}}, "df": 1}}, "a": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "e": {"docs": {"shimmer.modules.global_workspace.GWPredictionsBase.states": {"tf": 1}, "shimmer.modules.selection.SelectionBase.update_gw_state": {"tf": 1.7320508075688772}, "shimmer.modules.selection.SingleDomainSelection.forward": {"tf": 1.4142135623730951}, "shimmer.modules.selection.FixedSharedSelection.forward": {"tf": 1.4142135623730951}}, "df": 4, "s": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspaceBase.batch_gw_states": {"tf": 1.4142135623730951}}, "df": 1}}, "i": {"docs": {}, "df": 0, "c": {"docs": {"shimmer.modules.selection.KQFixedQSelection.forward": {"tf": 1}, "shimmer.modules.selection.DynamicQueryAttention.forward": {"tf": 1}}, "df": 2}}}, "r": {"docs": {}, "df": 0, "t": {"docs": {"shimmer.modules.global_workspace.GWPredictions.cycles": {"tf": 1}, "shimmer.modules.global_workspace.GWPredictions.translations": {"tf": 1}, "shimmer.modules.utils.batch_cycles": {"tf": 1}, "shimmer.modules.utils.batch_translations": {"tf": 1}}, "df": 4}}}, "r": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspaceBase.encode_domain": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.decode_domain": {"tf": 1}, "shimmer.modules.global_workspace.pretrained_global_workspace": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBayesian.get_precision": {"tf": 1}, "shimmer.modules.utils.translation": {"tf": 1}, "shimmer.modules.utils.cycle": {"tf": 1}, "shimmer.modules.utils.batch_cycles": {"tf": 1}, "shimmer.modules.utils.batch_translations": {"tf": 1}, "shimmer.utils.migrate_model": {"tf": 1}}, "df": 9, "u": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "e": {"docs": {"shimmer.modules.selection.RandomSelection.forward": {"tf": 1}}, "df": 1}}}}}}}, "d": {"docs": {"shimmer.modules.gw_module.compute_fusion_scores": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBayesian.fuse": {"tf": 1}, "shimmer.modules.contrastive_loss.ContrastiveLossBayesianType": {"tf": 1.4142135623730951}}, "df": 3}, "o": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "e": {"docs": {"shimmer.utils.SaveMigrations.on_save_checkpoint": {"tf": 1}}, "df": 1}}}}, "e": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "n": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspaceBase.encode_and_fuse": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.fuse": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.GlobalWorkspace.__init__": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian.__init__": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBase.fuse": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBase.encode_and_fuse": {"tf": 1}, "shimmer.modules.gw_module.GWModule.fuse": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBayesian.__init__": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBayesian.fuse": {"tf": 1.4142135623730951}, "shimmer.modules.selection.SelectionBase": {"tf": 1.4142135623730951}, "shimmer.modules.selection.SelectionBase.update_gw_state": {"tf": 1}, "shimmer.modules.selection.SelectionBase.forward": {"tf": 1}, "shimmer.modules.selection.SingleDomainSelection": {"tf": 1.4142135623730951}, "shimmer.modules.selection.FixedSharedSelection": {"tf": 1}, "shimmer.modules.losses.demi_cycle_loss": {"tf": 1.7320508075688772}, "shimmer.modules.losses.cycle_loss": {"tf": 1.7320508075688772}, "shimmer.modules.losses.GWLosses2Domains.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.losses.broadcast_loss": {"tf": 1.7320508075688772}, "shimmer.modules.losses.GWLosses.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.losses.GWLossesBayesian.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.losses.GWLossesBayesian.selection_mod": {"tf": 1}, "shimmer.modules.utils.translation": {"tf": 1.4142135623730951}, "shimmer.modules.utils.cycle": {"tf": 1.4142135623730951}, "shimmer.modules.utils.batch_demi_cycles": {"tf": 1.4142135623730951}, "shimmer.modules.utils.batch_cycles": {"tf": 1.4142135623730951}, "shimmer.modules.utils.batch_translations": {"tf": 1.4142135623730951}}, "df": 26, "b": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "e": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspaceBase.selection_mod": {"tf": 1}, "shimmer.modules.losses.demi_cycle_loss": {"tf": 1}, "shimmer.modules.losses.cycle_loss": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.__init__": {"tf": 1}, "shimmer.modules.losses.broadcast_loss": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.__init__": {"tf": 1}, "shimmer.modules.utils.translation": {"tf": 1}, "shimmer.modules.utils.cycle": {"tf": 1}, "shimmer.modules.utils.batch_demi_cycles": {"tf": 1}, "shimmer.modules.utils.batch_cycles": {"tf": 1}, "shimmer.modules.utils.batch_translations": {"tf": 1}}, "df": 11}}}}}}, "n": {"docs": {}, "df": 0, "g": {"docs": {"shimmer.modules.selection.SingleDomainSelection": {"tf": 1}}, "df": 1}}}, "s": {"docs": {"shimmer.modules.selection.SelectionBase": {"tf": 1}}, "df": 1}, "e": {"docs": {}, "df": 0, "d": {"docs": {"shimmer.modules.selection.SingleDomainSelection.forward": {"tf": 1}, "shimmer.modules.selection.FixedSharedSelection.forward": {"tf": 1}}, "df": 2}}}}}, "f": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspaceBase.encode_domain": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.decode_domain": {"tf": 1}}, "df": 2}}, "t": {"docs": {"shimmer.modules.global_workspace.freeze_domain_modules": {"tf": 1}, "shimmer.modules.losses.LossCoefs": {"tf": 1}, "shimmer.modules.losses.BroadcastLossCoefs": {"tf": 1}}, "df": 3}, "n": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "v": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "y": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspaceBayesian.__init__": {"tf": 1.7320508075688772}, "shimmer.modules.gw_module.compute_fusion_scores": {"tf": 2}, "shimmer.modules.gw_module.GWModuleBayesian.__init__": {"tf": 1.7320508075688772}}, "df": 3}}}}}}, "v": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "y": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspaceBayesian.__init__": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBayesian.__init__": {"tf": 1}}, "df": 2}}}}}}}, "e": {"docs": {"shimmer.modules.gw_module.GWModuleBase": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.demi_cycle_loss": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.cycle_loss": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.translation_loss": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.contrastive_loss": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.step": {"tf": 2}}, "df": 6}, "c": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "d": {"docs": {"shimmer.modules.gw_module.compute_fusion_scores": {"tf": 1.4142135623730951}, "shimmer.modules.vae.VAE.forward": {"tf": 1}}, "df": 2}}}}, "p": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "y": {"docs": {"shimmer.modules.utils.batch_cycles": {"tf": 1}}, "df": 1}}}}}}}}}, "i": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "p": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "e": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspace2Domains": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian": {"tf": 1}}, "df": 2}, "i": {"docs": {}, "df": 0, "f": {"docs": {}, "df": 0, "y": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspace2Domains": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian": {"tf": 1}}, "df": 3}}}}}, "i": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "r": {"docs": {"shimmer.modules.gw_module.GWEncoder": {"tf": 1}}, "df": 1, "l": {"docs": {}, "df": 0, "y": {"docs": {"shimmer.modules.gw_module.GWModuleBayesian.fuse": {"tf": 1}}, "df": 1}}}}}}}, "z": {"docs": {}, "df": 0, "e": {"docs": {"shimmer.modules.gw_module.get_n_layers": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBayesian.fuse": {"tf": 1}, "shimmer.modules.selection.KQFixedQSelection.__init__": {"tf": 1}, "shimmer.modules.selection.DynamicQueryAttention.__init__": {"tf": 1}, "shimmer.dataset.RepeatedDataset": {"tf": 2.6457513110645907}, "shimmer.dataset.RepeatedDataset.__init__": {"tf": 1.7320508075688772}, "shimmer.utils.groups_batch_size": {"tf": 1.4142135623730951}, "shimmer.utils.groups_device": {"tf": 1.4142135623730951}}, "df": 8, "d": {"docs": {}, "df": 0, "d": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "t": {"docs": {"shimmer.dataset.RepeatedDataset.__init__": {"tf": 1}}, "df": 1}}}}}}}}}}, "n": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "e": {"docs": {"shimmer.modules.gw_module.GWEncoder.forward": {"tf": 1}, "shimmer.modules.gw_module.GWEncoderLinear.forward": {"tf": 1}}, "df": 2}}}, "l": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "y": {"docs": {"shimmer.modules.gw_module.GWEncoder.forward": {"tf": 1}, "shimmer.modules.gw_module.GWEncoderLinear.forward": {"tf": 1}}, "df": 2}}}}}}, "g": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "a": {"docs": {"shimmer.modules.gw_module.GWModuleBayesian.fuse": {"tf": 1}, "shimmer.modules.vae.gaussian_nll": {"tf": 1.4142135623730951}}, "df": 2}}}}, "o": {"docs": {}, "df": 0, "f": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "x": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspaceBayesian.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.gw_module.GWModuleBayesian.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.gw_module.GWModuleBayesian.fuse": {"tf": 1}, "shimmer.modules.selection.KQFixedQSelection.forward": {"tf": 1}, "shimmer.modules.selection.RandomSelection": {"tf": 1.4142135623730951}, "shimmer.modules.selection.RandomSelection.__init__": {"tf": 1}, "shimmer.modules.selection.RandomSelection.forward": {"tf": 1}, "shimmer.modules.selection.DynamicQueryAttention.forward": {"tf": 1}}, "df": 8, "e": {"docs": {}, "df": 0, "d": {"docs": {"shimmer.modules.selection.RandomSelection.forward": {"tf": 1}}, "df": 1}}}}}}}, "m": {"docs": {}, "df": 0, "e": {"docs": {"shimmer.modules.domain.LossOutput.metrics": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBase": {"tf": 1}, "shimmer.modules.selection.SelectionBase.update_gw_state": {"tf": 1}, "shimmer.modules.vae.VAEEncoder.forward": {"tf": 1}, "shimmer.modules.vae.VAE.encode": {"tf": 1}}, "df": 5, "s": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "p": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "n": {"docs": {"shimmer.modules.selection.SelectionBase.forward": {"tf": 1}}, "df": 1}}}}}}}}}}}}}}}}}}}}}}}}}, "l": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "y": {"docs": {"shimmer.modules.selection.RandomSelection.forward": {"tf": 1}}, "df": 1}}}}, "u": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "e": {"docs": {"shimmer.modules.losses.cycle_loss": {"tf": 1.7320508075688772}, "shimmer.modules.losses.translation_loss": {"tf": 2}}, "df": 2}}}}}, "p": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "f": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "c": {"docs": {"shimmer.modules.domain.DomainModule": {"tf": 1}}, "df": 1}}}}}}}, "u": {"docs": {}, "df": 0, "b": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "s": {"docs": {"shimmer.utils.SaveMigrations": {"tf": 1}}, "df": 1, "e": {"docs": {}, "df": 0, "s": {"docs": {"shimmer.modules.gw_module.GWEncoder.forward": {"tf": 1}, "shimmer.modules.gw_module.GWEncoderLinear.forward": {"tf": 1}}, "df": 2}}}}}}}}, "m": {"docs": {"shimmer.modules.gw_module.GWModuleBayesian.fuse": {"tf": 1}, "shimmer.modules.contrastive_loss.info_nce": {"tf": 1}, "shimmer.modules.contrastive_loss.contrastive_loss": {"tf": 1}, "shimmer.modules.contrastive_loss.ContrastiveLoss.__init__": {"tf": 1}}, "df": 4, "m": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "n": {"docs": {"shimmer.modules.gw_module.compute_fusion_scores": {"tf": 1}}, "df": 1}}}}}}}, "f": {"docs": {}, "df": 0, "f": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "x": {"docs": {"shimmer.utils.migrate_model": {"tf": 1}}, "df": 1}}}}}, "q": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "d": {"docs": {"shimmer.modules.gw_module.GWModuleBayesian.fuse": {"tf": 1}}, "df": 1}}}}}}}, "b": {"docs": {"shimmer.modules.gw_module.GWModuleBayesian.fuse": {"tf": 1.7320508075688772}}, "df": 1, "e": {"docs": {"shimmer.types.RawDomainGroupT": {"tf": 1.4142135623730951}, "shimmer.types.LatentsDomainGroupT": {"tf": 1}, "shimmer.types.LatentsDomainGroupsT": {"tf": 1}, "shimmer.modules.gw_module.GWDecoder.__init__": {"tf": 1}, "shimmer.modules.gw_module.GWDecoder.n_layers": {"tf": 1}, "shimmer.modules.gw_module.GWEncoder.__init__": {"tf": 1}, "shimmer.modules.gw_module.GWEncoder.forward": {"tf": 1.4142135623730951}, "shimmer.modules.gw_module.GWEncoderLinear.forward": {"tf": 1.4142135623730951}, "shimmer.modules.gw_module.GWModuleBase": {"tf": 1}, "shimmer.modules.selection.KQFixedQSelection.__init__": {"tf": 1}, "shimmer.modules.selection.DynamicQueryAttention.__init__": {"tf": 1}, "shimmer.modules.losses.LossCoefs": {"tf": 1.7320508075688772}, "shimmer.modules.losses.BroadcastLossCoefs": {"tf": 1.7320508075688772}, "shimmer.modules.losses.BroadcastLossCoefs.cycles": {"tf": 1}, "shimmer.modules.losses.BroadcastLossCoefs.translations": {"tf": 1}, "shimmer.dataset.RepeatedDataset": {"tf": 1}, "shimmer.modules.utils.batch_cycles": {"tf": 1}, "shimmer.utils.migrate_model": {"tf": 1.4142135623730951}, "shimmer.utils.SaveMigrations.on_save_checkpoint": {"tf": 1}, "shimmer.cli.ckpt_migration.migrate_ckpt": {"tf": 1}}, "df": 20, "t": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "r": {"docs": {"shimmer.modules.global_workspace.freeze_domain_modules": {"tf": 1}}, "df": 1}}}, "w": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "n": {"docs": {"shimmer.modules.selection.SelectionBase": {"tf": 1}, "shimmer.modules.selection.FixedSharedSelection": {"tf": 1}, "shimmer.modules.losses.contrastive_loss": {"tf": 1}, "shimmer.modules.losses.contrastive_loss_bayesian": {"tf": 1}}, "df": 4}}}}, "a": {"docs": {"shimmer.modules.vae.VAE.__init__": {"tf": 1.7320508075688772}, "shimmer.modules.vae.VAE.beta": {"tf": 1.4142135623730951}}, "df": 2}}, "f": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "e": {"docs": {"shimmer.modules.gw_module.GWDecoder.__init__": {"tf": 1}, "shimmer.modules.gw_module.GWDecoder.n_layers": {"tf": 1}, "shimmer.modules.gw_module.GWEncoder.__init__": {"tf": 1}}, "df": 3}}}}}, "y": {"docs": {"shimmer.types.ModelModeT": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian.__init__": {"tf": 1}, "shimmer.modules.gw_module.GWEncoder.forward": {"tf": 1}, "shimmer.modules.gw_module.GWEncoderLinear.forward": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBayesian.fuse": {"tf": 1.4142135623730951}, "shimmer.modules.selection.SelectionBase.update_gw_state": {"tf": 1}, "shimmer.modules.selection.RandomSelection": {"tf": 1}, "shimmer.modules.losses.demi_cycle_loss": {"tf": 1}, "shimmer.modules.losses.cycle_loss": {"tf": 1}, "shimmer.modules.losses.translation_loss": {"tf": 1}, "shimmer.modules.losses.contrastive_loss": {"tf": 1}, "shimmer.modules.losses.contrastive_loss_bayesian": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.__init__": {"tf": 1}}, "df": 13}, "a": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "e": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspaceBase": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian": {"tf": 1}, "shimmer.modules.domain.DomainModule": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBase": {"tf": 1}, "shimmer.modules.selection.SelectionBase": {"tf": 1}, "shimmer.modules.losses.GWLossesBase": {"tf": 1}, "shimmer.modules.vae.VAEEncoder": {"tf": 1}, "shimmer.modules.vae.VAEDecoder": {"tf": 1}, "shimmer.utils.SaveMigrations": {"tf": 1}}, "df": 9, "d": {"docs": {"shimmer.modules.gw_module.GWModuleBayesian": {"tf": 1}, "shimmer.modules.selection.RandomSelection.forward": {"tf": 1}, "shimmer.modules.selection.DynamicQueryAttention": {"tf": 1}, "shimmer.modules.losses.contrastive_loss_bayesian": {"tf": 1}, "shimmer.modules.losses.GWLosses": {"tf": 1}}, "df": 5}}}, "t": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "h": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspaceBase.batch_gw_states": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.encode_domains": {"tf": 1.7320508075688772}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.decode_domains": {"tf": 1.7320508075688772}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.generic_step": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.GlobalWorkspace2Domains.forward": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace.forward": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian.forward": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBayesian.get_precision": {"tf": 1.7320508075688772}, "shimmer.modules.gw_module.GWModuleBayesian.fuse": {"tf": 1}, "shimmer.modules.selection.SelectionBase.forward": {"tf": 1}, "shimmer.modules.selection.SingleDomainSelection.forward": {"tf": 1}, "shimmer.modules.selection.FixedSharedSelection.forward": {"tf": 1}, "shimmer.modules.selection.RandomSelection.forward": {"tf": 1}, "shimmer.modules.utils.batch_demi_cycles": {"tf": 1.4142135623730951}, "shimmer.modules.utils.batch_cycles": {"tf": 1.4142135623730951}, "shimmer.modules.utils.batch_translations": {"tf": 1.4142135623730951}, "shimmer.utils.groups_batch_size": {"tf": 2}, "shimmer.utils.groups_device": {"tf": 2}}, "df": 18}}}, "y": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "n": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspaceBayesian": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBayesian": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBayesian.fuse": {"tf": 1}, "shimmer.modules.losses.contrastive_loss_bayesian": {"tf": 1}}, "df": 4}}}}}}, "c": {"docs": {}, "df": 0, "k": {"docs": {"shimmer.modules.domain.DomainModule.decode": {"tf": 1}}, "df": 1}}}, "u": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "d": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspaceBase": {"tf": 1}, "shimmer.utils.SaveMigrations": {"tf": 1}}, "df": 2}}}, "t": {"docs": {"shimmer.modules.global_workspace.freeze_domain_modules": {"tf": 1}, "shimmer.modules.gw_module.GWEncoder": {"tf": 1}, "shimmer.modules.selection.SingleDomainSelection": {"tf": 1}, "shimmer.modules.selection.RandomSelection.forward": {"tf": 1}, "shimmer.modules.losses.LossCoefs": {"tf": 1}, "shimmer.modules.losses.BroadcastLossCoefs": {"tf": 1}}, "df": 6}}, "o": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "l": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspace2Domains.__init__": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace.__init__": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.losses.GWLossesBayesian.__init__": {"tf": 1}, "shimmer.dataset.RepeatedDataset.__init__": {"tf": 1}}, "df": 5}}}, "r": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "d": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "t": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspace": {"tf": 1}, "shimmer.modules.domain.DomainModule.compute_broadcast_loss": {"tf": 1.4142135623730951}, "shimmer.modules.losses.broadcast_loss": {"tf": 1}}, "df": 3, "l": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "f": {"docs": {}, "df": 0, "s": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspace.__init__": {"tf": 1}, "shimmer.modules.losses.GWLosses.__init__": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.__init__": {"tf": 1}}, "df": 3}}}}}}}}}}}}}}}}}, "i": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "y": {"docs": {"shimmer.modules.selection.RandomSelection": {"tf": 1}}, "df": 1}}}}}}, "e": {"docs": {}, "df": 0, "x": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "p": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "e": {"docs": {"shimmer.types.RawDomainGroupT": {"tf": 1}, "shimmer.types.RawDomainGroupDT": {"tf": 1}, "shimmer.types.LatentsDomainGroupT": {"tf": 1}, "shimmer.types.LatentsDomainGroupDT": {"tf": 1}, "shimmer.types.RawDomainGroupsT": {"tf": 1}, "shimmer.types.RawDomainGroupsDT": {"tf": 1}, "shimmer.types.LatentsDomainGroupsT": {"tf": 1}, "shimmer.types.LatentsDomainGroupsDT": {"tf": 1}, "shimmer.modules.selection.SelectionBase.forward": {"tf": 1}, "shimmer.modules.selection.SingleDomainSelection": {"tf": 1}, "shimmer.modules.selection.FixedSharedSelection": {"tf": 1}}, "df": 11}}}}, "c": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "y": {"docs": {"shimmer.dataset.RepeatedDataset": {"tf": 1}}, "df": 1}}}}}, "c": {"docs": {}, "df": 0, "p": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "y": {"docs": {"shimmer.modules.losses.LossCoefs": {"tf": 1}, "shimmer.modules.losses.BroadcastLossCoefs": {"tf": 1}}, "df": 2}}}}}}}}}, "l": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "d": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "g": {"docs": {"shimmer.modules.losses.generate_partitions": {"tf": 1.4142135623730951}}, "df": 1}}}}}}}}, "a": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "h": {"docs": {"shimmer.types.RawDomainGroupsT": {"tf": 1}, "shimmer.types.RawDomainGroupsDT": {"tf": 1}, "shimmer.types.LatentsDomainGroupsT": {"tf": 1}, "shimmer.types.LatentsDomainGroupsDT": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.fuse": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.batch_gw_states": {"tf": 1}, "shimmer.modules.global_workspace.GWPredictions.demi_cycles": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace2Domains.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.GlobalWorkspace.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.pretrained_global_workspace": {"tf": 1.4142135623730951}, "shimmer.modules.gw_module.GWModule.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.gw_module.GWModuleBayesian.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.selection.SelectionBase.forward": {"tf": 1.4142135623730951}, "shimmer.modules.selection.SingleDomainSelection": {"tf": 1}, "shimmer.modules.selection.SingleDomainSelection.forward": {"tf": 1}, "shimmer.modules.selection.FixedSharedSelection": {"tf": 1.4142135623730951}, "shimmer.modules.selection.FixedSharedSelection.forward": {"tf": 1}, "shimmer.modules.selection.KQFixedQSelection.forward": {"tf": 1}, "shimmer.modules.selection.RandomSelection.forward": {"tf": 1.7320508075688772}, "shimmer.modules.selection.DynamicQueryAttention.fuse_weighted_encodings": {"tf": 1}, "shimmer.modules.selection.DynamicQueryAttention.forward": {"tf": 1}, "shimmer.modules.utils.batch_demi_cycles": {"tf": 1}, "shimmer.modules.utils.batch_cycles": {"tf": 1.4142135623730951}, "shimmer.modules.utils.batch_translations": {"tf": 1}, "shimmer.cli.ckpt_migration.migrate_ckpt": {"tf": 1}}, "df": 26}}}, "n": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "d": {"docs": {}, "df": 0, "e": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspaceBase.encode_and_fuse": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.encode": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.encode_domain": {"tf": 1.7320508075688772}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.encode_domains": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.decode_domain": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.GlobalWorkspace2Domains.__init__": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace.__init__": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian.__init__": {"tf": 1}, "shimmer.modules.global_workspace.pretrained_global_workspace": {"tf": 1}, "shimmer.modules.domain.DomainModule.encode": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBase.fuse": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBase.encode": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBase.encode_and_fuse": {"tf": 1.7320508075688772}, "shimmer.modules.gw_module.GWModule.fuse": {"tf": 1}, "shimmer.modules.gw_module.GWModule.encode": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBayesian.fuse": {"tf": 1}, "shimmer.modules.losses.BroadcastLossCoefs.fused": {"tf": 1}, "shimmer.modules.vae.VAEEncoder.forward": {"tf": 1}, "shimmer.modules.vae.VAE.__init__": {"tf": 1}, "shimmer.modules.vae.VAE.encode": {"tf": 1}, "shimmer.modules.vae.VAE.forward": {"tf": 1}, "shimmer.modules.utils.translation": {"tf": 1}}, "df": 22, "s": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspaceBase.encode_domain": {"tf": 1}, "shimmer.modules.gw_module.GWModule.__init__": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBayesian.__init__": {"tf": 1}}, "df": 3}, "r": {"docs": {"shimmer.modules.gw_module.GWEncoder": {"tf": 1}, "shimmer.modules.gw_module.GWEncoder.__init__": {"tf": 1}, "shimmer.modules.gw_module.GWEncoderLinear": {"tf": 1}, "shimmer.modules.vae.VAEEncoder": {"tf": 1}, "shimmer.modules.vae.VAE.__init__": {"tf": 1}, "shimmer.modules.vae.VAE.encoder": {"tf": 1}}, "df": 6, "s": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspace2Domains.__init__": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace.__init__": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian.__init__": {"tf": 1}, "shimmer.modules.global_workspace.pretrained_global_workspace": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBase": {"tf": 1}, "shimmer.modules.gw_module.GWModule.__init__": {"tf": 1}, "shimmer.modules.gw_module.GWModule.gw_encoders": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBayesian.__init__": {"tf": 1}}, "df": 8}}, "d": {"docs": {"shimmer.modules.vae.VAE.forward": {"tf": 1}}, "df": 1}}, "i": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "g": {"docs": {"shimmer.modules.gw_module.GWModuleBase": {"tf": 1}}, "df": 1, "s": {"docs": {"shimmer.modules.selection.KQFixedQSelection.forward": {"tf": 1.4142135623730951}, "shimmer.modules.selection.DynamicQueryAttention.fuse_weighted_encodings": {"tf": 1.4142135623730951}, "shimmer.modules.selection.DynamicQueryAttention.forward": {"tf": 1.4142135623730951}}, "df": 3}}}}}}}, "d": {"docs": {"shimmer.modules.gw_module.GWEncoder": {"tf": 1}}, "df": 1}}, "q": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "v": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "t": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspaceBase.encode_domain": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.decode_domain": {"tf": 1}}, "df": 2}}}}}}}, "a": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "y": {"docs": {"shimmer.modules.selection.FixedSharedSelection": {"tf": 1}}, "df": 1}}}}}}, "v": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "l": {"docs": {"shimmer.modules.global_workspace.freeze_domain_modules": {"tf": 1}}, "df": 1}}, "e": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "y": {"docs": {"shimmer.modules.gw_module.GWEncoder.forward": {"tf": 1}, "shimmer.modules.gw_module.GWEncoderLinear.forward": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBayesian.precisions": {"tf": 1}}, "df": 3}}}}, "p": {"docs": {}, "df": 0, "s": {"docs": {"shimmer.modules.gw_module.compute_fusion_scores": {"tf": 1}}, "df": 1}}, "r": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "r": {"docs": {"shimmer.modules.selection.SelectionBase.update_gw_state": {"tf": 1}}, "df": 1}}}}, "l": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "s": {"docs": {"shimmer.modules.losses.generate_partitions": {"tf": 1}}, "df": 1}}}}}}, "s": {"docs": {}, "df": 0, "e": {"docs": {"shimmer.utils.SaveMigrations.on_save_checkpoint": {"tf": 1}}, "df": 1}}}}, "g": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "p": {"docs": {"shimmer.types.RawDomainGroupT": {"tf": 1}, "shimmer.types.LatentsDomainGroupT": {"tf": 1}, "shimmer.types.RawDomainGroupsT": {"tf": 1.4142135623730951}, "shimmer.types.RawDomainGroupsDT": {"tf": 1.4142135623730951}, "shimmer.types.LatentsDomainGroupsT": {"tf": 1.7320508075688772}, "shimmer.types.LatentsDomainGroupsDT": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.encode_and_fuse": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.encode": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.fuse": {"tf": 1.7320508075688772}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.decode": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBase.fuse": {"tf": 1}, "shimmer.modules.gw_module.GWModule.fuse": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBayesian.fuse": {"tf": 1}, "shimmer.modules.selection.SelectionBase.forward": {"tf": 1.4142135623730951}, "shimmer.modules.selection.SingleDomainSelection": {"tf": 1.4142135623730951}, "shimmer.modules.selection.KQFixedQSelection.forward": {"tf": 1.7320508075688772}, "shimmer.modules.selection.RandomSelection.forward": {"tf": 1.4142135623730951}, "shimmer.modules.selection.DynamicQueryAttention.fuse_weighted_encodings": {"tf": 1}, "shimmer.modules.selection.DynamicQueryAttention.forward": {"tf": 1.7320508075688772}, "shimmer.modules.utils.translation": {"tf": 1}, "shimmer.modules.utils.cycle": {"tf": 1.7320508075688772}}, "df": 21, "s": {"docs": {"shimmer.modules.global_workspace.GWPredictionsBase.states": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.batch_gw_states": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.encode_domains": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.decode_domains": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.generic_step": {"tf": 1}, "shimmer.modules.global_workspace.GWPredictions.demi_cycles": {"tf": 1}, "shimmer.modules.global_workspace.GWPredictions.cycles": {"tf": 1}, "shimmer.modules.global_workspace.GWPredictions.translations": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace2Domains.forward": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace.forward": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian.forward": {"tf": 1}, "shimmer.modules.selection.SingleDomainSelection": {"tf": 1}, "shimmer.modules.losses.GWLossesBase.step": {"tf": 1}, "shimmer.modules.losses.demi_cycle_loss": {"tf": 1}, "shimmer.modules.losses.cycle_loss": {"tf": 1}, "shimmer.modules.losses.translation_loss": {"tf": 1}, "shimmer.modules.losses.contrastive_loss": {"tf": 1}, "shimmer.modules.losses.contrastive_loss_bayesian": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.demi_cycle_loss": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.cycle_loss": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.translation_loss": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.contrastive_loss": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.step": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.contrastive_loss": {"tf": 1}, "shimmer.modules.utils.batch_demi_cycles": {"tf": 1.4142135623730951}, "shimmer.modules.utils.batch_cycles": {"tf": 1.4142135623730951}, "shimmer.modules.utils.batch_translations": {"tf": 1.4142135623730951}, "shimmer.utils.groups_batch_size": {"tf": 1}, "shimmer.utils.groups_device": {"tf": 1}}, "df": 29}}}}}, "e": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "c": {"docs": {"shimmer.types.RawDomainGroupT": {"tf": 1}, "shimmer.types.LatentsDomainGroupT": {"tf": 1}, "shimmer.types.LatentsDomainGroupsT": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.generic_step": {"tf": 1}, "shimmer.modules.domain.DomainModule.compute_loss": {"tf": 1}, "shimmer.modules.domain.DomainModule.compute_dcy_loss": {"tf": 1}, "shimmer.modules.domain.DomainModule.compute_cy_loss": {"tf": 1}, "shimmer.modules.domain.DomainModule.compute_tr_loss": {"tf": 1}, "shimmer.modules.domain.DomainModule.compute_broadcast_loss": {"tf": 1}}, "df": 9}}, "a": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "g": {"docs": {"shimmer.modules.selection.RandomSelection": {"tf": 1}}, "df": 1}}}, "e": {"docs": {"shimmer.modules.selection.RandomSelection.forward": {"tf": 1}, "shimmer.modules.losses.generate_partitions": {"tf": 1}}, "df": 2, "s": {"docs": {"shimmer.modules.losses.generate_partitions": {"tf": 1}}, "df": 1}}}}}}}, "t": {"docs": {"shimmer.modules.gw_module.GWModuleBayesian.get_precision": {"tf": 1}, "shimmer.utils.groups_batch_size": {"tf": 1}, "shimmer.utils.groups_device": {"tf": 1}}, "df": 3}}, "t": {"docs": {"shimmer.types.RawDomainGroupDT": {"tf": 1}, "shimmer.types.LatentsDomainGroupDT": {"tf": 1}, "shimmer.types.RawDomainGroupsT": {"tf": 1}, "shimmer.types.RawDomainGroupsDT": {"tf": 1}, "shimmer.types.LatentsDomainGroupsDT": {"tf": 1}, "shimmer.modules.selection.SelectionBase.forward": {"tf": 1.7320508075688772}}, "df": 6}, "i": {"docs": {}, "df": 0, "v": {"docs": {}, "df": 0, "e": {"docs": {"shimmer.utils.SaveMigrations.on_save_checkpoint": {"tf": 1}}, "df": 1, "n": {"docs": {"shimmer.modules.global_workspace.GWPredictionsBase": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.decode": {"tf": 1}, "shimmer.modules.global_workspace.GWPredictions": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBase.decode": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBayesian.get_precision": {"tf": 1}, "shimmer.modules.losses.GWLosses.contrastive_loss": {"tf": 1}, "shimmer.utils.migrate_model": {"tf": 1.4142135623730951}, "shimmer.cli.ckpt_migration.migrate_ckpt": {"tf": 1}}, "df": 8}, "s": {"docs": {"shimmer.modules.selection.FixedSharedSelection": {"tf": 1}}, "df": 1}}}}, "l": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "b": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "l": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspaceBase": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.GlobalWorkspace2Domains": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace2Domains.__init__": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace.__init__": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian.__init__": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBayesian.fuse": {"tf": 1}, "shimmer.modules.losses.GWLossesBase": {"tf": 1}, "shimmer.modules.losses.GWLosses.__init__": {"tf": 1.4142135623730951}}, "df": 10, "w": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "k": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "p": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "e": {"docs": {"shimmer.modules.global_workspace.pretrained_global_workspace": {"tf": 2.23606797749979}, "shimmer.modules.losses.GWLosses2Domains.__init__": {"tf": 1}}, "df": 2, "b": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "e": {"docs": {"shimmer.modules.global_workspace.GWPredictionsBase": {"tf": 1}, "shimmer.modules.global_workspace.GWPredictions": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace2Domains": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian": {"tf": 1}, "shimmer.modules.global_workspace.pretrained_global_workspace": {"tf": 1}}, "df": 6}}, "y": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "n": {"docs": {"shimmer.modules.losses.GWLossesBayesian.__init__": {"tf": 1}, "shimmer.modules.contrastive_loss.ContrastiveLossBayesianType": {"tf": 1}}, "df": 2}}}}}}}}}}}}}}}}}}}}}}, "w": {"docs": {"shimmer.modules.global_workspace.GWPredictionsBase.states": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.loss_mod": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.workspace_dim": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.encode_and_fuse": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.encode": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.fuse": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.decode": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.batch_gw_states": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace2Domains.__init__": {"tf": 2.449489742783178}, "shimmer.modules.global_workspace.GlobalWorkspace.__init__": {"tf": 2.449489742783178}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian.__init__": {"tf": 2.449489742783178}, "shimmer.modules.global_workspace.pretrained_global_workspace": {"tf": 2.449489742783178}, "shimmer.modules.domain.DomainModule": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBase": {"tf": 1.7320508075688772}, "shimmer.modules.gw_module.GWModuleBase.__init__": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBase.workspace_dim": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBase.encode": {"tf": 1.4142135623730951}, "shimmer.modules.gw_module.GWModuleBase.encode_and_fuse": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBase.decode": {"tf": 1.4142135623730951}, "shimmer.modules.gw_module.GWModule": {"tf": 1}, "shimmer.modules.gw_module.GWModule.__init__": {"tf": 2.23606797749979}, "shimmer.modules.gw_module.GWModule.encode": {"tf": 1}, "shimmer.modules.gw_module.GWModule.decode": {"tf": 1.7320508075688772}, "shimmer.modules.gw_module.GWModuleBayesian.__init__": {"tf": 2.23606797749979}, "shimmer.modules.selection.SelectionBase.update_gw_state": {"tf": 1.7320508075688772}, "shimmer.modules.selection.SingleDomainSelection.forward": {"tf": 1.4142135623730951}, "shimmer.modules.selection.FixedSharedSelection.forward": {"tf": 1.4142135623730951}, "shimmer.modules.selection.KQFixedQSelection": {"tf": 1}, "shimmer.modules.selection.DynamicQueryAttention": {"tf": 1.4142135623730951}, "shimmer.modules.losses.GWLossesBase": {"tf": 1.4142135623730951}, "shimmer.modules.losses.demi_cycle_loss": {"tf": 1.4142135623730951}, "shimmer.modules.losses.cycle_loss": {"tf": 1}, "shimmer.modules.losses.translation_loss": {"tf": 1}, "shimmer.modules.losses.contrastive_loss": {"tf": 1}, "shimmer.modules.losses.contrastive_loss_bayesian": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.__init__": {"tf": 1}, "shimmer.modules.losses.broadcast_loss": {"tf": 1.4142135623730951}, "shimmer.modules.losses.GWLosses.__init__": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.__init__": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.domain_mods": {"tf": 1}, "shimmer.modules.utils.translation": {"tf": 1}, "shimmer.modules.utils.cycle": {"tf": 1.7320508075688772}, "shimmer.modules.utils.batch_demi_cycles": {"tf": 1}, "shimmer.modules.utils.batch_cycles": {"tf": 1}, "shimmer.modules.utils.batch_translations": {"tf": 1}}, "df": 45, "m": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "d": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "e": {"docs": {"shimmer.modules.gw_module.GWModuleBase": {"tf": 1.7320508075688772}, "shimmer.modules.gw_module.GWModuleBase.__init__": {"tf": 1}, "shimmer.modules.gw_module.GWModule.__init__": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBayesian": {"tf": 1}, "shimmer.modules.losses.demi_cycle_loss": {"tf": 1}, "shimmer.modules.losses.cycle_loss": {"tf": 1}, "shimmer.modules.losses.translation_loss": {"tf": 1}, "shimmer.modules.losses.contrastive_loss": {"tf": 1}, "shimmer.modules.losses.contrastive_loss_bayesian": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.losses.broadcast_loss": {"tf": 1}, "shimmer.modules.losses.GWLosses.__init__": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.__init__": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.gw_mod": {"tf": 1}, "shimmer.modules.utils.translation": {"tf": 1}, "shimmer.modules.utils.cycle": {"tf": 1}, "shimmer.modules.utils.batch_cycles": {"tf": 1}, "shimmer.modules.utils.batch_translations": {"tf": 1}}, "df": 19, "b": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "e": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspaceBase.gw_mod": {"tf": 1}, "shimmer.modules.gw_module.GWModule": {"tf": 1}, "shimmer.modules.losses.demi_cycle_loss": {"tf": 1}, "shimmer.modules.losses.cycle_loss": {"tf": 1}, "shimmer.modules.losses.translation_loss": {"tf": 1}, "shimmer.modules.losses.contrastive_loss": {"tf": 1}, "shimmer.modules.losses.broadcast_loss": {"tf": 1}, "shimmer.modules.utils.translation": {"tf": 1}, "shimmer.modules.utils.cycle": {"tf": 1}, "shimmer.modules.utils.batch_demi_cycles": {"tf": 1.4142135623730951}, "shimmer.modules.utils.batch_cycles": {"tf": 1}, "shimmer.modules.utils.batch_translations": {"tf": 1}}, "df": 12}}, "y": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "n": {"docs": {"shimmer.modules.gw_module.GWModuleBayesian.__init__": {"tf": 1}, "shimmer.modules.losses.contrastive_loss_bayesian": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.__init__": {"tf": 1}}, "df": 4}}}}}}}}, "s": {"docs": {"shimmer.modules.gw_module.GWDecoder": {"tf": 1}, "shimmer.modules.gw_module.GWEncoder": {"tf": 1}, "shimmer.modules.gw_module.GWEncoderLinear": {"tf": 1}}, "df": 3}}}}}}}, "p": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "d": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "s": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspace2Domains.forward": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace.forward": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian.forward": {"tf": 1}}, "df": 3}}}}}}}}}}}, "l": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "s": {"docs": {"shimmer.modules.losses.LossCoefs": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.step": {"tf": 2}}, "df": 2, "b": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "e": {"docs": {"shimmer.modules.losses.GWLosses2Domains": {"tf": 1}, "shimmer.modules.losses.GWLosses": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian": {"tf": 1}}, "df": 3}}}}, "f": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "n": {"docs": {"shimmer.modules.losses.BroadcastLossCoefs": {"tf": 1}}, "df": 1}}}}}}}}}}}}}, "a": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "n": {"docs": {"shimmer.modules.vae.gaussian_nll": {"tf": 1.4142135623730951}}, "df": 1}}}}}}}}, "x": {"docs": {"shimmer.types.RawDomainGroupT": {"tf": 1.4142135623730951}, "shimmer.types.LatentsDomainGroupT": {"tf": 1.4142135623730951}, "shimmer.types.LatentsDomainGroupsT": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.encode_and_fuse": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.encode": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.fuse": {"tf": 1}, "shimmer.modules.domain.DomainModule.encode": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBase.fuse": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBase.encode": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBase.encode_and_fuse": {"tf": 1}, "shimmer.modules.gw_module.GWModule.fuse": {"tf": 1}, "shimmer.modules.gw_module.GWModule.encode": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBayesian.get_precision": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBayesian.fuse": {"tf": 1}, "shimmer.modules.contrastive_loss.info_nce": {"tf": 1}, "shimmer.modules.contrastive_loss.contrastive_loss": {"tf": 1}, "shimmer.modules.contrastive_loss.ContrastiveLoss.forward": {"tf": 1}, "shimmer.modules.vae.gaussian_nll": {"tf": 1}, "shimmer.modules.vae.VAEEncoder.forward": {"tf": 1}, "shimmer.modules.vae.VAEDecoder.forward": {"tf": 1}, "shimmer.modules.vae.VAE.encode": {"tf": 1}, "shimmer.modules.vae.VAE.forward": {"tf": 1.4142135623730951}, "shimmer.modules.utils.translation": {"tf": 1}, "shimmer.modules.utils.cycle": {"tf": 1}}, "df": 24, "i": {"docs": {"shimmer.modules.gw_module.GWModuleBayesian.fuse": {"tf": 1.7320508075688772}}, "df": 1}}, "q": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "t": {"docs": {"shimmer.types.RawDomainGroupT": {"tf": 2.8284271247461903}, "shimmer.types.RawDomainGroupDT": {"tf": 2.8284271247461903}, "shimmer.types.LatentsDomainGroupT": {"tf": 2}, "shimmer.types.LatentsDomainGroupDT": {"tf": 2}, "shimmer.types.RawDomainGroupsT": {"tf": 4.898979485566356}, "shimmer.types.RawDomainGroupsDT": {"tf": 4.898979485566356}, "shimmer.types.LatentsDomainGroupsT": {"tf": 4}, "shimmer.types.LatentsDomainGroupsDT": {"tf": 4}, "shimmer.modules.selection.SelectionBase.forward": {"tf": 2.8284271247461903}}, "df": 9}}, "a": {"docs": {}, "df": 0, "d": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "e": {"docs": {"shimmer.modules.gw_module.compute_fusion_scores": {"tf": 1}}, "df": 1}}}}}}}}, "e": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "y": {"docs": {"shimmer.modules.selection.KQFixedQSelection": {"tf": 1}, "shimmer.modules.selection.KQFixedQSelection.__init__": {"tf": 1}, "shimmer.modules.selection.KQFixedQSelection.forward": {"tf": 1.4142135623730951}, "shimmer.modules.selection.DynamicQueryAttention": {"tf": 1.4142135623730951}, "shimmer.modules.selection.DynamicQueryAttention.__init__": {"tf": 1}, "shimmer.modules.selection.DynamicQueryAttention.forward": {"tf": 1.4142135623730951}}, "df": 6}, "i": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "s": {"docs": {"shimmer.modules.selection.KQFixedQSelection.forward": {"tf": 1}, "shimmer.modules.selection.DynamicQueryAttention.forward": {"tf": 1}}, "df": 2}}}}}}}, "p": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "l": {"docs": {"shimmer.types.RawDomainGroupT": {"tf": 1}, "shimmer.types.RawDomainGroupDT": {"tf": 1}, "shimmer.types.RawDomainGroupsT": {"tf": 1.4142135623730951}, "shimmer.types.RawDomainGroupsDT": {"tf": 1.4142135623730951}}, "df": 4}, "c": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "e": {"docs": {"shimmer.types.RawDomainGroupT": {"tf": 1}, "shimmer.types.RawDomainGroupDT": {"tf": 1}, "shimmer.types.RawDomainGroupsT": {"tf": 1.4142135623730951}, "shimmer.types.RawDomainGroupsDT": {"tf": 1.4142135623730951}}, "df": 4}}}}}}, "a": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "h": {"docs": {"shimmer.modules.global_workspace.pretrained_global_workspace": {"tf": 1.7320508075688772}, "shimmer.utils.migrate_model": {"tf": 1.4142135623730951}, "shimmer.cli.ckpt_migration.migrate_ckpt": {"tf": 1.7320508075688772}}, "df": 3, "/": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "/": {"docs": {}, "df": 0, "d": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "g": {"docs": {}, "df": 0, "/": {"docs": {}, "df": 0, "p": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "e": {"docs": {"shimmer.types.RawDomainGroupT": {"tf": 1}, "shimmer.types.RawDomainGroupDT": {"tf": 1}, "shimmer.types.RawDomainGroupsT": {"tf": 1}, "shimmer.types.RawDomainGroupsDT": {"tf": 1}}, "df": 4}}}}}}}}}}}, "c": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "/": {"docs": {}, "df": 0, "p": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "e": {"docs": {"shimmer.types.RawDomainGroupsT": {"tf": 1}, "shimmer.types.RawDomainGroupsDT": {"tf": 1}}, "df": 2}}}}}}}}}}}}}}}, "l": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "k": {"docs": {}, "df": 0, "e": {"docs": {"shimmer.utils.migrate_model": {"tf": 1}}, "df": 1}}}}, "s": {"docs": {"shimmer.cli.ckpt_migration.migrate_ckpt": {"tf": 1.4142135623730951}}, "df": 1}}}, "s": {"docs": {}, "df": 0, "s": {"docs": {"shimmer.modules.global_workspace.pretrained_global_workspace": {"tf": 1}, "shimmer.modules.gw_module.GWEncoder.forward": {"tf": 1}, "shimmer.modules.gw_module.GWEncoderLinear.forward": {"tf": 1}, "shimmer.modules.selection.SelectionBase.forward": {"tf": 1}, "shimmer.modules.selection.SingleDomainSelection.forward": {"tf": 1}, "shimmer.modules.selection.FixedSharedSelection.forward": {"tf": 1}}, "df": 6, "i": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "g": {"docs": {"shimmer.types.RawDomainGroupT": {"tf": 1}, "shimmer.types.LatentsDomainGroupT": {"tf": 1}, "shimmer.types.LatentsDomainGroupsT": {"tf": 1}}, "df": 3}}}, "e": {"docs": {}, "df": 0, "d": {"docs": {"shimmer.modules.global_workspace.SchedulerArgs": {"tf": 1}}, "df": 1}}}}, "r": {"docs": {}, "df": 0, "t": {"docs": {"shimmer.modules.losses.LossCoefs": {"tf": 1}, "shimmer.modules.losses.BroadcastLossCoefs": {"tf": 1}}, "df": 2, "i": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "r": {"docs": {"shimmer.modules.losses.demi_cycle_loss": {"tf": 1}, "shimmer.modules.losses.cycle_loss": {"tf": 1}}, "df": 2}}}}}, "t": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "n": {"docs": {"shimmer.modules.losses.generate_partitions": {"tf": 1.7320508075688772}}, "df": 1, "s": {"docs": {"shimmer.modules.losses.generate_partitions": {"tf": 1.4142135623730951}}, "df": 1}}}}}}}, "a": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "r": {"docs": {"shimmer.modules.contrastive_loss.ContrastiveLoss.__init__": {"tf": 1}}, "df": 1, "s": {"docs": {"shimmer.modules.vae.reparameterize": {"tf": 1}}, "df": 1}}}}}}}}}, "n": {"docs": {}, "df": 0, "g": {"docs": {"shimmer.types.RawDomainGroupT": {"tf": 1}, "shimmer.types.RawDomainGroupDT": {"tf": 1}, "shimmer.types.RawDomainGroupsT": {"tf": 1.4142135623730951}, "shimmer.types.RawDomainGroupsDT": {"tf": 1.4142135623730951}}, "df": 4}}, "y": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "h": {"docs": {"shimmer.types.ModelModeT": {"tf": 1}, "shimmer.utils.SaveMigrations.on_save_checkpoint": {"tf": 1.4142135623730951}}, "df": 2}}}}, "h": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "n": {"docs": {"shimmer.modules.domain.LossOutput": {"tf": 1}}, "df": 1}}}}}, "r": {"docs": {}, "df": 0, "e": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspaceBase.encode": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.fuse": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace2Domains.__init__": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace.__init__": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian.__init__": {"tf": 1}, "shimmer.modules.global_workspace.pretrained_global_workspace": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBase.encode": {"tf": 1.4142135623730951}, "shimmer.modules.gw_module.GWModule.__init__": {"tf": 1}, "shimmer.modules.gw_module.GWModule.encode": {"tf": 1.4142135623730951}, "shimmer.modules.gw_module.GWModuleBayesian.__init__": {"tf": 1}, "shimmer.modules.selection.KQFixedQSelection.forward": {"tf": 1}, "shimmer.modules.selection.DynamicQueryAttention.forward": {"tf": 1}}, "df": 12, "d": {"docs": {"shimmer.modules.domain.DomainModule.compute_loss": {"tf": 1}, "shimmer.modules.domain.DomainModule.compute_dcy_loss": {"tf": 1}, "shimmer.modules.domain.DomainModule.compute_cy_loss": {"tf": 1}, "shimmer.modules.domain.DomainModule.compute_tr_loss": {"tf": 1}, "shimmer.modules.domain.DomainModule.compute_broadcast_loss": {"tf": 1}}, "df": 5, "i": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "t": {"docs": {"shimmer.modules.global_workspace.GWPredictionsBase": {"tf": 1}, "shimmer.modules.global_workspace.GWPredictions": {"tf": 1}}, "df": 2, "i": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "n": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspaceBayesian": {"tf": 1}, "shimmer.modules.domain.DomainModule.compute_loss": {"tf": 1}, "shimmer.modules.domain.DomainModule.compute_dcy_loss": {"tf": 1}, "shimmer.modules.domain.DomainModule.compute_cy_loss": {"tf": 1}, "shimmer.modules.domain.DomainModule.compute_tr_loss": {"tf": 1}, "shimmer.modules.domain.DomainModule.compute_broadcast_loss": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBayesian": {"tf": 1}, "shimmer.modules.losses.contrastive_loss_bayesian": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.__init__": {"tf": 1}, "shimmer.modules.contrastive_loss.ContrastiveLossType": {"tf": 1}, "shimmer.modules.contrastive_loss.ContrastiveLossBayesianType": {"tf": 1.4142135623730951}, "shimmer.modules.contrastive_loss.info_nce": {"tf": 1}, "shimmer.modules.contrastive_loss.contrastive_loss": {"tf": 1}, "shimmer.modules.contrastive_loss.ContrastiveLoss.forward": {"tf": 1}, "shimmer.modules.vae.VAE.encode": {"tf": 1}}, "df": 15, "s": {"docs": {"shimmer.modules.global_workspace.GWPredictions.demi_cycles": {"tf": 1}, "shimmer.modules.global_workspace.GWPredictions.cycles": {"tf": 1}, "shimmer.modules.global_workspace.GWPredictions.translations": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace2Domains.forward": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace.forward": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian.forward": {"tf": 1}, "shimmer.modules.vae.gaussian_nll": {"tf": 1}, "shimmer.modules.utils.batch_demi_cycles": {"tf": 1}, "shimmer.modules.utils.batch_cycles": {"tf": 1}, "shimmer.modules.utils.batch_translations": {"tf": 1}}, "df": 10}}}, "n": {"docs": {}, "df": 0, "g": {"docs": {"shimmer.modules.gw_module.GWModuleBayesian.fuse": {"tf": 1}}, "df": 1}}}, "e": {"docs": {}, "df": 0, "d": {"docs": {"shimmer.modules.vae.reparameterize": {"tf": 1.4142135623730951}, "shimmer.modules.vae.kl_divergence_loss": {"tf": 1.4142135623730951}}, "df": 2}}}}}}, "c": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "n": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspaceBayesian.__init__": {"tf": 2}, "shimmer.modules.gw_module.compute_fusion_scores": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBayesian.__init__": {"tf": 1.7320508075688772}, "shimmer.modules.gw_module.GWModuleBayesian.precisions": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBayesian.get_precision": {"tf": 1.4142135623730951}, "shimmer.modules.gw_module.GWModuleBayesian.fuse": {"tf": 1.4142135623730951}, "shimmer.modules.losses.GWLossesBayesian.__init__": {"tf": 1}}, "df": 7}}}}}}, "t": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "d": {"docs": {"shimmer.modules.global_workspace.pretrained_global_workspace": {"tf": 1}}, "df": 1}}}}}}}, "v": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "s": {"docs": {"shimmer.modules.selection.SelectionBase.update_gw_state": {"tf": 1.4142135623730951}, "shimmer.modules.selection.SingleDomainSelection.forward": {"tf": 1}, "shimmer.modules.selection.FixedSharedSelection.forward": {"tf": 1}}, "df": 3}}}}}}, "o": {"docs": {}, "df": 0, "x": {"docs": {}, "df": 0, "y": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspaceBase.encode_domain": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.decode_domain": {"tf": 1}}, "df": 2}}, "d": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "t": {"docs": {"shimmer.modules.selection.KQFixedQSelection.forward": {"tf": 1}, "shimmer.modules.selection.DynamicQueryAttention.forward": {"tf": 1}}, "df": 2}}}}, "v": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "d": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "d": {"docs": {"shimmer.modules.losses.demi_cycle_loss": {"tf": 1}, "shimmer.modules.losses.cycle_loss": {"tf": 1}, "shimmer.modules.losses.translation_loss": {"tf": 1}, "shimmer.modules.losses.contrastive_loss": {"tf": 1}, "shimmer.modules.losses.contrastive_loss_bayesian": {"tf": 1}, "shimmer.modules.losses.LossCoefs": {"tf": 1}, "shimmer.modules.losses.BroadcastLossCoefs": {"tf": 1}, "shimmer.modules.vae.reparameterize": {"tf": 1}, "shimmer.modules.utils.translation": {"tf": 1}}, "df": 9}}}}}}}, "e": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "f": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "m": {"docs": {"shimmer.modules.utils.translation": {"tf": 1}, "shimmer.modules.utils.cycle": {"tf": 1}}, "df": 2, "e": {"docs": {}, "df": 0, "d": {"docs": {"shimmer.modules.gw_module.GWEncoder.forward": {"tf": 1}, "shimmer.modules.gw_module.GWEncoderLinear.forward": {"tf": 1}}, "df": 2}}, "s": {"docs": {"shimmer.modules.losses.GWLosses.step": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.step": {"tf": 1}}, "df": 2}}}}}}}, "o": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "b": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "e": {"docs": {"shimmer.modules.losses.generate_partitions": {"tf": 1}}, "df": 1}}}}}}, "i": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "t": {"docs": {"shimmer.cli.ckpt_migration.migrate_ckpt": {"tf": 1}}, "df": 1}}}}, "l": {"docs": {"shimmer.utils.SaveMigrations.on_save_checkpoint": {"tf": 1}}, "df": 1}}, "l": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "g": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "g": {"docs": {}, "df": 0, "e": {"docs": {"shimmer.types.RawDomainGroupT": {"tf": 1}, "shimmer.types.RawDomainGroupDT": {"tf": 1}, "shimmer.types.LatentsDomainGroupT": {"tf": 1}, "shimmer.types.LatentsDomainGroupDT": {"tf": 1}, "shimmer.types.RawDomainGroupsT": {"tf": 2}, "shimmer.types.RawDomainGroupsDT": {"tf": 2}, "shimmer.types.LatentsDomainGroupsT": {"tf": 2}, "shimmer.types.LatentsDomainGroupsDT": {"tf": 2}}, "df": 8}}}}}}, "t": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "t": {"docs": {"shimmer.types.LatentsDomainGroupT": {"tf": 1.4142135623730951}, "shimmer.types.LatentsDomainGroupDT": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.encode_and_fuse": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.encode": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.fuse": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.batch_gw_states": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.encode_domains": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.decode_domains": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace2Domains.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.GlobalWorkspace2Domains.forward": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.GlobalWorkspace.forward": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian.forward": {"tf": 1}, "shimmer.modules.global_workspace.pretrained_global_workspace": {"tf": 1.4142135623730951}, "shimmer.modules.domain.DomainModule.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.domain.DomainModule.latent_dim": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBase.fuse": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBase.encode": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBase.encode_and_fuse": {"tf": 1}, "shimmer.modules.gw_module.GWModule.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.gw_module.GWModule.fuse": {"tf": 1}, "shimmer.modules.gw_module.GWModule.encode": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBayesian.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.gw_module.GWModuleBayesian.fuse": {"tf": 1}, "shimmer.modules.selection.SelectionBase.forward": {"tf": 1}, "shimmer.modules.selection.SingleDomainSelection.forward": {"tf": 1}, "shimmer.modules.selection.FixedSharedSelection.forward": {"tf": 1}, "shimmer.modules.selection.KQFixedQSelection.forward": {"tf": 1}, "shimmer.modules.selection.RandomSelection.forward": {"tf": 1}, "shimmer.modules.selection.DynamicQueryAttention.fuse_weighted_encodings": {"tf": 1}, "shimmer.modules.selection.DynamicQueryAttention.forward": {"tf": 1}, "shimmer.modules.losses.GWLossesBase.step": {"tf": 1}, "shimmer.modules.losses.demi_cycle_loss": {"tf": 1.4142135623730951}, "shimmer.modules.losses.cycle_loss": {"tf": 1.4142135623730951}, "shimmer.modules.losses.translation_loss": {"tf": 1.4142135623730951}, "shimmer.modules.losses.contrastive_loss": {"tf": 1.4142135623730951}, "shimmer.modules.losses.contrastive_loss_bayesian": {"tf": 1.4142135623730951}, "shimmer.modules.losses.GWLosses2Domains.demi_cycle_loss": {"tf": 1.4142135623730951}, "shimmer.modules.losses.GWLosses2Domains.cycle_loss": {"tf": 1.4142135623730951}, "shimmer.modules.losses.GWLosses2Domains.translation_loss": {"tf": 1.4142135623730951}, "shimmer.modules.losses.GWLosses2Domains.contrastive_loss": {"tf": 1.4142135623730951}, "shimmer.modules.losses.GWLosses2Domains.step": {"tf": 1}, "shimmer.modules.losses.broadcast_loss": {"tf": 1.4142135623730951}, "shimmer.modules.losses.GWLosses.contrastive_loss": {"tf": 1.7320508075688772}, "shimmer.modules.losses.GWLosses.step": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.contrastive_loss": {"tf": 1.4142135623730951}, "shimmer.modules.losses.GWLossesBayesian.step": {"tf": 1}, "shimmer.modules.vae.VAEDecoder.forward": {"tf": 1}, "shimmer.modules.vae.VAE.decode": {"tf": 1.4142135623730951}, "shimmer.modules.utils.translation": {"tf": 1}, "shimmer.modules.utils.cycle": {"tf": 1.4142135623730951}, "shimmer.modules.utils.batch_demi_cycles": {"tf": 1}, "shimmer.modules.utils.batch_cycles": {"tf": 1}, "shimmer.modules.utils.batch_translations": {"tf": 1}}, "df": 55, "s": {"docs": {"shimmer.modules.losses.GWLossesBase.step": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.step": {"tf": 1}, "shimmer.modules.losses.GWLosses.step": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.step": {"tf": 1}, "shimmer.utils.groups_batch_size": {"tf": 1}, "shimmer.utils.groups_device": {"tf": 1}}, "df": 6, "d": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "g": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "p": {"docs": {}, "df": 0, "t": {"docs": {"shimmer.types.LatentsDomainGroupT": {"tf": 1}, "shimmer.types.LatentsDomainGroupDT": {"tf": 1}, "shimmer.types.LatentsDomainGroupsT": {"tf": 1}, "shimmer.types.LatentsDomainGroupsDT": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBase.fuse": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBase.encode": {"tf": 1.4142135623730951}, "shimmer.modules.gw_module.GWModuleBase.encode_and_fuse": {"tf": 1}, "shimmer.modules.gw_module.GWModule.fuse": {"tf": 1}, "shimmer.modules.gw_module.GWModule.encode": {"tf": 1.4142135623730951}, "shimmer.modules.gw_module.GWModuleBayesian.fuse": {"tf": 1}, "shimmer.modules.selection.SelectionBase.forward": {"tf": 1}, "shimmer.modules.selection.SingleDomainSelection.forward": {"tf": 1}, "shimmer.modules.selection.FixedSharedSelection.forward": {"tf": 1}, "shimmer.modules.selection.KQFixedQSelection.forward": {"tf": 1.4142135623730951}, "shimmer.modules.selection.RandomSelection.forward": {"tf": 1}, "shimmer.modules.selection.DynamicQueryAttention.fuse_weighted_encodings": {"tf": 1}, "shimmer.modules.selection.DynamicQueryAttention.forward": {"tf": 1.4142135623730951}, "shimmer.modules.utils.translation": {"tf": 1}, "shimmer.modules.utils.cycle": {"tf": 1}}, "df": 19}, "d": {"docs": {}, "df": 0, "t": {"docs": {"shimmer.types.LatentsDomainGroupT": {"tf": 1}, "shimmer.types.LatentsDomainGroupDT": {"tf": 1}, "shimmer.types.LatentsDomainGroupsDT": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBase.decode": {"tf": 1}, "shimmer.modules.gw_module.GWModule.decode": {"tf": 1}, "shimmer.modules.utils.cycle": {"tf": 1}}, "df": 6}}, "s": {"docs": {}, "df": 0, "t": {"docs": {"shimmer.types.LatentsDomainGroupsT": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.encode_and_fuse": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.encode": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.fuse": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.decode_domains": {"tf": 1}, "shimmer.modules.losses.GWLossesBase.step": {"tf": 1}, "shimmer.modules.losses.demi_cycle_loss": {"tf": 1}, "shimmer.modules.losses.cycle_loss": {"tf": 1}, "shimmer.modules.losses.translation_loss": {"tf": 1}, "shimmer.modules.losses.contrastive_loss": {"tf": 1}, "shimmer.modules.losses.contrastive_loss_bayesian": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.demi_cycle_loss": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.cycle_loss": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.translation_loss": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.contrastive_loss": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.step": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.contrastive_loss": {"tf": 1}, "shimmer.utils.groups_batch_size": {"tf": 1}, "shimmer.utils.groups_device": {"tf": 1}}, "df": 19}, "d": {"docs": {}, "df": 0, "t": {"docs": {"shimmer.types.LatentsDomainGroupsT": {"tf": 1}, "shimmer.types.LatentsDomainGroupsDT": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.encode_domains": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.decode_domains": {"tf": 1}}, "df": 4}}}}}}}}}}}}}}, "t": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspaceBase.batch_gw_states": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace2Domains.forward": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace.forward": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian.forward": {"tf": 1}, "shimmer.modules.utils.batch_demi_cycles": {"tf": 1}, "shimmer.modules.utils.batch_cycles": {"tf": 1}, "shimmer.modules.utils.batch_translations": {"tf": 1}}, "df": 7}}}, "s": {"docs": {}, "df": 0, "d": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "m": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "g": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "p": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "d": {"docs": {}, "df": 0, "t": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspaceBase.encode": {"tf": 1}}, "df": 1}}}}}}}}}}}}}}}}}, "t": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "r": {"docs": {"shimmer.modules.gw_module.GWEncoder.forward": {"tf": 1}, "shimmer.modules.gw_module.GWEncoderLinear.forward": {"tf": 1}}, "df": 2}}}}, "y": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "s": {"docs": {"shimmer.modules.gw_module.get_n_layers": {"tf": 2.23606797749979}, "shimmer.modules.gw_module.GWDecoder.__init__": {"tf": 2}, "shimmer.modules.gw_module.GWDecoder.n_layers": {"tf": 1.7320508075688772}, "shimmer.modules.gw_module.GWEncoder.__init__": {"tf": 2}}, "df": 4}}}}, "m": {"docs": {}, "df": 0, "b": {"docs": {}, "df": 0, "d": {"docs": {}, "df": 0, "a": {"docs": {"shimmer.modules.gw_module.GWModuleBayesian.fuse": {"tf": 1}}, "df": 1}}}}, "s": {"docs": {}, "df": 0, "t": {"docs": {"shimmer.dataset.RepeatedDataset": {"tf": 1.4142135623730951}, "shimmer.dataset.RepeatedDataset.__init__": {"tf": 1}}, "df": 2}}}, "i": {"docs": {}, "df": 0, "g": {"docs": {}, "df": 0, "h": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "g": {"docs": {"shimmer.types.ModelModeT": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase": {"tf": 1}, "shimmer.utils.SaveMigrations.on_save_checkpoint": {"tf": 1.4142135623730951}}, "df": 3, "m": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "d": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "e": {"docs": {"shimmer.utils.SaveMigrations.on_save_checkpoint": {"tf": 1}}, "df": 1}}}}}}}}}}}}}, "s": {"docs": {}, "df": 0, "t": {"docs": {"shimmer.modules.gw_module.get_n_layers": {"tf": 1.4142135623730951}, "shimmer.modules.selection.KQFixedQSelection.__init__": {"tf": 1}, "shimmer.modules.selection.DynamicQueryAttention.__init__": {"tf": 1}, "shimmer.cli.ckpt_migration.migrate_ckpt": {"tf": 1}}, "df": 4, "[": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "n": {"docs": {"shimmer.modules.gw_module.get_n_layers": {"tf": 1}}, "df": 1}}}}}, "n": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "r": {"docs": {"shimmer.modules.gw_module.get_n_layers": {"tf": 1.4142135623730951}, "shimmer.modules.gw_module.GWEncoderLinear": {"tf": 1}}, "df": 2, "i": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "y": {"docs": {"shimmer.modules.gw_module.GWEncoder": {"tf": 1}}, "df": 1}}}}}}, "k": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "d": {"docs": {"shimmer.modules.losses.GWLossesBayesian.domain_mods": {"tf": 1}}, "df": 1}}}}, "k": {"docs": {}, "df": 0, "e": {"docs": {"shimmer.modules.gw_module.GWModuleBase": {"tf": 1}, "shimmer.modules.losses.BroadcastLossCoefs.translations": {"tf": 1}, "shimmer.modules.contrastive_loss.contrastive_loss": {"tf": 1}, "shimmer.modules.contrastive_loss.ContrastiveLoss": {"tf": 1}}, "df": 4}}, "t": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "l": {"docs": {"shimmer.modules.losses.GWLossesBase.step": {"tf": 1}, "shimmer.modules.contrastive_loss.info_nce": {"tf": 1}, "shimmer.modules.contrastive_loss.contrastive_loss": {"tf": 1}, "shimmer.modules.contrastive_loss.ContrastiveLoss.__init__": {"tf": 1}}, "df": 4}}}}}}, "e": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "n": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspace2Domains.__init__": {"tf": 1.7320508075688772}, "shimmer.modules.global_workspace.GlobalWorkspace.__init__": {"tf": 1.7320508075688772}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian.__init__": {"tf": 1.7320508075688772}, "shimmer.modules.global_workspace.pretrained_global_workspace": {"tf": 1}, "shimmer.modules.contrastive_loss.ContrastiveLoss.__init__": {"tf": 1.4142135623730951}}, "df": 5, "i": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "g": {"docs": {"shimmer.modules.global_workspace.SchedulerArgs.max_lr": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace2Domains.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.GlobalWorkspace.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian.__init__": {"tf": 1.4142135623730951}}, "df": 4}}}}}, "s": {"docs": {}, "df": 0, "t": {"docs": {"shimmer.dataset.RepeatedDataset": {"tf": 1}}, "df": 1}}}, "v": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "l": {"docs": {"shimmer.modules.gw_module.GWModuleBayesian.precisions": {"tf": 1}}, "df": 1}}}, "n": {"docs": {"shimmer.dataset.RepeatedDataset": {"tf": 1}, "shimmer.dataset.RepeatedDataset.__init__": {"tf": 1}}, "df": 2}}, "o": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "s": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspaceBase.generic_step": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace2Domains.__init__": {"tf": 2.449489742783178}, "shimmer.modules.global_workspace.GlobalWorkspace": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace.__init__": {"tf": 2.449489742783178}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian.__init__": {"tf": 2.6457513110645907}, "shimmer.modules.global_workspace.pretrained_global_workspace": {"tf": 2}, "shimmer.modules.domain.LossOutput": {"tf": 1}, "shimmer.modules.domain.LossOutput.loss": {"tf": 1}, "shimmer.modules.domain.LossOutput.all": {"tf": 1.4142135623730951}, "shimmer.modules.domain.DomainModule.compute_loss": {"tf": 1.4142135623730951}, "shimmer.modules.domain.DomainModule.compute_dcy_loss": {"tf": 2}, "shimmer.modules.domain.DomainModule.compute_cy_loss": {"tf": 2}, "shimmer.modules.domain.DomainModule.compute_tr_loss": {"tf": 2}, "shimmer.modules.domain.DomainModule.compute_broadcast_loss": {"tf": 2}, "shimmer.modules.losses.demi_cycle_loss": {"tf": 1.4142135623730951}, "shimmer.modules.losses.cycle_loss": {"tf": 1.4142135623730951}, "shimmer.modules.losses.translation_loss": {"tf": 1.4142135623730951}, "shimmer.modules.losses.contrastive_loss": {"tf": 1.4142135623730951}, "shimmer.modules.losses.contrastive_loss_bayesian": {"tf": 1.4142135623730951}, "shimmer.modules.losses.LossCoefs": {"tf": 1.7320508075688772}, "shimmer.modules.losses.LossCoefs.demi_cycles": {"tf": 1}, "shimmer.modules.losses.LossCoefs.cycles": {"tf": 1}, "shimmer.modules.losses.LossCoefs.translations": {"tf": 1}, "shimmer.modules.losses.LossCoefs.contrastives": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.__init__": {"tf": 2}, "shimmer.modules.losses.GWLosses2Domains.demi_cycle_loss": {"tf": 1.4142135623730951}, "shimmer.modules.losses.GWLosses2Domains.cycle_loss": {"tf": 1.4142135623730951}, "shimmer.modules.losses.GWLosses2Domains.translation_loss": {"tf": 1.4142135623730951}, "shimmer.modules.losses.GWLosses2Domains.contrastive_loss": {"tf": 1.4142135623730951}, "shimmer.modules.losses.GWLosses2Domains.step": {"tf": 2}, "shimmer.modules.losses.broadcast_loss": {"tf": 1.4142135623730951}, "shimmer.modules.losses.BroadcastLossCoefs": {"tf": 1.7320508075688772}, "shimmer.modules.losses.BroadcastLossCoefs.contrastives": {"tf": 1}, "shimmer.modules.losses.BroadcastLossCoefs.fused": {"tf": 1}, "shimmer.modules.losses.BroadcastLossCoefs.demi_cycles": {"tf": 1}, "shimmer.modules.losses.BroadcastLossCoefs.cycles": {"tf": 1}, "shimmer.modules.losses.BroadcastLossCoefs.translations": {"tf": 1}, "shimmer.modules.losses.GWLosses.__init__": {"tf": 1.7320508075688772}, "shimmer.modules.losses.GWLosses.contrastive_loss": {"tf": 1.4142135623730951}, "shimmer.modules.losses.GWLosses.step": {"tf": 1.4142135623730951}, "shimmer.modules.losses.GWLossesBayesian.__init__": {"tf": 2.23606797749979}, "shimmer.modules.losses.GWLossesBayesian.loss_coefs": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.contrastive_fn": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.contrastive_loss": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.step": {"tf": 1.4142135623730951}, "shimmer.modules.contrastive_loss": {"tf": 1}, "shimmer.modules.contrastive_loss.ContrastiveLossType": {"tf": 1}, "shimmer.modules.contrastive_loss.ContrastiveLossBayesianType": {"tf": 1}, "shimmer.modules.contrastive_loss.info_nce": {"tf": 1.4142135623730951}, "shimmer.modules.contrastive_loss.contrastive_loss": {"tf": 1.4142135623730951}, "shimmer.modules.contrastive_loss.ContrastiveLoss.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.contrastive_loss.ContrastiveLoss.forward": {"tf": 1.4142135623730951}, "shimmer.modules.vae.kl_divergence_loss": {"tf": 1.4142135623730951}, "shimmer.modules.vae.gaussian_nll": {"tf": 1.4142135623730951}}, "df": 54, "e": {"docs": {}, "df": 0, "s": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspaceBase.loss_mod": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace2Domains.__init__": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian.__init__": {"tf": 1}, "shimmer.modules.global_workspace.pretrained_global_workspace": {"tf": 1}, "shimmer.modules.domain.LossOutput": {"tf": 1}, "shimmer.modules.losses.GWLossesBase": {"tf": 1.7320508075688772}, "shimmer.modules.losses.GWLossesBase.step": {"tf": 1.4142135623730951}, "shimmer.modules.losses.GWLosses2Domains.demi_cycle_loss": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.cycle_loss": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.translation_loss": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.contrastive_loss": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.step": {"tf": 1.4142135623730951}, "shimmer.modules.losses.broadcast_loss": {"tf": 1}, "shimmer.modules.losses.GWLosses.__init__": {"tf": 1}}, "df": 15}}, "c": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "f": {"docs": {}, "df": 0, "s": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspace2Domains.__init__": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian.__init__": {"tf": 1}, "shimmer.modules.global_workspace.pretrained_global_workspace": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.__init__": {"tf": 1.4142135623730951}}, "df": 4}}}}}, "o": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "p": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "t": {"docs": {"shimmer.modules.domain.DomainModule.compute_loss": {"tf": 1}, "shimmer.modules.domain.DomainModule.compute_dcy_loss": {"tf": 1}, "shimmer.modules.domain.DomainModule.compute_cy_loss": {"tf": 1}, "shimmer.modules.domain.DomainModule.compute_tr_loss": {"tf": 1}, "shimmer.modules.domain.DomainModule.compute_broadcast_loss": {"tf": 1}, "shimmer.modules.losses.GWLossesBase.step": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.step": {"tf": 1}, "shimmer.modules.losses.GWLosses.step": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.step": {"tf": 1}, "shimmer.modules.contrastive_loss.ContrastiveLossType": {"tf": 1}, "shimmer.modules.contrastive_loss.ContrastiveLossBayesianType": {"tf": 1}, "shimmer.modules.contrastive_loss.ContrastiveLoss.forward": {"tf": 1}}, "df": 12}}}}, "p": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "t": {"docs": {"shimmer.modules.domain.DomainModule.compute_loss": {"tf": 1}, "shimmer.modules.domain.DomainModule.compute_dcy_loss": {"tf": 1}, "shimmer.modules.domain.DomainModule.compute_cy_loss": {"tf": 1}, "shimmer.modules.domain.DomainModule.compute_tr_loss": {"tf": 1}, "shimmer.modules.domain.DomainModule.compute_broadcast_loss": {"tf": 1}}, "df": 5}}}}}}}, "g": {"docs": {"shimmer.modules.domain.LossOutput.metrics": {"tf": 1}, "shimmer.modules.vae.reparameterize": {"tf": 1}, "shimmer.modules.vae.gaussian_nll": {"tf": 1.4142135623730951}, "shimmer.modules.vae.VAEEncoder.forward": {"tf": 1}}, "df": 4, "i": {"docs": {}, "df": 0, "t": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspace2Domains.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.GlobalWorkspace.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.pretrained_global_workspace": {"tf": 1}, "shimmer.modules.contrastive_loss.info_nce": {"tf": 1.4142135623730951}, "shimmer.modules.contrastive_loss.contrastive_loss": {"tf": 1.4142135623730951}, "shimmer.modules.contrastive_loss.ContrastiveLoss.__init__": {"tf": 2}, "shimmer.modules.contrastive_loss.ContrastiveLoss.forward": {"tf": 1}}, "df": 8, "s": {"docs": {"shimmer.modules.gw_module.GWModuleBayesian.fuse": {"tf": 1}}, "df": 1}}}, "g": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "g": {"docs": {"shimmer.modules.domain.LossOutput": {"tf": 1}}, "df": 1}}}, "e": {"docs": {}, "df": 0, "d": {"docs": {"shimmer.modules.losses.LossCoefs": {"tf": 1.4142135623730951}, "shimmer.modules.losses.BroadcastLossCoefs": {"tf": 1.4142135623730951}}, "df": 2}}}, "v": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "r": {"docs": {"shimmer.modules.vae.reparameterize": {"tf": 1}, "shimmer.modules.vae.kl_divergence_loss": {"tf": 1}, "shimmer.modules.vae.VAE.forward": {"tf": 1}}, "df": 3, "s": {"docs": {"shimmer.modules.vae.kl_divergence_loss": {"tf": 1}}, "df": 1}}}}}, "a": {"docs": {}, "df": 0, "d": {"docs": {"shimmer.modules.global_workspace.pretrained_global_workspace": {"tf": 1.4142135623730951}, "shimmer.utils.migrate_model": {"tf": 1.4142135623730951}}, "df": 2, "e": {"docs": {}, "df": 0, "d": {"docs": {"shimmer.modules.global_workspace.pretrained_global_workspace": {"tf": 1}}, "df": 1}}}}}, "r": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspace2Domains.__init__": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace.__init__": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian.__init__": {"tf": 1}}, "df": 3}, "t": {"docs": {"shimmer.dataset.RepeatedDataset": {"tf": 1}}, "df": 1}}, "c": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspaceBayesian.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.gw_module.GWModuleBayesian.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.gw_module.GWModuleBayesian.fuse": {"tf": 2.449489742783178}}, "df": 3, "o": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "s": {"docs": {"shimmer.types.RawDomainGroupT": {"tf": 1}, "shimmer.types.LatentsDomainGroupT": {"tf": 1}, "shimmer.types.LatentsDomainGroupsT": {"tf": 1}}, "df": 3}}}}}}}}}, "n": {"docs": {}, "df": 0, "t": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspaceBayesian.__init__": {"tf": 1}, "shimmer.modules.losses.contrastive_loss": {"tf": 1}, "shimmer.modules.losses.contrastive_loss_bayesian": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.__init__": {"tf": 1}}, "df": 4, "a": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "s": {"docs": {"shimmer.types.RawDomainGroupsT": {"tf": 1}, "shimmer.types.RawDomainGroupsDT": {"tf": 1}, "shimmer.types.LatentsDomainGroupsT": {"tf": 1}, "shimmer.types.LatentsDomainGroupsDT": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.step": {"tf": 1}, "shimmer.modules.contrastive_loss.ContrastiveLoss.forward": {"tf": 1}, "shimmer.modules.vae.VAE.forward": {"tf": 1}}, "df": 7}, "i": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "g": {"docs": {"shimmer.modules.losses.GWLosses.step": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.step": {"tf": 1}}, "df": 2}}}}}}, "r": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "v": {"docs": {}, "df": 0, "e": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspace2Domains.__init__": {"tf": 2.449489742783178}, "shimmer.modules.global_workspace.GlobalWorkspace.__init__": {"tf": 2.449489742783178}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian.__init__": {"tf": 2.449489742783178}, "shimmer.modules.global_workspace.pretrained_global_workspace": {"tf": 1.7320508075688772}, "shimmer.modules.losses.GWLossesBase": {"tf": 1}, "shimmer.modules.losses.contrastive_loss": {"tf": 2.6457513110645907}, "shimmer.modules.losses.contrastive_loss_bayesian": {"tf": 2.6457513110645907}, "shimmer.modules.losses.LossCoefs.contrastives": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.__init__": {"tf": 1.7320508075688772}, "shimmer.modules.losses.GWLosses2Domains.contrastive_loss": {"tf": 1.4142135623730951}, "shimmer.modules.losses.GWLosses2Domains.step": {"tf": 1.4142135623730951}, "shimmer.modules.losses.BroadcastLossCoefs.contrastives": {"tf": 1}, "shimmer.modules.losses.GWLosses.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.losses.GWLosses.contrastive_loss": {"tf": 1.4142135623730951}, "shimmer.modules.losses.GWLossesBayesian.__init__": {"tf": 1.7320508075688772}, "shimmer.modules.losses.GWLossesBayesian.contrastive_fn": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.contrastive_loss": {"tf": 1}, "shimmer.modules.contrastive_loss": {"tf": 1}, "shimmer.modules.contrastive_loss.ContrastiveLossType": {"tf": 1}, "shimmer.modules.contrastive_loss.ContrastiveLossBayesianType": {"tf": 1}, "shimmer.modules.contrastive_loss.contrastive_loss": {"tf": 1.4142135623730951}, "shimmer.modules.contrastive_loss.ContrastiveLoss.__init__": {"tf": 1}}, "df": 22, "l": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "s": {"docs": {"shimmer.modules.contrastive_loss.ContrastiveLoss": {"tf": 1}}, "df": 1, "t": {"docs": {}, "df": 0, "y": {"docs": {}, "df": 0, "p": {"docs": {}, "df": 0, "e": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspace2Domains.__init__": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace.__init__": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian.__init__": {"tf": 1}, "shimmer.modules.global_workspace.pretrained_global_workspace": {"tf": 1}, "shimmer.modules.losses.contrastive_loss": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.__init__": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.__init__": {"tf": 1}}, "df": 7}}}}, "b": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "y": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "y": {"docs": {}, "df": 0, "p": {"docs": {}, "df": 0, "e": {"docs": {"shimmer.modules.losses.contrastive_loss_bayesian": {"tf": 1}}, "df": 1}}}}}}}}}}}}}}}}, "s": {"docs": {"shimmer.modules.losses.contrastive_loss": {"tf": 1}, "shimmer.modules.losses.contrastive_loss_bayesian": {"tf": 1}}, "df": 2}}}}}}}}}, "v": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "t": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspaceBase.encode_domain": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.decode_domain": {"tf": 1}}, "df": 2}}}}}}}, "n": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "d": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspace2Domains.__init__": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace.__init__": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian.__init__": {"tf": 1}, "shimmer.modules.global_workspace.pretrained_global_workspace": {"tf": 1}}, "df": 4}}}}}}, "s": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "v": {"docs": {}, "df": 0, "e": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspaceBayesian.__init__": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.__init__": {"tf": 1}}, "df": 2}}}}}}}}}}, "m": {"docs": {}, "df": 0, "p": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "e": {"docs": {"shimmer.modules.selection.KQFixedQSelection.forward": {"tf": 1}, "shimmer.modules.selection.DynamicQueryAttention.forward": {"tf": 1}, "shimmer.modules.losses.GWLossesBase": {"tf": 1}, "shimmer.modules.losses.demi_cycle_loss": {"tf": 1}, "shimmer.modules.losses.cycle_loss": {"tf": 1}, "shimmer.modules.losses.translation_loss": {"tf": 1}, "shimmer.modules.losses.contrastive_loss": {"tf": 1}, "shimmer.modules.losses.contrastive_loss_bayesian": {"tf": 1}}, "df": 8, "s": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspaceBase.loss_mod": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace2Domains.forward": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace.forward": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian.forward": {"tf": 1}, "shimmer.modules.domain.DomainModule.compute_dcy_loss": {"tf": 1}, "shimmer.modules.domain.DomainModule.compute_cy_loss": {"tf": 1}, "shimmer.modules.domain.DomainModule.compute_tr_loss": {"tf": 1}, "shimmer.modules.domain.DomainModule.compute_broadcast_loss": {"tf": 1}, "shimmer.modules.losses.GWLossesBase.step": {"tf": 1}, "shimmer.modules.losses.demi_cycle_loss": {"tf": 1}, "shimmer.modules.losses.cycle_loss": {"tf": 1}, "shimmer.modules.losses.translation_loss": {"tf": 1}, "shimmer.modules.losses.contrastive_loss": {"tf": 1}, "shimmer.modules.losses.contrastive_loss_bayesian": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.demi_cycle_loss": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.cycle_loss": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.translation_loss": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.contrastive_loss": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.step": {"tf": 1}, "shimmer.modules.losses.broadcast_loss": {"tf": 1}, "shimmer.modules.losses.GWLosses.contrastive_loss": {"tf": 1}, "shimmer.modules.contrastive_loss.ContrastiveLoss.forward": {"tf": 1}, "shimmer.modules.vae.kl_divergence_loss": {"tf": 1}, "shimmer.modules.vae.gaussian_nll": {"tf": 1}, "shimmer.modules.utils.batch_demi_cycles": {"tf": 1}, "shimmer.modules.utils.batch_cycles": {"tf": 1}, "shimmer.modules.utils.batch_translations": {"tf": 1}}, "df": 27}, "d": {"docs": {"shimmer.modules.global_workspace.GWPredictions.demi_cycles": {"tf": 1}, "shimmer.modules.global_workspace.GWPredictions.cycles": {"tf": 1}, "shimmer.modules.global_workspace.GWPredictions.translations": {"tf": 1}}, "df": 3}}, "a": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "n": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspace2Domains.forward": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace.forward": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian.forward": {"tf": 1}, "shimmer.modules.domain.DomainModule.compute_loss": {"tf": 1}, "shimmer.modules.gw_module.GWEncoder.forward": {"tf": 1}, "shimmer.modules.gw_module.GWEncoderLinear.forward": {"tf": 1}, "shimmer.modules.losses.GWLosses.__init__": {"tf": 1}, "shimmer.modules.losses.GWLosses.step": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.step": {"tf": 1}}, "df": 9}}}}}, "i": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "g": {"docs": {"shimmer.modules.losses.GWLosses.__init__": {"tf": 1}}, "df": 1}}}}}, "t": {"docs": {}, "df": 0, "u": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "s": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspaceBase.batch_gw_states": {"tf": 1}}, "df": 1}}}}, "l": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "n": {"docs": {"shimmer.modules.global_workspace.freeze_domain_modules": {"tf": 1}}, "df": 1}}}}}}, "e": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "n": {"docs": {"shimmer.modules.selection.SelectionBase": {"tf": 1}}, "df": 1}}}}}}}}, "m": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "n": {"docs": {"shimmer.modules.gw_module.GWModuleBase": {"tf": 1}}, "df": 1}}}, "b": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "e": {"docs": {"shimmer.modules.gw_module.GWModuleBase.fuse": {"tf": 1}, "shimmer.modules.gw_module.GWModule.fuse": {"tf": 1}, "shimmer.modules.gw_module.compute_fusion_scores": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBayesian.fuse": {"tf": 1}}, "df": 4, "s": {"docs": {"shimmer.modules.gw_module.GWModuleBase.encode_and_fuse": {"tf": 1}}, "df": 1}, "d": {"docs": {"shimmer.modules.gw_module.compute_fusion_scores": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBayesian.fuse": {"tf": 1}}, "df": 2}}}}}}, "e": {"docs": {}, "df": 0, "f": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspaceBayesian.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.gw_module.GWModuleBayesian.__init__": {"tf": 1.4142135623730951}}, "df": 2, "s": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspace2Domains.__init__": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.pretrained_global_workspace": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.__init__": {"tf": 1}, "shimmer.modules.losses.GWLosses.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.losses.GWLossesBayesian.__init__": {"tf": 1.4142135623730951}}, "df": 7}, "f": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "t": {"docs": {"shimmer.modules.gw_module.GWModuleBayesian.fuse": {"tf": 1}, "shimmer.modules.selection.SelectionBase.forward": {"tf": 1}, "shimmer.modules.selection.RandomSelection.forward": {"tf": 1}, "shimmer.modules.losses.LossCoefs": {"tf": 1}, "shimmer.modules.losses.LossCoefs.demi_cycles": {"tf": 1}, "shimmer.modules.losses.LossCoefs.cycles": {"tf": 1}, "shimmer.modules.losses.LossCoefs.translations": {"tf": 1}, "shimmer.modules.losses.LossCoefs.contrastives": {"tf": 1}, "shimmer.modules.losses.BroadcastLossCoefs": {"tf": 1}, "shimmer.modules.losses.BroadcastLossCoefs.contrastives": {"tf": 1}, "shimmer.modules.losses.BroadcastLossCoefs.fused": {"tf": 1}, "shimmer.modules.losses.BroadcastLossCoefs.demi_cycles": {"tf": 1}, "shimmer.modules.losses.BroadcastLossCoefs.cycles": {"tf": 1}, "shimmer.modules.losses.BroadcastLossCoefs.translations": {"tf": 1}}, "df": 14, "s": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspace2Domains.__init__": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian.__init__": {"tf": 1}, "shimmer.modules.global_workspace.pretrained_global_workspace": {"tf": 1}, "shimmer.modules.selection.SelectionBase": {"tf": 1}, "shimmer.modules.selection.RandomSelection": {"tf": 1}, "shimmer.modules.selection.RandomSelection.forward": {"tf": 1}, "shimmer.modules.losses.LossCoefs": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.__init__": {"tf": 1}, "shimmer.modules.losses.BroadcastLossCoefs": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.__init__": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.loss_coefs": {"tf": 1}}, "df": 11}}}}}}}}}}, "p": {"docs": {}, "df": 0, "y": {"docs": {"shimmer.modules.selection.SelectionBase.update_gw_state": {"tf": 1}}, "df": 1}}, "r": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "t": {"docs": {"shimmer.modules.losses.GWLosses2Domains.__init__": {"tf": 1}}, "df": 1}}}}, "e": {"docs": {"shimmer.utils.SaveMigrations.on_save_checkpoint": {"tf": 1}}, "df": 1}}, "u": {"docs": {}, "df": 0, "p": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "e": {"docs": {"shimmer.modules.utils.batch_cycles": {"tf": 1}, "shimmer.modules.utils.batch_translations": {"tf": 1}}, "df": 2}}}}}, "a": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "l": {"docs": {"shimmer.modules.gw_module.GWEncoder.forward": {"tf": 1.4142135623730951}, "shimmer.modules.gw_module.GWEncoderLinear.forward": {"tf": 1.4142135623730951}}, "df": 2, "i": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "g": {"docs": {"shimmer.modules.global_workspace.GWPredictionsBase": {"tf": 1}, "shimmer.modules.global_workspace.GWPredictions": {"tf": 1}}, "df": 2}}}, "b": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "k": {"docs": {}, "df": 0, "s": {"docs": {"shimmer.utils.SaveMigrations": {"tf": 1}}, "df": 1}}}}}, "e": {"docs": {}, "df": 0, "d": {"docs": {"shimmer.utils.SaveMigrations.on_save_checkpoint": {"tf": 1}, "shimmer.cli.ckpt_migration.migrate_ckpt": {"tf": 1}}, "df": 2}}, "s": {"docs": {"shimmer.cli.ckpt_migration.migrate_ckpt": {"tf": 1}}, "df": 1}}}, "s": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "d": {"docs": {"shimmer.modules.global_workspace.freeze_domain_modules": {"tf": 1}}, "df": 1}}}}, "r": {"docs": {}, "df": 0, "e": {"docs": {"shimmer.modules.gw_module.GWEncoder.forward": {"tf": 1}, "shimmer.modules.gw_module.GWEncoderLinear.forward": {"tf": 1}}, "df": 2}}, "n": {"docs": {"shimmer.modules.gw_module.GWModuleBayesian.fuse": {"tf": 1.4142135623730951}, "shimmer.modules.selection.SingleDomainSelection": {"tf": 1}, "shimmer.modules.losses.BroadcastLossCoefs.cycles": {"tf": 1}, "shimmer.modules.losses.BroadcastLossCoefs.translations": {"tf": 1}, "shimmer.cli.ckpt_migration.migrate_ckpt": {"tf": 1}}, "df": 5}}, "l": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "s": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspaceBase": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace2Domains.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.GlobalWorkspace.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.pretrained_global_workspace": {"tf": 1.4142135623730951}, "shimmer.modules.domain.DomainModule": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBase": {"tf": 1.4142135623730951}, "shimmer.modules.gw_module.GWModule.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.gw_module.GWModuleBayesian.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.selection.SelectionBase": {"tf": 1}, "shimmer.modules.losses.GWLossesBase": {"tf": 1}, "shimmer.modules.vae.VAEEncoder": {"tf": 1}, "shimmer.modules.vae.VAEDecoder": {"tf": 1}, "shimmer.utils.SaveMigrations": {"tf": 1.4142135623730951}}, "df": 14}}}, "i": {"docs": {}, "df": 0, "p": {"docs": {"shimmer.modules.contrastive_loss.contrastive_loss": {"tf": 1}, "shimmer.modules.contrastive_loss.ContrastiveLoss": {"tf": 1}}, "df": 2}}}, "y": {"docs": {"shimmer.modules.losses.cycle_loss": {"tf": 1}}, "df": 1, "c": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "e": {"docs": {"shimmer.modules.global_workspace.GWPredictions.demi_cycles": {"tf": 1}, "shimmer.modules.global_workspace.GWPredictions.cycles": {"tf": 1}, "shimmer.modules.domain.DomainModule.compute_dcy_loss": {"tf": 1.4142135623730951}, "shimmer.modules.domain.DomainModule.compute_cy_loss": {"tf": 1.4142135623730951}, "shimmer.modules.losses.GWLossesBase": {"tf": 1.4142135623730951}, "shimmer.modules.losses.demi_cycle_loss": {"tf": 2.23606797749979}, "shimmer.modules.losses.cycle_loss": {"tf": 2.23606797749979}, "shimmer.modules.losses.LossCoefs.demi_cycles": {"tf": 1}, "shimmer.modules.losses.LossCoefs.cycles": {"tf": 1}, "shimmer.modules.losses.GWLosses2Domains.demi_cycle_loss": {"tf": 1.4142135623730951}, "shimmer.modules.losses.GWLosses2Domains.cycle_loss": {"tf": 1.4142135623730951}, "shimmer.modules.losses.GWLosses2Domains.step": {"tf": 2}, "shimmer.modules.losses.broadcast_loss": {"tf": 1.4142135623730951}, "shimmer.modules.utils.cycle": {"tf": 1.4142135623730951}, "shimmer.modules.utils.batch_cycles": {"tf": 1.4142135623730951}}, "df": 15, "s": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspace2Domains.forward": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.GlobalWorkspace.forward": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian.forward": {"tf": 1.4142135623730951}, "shimmer.modules.gw_module.GWModuleBase": {"tf": 1}, "shimmer.modules.losses.demi_cycle_loss": {"tf": 1}, "shimmer.modules.losses.cycle_loss": {"tf": 1}, "shimmer.modules.losses.BroadcastLossCoefs.demi_cycles": {"tf": 1.4142135623730951}, "shimmer.modules.losses.BroadcastLossCoefs.cycles": {"tf": 1.4142135623730951}, "shimmer.modules.losses.BroadcastLossCoefs.translations": {"tf": 1}, "shimmer.dataset.RepeatedDataset": {"tf": 1}, "shimmer.modules.utils.batch_demi_cycles": {"tf": 1.4142135623730951}, "shimmer.modules.utils.batch_cycles": {"tf": 1.4142135623730951}}, "df": 12}}, "i": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "g": {"docs": {"shimmer.modules.utils.cycle": {"tf": 1}}, "df": 1}}}}}}, "u": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "m": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspace2Domains.__init__": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace.__init__": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian.__init__": {"tf": 1}, "shimmer.modules.global_workspace.pretrained_global_workspace": {"tf": 1}}, "df": 4}}}}, "r": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "t": {"docs": {"shimmer.utils.SaveMigrations.on_save_checkpoint": {"tf": 1.4142135623730951}}, "df": 1, "l": {"docs": {}, "df": 0, "y": {"docs": {"shimmer.modules.losses.GWLosses.step": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.step": {"tf": 1}}, "df": 2}}}}}}}}, "h": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "k": {"docs": {}, "df": 0, "p": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "t": {"docs": {"shimmer.modules.global_workspace.pretrained_global_workspace": {"tf": 2}, "shimmer.utils.migrate_model": {"tf": 2}, "shimmer.utils.SaveMigrations.on_save_checkpoint": {"tf": 1.7320508075688772}}, "df": 3, "s": {"docs": {"shimmer.cli.ckpt_migration.migrate_ckpt": {"tf": 1.4142135623730951}}, "df": 1}}}}}}}}}, "a": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "e": {"docs": {"shimmer.modules.selection.SingleDomainSelection": {"tf": 1}, "shimmer.utils.SaveMigrations.on_save_checkpoint": {"tf": 1}}, "df": 2}}}}}, "d": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "t": {"docs": {"shimmer.modules.gw_module.GWModuleBayesian.fuse": {"tf": 1.4142135623730951}}, "df": 1}}}, "k": {"docs": {}, "df": 0, "p": {"docs": {}, "df": 0, "t": {"docs": {"shimmer.utils.migrate_model": {"tf": 1}, "shimmer.cli.ckpt_migration.migrate_ckpt": {"tf": 1}}, "df": 2}}}}, "w": {"docs": {}, "df": 0, "h": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "n": {"docs": {"shimmer.types.ModelModeT": {"tf": 1}, "shimmer.modules.global_workspace.GWPredictionsBase": {"tf": 1}, "shimmer.modules.global_workspace.GWPredictions": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace2Domains.__init__": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace.__init__": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian.__init__": {"tf": 1}, "shimmer.dataset.RepeatedDataset.__init__": {"tf": 1}, "shimmer.utils.SaveMigrations.on_save_checkpoint": {"tf": 1}}, "df": 8}, "t": {"docs": {}, "df": 0, "h": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "r": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspace2Domains.__init__": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace.__init__": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.selection.SingleDomainSelection.forward": {"tf": 1}, "shimmer.modules.selection.FixedSharedSelection.forward": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.__init__": {"tf": 1}, "shimmer.modules.contrastive_loss.ContrastiveLoss.__init__": {"tf": 1}, "shimmer.dataset.RepeatedDataset.__init__": {"tf": 1}}, "df": 8}}}}, "r": {"docs": {}, "df": 0, "e": {"docs": {"shimmer.modules.gw_module.GWModuleBayesian.fuse": {"tf": 2}, "shimmer.modules.losses.GWLosses2Domains.__init__": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.__init__": {"tf": 1}, "shimmer.dataset.RepeatedDataset.__init__": {"tf": 1}, "shimmer.cli.ckpt_migration.migrate_ckpt": {"tf": 1}}, "df": 5}}}, "i": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "h": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspace2Domains.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.GlobalWorkspace.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.pretrained_global_workspace": {"tf": 1.4142135623730951}, "shimmer.modules.gw_module.GWModuleBayesian.fuse": {"tf": 1}, "shimmer.modules.losses.GWLosses.step": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.step": {"tf": 1}}, "df": 7}}, "l": {"docs": {}, "df": 0, "e": {"docs": {"shimmer.modules.gw_module.GWEncoder.forward": {"tf": 1}, "shimmer.modules.gw_module.GWEncoderLinear.forward": {"tf": 1}}, "df": 2}}}, "a": {"docs": {}, "df": 0, "t": {"docs": {"shimmer.modules.domain.LossOutput": {"tf": 1.4142135623730951}}, "df": 1}}}, "i": {"docs": {}, "df": 0, "t": {"docs": {}, "df": 0, "h": {"docs": {"shimmer.modules.global_workspace.GWPredictionsBase.states": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.encode_domains": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBase.decode_domains": {"tf": 1}, "shimmer.modules.global_workspace.GWPredictions.demi_cycles": {"tf": 1}, "shimmer.modules.global_workspace.GWPredictions.cycles": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.GWPredictions.translations": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.GlobalWorkspace": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian": {"tf": 1}, "shimmer.modules.domain.LossOutput.all": {"tf": 1.4142135623730951}, "shimmer.modules.domain.DomainModule.compute_loss": {"tf": 1}, "shimmer.modules.domain.DomainModule.compute_dcy_loss": {"tf": 1}, "shimmer.modules.domain.DomainModule.compute_cy_loss": {"tf": 1}, "shimmer.modules.domain.DomainModule.compute_tr_loss": {"tf": 1}, "shimmer.modules.domain.DomainModule.compute_broadcast_loss": {"tf": 1}, "shimmer.modules.gw_module.get_n_layers": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBayesian": {"tf": 1}, "shimmer.modules.selection.SingleDomainSelection": {"tf": 1}, "shimmer.modules.selection.KQFixedQSelection": {"tf": 1}, "shimmer.modules.selection.KQFixedQSelection.forward": {"tf": 1.7320508075688772}, "shimmer.modules.selection.DynamicQueryAttention": {"tf": 1}, "shimmer.modules.selection.DynamicQueryAttention.forward": {"tf": 1.7320508075688772}, "shimmer.modules.losses.demi_cycle_loss": {"tf": 1.7320508075688772}, "shimmer.modules.losses.cycle_loss": {"tf": 1.7320508075688772}, "shimmer.modules.losses.translation_loss": {"tf": 1.7320508075688772}, "shimmer.modules.losses.contrastive_loss": {"tf": 1.7320508075688772}, "shimmer.modules.losses.contrastive_loss_bayesian": {"tf": 2}, "shimmer.modules.losses.GWLosses2Domains.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.losses.broadcast_loss": {"tf": 1}, "shimmer.modules.losses.GWLossesBayesian.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.vae.reparameterize": {"tf": 1}, "shimmer.modules.vae.VAEEncoder.forward": {"tf": 1}, "shimmer.modules.vae.VAEDecoder.forward": {"tf": 1}, "shimmer.cli.ckpt_migration.migrate_ckpt": {"tf": 1}}, "df": 33, "i": {"docs": {}, "df": 0, "n": {"docs": {"shimmer.modules.gw_module.GWEncoder.forward": {"tf": 1}, "shimmer.modules.gw_module.GWEncoderLinear.forward": {"tf": 1}}, "df": 2}}}}, "l": {"docs": {}, "df": 0, "l": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspace2Domains.__init__": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace.__init__": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian.__init__": {"tf": 1}, "shimmer.modules.global_workspace.pretrained_global_workspace": {"tf": 1}, "shimmer.modules.gw_module.GWDecoder.__init__": {"tf": 1}, "shimmer.modules.gw_module.GWDecoder.n_layers": {"tf": 1}, "shimmer.modules.gw_module.GWEncoder.__init__": {"tf": 1}, "shimmer.modules.selection.SelectionBase.update_gw_state": {"tf": 1}, "shimmer.modules.losses.LossCoefs": {"tf": 1.4142135623730951}, "shimmer.modules.losses.BroadcastLossCoefs": {"tf": 1.4142135623730951}, "shimmer.dataset.RepeatedDataset": {"tf": 1}, "shimmer.modules.utils.batch_cycles": {"tf": 1}, "shimmer.utils.migrate_model": {"tf": 1.4142135623730951}, "shimmer.utils.SaveMigrations.on_save_checkpoint": {"tf": 1}}, "df": 14}}, "s": {"docs": {}, "df": 0, "e": {"docs": {"shimmer.modules.selection.RandomSelection": {"tf": 1}, "shimmer.modules.selection.RandomSelection.forward": {"tf": 1}}, "df": 2}}}, "o": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "k": {"docs": {}, "df": 0, "s": {"docs": {}, "df": 0, "p": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "c": {"docs": {}, "df": 0, "e": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspaceBase": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.GlobalWorkspace2Domains": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace2Domains.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.GlobalWorkspace": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspace.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian": {"tf": 1}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.pretrained_global_workspace": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBase.__init__": {"tf": 1}, "shimmer.modules.gw_module.GWModule.__init__": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBayesian.__init__": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBayesian.fuse": {"tf": 1}, "shimmer.modules.losses.GWLossesBase": {"tf": 1}, "shimmer.modules.losses.GWLosses.__init__": {"tf": 1.4142135623730951}}, "df": 14}}}}}}}}, "e": {"docs": {"shimmer.modules.gw_module.GWModuleBayesian.fuse": {"tf": 1.4142135623730951}}, "df": 1, "i": {"docs": {}, "df": 0, "g": {"docs": {}, "df": 0, "h": {"docs": {}, "df": 0, "t": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspace2Domains.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.GlobalWorkspace.__init__": {"tf": 1.4142135623730951}, "shimmer.modules.global_workspace.GlobalWorkspaceBayesian.__init__": {"tf": 1.4142135623730951}}, "df": 3, "s": {"docs": {"shimmer.modules.global_workspace.freeze_domain_modules": {"tf": 1}, "shimmer.modules.selection.FixedSharedSelection": {"tf": 1}}, "df": 2}, "e": {"docs": {}, "df": 0, "d": {"docs": {"shimmer.modules.selection.DynamicQueryAttention.fuse_weighted_encodings": {"tf": 1}}, "df": 1}}}}}}}, "a": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "t": {"docs": {"shimmer.utils.SaveMigrations.on_save_checkpoint": {"tf": 1}}, "df": 1}}}}, "z": {"docs": {"shimmer.modules.global_workspace.GlobalWorkspaceBase.decode": {"tf": 1}, "shimmer.modules.domain.DomainModule.decode": {"tf": 1}, "shimmer.modules.gw_module.GWModuleBase.decode": {"tf": 1}, "shimmer.modules.gw_module.GWModule.decode": {"tf": 1}, "shimmer.modules.vae.VAE.decode": {"tf": 1}}, "df": 5, "e": {"docs": {}, "df": 0, "r": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "s": {"docs": {"shimmer.modules.losses.generate_partitions": {"tf": 2}}, "df": 1}}}}}, "h": {"docs": {}, "df": 0, "i": {"docs": {}, "df": 0, "d": {"docs": {}, "df": 0, "d": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "n": {"docs": {"shimmer.modules.gw_module.get_n_layers": {"tf": 1.4142135623730951}, "shimmer.modules.gw_module.GWDecoder.__init__": {"tf": 1.7320508075688772}, "shimmer.modules.gw_module.GWDecoder.hidden_dim": {"tf": 1}, "shimmer.modules.gw_module.GWDecoder.n_layers": {"tf": 1}, "shimmer.modules.gw_module.GWEncoder.__init__": {"tf": 1.7320508075688772}}, "df": 5}}}}}, "o": {"docs": {}, "df": 0, "o": {"docs": {}, "df": 0, "k": {"docs": {}, "df": 0, "s": {"docs": {"shimmer.modules.gw_module.GWEncoder.forward": {"tf": 1}, "shimmer.modules.gw_module.GWEncoderLinear.forward": {"tf": 1}, "shimmer.utils.SaveMigrations": {"tf": 1}}, "df": 3}}}}, "a": {"docs": {}, "df": 0, "n": {"docs": {}, "df": 0, "d": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "s": {"docs": {"shimmer.modules.gw_module.GWModuleBase": {"tf": 1}, "shimmer.modules.selection.SelectionBase": {"tf": 1}, "shimmer.modules.selection.SingleDomainSelection": {"tf": 1}}, "df": 3}}}}}, "v": {"docs": {}, "df": 0, "e": {"docs": {"shimmer.modules.gw_module.compute_fusion_scores": {"tf": 1}, "shimmer.modules.selection.SingleDomainSelection": {"tf": 1}, "shimmer.dataset.RepeatedDataset": {"tf": 1}, "shimmer.dataset.RepeatedDataset.__init__": {"tf": 1}}, "df": 4}}, "s": {"docs": {"shimmer.modules.selection.SingleDomainSelection": {"tf": 1}}, "df": 1}}, "e": {"docs": {}, "df": 0, "a": {"docs": {}, "df": 0, "d": {"docs": {"shimmer.modules.selection.KQFixedQSelection.__init__": {"tf": 1}, "shimmer.modules.selection.DynamicQueryAttention.__init__": {"tf": 1}}, "df": 2}}}}, "y": {"docs": {"shimmer.modules.contrastive_loss.info_nce": {"tf": 1}, "shimmer.modules.contrastive_loss.contrastive_loss": {"tf": 1}, "shimmer.modules.contrastive_loss.ContrastiveLoss.forward": {"tf": 1}}, "df": 3, "i": {"docs": {}, "df": 0, "e": {"docs": {}, "df": 0, "l": {"docs": {}, "df": 0, "d": {"docs": {}, "df": 0, "s": {"docs": {"shimmer.modules.gw_module.GWModuleBayesian.fuse": {"tf": 1}, "shimmer.modules.losses.generate_partitions": {"tf": 1}}, "df": 2}}}}}, "o": {"docs": {}, "df": 0, "u": {"docs": {"shimmer.utils.SaveMigrations.on_save_checkpoint": {"tf": 1.4142135623730951}}, "df": 1}}}}}}, "pipeline": ["trimmer"], "_isPrebuiltIndex": true};
+
+    // mirrored in build-search-index.js (part 1)
+    // Also split on html tags. this is a cheap heuristic, but good enough.
+    elasticlunr.tokenizer.setSeperator(/[\s\-.;&_'"=,()]+|<[^>]*>/);
+
+    let searchIndex;
+    if (docs._isPrebuiltIndex) {
+        console.info("using precompiled search index");
+        searchIndex = elasticlunr.Index.load(docs);
+    } else {
+        console.time("building search index");
+        // mirrored in build-search-index.js (part 2)
+        searchIndex = elasticlunr(function () {
+            this.pipeline.remove(elasticlunr.stemmer);
+            this.pipeline.remove(elasticlunr.stopWordFilter);
+            this.addField("qualname");
+            this.addField("fullname");
+            this.addField("annotation");
+            this.addField("default_value");
+            this.addField("signature");
+            this.addField("bases");
+            this.addField("doc");
+            this.setRef("fullname");
+        });
+        for (let doc of docs) {
+            searchIndex.addDoc(doc);
+        }
+        console.timeEnd("building search index");
+    }
+
+    return (term) => searchIndex.search(term, {
+        fields: {
+            qualname: {boost: 4},
+            fullname: {boost: 2},
+            annotation: {boost: 2},
+            default_value: {boost: 2},
+            signature: {boost: 2},
+            bases: {boost: 2},
+            doc: {boost: 1},
+        },
+        expand: true
+    });
+})();
\ No newline at end of file
diff --git a/docs/api/v0.5.1/shimmer/cli/ckpt_migration.html b/docs/api/v0.5.1/shimmer/cli/ckpt_migration.html
new file mode 100644
index 00000000..a6f4201a
--- /dev/null
+++ b/docs/api/v0.5.1/shimmer/cli/ckpt_migration.html
@@ -0,0 +1,319 @@
+<!doctype html>
+<html lang="en">
+<head>
+    <meta charset="utf-8">
+    <meta name="viewport" content="width=device-width, initial-scale=1">
+    <meta name="generator" content="pdoc 14.4.0"/>
+    <title>shimmer.cli.ckpt_migration API documentation</title>
+
+    <style>/*! * Bootstrap Reboot v5.0.0 (https://getbootstrap.com/) * Copyright 2011-2021 The Bootstrap Authors * Copyright 2011-2021 Twitter, Inc. * Licensed under MIT (https://github.com/twbs/bootstrap/blob/main/LICENSE) * Forked from Normalize.css, licensed MIT (https://github.com/necolas/normalize.css/blob/master/LICENSE.md) */*,::after,::before{box-sizing:border-box}@media (prefers-reduced-motion:no-preference){:root{scroll-behavior:smooth}}body{margin:0;font-family:system-ui,-apple-system,"Segoe UI",Roboto,"Helvetica Neue",Arial,"Noto Sans","Liberation Sans",sans-serif,"Apple Color Emoji","Segoe UI Emoji","Segoe UI Symbol","Noto Color Emoji";font-size:1rem;font-weight:400;line-height:1.5;color:#212529;background-color:#fff;-webkit-text-size-adjust:100%;-webkit-tap-highlight-color:transparent}hr{margin:1rem 0;color:inherit;background-color:currentColor;border:0;opacity:.25}hr:not([size]){height:1px}h1,h2,h3,h4,h5,h6{margin-top:0;margin-bottom:.5rem;font-weight:500;line-height:1.2}h1{font-size:calc(1.375rem + 1.5vw)}@media (min-width:1200px){h1{font-size:2.5rem}}h2{font-size:calc(1.325rem + .9vw)}@media (min-width:1200px){h2{font-size:2rem}}h3{font-size:calc(1.3rem + .6vw)}@media (min-width:1200px){h3{font-size:1.75rem}}h4{font-size:calc(1.275rem + .3vw)}@media (min-width:1200px){h4{font-size:1.5rem}}h5{font-size:1.25rem}h6{font-size:1rem}p{margin-top:0;margin-bottom:1rem}abbr[data-bs-original-title],abbr[title]{-webkit-text-decoration:underline dotted;text-decoration:underline dotted;cursor:help;-webkit-text-decoration-skip-ink:none;text-decoration-skip-ink:none}address{margin-bottom:1rem;font-style:normal;line-height:inherit}ol,ul{padding-left:2rem}dl,ol,ul{margin-top:0;margin-bottom:1rem}ol ol,ol ul,ul ol,ul ul{margin-bottom:0}dt{font-weight:700}dd{margin-bottom:.5rem;margin-left:0}blockquote{margin:0 0 1rem}b,strong{font-weight:bolder}small{font-size:.875em}mark{padding:.2em;background-color:#fcf8e3}sub,sup{position:relative;font-size:.75em;line-height:0;vertical-align:baseline}sub{bottom:-.25em}sup{top:-.5em}a{color:#0d6efd;text-decoration:underline}a:hover{color:#0a58ca}a:not([href]):not([class]),a:not([href]):not([class]):hover{color:inherit;text-decoration:none}code,kbd,pre,samp{font-family:SFMono-Regular,Menlo,Monaco,Consolas,"Liberation Mono","Courier New",monospace;font-size:1em;direction:ltr;unicode-bidi:bidi-override}pre{display:block;margin-top:0;margin-bottom:1rem;overflow:auto;font-size:.875em}pre code{font-size:inherit;color:inherit;word-break:normal}code{font-size:.875em;color:#d63384;word-wrap:break-word}a>code{color:inherit}kbd{padding:.2rem .4rem;font-size:.875em;color:#fff;background-color:#212529;border-radius:.2rem}kbd kbd{padding:0;font-size:1em;font-weight:700}figure{margin:0 0 1rem}img,svg{vertical-align:middle}table{caption-side:bottom;border-collapse:collapse}caption{padding-top:.5rem;padding-bottom:.5rem;color:#6c757d;text-align:left}th{text-align:inherit;text-align:-webkit-match-parent}tbody,td,tfoot,th,thead,tr{border-color:inherit;border-style:solid;border-width:0}label{display:inline-block}button{border-radius:0}button:focus:not(:focus-visible){outline:0}button,input,optgroup,select,textarea{margin:0;font-family:inherit;font-size:inherit;line-height:inherit}button,select{text-transform:none}[role=button]{cursor:pointer}select{word-wrap:normal}select:disabled{opacity:1}[list]::-webkit-calendar-picker-indicator{display:none}[type=button],[type=reset],[type=submit],button{-webkit-appearance:button}[type=button]:not(:disabled),[type=reset]:not(:disabled),[type=submit]:not(:disabled),button:not(:disabled){cursor:pointer}::-moz-focus-inner{padding:0;border-style:none}textarea{resize:vertical}fieldset{min-width:0;padding:0;margin:0;border:0}legend{float:left;width:100%;padding:0;margin-bottom:.5rem;font-size:calc(1.275rem + .3vw);line-height:inherit}@media (min-width:1200px){legend{font-size:1.5rem}}legend+*{clear:left}::-webkit-datetime-edit-day-field,::-webkit-datetime-edit-fields-wrapper,::-webkit-datetime-edit-hour-field,::-webkit-datetime-edit-minute,::-webkit-datetime-edit-month-field,::-webkit-datetime-edit-text,::-webkit-datetime-edit-year-field{padding:0}::-webkit-inner-spin-button{height:auto}[type=search]{outline-offset:-2px;-webkit-appearance:textfield}::-webkit-search-decoration{-webkit-appearance:none}::-webkit-color-swatch-wrapper{padding:0}::file-selector-button{font:inherit}::-webkit-file-upload-button{font:inherit;-webkit-appearance:button}output{display:inline-block}iframe{border:0}summary{display:list-item;cursor:pointer}progress{vertical-align:baseline}[hidden]{display:none!important}</style>
+    <style>/*! syntax-highlighting.css */pre{line-height:125%;}span.linenos{color:inherit; background-color:transparent; padding-left:5px; padding-right:20px;}.pdoc-code .hll{background-color:#ffffcc}.pdoc-code{background:#f8f8f8;}.pdoc-code .c{color:#3D7B7B; font-style:italic}.pdoc-code .err{border:1px solid #FF0000}.pdoc-code .k{color:#008000; font-weight:bold}.pdoc-code .o{color:#666666}.pdoc-code .ch{color:#3D7B7B; font-style:italic}.pdoc-code .cm{color:#3D7B7B; font-style:italic}.pdoc-code .cp{color:#9C6500}.pdoc-code .cpf{color:#3D7B7B; font-style:italic}.pdoc-code .c1{color:#3D7B7B; font-style:italic}.pdoc-code .cs{color:#3D7B7B; font-style:italic}.pdoc-code .gd{color:#A00000}.pdoc-code .ge{font-style:italic}.pdoc-code .gr{color:#E40000}.pdoc-code .gh{color:#000080; font-weight:bold}.pdoc-code .gi{color:#008400}.pdoc-code .go{color:#717171}.pdoc-code .gp{color:#000080; font-weight:bold}.pdoc-code .gs{font-weight:bold}.pdoc-code .gu{color:#800080; font-weight:bold}.pdoc-code .gt{color:#0044DD}.pdoc-code .kc{color:#008000; font-weight:bold}.pdoc-code .kd{color:#008000; font-weight:bold}.pdoc-code .kn{color:#008000; font-weight:bold}.pdoc-code .kp{color:#008000}.pdoc-code .kr{color:#008000; font-weight:bold}.pdoc-code .kt{color:#B00040}.pdoc-code .m{color:#666666}.pdoc-code .s{color:#BA2121}.pdoc-code .na{color:#687822}.pdoc-code .nb{color:#008000}.pdoc-code .nc{color:#0000FF; font-weight:bold}.pdoc-code .no{color:#880000}.pdoc-code .nd{color:#AA22FF}.pdoc-code .ni{color:#717171; font-weight:bold}.pdoc-code .ne{color:#CB3F38; font-weight:bold}.pdoc-code .nf{color:#0000FF}.pdoc-code .nl{color:#767600}.pdoc-code .nn{color:#0000FF; font-weight:bold}.pdoc-code .nt{color:#008000; font-weight:bold}.pdoc-code .nv{color:#19177C}.pdoc-code .ow{color:#AA22FF; font-weight:bold}.pdoc-code .w{color:#bbbbbb}.pdoc-code .mb{color:#666666}.pdoc-code .mf{color:#666666}.pdoc-code .mh{color:#666666}.pdoc-code .mi{color:#666666}.pdoc-code .mo{color:#666666}.pdoc-code .sa{color:#BA2121}.pdoc-code .sb{color:#BA2121}.pdoc-code .sc{color:#BA2121}.pdoc-code .dl{color:#BA2121}.pdoc-code .sd{color:#BA2121; font-style:italic}.pdoc-code .s2{color:#BA2121}.pdoc-code .se{color:#AA5D1F; font-weight:bold}.pdoc-code .sh{color:#BA2121}.pdoc-code .si{color:#A45A77; font-weight:bold}.pdoc-code .sx{color:#008000}.pdoc-code .sr{color:#A45A77}.pdoc-code .s1{color:#BA2121}.pdoc-code .ss{color:#19177C}.pdoc-code .bp{color:#008000}.pdoc-code .fm{color:#0000FF}.pdoc-code .vc{color:#19177C}.pdoc-code .vg{color:#19177C}.pdoc-code .vi{color:#19177C}.pdoc-code .vm{color:#19177C}.pdoc-code .il{color:#666666}</style>
+    <style>/*! theme.css */:root{--pdoc-background:#fff;}.pdoc{--text:#212529;--muted:#6c757d;--link:#3660a5;--link-hover:#1659c5;--code:#f8f8f8;--active:#fff598;--accent:#eee;--accent2:#c1c1c1;--nav-hover:rgba(255, 255, 255, 0.5);--name:#0066BB;--def:#008800;--annotation:#007020;}</style>
+    <style>/*! layout.css */html, body{width:100%;height:100%;}html, main{scroll-behavior:smooth;}body{background-color:var(--pdoc-background);}@media (max-width:769px){#navtoggle{cursor:pointer;position:absolute;width:50px;height:40px;top:1rem;right:1rem;border-color:var(--text);color:var(--text);display:flex;opacity:0.8;z-index:999;}#navtoggle:hover{opacity:1;}#togglestate + div{display:none;}#togglestate:checked + div{display:inherit;}main, header{padding:2rem 3vw;}header + main{margin-top:-3rem;}.git-button{display:none !important;}nav input[type="search"]{max-width:77%;}nav input[type="search"]:first-child{margin-top:-6px;}nav input[type="search"]:valid ~ *{display:none !important;}}@media (min-width:770px){:root{--sidebar-width:clamp(12.5rem, 28vw, 22rem);}nav{position:fixed;overflow:auto;height:100vh;width:var(--sidebar-width);}main, header{padding:3rem 2rem 3rem calc(var(--sidebar-width) + 3rem);width:calc(54rem + var(--sidebar-width));max-width:100%;}header + main{margin-top:-4rem;}#navtoggle{display:none;}}#togglestate{position:absolute;height:0;opacity:0;}nav.pdoc{--pad:clamp(0.5rem, 2vw, 1.75rem);--indent:1.5rem;background-color:var(--accent);border-right:1px solid var(--accent2);box-shadow:0 0 20px rgba(50, 50, 50, .2) inset;padding:0 0 0 var(--pad);overflow-wrap:anywhere;scrollbar-width:thin; scrollbar-color:var(--accent2) transparent; z-index:1}nav.pdoc::-webkit-scrollbar{width:.4rem; }nav.pdoc::-webkit-scrollbar-thumb{background-color:var(--accent2); }nav.pdoc > div{padding:var(--pad) 0;}nav.pdoc .module-list-button{display:inline-flex;align-items:center;color:var(--text);border-color:var(--muted);margin-bottom:1rem;}nav.pdoc .module-list-button:hover{border-color:var(--text);}nav.pdoc input[type=search]{display:block;outline-offset:0;width:calc(100% - var(--pad));}nav.pdoc .logo{max-width:calc(100% - var(--pad));max-height:35vh;display:block;margin:0 auto 1rem;transform:translate(calc(-.5 * var(--pad)), 0);}nav.pdoc ul{list-style:none;padding-left:0;}nav.pdoc > div > ul{margin-left:calc(0px - var(--pad));}nav.pdoc li a{padding:.2rem 0 .2rem calc(var(--pad) + var(--indent));}nav.pdoc > div > ul > li > a{padding-left:var(--pad);}nav.pdoc li{transition:all 100ms;}nav.pdoc li:hover{background-color:var(--nav-hover);}nav.pdoc a, nav.pdoc a:hover{color:var(--text);}nav.pdoc a{display:block;}nav.pdoc > h2:first-of-type{margin-top:1.5rem;}nav.pdoc .class:before{content:"class ";color:var(--muted);}nav.pdoc .function:after{content:"()";color:var(--muted);}nav.pdoc footer:before{content:"";display:block;width:calc(100% - var(--pad));border-top:solid var(--accent2) 1px;margin-top:1.5rem;padding-top:.5rem;}nav.pdoc footer{font-size:small;}</style>
+    <style>/*! content.css */.pdoc{color:var(--text);box-sizing:border-box;line-height:1.5;background:none;}.pdoc .pdoc-button{cursor:pointer;display:inline-block;border:solid black 1px;border-radius:2px;font-size:.75rem;padding:calc(0.5em - 1px) 1em;transition:100ms all;}.pdoc .pdoc-alert{padding:1rem 1rem 1rem calc(1.5rem + 24px);border:1px solid transparent;border-radius:.25rem;background-repeat:no-repeat;background-position:1rem center;margin-bottom:1rem;}.pdoc .pdoc-alert > *:last-child{margin-bottom:0;}.pdoc .pdoc-alert-note {color:#084298;background-color:#cfe2ff;border-color:#b6d4fe;background-image:url("data:image/svg+xml,%3Csvg%20xmlns%3D%22http%3A//www.w3.org/2000/svg%22%20width%3D%2224%22%20height%3D%2224%22%20fill%3D%22%23084298%22%20viewBox%3D%220%200%2016%2016%22%3E%3Cpath%20d%3D%22M8%2016A8%208%200%201%200%208%200a8%208%200%200%200%200%2016zm.93-9.412-1%204.705c-.07.34.029.533.304.533.194%200%20.487-.07.686-.246l-.088.416c-.287.346-.92.598-1.465.598-.703%200-1.002-.422-.808-1.319l.738-3.468c.064-.293.006-.399-.287-.47l-.451-.081.082-.381%202.29-.287zM8%205.5a1%201%200%201%201%200-2%201%201%200%200%201%200%202z%22/%3E%3C/svg%3E");}.pdoc .pdoc-alert-warning{color:#664d03;background-color:#fff3cd;border-color:#ffecb5;background-image:url("data:image/svg+xml,%3Csvg%20xmlns%3D%22http%3A//www.w3.org/2000/svg%22%20width%3D%2224%22%20height%3D%2224%22%20fill%3D%22%23664d03%22%20viewBox%3D%220%200%2016%2016%22%3E%3Cpath%20d%3D%22M8.982%201.566a1.13%201.13%200%200%200-1.96%200L.165%2013.233c-.457.778.091%201.767.98%201.767h13.713c.889%200%201.438-.99.98-1.767L8.982%201.566zM8%205c.535%200%20.954.462.9.995l-.35%203.507a.552.552%200%200%201-1.1%200L7.1%205.995A.905.905%200%200%201%208%205zm.002%206a1%201%200%201%201%200%202%201%201%200%200%201%200-2z%22/%3E%3C/svg%3E");}.pdoc .pdoc-alert-danger{color:#842029;background-color:#f8d7da;border-color:#f5c2c7;background-image:url("data:image/svg+xml,%3Csvg%20xmlns%3D%22http%3A//www.w3.org/2000/svg%22%20width%3D%2224%22%20height%3D%2224%22%20fill%3D%22%23842029%22%20viewBox%3D%220%200%2016%2016%22%3E%3Cpath%20d%3D%22M5.52.359A.5.5%200%200%201%206%200h4a.5.5%200%200%201%20.474.658L8.694%206H12.5a.5.5%200%200%201%20.395.807l-7%209a.5.5%200%200%201-.873-.454L6.823%209.5H3.5a.5.5%200%200%201-.48-.641l2.5-8.5z%22/%3E%3C/svg%3E");}.pdoc .visually-hidden{position:absolute !important;width:1px !important;height:1px !important;padding:0 !important;margin:-1px !important;overflow:hidden !important;clip:rect(0, 0, 0, 0) !important;white-space:nowrap !important;border:0 !important;}.pdoc h1, .pdoc h2, .pdoc h3{font-weight:300;margin:.3em 0;padding:.2em 0;}.pdoc > section:not(.module-info) h1{font-size:1.5rem;font-weight:500;}.pdoc > section:not(.module-info) h2{font-size:1.4rem;font-weight:500;}.pdoc > section:not(.module-info) h3{font-size:1.3rem;font-weight:500;}.pdoc > section:not(.module-info) h4{font-size:1.2rem;}.pdoc > section:not(.module-info) h5{font-size:1.1rem;}.pdoc a{text-decoration:none;color:var(--link);}.pdoc a:hover{color:var(--link-hover);}.pdoc blockquote{margin-left:2rem;}.pdoc pre{border-top:1px solid var(--accent2);border-bottom:1px solid var(--accent2);margin-top:0;margin-bottom:1em;padding:.5rem 0 .5rem .5rem;overflow-x:auto;background-color:var(--code);}.pdoc code{color:var(--text);padding:.2em .4em;margin:0;font-size:85%;background-color:var(--accent);border-radius:6px;}.pdoc a > code{color:inherit;}.pdoc pre > code{display:inline-block;font-size:inherit;background:none;border:none;padding:0;}.pdoc > section:not(.module-info){margin-bottom:1.5rem;}.pdoc .modulename{margin-top:0;font-weight:bold;}.pdoc .modulename a{color:var(--link);transition:100ms all;}.pdoc .git-button{float:right;border:solid var(--link) 1px;}.pdoc .git-button:hover{background-color:var(--link);color:var(--pdoc-background);}.view-source-toggle-state,.view-source-toggle-state ~ .pdoc-code{display:none;}.view-source-toggle-state:checked ~ .pdoc-code{display:block;}.view-source-button{display:inline-block;float:right;font-size:.75rem;line-height:1.5rem;color:var(--muted);padding:0 .4rem 0 1.3rem;cursor:pointer;text-indent:-2px;}.view-source-button > span{visibility:hidden;}.module-info .view-source-button{float:none;display:flex;justify-content:flex-end;margin:-1.2rem .4rem -.2rem 0;}.view-source-button::before{position:absolute;content:"View Source";display:list-item;list-style-type:disclosure-closed;}.view-source-toggle-state:checked ~ .attr .view-source-button::before,.view-source-toggle-state:checked ~ .view-source-button::before{list-style-type:disclosure-open;}.pdoc .docstring{margin-bottom:1.5rem;}.pdoc section:not(.module-info) .docstring{margin-left:clamp(0rem, 5vw - 2rem, 1rem);}.pdoc .docstring .pdoc-code{margin-left:1em;margin-right:1em;}.pdoc h1:target,.pdoc h2:target,.pdoc h3:target,.pdoc h4:target,.pdoc h5:target,.pdoc h6:target,.pdoc .pdoc-code > pre > span:target{background-color:var(--active);box-shadow:-1rem 0 0 0 var(--active);}.pdoc .pdoc-code > pre > span:target{display:block;}.pdoc div:target > .attr,.pdoc section:target > .attr,.pdoc dd:target > a{background-color:var(--active);}.pdoc *{scroll-margin:2rem;}.pdoc .pdoc-code .linenos{user-select:none;}.pdoc .attr:hover{filter:contrast(0.95);}.pdoc section, .pdoc .classattr{position:relative;}.pdoc .headerlink{--width:clamp(1rem, 3vw, 2rem);position:absolute;top:0;left:calc(0rem - var(--width));transition:all 100ms ease-in-out;opacity:0;}.pdoc .headerlink::before{content:"#";display:block;text-align:center;width:var(--width);height:2.3rem;line-height:2.3rem;font-size:1.5rem;}.pdoc .attr:hover ~ .headerlink,.pdoc *:target > .headerlink,.pdoc .headerlink:hover{opacity:1;}.pdoc .attr{display:block;margin:.5rem 0 .5rem;padding:.4rem .4rem .4rem 1rem;background-color:var(--accent);overflow-x:auto;}.pdoc .classattr{margin-left:2rem;}.pdoc .name{color:var(--name);font-weight:bold;}.pdoc .def{color:var(--def);font-weight:bold;}.pdoc .signature{background-color:transparent;}.pdoc .param, .pdoc .return-annotation{white-space:pre;}.pdoc .signature.multiline .param{display:block;}.pdoc .signature.condensed .param{display:inline-block;}.pdoc .annotation{color:var(--annotation);}.pdoc .view-value-toggle-state,.pdoc .view-value-toggle-state ~ .default_value{display:none;}.pdoc .view-value-toggle-state:checked ~ .default_value{display:inherit;}.pdoc .view-value-button{font-size:.5rem;vertical-align:middle;border-style:dashed;margin-top:-0.1rem;}.pdoc .view-value-button:hover{background:white;}.pdoc .view-value-button::before{content:"show";text-align:center;width:2.2em;display:inline-block;}.pdoc .view-value-toggle-state:checked ~ .view-value-button::before{content:"hide";}.pdoc .inherited{margin-left:2rem;}.pdoc .inherited dt{font-weight:700;}.pdoc .inherited dt, .pdoc .inherited dd{display:inline;margin-left:0;margin-bottom:.5rem;}.pdoc .inherited dd:not(:last-child):after{content:", ";}.pdoc .inherited .class:before{content:"class ";}.pdoc .inherited .function a:after{content:"()";}.pdoc .search-result .docstring{overflow:auto;max-height:25vh;}.pdoc .search-result.focused > .attr{background-color:var(--active);}.pdoc .attribution{margin-top:2rem;display:block;opacity:0.5;transition:all 200ms;filter:grayscale(100%);}.pdoc .attribution:hover{opacity:1;filter:grayscale(0%);}.pdoc .attribution img{margin-left:5px;height:35px;vertical-align:middle;width:70px;transition:all 200ms;}.pdoc table{display:block;width:max-content;max-width:100%;overflow:auto;margin-bottom:1rem;}.pdoc table th{font-weight:600;}.pdoc table th, .pdoc table td{padding:6px 13px;border:1px solid var(--accent2);}</style>
+    <style>/*! custom.css */</style><script>
+    window.MathJax = {
+        tex: {
+            inlineMath: [['$', '$'], ['\\(', '\\)']]
+        }
+    };
+</script>
+<script src="https://polyfill.io/v3/polyfill.min.js?features=es6"></script>
+<script id="MathJax-script" async src="https://cdn.jsdelivr.net/npm/mathjax@3/es5/tex-mml-chtml.js"></script>
+<script>
+    /* Re-invoke MathJax when DOM content changes, for example during search. */
+    document.addEventListener("DOMContentLoaded", () => {
+        new MutationObserver(() => MathJax.typeset()).observe(
+            document.querySelector("main.pdoc").parentNode,
+            {childList: true}
+        );
+    })
+</script>
+<style>
+    mjx-container {
+        overflow-x: auto;
+    }
+</style></head>
+<body>
+    <nav class="pdoc">
+        <label id="navtoggle" for="togglestate" class="pdoc-button"><svg xmlns='http://www.w3.org/2000/svg' viewBox='0 0 30 30'><path stroke-linecap='round' stroke="currentColor" stroke-miterlimit='10' stroke-width='2' d='M4 7h22M4 15h22M4 23h22'/></svg></label>
+        <input id="togglestate" type="checkbox" aria-hidden="true" tabindex="-1">
+        <div>            <a class="pdoc-button module-list-button" href="../../index.html">
+<svg xmlns="http://www.w3.org/2000/svg" width="16" height="16" fill="currentColor" class="bi bi-box-arrow-in-left" viewBox="0 0 16 16">
+  <path fill-rule="evenodd" d="M10 3.5a.5.5 0 0 0-.5-.5h-8a.5.5 0 0 0-.5.5v9a.5.5 0 0 0 .5.5h8a.5.5 0 0 0 .5-.5v-2a.5.5 0 0 1 1 0v2A1.5 1.5 0 0 1 9.5 14h-8A1.5 1.5 0 0 1 0 12.5v-9A1.5 1.5 0 0 1 1.5 2h8A1.5 1.5 0 0 1 11 3.5v2a.5.5 0 0 1-1 0v-2z"/>
+  <path fill-rule="evenodd" d="M4.146 8.354a.5.5 0 0 1 0-.708l3-3a.5.5 0 1 1 .708.708L5.707 7.5H14.5a.5.5 0 0 1 0 1H5.707l2.147 2.146a.5.5 0 0 1-.708.708l-3-3z"/>
+</svg>                &nbsp;
+                Module Index
+            </a>
+
+
+            <input type="search" placeholder="Search..." role="searchbox" aria-label="search"
+                   pattern=".+" required>
+
+
+
+            <h2>API Documentation</h2>
+                <ul class="memberlist">
+            <li>
+                    <a class="variable" href="#migrate_ckpt">migrate_ckpt</a>
+            </li>
+    </ul>
+
+
+
+        <a class="attribution" title="pdoc: Python API documentation generator" href="https://pdoc.dev" target="_blank">
+            built with <span class="visually-hidden">pdoc</span><img
+                alt="pdoc logo"
+                src="data:image/svg+xml,%3Csvg%20xmlns%3D%22http%3A//www.w3.org/2000/svg%22%20role%3D%22img%22%20aria-label%3D%22pdoc%20logo%22%20width%3D%22300%22%20height%3D%22150%22%20viewBox%3D%22-1%200%2060%2030%22%3E%3Ctitle%3Epdoc%3C/title%3E%3Cpath%20d%3D%22M29.621%2021.293c-.011-.273-.214-.475-.511-.481a.5.5%200%200%200-.489.503l-.044%201.393c-.097.551-.695%201.215-1.566%201.704-.577.428-1.306.486-2.193.182-1.426-.617-2.467-1.654-3.304-2.487l-.173-.172a3.43%203.43%200%200%200-.365-.306.49.49%200%200%200-.286-.196c-1.718-1.06-4.931-1.47-7.353.191l-.219.15c-1.707%201.187-3.413%202.131-4.328%201.03-.02-.027-.49-.685-.141-1.763.233-.721.546-2.408.772-4.076.042-.09.067-.187.046-.288.166-1.347.277-2.625.241-3.351%201.378-1.008%202.271-2.586%202.271-4.362%200-.976-.272-1.935-.788-2.774-.057-.094-.122-.18-.184-.268.033-.167.052-.339.052-.516%200-1.477-1.202-2.679-2.679-2.679-.791%200-1.496.352-1.987.9a6.3%206.3%200%200%200-1.001.029c-.492-.564-1.207-.929-2.012-.929-1.477%200-2.679%201.202-2.679%202.679A2.65%202.65%200%200%200%20.97%206.554c-.383.747-.595%201.572-.595%202.41%200%202.311%201.507%204.29%203.635%205.107-.037.699-.147%202.27-.423%203.294l-.137.461c-.622%202.042-2.515%208.257%201.727%2010.643%201.614.908%203.06%201.248%204.317%201.248%202.665%200%204.492-1.524%205.322-2.401%201.476-1.559%202.886-1.854%206.491.82%201.877%201.393%203.514%201.753%204.861%201.068%202.223-1.713%202.811-3.867%203.399-6.374.077-.846.056-1.469.054-1.537zm-4.835%204.313c-.054.305-.156.586-.242.629-.034-.007-.131-.022-.307-.157-.145-.111-.314-.478-.456-.908.221.121.432.25.675.355.115.039.219.051.33.081zm-2.251-1.238c-.05.33-.158.648-.252.694-.022.001-.125-.018-.307-.157-.217-.166-.488-.906-.639-1.573.358.344.754.693%201.198%201.036zm-3.887-2.337c-.006-.116-.018-.231-.041-.342.635.145%201.189.368%201.599.625.097.231.166.481.174.642-.03.049-.055.101-.067.158-.046.013-.128.026-.298.004-.278-.037-.901-.57-1.367-1.087zm-1.127-.497c.116.306.176.625.12.71-.019.014-.117.045-.345.016-.206-.027-.604-.332-.986-.695.41-.051.816-.056%201.211-.031zm-4.535%201.535c.209.22.379.47.358.598-.006.041-.088.138-.351.234-.144.055-.539-.063-.979-.259a11.66%2011.66%200%200%200%20.972-.573zm.983-.664c.359-.237.738-.418%201.126-.554.25.237.479.548.457.694-.006.042-.087.138-.351.235-.174.064-.694-.105-1.232-.375zm-3.381%201.794c-.022.145-.061.29-.149.401-.133.166-.358.248-.69.251h-.002c-.133%200-.306-.26-.45-.621.417.091.854.07%201.291-.031zm-2.066-8.077a4.78%204.78%200%200%201-.775-.584c.172-.115.505-.254.88-.378l-.105.962zm-.331%202.302a10.32%2010.32%200%200%201-.828-.502c.202-.143.576-.328.984-.49l-.156.992zm-.45%202.157l-.701-.403c.214-.115.536-.249.891-.376a11.57%2011.57%200%200%201-.19.779zm-.181%201.716c.064.398.194.702.298.893-.194-.051-.435-.162-.736-.398.061-.119.224-.3.438-.495zM8.87%204.141c0%20.152-.123.276-.276.276s-.275-.124-.275-.276.123-.276.276-.276.275.124.275.276zm-.735-.389a1.15%201.15%200%200%200-.314.783%201.16%201.16%200%200%200%201.162%201.162c.457%200%20.842-.27%201.032-.653.026.117.042.238.042.362a1.68%201.68%200%200%201-1.679%201.679%201.68%201.68%200%200%201-1.679-1.679c0-.843.626-1.535%201.436-1.654zM5.059%205.406A1.68%201.68%200%200%201%203.38%207.085a1.68%201.68%200%200%201-1.679-1.679c0-.037.009-.072.011-.109.21.3.541.508.935.508a1.16%201.16%200%200%200%201.162-1.162%201.14%201.14%200%200%200-.474-.912c.015%200%20.03-.005.045-.005.926.001%201.679.754%201.679%201.68zM3.198%204.141c0%20.152-.123.276-.276.276s-.275-.124-.275-.276.123-.276.276-.276.275.124.275.276zM1.375%208.964c0-.52.103-1.035.288-1.52.466.394%201.06.64%201.717.64%201.144%200%202.116-.725%202.499-1.738.383%201.012%201.355%201.738%202.499%201.738.867%200%201.631-.421%202.121-1.062.307.605.478%201.267.478%201.942%200%202.486-2.153%204.51-4.801%204.51s-4.801-2.023-4.801-4.51zm24.342%2019.349c-.985.498-2.267.168-3.813-.979-3.073-2.281-5.453-3.199-7.813-.705-1.315%201.391-4.163%203.365-8.423.97-3.174-1.786-2.239-6.266-1.261-9.479l.146-.492c.276-1.02.395-2.457.444-3.268a6.11%206.11%200%200%200%201.18.115%206.01%206.01%200%200%200%202.536-.562l-.006.175c-.802.215-1.848.612-2.021%201.25-.079.295.021.601.274.837.219.203.415.364.598.501-.667.304-1.243.698-1.311%201.179-.02.144-.022.507.393.787.213.144.395.26.564.365-1.285.521-1.361.96-1.381%201.126-.018.142-.011.496.427.746l.854.489c-.473.389-.971.914-.999%201.429-.018.278.095.532.316.713.675.556%201.231.721%201.653.721.059%200%20.104-.014.158-.02.207.707.641%201.64%201.513%201.64h.013c.8-.008%201.236-.345%201.462-.626.173-.216.268-.457.325-.692.424.195.93.374%201.372.374.151%200%20.294-.021.423-.068.732-.27.944-.704.993-1.021.009-.061.003-.119.002-.179.266.086.538.147.789.147.15%200%20.294-.021.423-.069.542-.2.797-.489.914-.754.237.147.478.258.704.288.106.014.205.021.296.021.356%200%20.595-.101.767-.229.438.435%201.094.992%201.656%201.067.106.014.205.021.296.021a1.56%201.56%200%200%200%20.323-.035c.17.575.453%201.289.866%201.605.358.273.665.362.914.362a.99.99%200%200%200%20.421-.093%201.03%201.03%200%200%200%20.245-.164c.168.428.39.846.68%201.068.358.273.665.362.913.362a.99.99%200%200%200%20.421-.093c.317-.148.512-.448.639-.762.251.157.495.257.726.257.127%200%20.25-.024.37-.071.427-.17.706-.617.841-1.314.022-.015.047-.022.068-.038.067-.051.133-.104.196-.159-.443%201.486-1.107%202.761-2.086%203.257zM8.66%209.925a.5.5%200%201%200-1%200c0%20.653-.818%201.205-1.787%201.205s-1.787-.552-1.787-1.205a.5.5%200%201%200-1%200c0%201.216%201.25%202.205%202.787%202.205s2.787-.989%202.787-2.205zm4.4%2015.965l-.208.097c-2.661%201.258-4.708%201.436-6.086.527-1.542-1.017-1.88-3.19-1.844-4.198a.4.4%200%200%200-.385-.414c-.242-.029-.406.164-.414.385-.046%201.249.367%203.686%202.202%204.896.708.467%201.547.7%202.51.7%201.248%200%202.706-.392%204.362-1.174l.185-.086a.4.4%200%200%200%20.205-.527c-.089-.204-.326-.291-.527-.206zM9.547%202.292c.093.077.205.114.317.114a.5.5%200%200%200%20.318-.886L8.817.397a.5.5%200%200%200-.703.068.5.5%200%200%200%20.069.703l1.364%201.124zm-7.661-.065c.086%200%20.173-.022.253-.068l1.523-.893a.5.5%200%200%200-.506-.863l-1.523.892a.5.5%200%200%200-.179.685c.094.158.261.247.432.247z%22%20transform%3D%22matrix%28-1%200%200%201%2058%200%29%22%20fill%3D%22%233bb300%22/%3E%3Cpath%20d%3D%22M.3%2021.86V10.18q0-.46.02-.68.04-.22.18-.5.28-.54%201.34-.54%201.06%200%201.42.28.38.26.44.78.76-1.04%202.38-1.04%201.64%200%203.1%201.54%201.46%201.54%201.46%203.58%200%202.04-1.46%203.58-1.44%201.54-3.08%201.54-1.64%200-2.38-.92v4.04q0%20.46-.04.68-.02.22-.18.5-.14.3-.5.42-.36.12-.98.12-.62%200-1-.12-.36-.12-.52-.4-.14-.28-.18-.5-.02-.22-.02-.68zm3.96-9.42q-.46.54-.46%201.18%200%20.64.46%201.18.48.52%201.2.52.74%200%201.24-.52.52-.52.52-1.18%200-.66-.48-1.18-.48-.54-1.26-.54-.76%200-1.22.54zm14.741-8.36q.16-.3.54-.42.38-.12%201-.12.64%200%201.02.12.38.12.52.42.16.3.18.54.04.22.04.68v11.94q0%20.46-.04.7-.02.22-.18.5-.3.54-1.7.54-1.38%200-1.54-.98-.84.96-2.34.96-1.8%200-3.28-1.56-1.48-1.58-1.48-3.66%200-2.1%201.48-3.68%201.5-1.58%203.28-1.58%201.48%200%202.3%201v-4.2q0-.46.02-.68.04-.24.18-.52zm-3.24%2010.86q.52.54%201.26.54.74%200%201.22-.54.5-.54.5-1.18%200-.66-.48-1.22-.46-.56-1.26-.56-.8%200-1.28.56-.48.54-.48%201.2%200%20.66.52%201.2zm7.833-1.2q0-2.4%201.68-3.96%201.68-1.56%203.84-1.56%202.16%200%203.82%201.56%201.66%201.54%201.66%203.94%200%201.66-.86%202.96-.86%201.28-2.1%201.9-1.22.6-2.54.6-1.32%200-2.56-.64-1.24-.66-2.1-1.92-.84-1.28-.84-2.88zm4.18%201.44q.64.48%201.3.48.66%200%201.32-.5.66-.5.66-1.48%200-.98-.62-1.46-.62-.48-1.34-.48-.72%200-1.34.5-.62.5-.62%201.48%200%20.96.64%201.46zm11.412-1.44q0%20.84.56%201.32.56.46%201.18.46.64%200%201.18-.36.56-.38.9-.38.6%200%201.46%201.06.46.58.46%201.04%200%20.76-1.1%201.42-1.14.8-2.8.8-1.86%200-3.58-1.34-.82-.64-1.34-1.7-.52-1.08-.52-2.36%200-1.3.52-2.34.52-1.06%201.34-1.7%201.66-1.32%203.54-1.32.76%200%201.48.22.72.2%201.06.4l.32.2q.36.24.56.38.52.4.52.92%200%20.5-.42%201.14-.72%201.1-1.38%201.1-.38%200-1.08-.44-.36-.34-1.04-.34-.66%200-1.24.48-.58.48-.58%201.34z%22%20fill%3D%22green%22/%3E%3C/svg%3E"/>
+        </a>
+</div>
+    </nav>
+    <main class="pdoc">
+            <section class="module-info">
+                    <h1 class="modulename">
+shimmer<wbr>.cli<wbr>.ckpt_migration    </h1>
+
+                
+                        <input id="mod-ckpt_migration-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
+
+                        <label class="view-source-button" for="mod-ckpt_migration-view-source"><span>View Source</span></label>
+
+                        <div class="pdoc-code codehilite"><pre><span></span><span id="L-1"><a href="#L-1"><span class="linenos"> 1</span></a><span class="kn">from</span> <span class="nn">collections.abc</span> <span class="kn">import</span> <span class="n">Sequence</span>
+</span><span id="L-2"><a href="#L-2"><span class="linenos"> 2</span></a><span class="kn">from</span> <span class="nn">pathlib</span> <span class="kn">import</span> <span class="n">Path</span>
+</span><span id="L-3"><a href="#L-3"><span class="linenos"> 3</span></a>
+</span><span id="L-4"><a href="#L-4"><span class="linenos"> 4</span></a><span class="kn">import</span> <span class="nn">click</span>
+</span><span id="L-5"><a href="#L-5"><span class="linenos"> 5</span></a>
+</span><span id="L-6"><a href="#L-6"><span class="linenos"> 6</span></a><span class="kn">from</span> <span class="nn">shimmer.utils</span> <span class="kn">import</span> <span class="n">migrate_model</span>
+</span><span id="L-7"><a href="#L-7"><span class="linenos"> 7</span></a>
+</span><span id="L-8"><a href="#L-8"><span class="linenos"> 8</span></a>
+</span><span id="L-9"><a href="#L-9"><span class="linenos"> 9</span></a><span class="nd">@click</span><span class="o">.</span><span class="n">command</span><span class="p">(</span><span class="s2">&quot;migrate-ckpt&quot;</span><span class="p">)</span>
+</span><span id="L-10"><a href="#L-10"><span class="linenos">10</span></a><span class="nd">@click</span><span class="o">.</span><span class="n">argument</span><span class="p">(</span>
+</span><span id="L-11"><a href="#L-11"><span class="linenos">11</span></a>    <span class="s2">&quot;paths&quot;</span><span class="p">,</span>
+</span><span id="L-12"><a href="#L-12"><span class="linenos">12</span></a>    <span class="n">nargs</span><span class="o">=-</span><span class="mi">1</span><span class="p">,</span>
+</span><span id="L-13"><a href="#L-13"><span class="linenos">13</span></a>    <span class="nb">type</span><span class="o">=</span><span class="n">click</span><span class="o">.</span><span class="n">Path</span><span class="p">(</span><span class="n">exists</span><span class="o">=</span><span class="kc">True</span><span class="p">,</span> <span class="n">path_type</span><span class="o">=</span><span class="n">Path</span><span class="p">,</span> <span class="n">file_okay</span><span class="o">=</span><span class="kc">True</span><span class="p">,</span> <span class="n">dir_okay</span><span class="o">=</span><span class="kc">False</span><span class="p">),</span>
+</span><span id="L-14"><a href="#L-14"><span class="linenos">14</span></a><span class="p">)</span>
+</span><span id="L-15"><a href="#L-15"><span class="linenos">15</span></a><span class="k">def</span> <span class="nf">migrate_ckpt</span><span class="p">(</span><span class="n">paths</span><span class="p">:</span> <span class="n">Sequence</span><span class="p">[</span><span class="n">Path</span><span class="p">]):</span>
+</span><span id="L-16"><a href="#L-16"><span class="linenos">16</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="L-17"><a href="#L-17"><span class="linenos">17</span></a><span class="sd">    Script to migrate a list of checkpoints.</span>
+</span><span id="L-18"><a href="#L-18"><span class="linenos">18</span></a><span class="sd">    This can be called with:</span>
+</span><span id="L-19"><a href="#L-19"><span class="linenos">19</span></a><span class="sd">    ```sh</span>
+</span><span id="L-20"><a href="#L-20"><span class="linenos">20</span></a><span class="sd">    shimmer migrate-ckpt PATH_1 PATH_2 ... PATH_N</span>
+</span><span id="L-21"><a href="#L-21"><span class="linenos">21</span></a><span class="sd">    ```</span>
+</span><span id="L-22"><a href="#L-22"><span class="linenos">22</span></a><span class="sd">    where paths point to checkpoints.</span>
+</span><span id="L-23"><a href="#L-23"><span class="linenos">23</span></a>
+</span><span id="L-24"><a href="#L-24"><span class="linenos">24</span></a><span class="sd">    Internally, this calls `shimmer.utils.migrate_model` for each of the given paths.</span>
+</span><span id="L-25"><a href="#L-25"><span class="linenos">25</span></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="L-26"><a href="#L-26"><span class="linenos">26</span></a>    <span class="k">for</span> <span class="n">path</span> <span class="ow">in</span> <span class="n">paths</span><span class="p">:</span>
+</span><span id="L-27"><a href="#L-27"><span class="linenos">27</span></a>        <span class="n">migrate_model</span><span class="p">(</span><span class="n">path</span><span class="p">)</span>
+</span></pre></div>
+
+
+            </section>
+                <section id="migrate_ckpt">
+                    <div class="attr variable">
+            <span class="name">migrate_ckpt</span>        =
+<span class="default_value">&lt;Command migrate-ckpt&gt;</span>
+
+        
+    </div>
+    <a class="headerlink" href="#migrate_ckpt"></a>
+    
+            <div class="docstring"><p>Script to migrate a list of checkpoints.
+This can be called with:</p>
+
+<div class="pdoc-code codehilite">
+<pre><span></span><code>shimmer<span class="w"> </span>migrate-ckpt<span class="w"> </span>PATH_1<span class="w"> </span>PATH_2<span class="w"> </span>...<span class="w"> </span>PATH_N
+</code></pre>
+</div>
+
+<p>where paths point to checkpoints.</p>
+
+<p>Internally, this calls <code><a href="../utils.html#migrate_model">shimmer.utils.migrate_model</a></code> for each of the given paths.</p>
+</div>
+
+
+                </section>
+    </main>
+<script>
+    function escapeHTML(html) {
+        return document.createElement('div').appendChild(document.createTextNode(html)).parentNode.innerHTML;
+    }
+
+    const originalContent = document.querySelector("main.pdoc");
+    let currentContent = originalContent;
+
+    function setContent(innerHTML) {
+        let elem;
+        if (innerHTML) {
+            elem = document.createElement("main");
+            elem.classList.add("pdoc");
+            elem.innerHTML = innerHTML;
+        } else {
+            elem = originalContent;
+        }
+        if (currentContent !== elem) {
+            currentContent.replaceWith(elem);
+            currentContent = elem;
+        }
+    }
+
+    function getSearchTerm() {
+        return (new URL(window.location)).searchParams.get("search");
+    }
+
+    const searchBox = document.querySelector(".pdoc input[type=search]");
+    searchBox.addEventListener("input", function () {
+        let url = new URL(window.location);
+        if (searchBox.value.trim()) {
+            url.hash = "";
+            url.searchParams.set("search", searchBox.value);
+        } else {
+            url.searchParams.delete("search");
+        }
+        history.replaceState("", "", url.toString());
+        onInput();
+    });
+    window.addEventListener("popstate", onInput);
+
+
+    let search, searchErr;
+
+    async function initialize() {
+        try {
+            search = await new Promise((resolve, reject) => {
+                const script = document.createElement("script");
+                script.type = "text/javascript";
+                script.async = true;
+                script.onload = () => resolve(window.pdocSearch);
+                script.onerror = (e) => reject(e);
+                script.src = "../../search.js";
+                document.getElementsByTagName("head")[0].appendChild(script);
+            });
+        } catch (e) {
+            console.error("Cannot fetch pdoc search index");
+            searchErr = "Cannot fetch search index.";
+        }
+        onInput();
+
+        document.querySelector("nav.pdoc").addEventListener("click", e => {
+            if (e.target.hash) {
+                searchBox.value = "";
+                searchBox.dispatchEvent(new Event("input"));
+            }
+        });
+    }
+
+    function onInput() {
+        setContent((() => {
+            const term = getSearchTerm();
+            if (!term) {
+                return null
+            }
+            if (searchErr) {
+                return `<h3>Error: ${searchErr}</h3>`
+            }
+            if (!search) {
+                return "<h3>Searching...</h3>"
+            }
+
+            window.scrollTo({top: 0, left: 0, behavior: 'auto'});
+
+            const results = search(term);
+
+            let html;
+            if (results.length === 0) {
+                html = `No search results for '${escapeHTML(term)}'.`
+            } else {
+                html = `<h4>${results.length} search result${results.length > 1 ? "s" : ""} for '${escapeHTML(term)}'.</h4>`;
+            }
+            for (let result of results.slice(0, 10)) {
+                let doc = result.doc;
+                let url = `../../${doc.modulename.replaceAll(".", "/")}.html`;
+                if (doc.qualname) {
+                    url += `#${doc.qualname}`;
+                }
+
+                let heading;
+                switch (result.doc.kind) {
+                    case "function":
+                        if (doc.fullname.endsWith(".__init__")) {
+                            heading = `<span class="name">${doc.fullname.replace(/\.__init__$/, "")}</span>${doc.signature}`;
+                        } else {
+                            heading = `<span class="def">${doc.funcdef}</span> <span class="name">${doc.fullname}</span>${doc.signature}`;
+                        }
+                        break;
+                    case "class":
+                        heading = `<span class="def">class</span> <span class="name">${doc.fullname}</span>`;
+                        if (doc.bases)
+                            heading += `<wbr>(<span class="base">${doc.bases}</span>)`;
+                        heading += `:`;
+                        break;
+                    case "variable":
+                        heading = `<span class="name">${doc.fullname}</span>`;
+                        if (doc.annotation)
+                            heading += `<span class="annotation">${doc.annotation}</span>`;
+                        if (doc.default_value)
+                            heading += `<span class="default_value"> = ${doc.default_value}</span>`;
+                        break;
+                    default:
+                        heading = `<span class="name">${doc.fullname}</span>`;
+                        break;
+                }
+                html += `
+                        <section class="search-result">
+                        <a href="${url}" class="attr ${doc.kind}">${heading}</a>
+                        <div class="docstring">${doc.doc}</div>
+                        </section>
+                    `;
+
+            }
+            return html;
+        })());
+    }
+
+    if (getSearchTerm()) {
+        initialize();
+        searchBox.value = getSearchTerm();
+        onInput();
+    } else {
+        searchBox.addEventListener("focus", initialize, {once: true});
+    }
+
+    searchBox.addEventListener("keydown", e => {
+        if (["ArrowDown", "ArrowUp", "Enter"].includes(e.key)) {
+            let focused = currentContent.querySelector(".search-result.focused");
+            if (!focused) {
+                currentContent.querySelector(".search-result").classList.add("focused");
+            } else if (
+                e.key === "ArrowDown"
+                && focused.nextElementSibling
+                && focused.nextElementSibling.classList.contains("search-result")
+            ) {
+                focused.classList.remove("focused");
+                focused.nextElementSibling.classList.add("focused");
+                focused.nextElementSibling.scrollIntoView({
+                    behavior: "smooth",
+                    block: "nearest",
+                    inline: "nearest"
+                });
+            } else if (
+                e.key === "ArrowUp"
+                && focused.previousElementSibling
+                && focused.previousElementSibling.classList.contains("search-result")
+            ) {
+                focused.classList.remove("focused");
+                focused.previousElementSibling.classList.add("focused");
+                focused.previousElementSibling.scrollIntoView({
+                    behavior: "smooth",
+                    block: "nearest",
+                    inline: "nearest"
+                });
+            } else if (
+                e.key === "Enter"
+            ) {
+                focused.querySelector("a").click();
+            }
+        }
+    });
+</script></body>
+</html>
\ No newline at end of file
diff --git a/docs/api/v0.5.1/shimmer/dataset.html b/docs/api/v0.5.1/shimmer/dataset.html
new file mode 100644
index 00000000..1ba30a7d
--- /dev/null
+++ b/docs/api/v0.5.1/shimmer/dataset.html
@@ -0,0 +1,448 @@
+<!doctype html>
+<html lang="en">
+<head>
+    <meta charset="utf-8">
+    <meta name="viewport" content="width=device-width, initial-scale=1">
+    <meta name="generator" content="pdoc 14.4.0"/>
+    <title>shimmer.dataset API documentation</title>
+
+    <style>/*! * Bootstrap Reboot v5.0.0 (https://getbootstrap.com/) * Copyright 2011-2021 The Bootstrap Authors * Copyright 2011-2021 Twitter, Inc. * Licensed under MIT (https://github.com/twbs/bootstrap/blob/main/LICENSE) * Forked from Normalize.css, licensed MIT (https://github.com/necolas/normalize.css/blob/master/LICENSE.md) */*,::after,::before{box-sizing:border-box}@media (prefers-reduced-motion:no-preference){:root{scroll-behavior:smooth}}body{margin:0;font-family:system-ui,-apple-system,"Segoe UI",Roboto,"Helvetica Neue",Arial,"Noto Sans","Liberation Sans",sans-serif,"Apple Color Emoji","Segoe UI Emoji","Segoe UI Symbol","Noto Color Emoji";font-size:1rem;font-weight:400;line-height:1.5;color:#212529;background-color:#fff;-webkit-text-size-adjust:100%;-webkit-tap-highlight-color:transparent}hr{margin:1rem 0;color:inherit;background-color:currentColor;border:0;opacity:.25}hr:not([size]){height:1px}h1,h2,h3,h4,h5,h6{margin-top:0;margin-bottom:.5rem;font-weight:500;line-height:1.2}h1{font-size:calc(1.375rem + 1.5vw)}@media (min-width:1200px){h1{font-size:2.5rem}}h2{font-size:calc(1.325rem + .9vw)}@media (min-width:1200px){h2{font-size:2rem}}h3{font-size:calc(1.3rem + .6vw)}@media (min-width:1200px){h3{font-size:1.75rem}}h4{font-size:calc(1.275rem + .3vw)}@media (min-width:1200px){h4{font-size:1.5rem}}h5{font-size:1.25rem}h6{font-size:1rem}p{margin-top:0;margin-bottom:1rem}abbr[data-bs-original-title],abbr[title]{-webkit-text-decoration:underline dotted;text-decoration:underline dotted;cursor:help;-webkit-text-decoration-skip-ink:none;text-decoration-skip-ink:none}address{margin-bottom:1rem;font-style:normal;line-height:inherit}ol,ul{padding-left:2rem}dl,ol,ul{margin-top:0;margin-bottom:1rem}ol ol,ol ul,ul ol,ul ul{margin-bottom:0}dt{font-weight:700}dd{margin-bottom:.5rem;margin-left:0}blockquote{margin:0 0 1rem}b,strong{font-weight:bolder}small{font-size:.875em}mark{padding:.2em;background-color:#fcf8e3}sub,sup{position:relative;font-size:.75em;line-height:0;vertical-align:baseline}sub{bottom:-.25em}sup{top:-.5em}a{color:#0d6efd;text-decoration:underline}a:hover{color:#0a58ca}a:not([href]):not([class]),a:not([href]):not([class]):hover{color:inherit;text-decoration:none}code,kbd,pre,samp{font-family:SFMono-Regular,Menlo,Monaco,Consolas,"Liberation Mono","Courier New",monospace;font-size:1em;direction:ltr;unicode-bidi:bidi-override}pre{display:block;margin-top:0;margin-bottom:1rem;overflow:auto;font-size:.875em}pre code{font-size:inherit;color:inherit;word-break:normal}code{font-size:.875em;color:#d63384;word-wrap:break-word}a>code{color:inherit}kbd{padding:.2rem .4rem;font-size:.875em;color:#fff;background-color:#212529;border-radius:.2rem}kbd kbd{padding:0;font-size:1em;font-weight:700}figure{margin:0 0 1rem}img,svg{vertical-align:middle}table{caption-side:bottom;border-collapse:collapse}caption{padding-top:.5rem;padding-bottom:.5rem;color:#6c757d;text-align:left}th{text-align:inherit;text-align:-webkit-match-parent}tbody,td,tfoot,th,thead,tr{border-color:inherit;border-style:solid;border-width:0}label{display:inline-block}button{border-radius:0}button:focus:not(:focus-visible){outline:0}button,input,optgroup,select,textarea{margin:0;font-family:inherit;font-size:inherit;line-height:inherit}button,select{text-transform:none}[role=button]{cursor:pointer}select{word-wrap:normal}select:disabled{opacity:1}[list]::-webkit-calendar-picker-indicator{display:none}[type=button],[type=reset],[type=submit],button{-webkit-appearance:button}[type=button]:not(:disabled),[type=reset]:not(:disabled),[type=submit]:not(:disabled),button:not(:disabled){cursor:pointer}::-moz-focus-inner{padding:0;border-style:none}textarea{resize:vertical}fieldset{min-width:0;padding:0;margin:0;border:0}legend{float:left;width:100%;padding:0;margin-bottom:.5rem;font-size:calc(1.275rem + .3vw);line-height:inherit}@media (min-width:1200px){legend{font-size:1.5rem}}legend+*{clear:left}::-webkit-datetime-edit-day-field,::-webkit-datetime-edit-fields-wrapper,::-webkit-datetime-edit-hour-field,::-webkit-datetime-edit-minute,::-webkit-datetime-edit-month-field,::-webkit-datetime-edit-text,::-webkit-datetime-edit-year-field{padding:0}::-webkit-inner-spin-button{height:auto}[type=search]{outline-offset:-2px;-webkit-appearance:textfield}::-webkit-search-decoration{-webkit-appearance:none}::-webkit-color-swatch-wrapper{padding:0}::file-selector-button{font:inherit}::-webkit-file-upload-button{font:inherit;-webkit-appearance:button}output{display:inline-block}iframe{border:0}summary{display:list-item;cursor:pointer}progress{vertical-align:baseline}[hidden]{display:none!important}</style>
+    <style>/*! syntax-highlighting.css */pre{line-height:125%;}span.linenos{color:inherit; background-color:transparent; padding-left:5px; padding-right:20px;}.pdoc-code .hll{background-color:#ffffcc}.pdoc-code{background:#f8f8f8;}.pdoc-code .c{color:#3D7B7B; font-style:italic}.pdoc-code .err{border:1px solid #FF0000}.pdoc-code .k{color:#008000; font-weight:bold}.pdoc-code .o{color:#666666}.pdoc-code .ch{color:#3D7B7B; font-style:italic}.pdoc-code .cm{color:#3D7B7B; font-style:italic}.pdoc-code .cp{color:#9C6500}.pdoc-code .cpf{color:#3D7B7B; font-style:italic}.pdoc-code .c1{color:#3D7B7B; font-style:italic}.pdoc-code .cs{color:#3D7B7B; font-style:italic}.pdoc-code .gd{color:#A00000}.pdoc-code .ge{font-style:italic}.pdoc-code .gr{color:#E40000}.pdoc-code .gh{color:#000080; font-weight:bold}.pdoc-code .gi{color:#008400}.pdoc-code .go{color:#717171}.pdoc-code .gp{color:#000080; font-weight:bold}.pdoc-code .gs{font-weight:bold}.pdoc-code .gu{color:#800080; font-weight:bold}.pdoc-code .gt{color:#0044DD}.pdoc-code .kc{color:#008000; font-weight:bold}.pdoc-code .kd{color:#008000; font-weight:bold}.pdoc-code .kn{color:#008000; font-weight:bold}.pdoc-code .kp{color:#008000}.pdoc-code .kr{color:#008000; font-weight:bold}.pdoc-code .kt{color:#B00040}.pdoc-code .m{color:#666666}.pdoc-code .s{color:#BA2121}.pdoc-code .na{color:#687822}.pdoc-code .nb{color:#008000}.pdoc-code .nc{color:#0000FF; font-weight:bold}.pdoc-code .no{color:#880000}.pdoc-code .nd{color:#AA22FF}.pdoc-code .ni{color:#717171; font-weight:bold}.pdoc-code .ne{color:#CB3F38; font-weight:bold}.pdoc-code .nf{color:#0000FF}.pdoc-code .nl{color:#767600}.pdoc-code .nn{color:#0000FF; font-weight:bold}.pdoc-code .nt{color:#008000; font-weight:bold}.pdoc-code .nv{color:#19177C}.pdoc-code .ow{color:#AA22FF; font-weight:bold}.pdoc-code .w{color:#bbbbbb}.pdoc-code .mb{color:#666666}.pdoc-code .mf{color:#666666}.pdoc-code .mh{color:#666666}.pdoc-code .mi{color:#666666}.pdoc-code .mo{color:#666666}.pdoc-code .sa{color:#BA2121}.pdoc-code .sb{color:#BA2121}.pdoc-code .sc{color:#BA2121}.pdoc-code .dl{color:#BA2121}.pdoc-code .sd{color:#BA2121; font-style:italic}.pdoc-code .s2{color:#BA2121}.pdoc-code .se{color:#AA5D1F; font-weight:bold}.pdoc-code .sh{color:#BA2121}.pdoc-code .si{color:#A45A77; font-weight:bold}.pdoc-code .sx{color:#008000}.pdoc-code .sr{color:#A45A77}.pdoc-code .s1{color:#BA2121}.pdoc-code .ss{color:#19177C}.pdoc-code .bp{color:#008000}.pdoc-code .fm{color:#0000FF}.pdoc-code .vc{color:#19177C}.pdoc-code .vg{color:#19177C}.pdoc-code .vi{color:#19177C}.pdoc-code .vm{color:#19177C}.pdoc-code .il{color:#666666}</style>
+    <style>/*! theme.css */:root{--pdoc-background:#fff;}.pdoc{--text:#212529;--muted:#6c757d;--link:#3660a5;--link-hover:#1659c5;--code:#f8f8f8;--active:#fff598;--accent:#eee;--accent2:#c1c1c1;--nav-hover:rgba(255, 255, 255, 0.5);--name:#0066BB;--def:#008800;--annotation:#007020;}</style>
+    <style>/*! layout.css */html, body{width:100%;height:100%;}html, main{scroll-behavior:smooth;}body{background-color:var(--pdoc-background);}@media (max-width:769px){#navtoggle{cursor:pointer;position:absolute;width:50px;height:40px;top:1rem;right:1rem;border-color:var(--text);color:var(--text);display:flex;opacity:0.8;z-index:999;}#navtoggle:hover{opacity:1;}#togglestate + div{display:none;}#togglestate:checked + div{display:inherit;}main, header{padding:2rem 3vw;}header + main{margin-top:-3rem;}.git-button{display:none !important;}nav input[type="search"]{max-width:77%;}nav input[type="search"]:first-child{margin-top:-6px;}nav input[type="search"]:valid ~ *{display:none !important;}}@media (min-width:770px){:root{--sidebar-width:clamp(12.5rem, 28vw, 22rem);}nav{position:fixed;overflow:auto;height:100vh;width:var(--sidebar-width);}main, header{padding:3rem 2rem 3rem calc(var(--sidebar-width) + 3rem);width:calc(54rem + var(--sidebar-width));max-width:100%;}header + main{margin-top:-4rem;}#navtoggle{display:none;}}#togglestate{position:absolute;height:0;opacity:0;}nav.pdoc{--pad:clamp(0.5rem, 2vw, 1.75rem);--indent:1.5rem;background-color:var(--accent);border-right:1px solid var(--accent2);box-shadow:0 0 20px rgba(50, 50, 50, .2) inset;padding:0 0 0 var(--pad);overflow-wrap:anywhere;scrollbar-width:thin; scrollbar-color:var(--accent2) transparent; z-index:1}nav.pdoc::-webkit-scrollbar{width:.4rem; }nav.pdoc::-webkit-scrollbar-thumb{background-color:var(--accent2); }nav.pdoc > div{padding:var(--pad) 0;}nav.pdoc .module-list-button{display:inline-flex;align-items:center;color:var(--text);border-color:var(--muted);margin-bottom:1rem;}nav.pdoc .module-list-button:hover{border-color:var(--text);}nav.pdoc input[type=search]{display:block;outline-offset:0;width:calc(100% - var(--pad));}nav.pdoc .logo{max-width:calc(100% - var(--pad));max-height:35vh;display:block;margin:0 auto 1rem;transform:translate(calc(-.5 * var(--pad)), 0);}nav.pdoc ul{list-style:none;padding-left:0;}nav.pdoc > div > ul{margin-left:calc(0px - var(--pad));}nav.pdoc li a{padding:.2rem 0 .2rem calc(var(--pad) + var(--indent));}nav.pdoc > div > ul > li > a{padding-left:var(--pad);}nav.pdoc li{transition:all 100ms;}nav.pdoc li:hover{background-color:var(--nav-hover);}nav.pdoc a, nav.pdoc a:hover{color:var(--text);}nav.pdoc a{display:block;}nav.pdoc > h2:first-of-type{margin-top:1.5rem;}nav.pdoc .class:before{content:"class ";color:var(--muted);}nav.pdoc .function:after{content:"()";color:var(--muted);}nav.pdoc footer:before{content:"";display:block;width:calc(100% - var(--pad));border-top:solid var(--accent2) 1px;margin-top:1.5rem;padding-top:.5rem;}nav.pdoc footer{font-size:small;}</style>
+    <style>/*! content.css */.pdoc{color:var(--text);box-sizing:border-box;line-height:1.5;background:none;}.pdoc .pdoc-button{cursor:pointer;display:inline-block;border:solid black 1px;border-radius:2px;font-size:.75rem;padding:calc(0.5em - 1px) 1em;transition:100ms all;}.pdoc .pdoc-alert{padding:1rem 1rem 1rem calc(1.5rem + 24px);border:1px solid transparent;border-radius:.25rem;background-repeat:no-repeat;background-position:1rem center;margin-bottom:1rem;}.pdoc .pdoc-alert > *:last-child{margin-bottom:0;}.pdoc .pdoc-alert-note {color:#084298;background-color:#cfe2ff;border-color:#b6d4fe;background-image:url("data:image/svg+xml,%3Csvg%20xmlns%3D%22http%3A//www.w3.org/2000/svg%22%20width%3D%2224%22%20height%3D%2224%22%20fill%3D%22%23084298%22%20viewBox%3D%220%200%2016%2016%22%3E%3Cpath%20d%3D%22M8%2016A8%208%200%201%200%208%200a8%208%200%200%200%200%2016zm.93-9.412-1%204.705c-.07.34.029.533.304.533.194%200%20.487-.07.686-.246l-.088.416c-.287.346-.92.598-1.465.598-.703%200-1.002-.422-.808-1.319l.738-3.468c.064-.293.006-.399-.287-.47l-.451-.081.082-.381%202.29-.287zM8%205.5a1%201%200%201%201%200-2%201%201%200%200%201%200%202z%22/%3E%3C/svg%3E");}.pdoc .pdoc-alert-warning{color:#664d03;background-color:#fff3cd;border-color:#ffecb5;background-image:url("data:image/svg+xml,%3Csvg%20xmlns%3D%22http%3A//www.w3.org/2000/svg%22%20width%3D%2224%22%20height%3D%2224%22%20fill%3D%22%23664d03%22%20viewBox%3D%220%200%2016%2016%22%3E%3Cpath%20d%3D%22M8.982%201.566a1.13%201.13%200%200%200-1.96%200L.165%2013.233c-.457.778.091%201.767.98%201.767h13.713c.889%200%201.438-.99.98-1.767L8.982%201.566zM8%205c.535%200%20.954.462.9.995l-.35%203.507a.552.552%200%200%201-1.1%200L7.1%205.995A.905.905%200%200%201%208%205zm.002%206a1%201%200%201%201%200%202%201%201%200%200%201%200-2z%22/%3E%3C/svg%3E");}.pdoc .pdoc-alert-danger{color:#842029;background-color:#f8d7da;border-color:#f5c2c7;background-image:url("data:image/svg+xml,%3Csvg%20xmlns%3D%22http%3A//www.w3.org/2000/svg%22%20width%3D%2224%22%20height%3D%2224%22%20fill%3D%22%23842029%22%20viewBox%3D%220%200%2016%2016%22%3E%3Cpath%20d%3D%22M5.52.359A.5.5%200%200%201%206%200h4a.5.5%200%200%201%20.474.658L8.694%206H12.5a.5.5%200%200%201%20.395.807l-7%209a.5.5%200%200%201-.873-.454L6.823%209.5H3.5a.5.5%200%200%201-.48-.641l2.5-8.5z%22/%3E%3C/svg%3E");}.pdoc .visually-hidden{position:absolute !important;width:1px !important;height:1px !important;padding:0 !important;margin:-1px !important;overflow:hidden !important;clip:rect(0, 0, 0, 0) !important;white-space:nowrap !important;border:0 !important;}.pdoc h1, .pdoc h2, .pdoc h3{font-weight:300;margin:.3em 0;padding:.2em 0;}.pdoc > section:not(.module-info) h1{font-size:1.5rem;font-weight:500;}.pdoc > section:not(.module-info) h2{font-size:1.4rem;font-weight:500;}.pdoc > section:not(.module-info) h3{font-size:1.3rem;font-weight:500;}.pdoc > section:not(.module-info) h4{font-size:1.2rem;}.pdoc > section:not(.module-info) h5{font-size:1.1rem;}.pdoc a{text-decoration:none;color:var(--link);}.pdoc a:hover{color:var(--link-hover);}.pdoc blockquote{margin-left:2rem;}.pdoc pre{border-top:1px solid var(--accent2);border-bottom:1px solid var(--accent2);margin-top:0;margin-bottom:1em;padding:.5rem 0 .5rem .5rem;overflow-x:auto;background-color:var(--code);}.pdoc code{color:var(--text);padding:.2em .4em;margin:0;font-size:85%;background-color:var(--accent);border-radius:6px;}.pdoc a > code{color:inherit;}.pdoc pre > code{display:inline-block;font-size:inherit;background:none;border:none;padding:0;}.pdoc > section:not(.module-info){margin-bottom:1.5rem;}.pdoc .modulename{margin-top:0;font-weight:bold;}.pdoc .modulename a{color:var(--link);transition:100ms all;}.pdoc .git-button{float:right;border:solid var(--link) 1px;}.pdoc .git-button:hover{background-color:var(--link);color:var(--pdoc-background);}.view-source-toggle-state,.view-source-toggle-state ~ .pdoc-code{display:none;}.view-source-toggle-state:checked ~ .pdoc-code{display:block;}.view-source-button{display:inline-block;float:right;font-size:.75rem;line-height:1.5rem;color:var(--muted);padding:0 .4rem 0 1.3rem;cursor:pointer;text-indent:-2px;}.view-source-button > span{visibility:hidden;}.module-info .view-source-button{float:none;display:flex;justify-content:flex-end;margin:-1.2rem .4rem -.2rem 0;}.view-source-button::before{position:absolute;content:"View Source";display:list-item;list-style-type:disclosure-closed;}.view-source-toggle-state:checked ~ .attr .view-source-button::before,.view-source-toggle-state:checked ~ .view-source-button::before{list-style-type:disclosure-open;}.pdoc .docstring{margin-bottom:1.5rem;}.pdoc section:not(.module-info) .docstring{margin-left:clamp(0rem, 5vw - 2rem, 1rem);}.pdoc .docstring .pdoc-code{margin-left:1em;margin-right:1em;}.pdoc h1:target,.pdoc h2:target,.pdoc h3:target,.pdoc h4:target,.pdoc h5:target,.pdoc h6:target,.pdoc .pdoc-code > pre > span:target{background-color:var(--active);box-shadow:-1rem 0 0 0 var(--active);}.pdoc .pdoc-code > pre > span:target{display:block;}.pdoc div:target > .attr,.pdoc section:target > .attr,.pdoc dd:target > a{background-color:var(--active);}.pdoc *{scroll-margin:2rem;}.pdoc .pdoc-code .linenos{user-select:none;}.pdoc .attr:hover{filter:contrast(0.95);}.pdoc section, .pdoc .classattr{position:relative;}.pdoc .headerlink{--width:clamp(1rem, 3vw, 2rem);position:absolute;top:0;left:calc(0rem - var(--width));transition:all 100ms ease-in-out;opacity:0;}.pdoc .headerlink::before{content:"#";display:block;text-align:center;width:var(--width);height:2.3rem;line-height:2.3rem;font-size:1.5rem;}.pdoc .attr:hover ~ .headerlink,.pdoc *:target > .headerlink,.pdoc .headerlink:hover{opacity:1;}.pdoc .attr{display:block;margin:.5rem 0 .5rem;padding:.4rem .4rem .4rem 1rem;background-color:var(--accent);overflow-x:auto;}.pdoc .classattr{margin-left:2rem;}.pdoc .name{color:var(--name);font-weight:bold;}.pdoc .def{color:var(--def);font-weight:bold;}.pdoc .signature{background-color:transparent;}.pdoc .param, .pdoc .return-annotation{white-space:pre;}.pdoc .signature.multiline .param{display:block;}.pdoc .signature.condensed .param{display:inline-block;}.pdoc .annotation{color:var(--annotation);}.pdoc .view-value-toggle-state,.pdoc .view-value-toggle-state ~ .default_value{display:none;}.pdoc .view-value-toggle-state:checked ~ .default_value{display:inherit;}.pdoc .view-value-button{font-size:.5rem;vertical-align:middle;border-style:dashed;margin-top:-0.1rem;}.pdoc .view-value-button:hover{background:white;}.pdoc .view-value-button::before{content:"show";text-align:center;width:2.2em;display:inline-block;}.pdoc .view-value-toggle-state:checked ~ .view-value-button::before{content:"hide";}.pdoc .inherited{margin-left:2rem;}.pdoc .inherited dt{font-weight:700;}.pdoc .inherited dt, .pdoc .inherited dd{display:inline;margin-left:0;margin-bottom:.5rem;}.pdoc .inherited dd:not(:last-child):after{content:", ";}.pdoc .inherited .class:before{content:"class ";}.pdoc .inherited .function a:after{content:"()";}.pdoc .search-result .docstring{overflow:auto;max-height:25vh;}.pdoc .search-result.focused > .attr{background-color:var(--active);}.pdoc .attribution{margin-top:2rem;display:block;opacity:0.5;transition:all 200ms;filter:grayscale(100%);}.pdoc .attribution:hover{opacity:1;filter:grayscale(0%);}.pdoc .attribution img{margin-left:5px;height:35px;vertical-align:middle;width:70px;transition:all 200ms;}.pdoc table{display:block;width:max-content;max-width:100%;overflow:auto;margin-bottom:1rem;}.pdoc table th{font-weight:600;}.pdoc table th, .pdoc table td{padding:6px 13px;border:1px solid var(--accent2);}</style>
+    <style>/*! custom.css */</style><script>
+    window.MathJax = {
+        tex: {
+            inlineMath: [['$', '$'], ['\\(', '\\)']]
+        }
+    };
+</script>
+<script src="https://polyfill.io/v3/polyfill.min.js?features=es6"></script>
+<script id="MathJax-script" async src="https://cdn.jsdelivr.net/npm/mathjax@3/es5/tex-mml-chtml.js"></script>
+<script>
+    /* Re-invoke MathJax when DOM content changes, for example during search. */
+    document.addEventListener("DOMContentLoaded", () => {
+        new MutationObserver(() => MathJax.typeset()).observe(
+            document.querySelector("main.pdoc").parentNode,
+            {childList: true}
+        );
+    })
+</script>
+<style>
+    mjx-container {
+        overflow-x: auto;
+    }
+</style></head>
+<body>
+    <nav class="pdoc">
+        <label id="navtoggle" for="togglestate" class="pdoc-button"><svg xmlns='http://www.w3.org/2000/svg' viewBox='0 0 30 30'><path stroke-linecap='round' stroke="currentColor" stroke-miterlimit='10' stroke-width='2' d='M4 7h22M4 15h22M4 23h22'/></svg></label>
+        <input id="togglestate" type="checkbox" aria-hidden="true" tabindex="-1">
+        <div>            <a class="pdoc-button module-list-button" href="../index.html">
+<svg xmlns="http://www.w3.org/2000/svg" width="16" height="16" fill="currentColor" class="bi bi-box-arrow-in-left" viewBox="0 0 16 16">
+  <path fill-rule="evenodd" d="M10 3.5a.5.5 0 0 0-.5-.5h-8a.5.5 0 0 0-.5.5v9a.5.5 0 0 0 .5.5h8a.5.5 0 0 0 .5-.5v-2a.5.5 0 0 1 1 0v2A1.5 1.5 0 0 1 9.5 14h-8A1.5 1.5 0 0 1 0 12.5v-9A1.5 1.5 0 0 1 1.5 2h8A1.5 1.5 0 0 1 11 3.5v2a.5.5 0 0 1-1 0v-2z"/>
+  <path fill-rule="evenodd" d="M4.146 8.354a.5.5 0 0 1 0-.708l3-3a.5.5 0 1 1 .708.708L5.707 7.5H14.5a.5.5 0 0 1 0 1H5.707l2.147 2.146a.5.5 0 0 1-.708.708l-3-3z"/>
+</svg>                &nbsp;
+                Module Index
+            </a>
+
+
+            <input type="search" placeholder="Search..." role="searchbox" aria-label="search"
+                   pattern=".+" required>
+
+
+
+            <h2>API Documentation</h2>
+                <ul class="memberlist">
+            <li>
+                    <a class="class" href="#RepeatedDataset">RepeatedDataset</a>
+                            <ul class="memberlist">
+                        <li>
+                                <a class="function" href="#RepeatedDataset.__init__">RepeatedDataset</a>
+                        </li>
+                        <li>
+                                <a class="variable" href="#RepeatedDataset.dataset">dataset</a>
+                        </li>
+                        <li>
+                                <a class="variable" href="#RepeatedDataset.dataset_size">dataset_size</a>
+                        </li>
+                </ul>
+
+            </li>
+    </ul>
+
+
+
+        <a class="attribution" title="pdoc: Python API documentation generator" href="https://pdoc.dev" target="_blank">
+            built with <span class="visually-hidden">pdoc</span><img
+                alt="pdoc logo"
+                src="data:image/svg+xml,%3Csvg%20xmlns%3D%22http%3A//www.w3.org/2000/svg%22%20role%3D%22img%22%20aria-label%3D%22pdoc%20logo%22%20width%3D%22300%22%20height%3D%22150%22%20viewBox%3D%22-1%200%2060%2030%22%3E%3Ctitle%3Epdoc%3C/title%3E%3Cpath%20d%3D%22M29.621%2021.293c-.011-.273-.214-.475-.511-.481a.5.5%200%200%200-.489.503l-.044%201.393c-.097.551-.695%201.215-1.566%201.704-.577.428-1.306.486-2.193.182-1.426-.617-2.467-1.654-3.304-2.487l-.173-.172a3.43%203.43%200%200%200-.365-.306.49.49%200%200%200-.286-.196c-1.718-1.06-4.931-1.47-7.353.191l-.219.15c-1.707%201.187-3.413%202.131-4.328%201.03-.02-.027-.49-.685-.141-1.763.233-.721.546-2.408.772-4.076.042-.09.067-.187.046-.288.166-1.347.277-2.625.241-3.351%201.378-1.008%202.271-2.586%202.271-4.362%200-.976-.272-1.935-.788-2.774-.057-.094-.122-.18-.184-.268.033-.167.052-.339.052-.516%200-1.477-1.202-2.679-2.679-2.679-.791%200-1.496.352-1.987.9a6.3%206.3%200%200%200-1.001.029c-.492-.564-1.207-.929-2.012-.929-1.477%200-2.679%201.202-2.679%202.679A2.65%202.65%200%200%200%20.97%206.554c-.383.747-.595%201.572-.595%202.41%200%202.311%201.507%204.29%203.635%205.107-.037.699-.147%202.27-.423%203.294l-.137.461c-.622%202.042-2.515%208.257%201.727%2010.643%201.614.908%203.06%201.248%204.317%201.248%202.665%200%204.492-1.524%205.322-2.401%201.476-1.559%202.886-1.854%206.491.82%201.877%201.393%203.514%201.753%204.861%201.068%202.223-1.713%202.811-3.867%203.399-6.374.077-.846.056-1.469.054-1.537zm-4.835%204.313c-.054.305-.156.586-.242.629-.034-.007-.131-.022-.307-.157-.145-.111-.314-.478-.456-.908.221.121.432.25.675.355.115.039.219.051.33.081zm-2.251-1.238c-.05.33-.158.648-.252.694-.022.001-.125-.018-.307-.157-.217-.166-.488-.906-.639-1.573.358.344.754.693%201.198%201.036zm-3.887-2.337c-.006-.116-.018-.231-.041-.342.635.145%201.189.368%201.599.625.097.231.166.481.174.642-.03.049-.055.101-.067.158-.046.013-.128.026-.298.004-.278-.037-.901-.57-1.367-1.087zm-1.127-.497c.116.306.176.625.12.71-.019.014-.117.045-.345.016-.206-.027-.604-.332-.986-.695.41-.051.816-.056%201.211-.031zm-4.535%201.535c.209.22.379.47.358.598-.006.041-.088.138-.351.234-.144.055-.539-.063-.979-.259a11.66%2011.66%200%200%200%20.972-.573zm.983-.664c.359-.237.738-.418%201.126-.554.25.237.479.548.457.694-.006.042-.087.138-.351.235-.174.064-.694-.105-1.232-.375zm-3.381%201.794c-.022.145-.061.29-.149.401-.133.166-.358.248-.69.251h-.002c-.133%200-.306-.26-.45-.621.417.091.854.07%201.291-.031zm-2.066-8.077a4.78%204.78%200%200%201-.775-.584c.172-.115.505-.254.88-.378l-.105.962zm-.331%202.302a10.32%2010.32%200%200%201-.828-.502c.202-.143.576-.328.984-.49l-.156.992zm-.45%202.157l-.701-.403c.214-.115.536-.249.891-.376a11.57%2011.57%200%200%201-.19.779zm-.181%201.716c.064.398.194.702.298.893-.194-.051-.435-.162-.736-.398.061-.119.224-.3.438-.495zM8.87%204.141c0%20.152-.123.276-.276.276s-.275-.124-.275-.276.123-.276.276-.276.275.124.275.276zm-.735-.389a1.15%201.15%200%200%200-.314.783%201.16%201.16%200%200%200%201.162%201.162c.457%200%20.842-.27%201.032-.653.026.117.042.238.042.362a1.68%201.68%200%200%201-1.679%201.679%201.68%201.68%200%200%201-1.679-1.679c0-.843.626-1.535%201.436-1.654zM5.059%205.406A1.68%201.68%200%200%201%203.38%207.085a1.68%201.68%200%200%201-1.679-1.679c0-.037.009-.072.011-.109.21.3.541.508.935.508a1.16%201.16%200%200%200%201.162-1.162%201.14%201.14%200%200%200-.474-.912c.015%200%20.03-.005.045-.005.926.001%201.679.754%201.679%201.68zM3.198%204.141c0%20.152-.123.276-.276.276s-.275-.124-.275-.276.123-.276.276-.276.275.124.275.276zM1.375%208.964c0-.52.103-1.035.288-1.52.466.394%201.06.64%201.717.64%201.144%200%202.116-.725%202.499-1.738.383%201.012%201.355%201.738%202.499%201.738.867%200%201.631-.421%202.121-1.062.307.605.478%201.267.478%201.942%200%202.486-2.153%204.51-4.801%204.51s-4.801-2.023-4.801-4.51zm24.342%2019.349c-.985.498-2.267.168-3.813-.979-3.073-2.281-5.453-3.199-7.813-.705-1.315%201.391-4.163%203.365-8.423.97-3.174-1.786-2.239-6.266-1.261-9.479l.146-.492c.276-1.02.395-2.457.444-3.268a6.11%206.11%200%200%200%201.18.115%206.01%206.01%200%200%200%202.536-.562l-.006.175c-.802.215-1.848.612-2.021%201.25-.079.295.021.601.274.837.219.203.415.364.598.501-.667.304-1.243.698-1.311%201.179-.02.144-.022.507.393.787.213.144.395.26.564.365-1.285.521-1.361.96-1.381%201.126-.018.142-.011.496.427.746l.854.489c-.473.389-.971.914-.999%201.429-.018.278.095.532.316.713.675.556%201.231.721%201.653.721.059%200%20.104-.014.158-.02.207.707.641%201.64%201.513%201.64h.013c.8-.008%201.236-.345%201.462-.626.173-.216.268-.457.325-.692.424.195.93.374%201.372.374.151%200%20.294-.021.423-.068.732-.27.944-.704.993-1.021.009-.061.003-.119.002-.179.266.086.538.147.789.147.15%200%20.294-.021.423-.069.542-.2.797-.489.914-.754.237.147.478.258.704.288.106.014.205.021.296.021.356%200%20.595-.101.767-.229.438.435%201.094.992%201.656%201.067.106.014.205.021.296.021a1.56%201.56%200%200%200%20.323-.035c.17.575.453%201.289.866%201.605.358.273.665.362.914.362a.99.99%200%200%200%20.421-.093%201.03%201.03%200%200%200%20.245-.164c.168.428.39.846.68%201.068.358.273.665.362.913.362a.99.99%200%200%200%20.421-.093c.317-.148.512-.448.639-.762.251.157.495.257.726.257.127%200%20.25-.024.37-.071.427-.17.706-.617.841-1.314.022-.015.047-.022.068-.038.067-.051.133-.104.196-.159-.443%201.486-1.107%202.761-2.086%203.257zM8.66%209.925a.5.5%200%201%200-1%200c0%20.653-.818%201.205-1.787%201.205s-1.787-.552-1.787-1.205a.5.5%200%201%200-1%200c0%201.216%201.25%202.205%202.787%202.205s2.787-.989%202.787-2.205zm4.4%2015.965l-.208.097c-2.661%201.258-4.708%201.436-6.086.527-1.542-1.017-1.88-3.19-1.844-4.198a.4.4%200%200%200-.385-.414c-.242-.029-.406.164-.414.385-.046%201.249.367%203.686%202.202%204.896.708.467%201.547.7%202.51.7%201.248%200%202.706-.392%204.362-1.174l.185-.086a.4.4%200%200%200%20.205-.527c-.089-.204-.326-.291-.527-.206zM9.547%202.292c.093.077.205.114.317.114a.5.5%200%200%200%20.318-.886L8.817.397a.5.5%200%200%200-.703.068.5.5%200%200%200%20.069.703l1.364%201.124zm-7.661-.065c.086%200%20.173-.022.253-.068l1.523-.893a.5.5%200%200%200-.506-.863l-1.523.892a.5.5%200%200%200-.179.685c.094.158.261.247.432.247z%22%20transform%3D%22matrix%28-1%200%200%201%2058%200%29%22%20fill%3D%22%233bb300%22/%3E%3Cpath%20d%3D%22M.3%2021.86V10.18q0-.46.02-.68.04-.22.18-.5.28-.54%201.34-.54%201.06%200%201.42.28.38.26.44.78.76-1.04%202.38-1.04%201.64%200%203.1%201.54%201.46%201.54%201.46%203.58%200%202.04-1.46%203.58-1.44%201.54-3.08%201.54-1.64%200-2.38-.92v4.04q0%20.46-.04.68-.02.22-.18.5-.14.3-.5.42-.36.12-.98.12-.62%200-1-.12-.36-.12-.52-.4-.14-.28-.18-.5-.02-.22-.02-.68zm3.96-9.42q-.46.54-.46%201.18%200%20.64.46%201.18.48.52%201.2.52.74%200%201.24-.52.52-.52.52-1.18%200-.66-.48-1.18-.48-.54-1.26-.54-.76%200-1.22.54zm14.741-8.36q.16-.3.54-.42.38-.12%201-.12.64%200%201.02.12.38.12.52.42.16.3.18.54.04.22.04.68v11.94q0%20.46-.04.7-.02.22-.18.5-.3.54-1.7.54-1.38%200-1.54-.98-.84.96-2.34.96-1.8%200-3.28-1.56-1.48-1.58-1.48-3.66%200-2.1%201.48-3.68%201.5-1.58%203.28-1.58%201.48%200%202.3%201v-4.2q0-.46.02-.68.04-.24.18-.52zm-3.24%2010.86q.52.54%201.26.54.74%200%201.22-.54.5-.54.5-1.18%200-.66-.48-1.22-.46-.56-1.26-.56-.8%200-1.28.56-.48.54-.48%201.2%200%20.66.52%201.2zm7.833-1.2q0-2.4%201.68-3.96%201.68-1.56%203.84-1.56%202.16%200%203.82%201.56%201.66%201.54%201.66%203.94%200%201.66-.86%202.96-.86%201.28-2.1%201.9-1.22.6-2.54.6-1.32%200-2.56-.64-1.24-.66-2.1-1.92-.84-1.28-.84-2.88zm4.18%201.44q.64.48%201.3.48.66%200%201.32-.5.66-.5.66-1.48%200-.98-.62-1.46-.62-.48-1.34-.48-.72%200-1.34.5-.62.5-.62%201.48%200%20.96.64%201.46zm11.412-1.44q0%20.84.56%201.32.56.46%201.18.46.64%200%201.18-.36.56-.38.9-.38.6%200%201.46%201.06.46.58.46%201.04%200%20.76-1.1%201.42-1.14.8-2.8.8-1.86%200-3.58-1.34-.82-.64-1.34-1.7-.52-1.08-.52-2.36%200-1.3.52-2.34.52-1.06%201.34-1.7%201.66-1.32%203.54-1.32.76%200%201.48.22.72.2%201.06.4l.32.2q.36.24.56.38.52.4.52.92%200%20.5-.42%201.14-.72%201.1-1.38%201.1-.38%200-1.08-.44-.36-.34-1.04-.34-.66%200-1.24.48-.58.48-.58%201.34z%22%20fill%3D%22green%22/%3E%3C/svg%3E"/>
+        </a>
+</div>
+    </nav>
+    <main class="pdoc">
+            <section class="module-info">
+                    <h1 class="modulename">
+shimmer<wbr>.dataset    </h1>
+
+                
+                        <input id="mod-dataset-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
+
+                        <label class="view-source-button" for="mod-dataset-view-source"><span>View Source</span></label>
+
+                        <div class="pdoc-code codehilite"><pre><span></span><span id="L-1"><a href="#L-1"><span class="linenos"> 1</span></a><span class="kn">from</span> <span class="nn">typing</span> <span class="kn">import</span> <span class="n">Any</span><span class="p">,</span> <span class="n">Protocol</span>
+</span><span id="L-2"><a href="#L-2"><span class="linenos"> 2</span></a>
+</span><span id="L-3"><a href="#L-3"><span class="linenos"> 3</span></a><span class="kn">from</span> <span class="nn">torch.utils.data</span> <span class="kn">import</span> <span class="n">Dataset</span>
+</span><span id="L-4"><a href="#L-4"><span class="linenos"> 4</span></a>
+</span><span id="L-5"><a href="#L-5"><span class="linenos"> 5</span></a>
+</span><span id="L-6"><a href="#L-6"><span class="linenos"> 6</span></a><span class="k">class</span> <span class="nc">_SizedDataset</span><span class="p">(</span><span class="n">Protocol</span><span class="p">):</span>
+</span><span id="L-7"><a href="#L-7"><span class="linenos"> 7</span></a>    <span class="k">def</span> <span class="fm">__getitem__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">k</span><span class="p">:</span> <span class="nb">int</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">Any</span><span class="p">:</span> <span class="o">...</span>
+</span><span id="L-8"><a href="#L-8"><span class="linenos"> 8</span></a>
+</span><span id="L-9"><a href="#L-9"><span class="linenos"> 9</span></a>    <span class="k">def</span> <span class="fm">__len__</span><span class="p">(</span><span class="bp">self</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">int</span><span class="p">:</span> <span class="o">...</span>
+</span><span id="L-10"><a href="#L-10"><span class="linenos">10</span></a>
+</span><span id="L-11"><a href="#L-11"><span class="linenos">11</span></a>
+</span><span id="L-12"><a href="#L-12"><span class="linenos">12</span></a><span class="k">class</span> <span class="nc">RepeatedDataset</span><span class="p">(</span><span class="n">Dataset</span><span class="p">):</span>
+</span><span id="L-13"><a href="#L-13"><span class="linenos">13</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="L-14"><a href="#L-14"><span class="linenos">14</span></a><span class="sd">    Dataset that cycles through its items to have a size of at least min size.</span>
+</span><span id="L-15"><a href="#L-15"><span class="linenos">15</span></a><span class="sd">    If drop_last is True, the size will be exaclty min_size. If drop_last is False,</span>
+</span><span id="L-16"><a href="#L-16"><span class="linenos">16</span></a><span class="sd">    the min_size ≤ size &lt; min_size + len(dataset).</span>
+</span><span id="L-17"><a href="#L-17"><span class="linenos">17</span></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="L-18"><a href="#L-18"><span class="linenos">18</span></a>
+</span><span id="L-19"><a href="#L-19"><span class="linenos">19</span></a>    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">dataset</span><span class="p">:</span> <span class="n">_SizedDataset</span><span class="p">,</span> <span class="n">min_size</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span> <span class="n">drop_last</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">False</span><span class="p">):</span>
+</span><span id="L-20"><a href="#L-20"><span class="linenos">20</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="L-21"><a href="#L-21"><span class="linenos">21</span></a><span class="sd">        Args:</span>
+</span><span id="L-22"><a href="#L-22"><span class="linenos">22</span></a><span class="sd">            dataset (SizedDataset): dataset to repeat. The dataset should have a size</span>
+</span><span id="L-23"><a href="#L-23"><span class="linenos">23</span></a><span class="sd">                (where `__len__` is defined).</span>
+</span><span id="L-24"><a href="#L-24"><span class="linenos">24</span></a><span class="sd">            min_size (int): minimum size of the final dataset</span>
+</span><span id="L-25"><a href="#L-25"><span class="linenos">25</span></a><span class="sd">            drop_last (bool): whether to remove overflow when repeating the</span>
+</span><span id="L-26"><a href="#L-26"><span class="linenos">26</span></a><span class="sd">                dataset.</span>
+</span><span id="L-27"><a href="#L-27"><span class="linenos">27</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="L-28"><a href="#L-28"><span class="linenos">28</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">dataset</span> <span class="o">=</span> <span class="n">dataset</span>
+</span><span id="L-29"><a href="#L-29"><span class="linenos">29</span></a>        <span class="k">assert</span> <span class="n">min_size</span> <span class="o">&gt;=</span> <span class="nb">len</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">dataset</span><span class="p">)</span>
+</span><span id="L-30"><a href="#L-30"><span class="linenos">30</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">dataset_size</span> <span class="o">=</span> <span class="nb">len</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">dataset</span><span class="p">)</span>
+</span><span id="L-31"><a href="#L-31"><span class="linenos">31</span></a>        <span class="k">if</span> <span class="n">drop_last</span><span class="p">:</span>
+</span><span id="L-32"><a href="#L-32"><span class="linenos">32</span></a>            <span class="bp">self</span><span class="o">.</span><span class="n">total_size</span> <span class="o">=</span> <span class="n">min_size</span>
+</span><span id="L-33"><a href="#L-33"><span class="linenos">33</span></a>        <span class="k">else</span><span class="p">:</span>
+</span><span id="L-34"><a href="#L-34"><span class="linenos">34</span></a>            <span class="bp">self</span><span class="o">.</span><span class="n">total_size</span> <span class="o">=</span> <span class="p">(</span>
+</span><span id="L-35"><a href="#L-35"><span class="linenos">35</span></a>                <span class="n">min_size</span> <span class="o">//</span> <span class="bp">self</span><span class="o">.</span><span class="n">dataset_size</span> <span class="o">+</span> <span class="nb">int</span><span class="p">(</span><span class="n">min_size</span> <span class="o">%</span> <span class="bp">self</span><span class="o">.</span><span class="n">dataset_size</span> <span class="o">&gt;</span> <span class="mi">0</span><span class="p">)</span>
+</span><span id="L-36"><a href="#L-36"><span class="linenos">36</span></a>            <span class="p">)</span> <span class="o">*</span> <span class="bp">self</span><span class="o">.</span><span class="n">dataset_size</span>
+</span><span id="L-37"><a href="#L-37"><span class="linenos">37</span></a>
+</span><span id="L-38"><a href="#L-38"><span class="linenos">38</span></a>    <span class="k">def</span> <span class="fm">__len__</span><span class="p">(</span><span class="bp">self</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">int</span><span class="p">:</span>
+</span><span id="L-39"><a href="#L-39"><span class="linenos">39</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="L-40"><a href="#L-40"><span class="linenos">40</span></a><span class="sd">        Size of the dataset. Will be min_size if drop_last is True.</span>
+</span><span id="L-41"><a href="#L-41"><span class="linenos">41</span></a><span class="sd">        Otherwise, min_size ≤ size &lt; min_size + len(dataset).</span>
+</span><span id="L-42"><a href="#L-42"><span class="linenos">42</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="L-43"><a href="#L-43"><span class="linenos">43</span></a>        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">total_size</span>
+</span><span id="L-44"><a href="#L-44"><span class="linenos">44</span></a>
+</span><span id="L-45"><a href="#L-45"><span class="linenos">45</span></a>    <span class="k">def</span> <span class="fm">__getitem__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">index</span><span class="p">:</span> <span class="nb">int</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">Any</span><span class="p">:</span>
+</span><span id="L-46"><a href="#L-46"><span class="linenos">46</span></a>        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">dataset</span><span class="p">[</span><span class="n">index</span> <span class="o">%</span> <span class="bp">self</span><span class="o">.</span><span class="n">dataset_size</span><span class="p">]</span>
+</span></pre></div>
+
+
+            </section>
+                <section id="RepeatedDataset">
+                            <input id="RepeatedDataset-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
+<div class="attr class">
+            
+    <span class="def">class</span>
+    <span class="name">RepeatedDataset</span><wbr>(<span class="base">typing.Generic[+T_co]</span>):
+
+                <label class="view-source-button" for="RepeatedDataset-view-source"><span>View Source</span></label>
+
+    </div>
+    <a class="headerlink" href="#RepeatedDataset"></a>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="RepeatedDataset-13"><a href="#RepeatedDataset-13"><span class="linenos">13</span></a><span class="k">class</span> <span class="nc">RepeatedDataset</span><span class="p">(</span><span class="n">Dataset</span><span class="p">):</span>
+</span><span id="RepeatedDataset-14"><a href="#RepeatedDataset-14"><span class="linenos">14</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="RepeatedDataset-15"><a href="#RepeatedDataset-15"><span class="linenos">15</span></a><span class="sd">    Dataset that cycles through its items to have a size of at least min size.</span>
+</span><span id="RepeatedDataset-16"><a href="#RepeatedDataset-16"><span class="linenos">16</span></a><span class="sd">    If drop_last is True, the size will be exaclty min_size. If drop_last is False,</span>
+</span><span id="RepeatedDataset-17"><a href="#RepeatedDataset-17"><span class="linenos">17</span></a><span class="sd">    the min_size ≤ size &lt; min_size + len(dataset).</span>
+</span><span id="RepeatedDataset-18"><a href="#RepeatedDataset-18"><span class="linenos">18</span></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="RepeatedDataset-19"><a href="#RepeatedDataset-19"><span class="linenos">19</span></a>
+</span><span id="RepeatedDataset-20"><a href="#RepeatedDataset-20"><span class="linenos">20</span></a>    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">dataset</span><span class="p">:</span> <span class="n">_SizedDataset</span><span class="p">,</span> <span class="n">min_size</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span> <span class="n">drop_last</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">False</span><span class="p">):</span>
+</span><span id="RepeatedDataset-21"><a href="#RepeatedDataset-21"><span class="linenos">21</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="RepeatedDataset-22"><a href="#RepeatedDataset-22"><span class="linenos">22</span></a><span class="sd">        Args:</span>
+</span><span id="RepeatedDataset-23"><a href="#RepeatedDataset-23"><span class="linenos">23</span></a><span class="sd">            dataset (SizedDataset): dataset to repeat. The dataset should have a size</span>
+</span><span id="RepeatedDataset-24"><a href="#RepeatedDataset-24"><span class="linenos">24</span></a><span class="sd">                (where `__len__` is defined).</span>
+</span><span id="RepeatedDataset-25"><a href="#RepeatedDataset-25"><span class="linenos">25</span></a><span class="sd">            min_size (int): minimum size of the final dataset</span>
+</span><span id="RepeatedDataset-26"><a href="#RepeatedDataset-26"><span class="linenos">26</span></a><span class="sd">            drop_last (bool): whether to remove overflow when repeating the</span>
+</span><span id="RepeatedDataset-27"><a href="#RepeatedDataset-27"><span class="linenos">27</span></a><span class="sd">                dataset.</span>
+</span><span id="RepeatedDataset-28"><a href="#RepeatedDataset-28"><span class="linenos">28</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="RepeatedDataset-29"><a href="#RepeatedDataset-29"><span class="linenos">29</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">dataset</span> <span class="o">=</span> <span class="n">dataset</span>
+</span><span id="RepeatedDataset-30"><a href="#RepeatedDataset-30"><span class="linenos">30</span></a>        <span class="k">assert</span> <span class="n">min_size</span> <span class="o">&gt;=</span> <span class="nb">len</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">dataset</span><span class="p">)</span>
+</span><span id="RepeatedDataset-31"><a href="#RepeatedDataset-31"><span class="linenos">31</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">dataset_size</span> <span class="o">=</span> <span class="nb">len</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">dataset</span><span class="p">)</span>
+</span><span id="RepeatedDataset-32"><a href="#RepeatedDataset-32"><span class="linenos">32</span></a>        <span class="k">if</span> <span class="n">drop_last</span><span class="p">:</span>
+</span><span id="RepeatedDataset-33"><a href="#RepeatedDataset-33"><span class="linenos">33</span></a>            <span class="bp">self</span><span class="o">.</span><span class="n">total_size</span> <span class="o">=</span> <span class="n">min_size</span>
+</span><span id="RepeatedDataset-34"><a href="#RepeatedDataset-34"><span class="linenos">34</span></a>        <span class="k">else</span><span class="p">:</span>
+</span><span id="RepeatedDataset-35"><a href="#RepeatedDataset-35"><span class="linenos">35</span></a>            <span class="bp">self</span><span class="o">.</span><span class="n">total_size</span> <span class="o">=</span> <span class="p">(</span>
+</span><span id="RepeatedDataset-36"><a href="#RepeatedDataset-36"><span class="linenos">36</span></a>                <span class="n">min_size</span> <span class="o">//</span> <span class="bp">self</span><span class="o">.</span><span class="n">dataset_size</span> <span class="o">+</span> <span class="nb">int</span><span class="p">(</span><span class="n">min_size</span> <span class="o">%</span> <span class="bp">self</span><span class="o">.</span><span class="n">dataset_size</span> <span class="o">&gt;</span> <span class="mi">0</span><span class="p">)</span>
+</span><span id="RepeatedDataset-37"><a href="#RepeatedDataset-37"><span class="linenos">37</span></a>            <span class="p">)</span> <span class="o">*</span> <span class="bp">self</span><span class="o">.</span><span class="n">dataset_size</span>
+</span><span id="RepeatedDataset-38"><a href="#RepeatedDataset-38"><span class="linenos">38</span></a>
+</span><span id="RepeatedDataset-39"><a href="#RepeatedDataset-39"><span class="linenos">39</span></a>    <span class="k">def</span> <span class="fm">__len__</span><span class="p">(</span><span class="bp">self</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">int</span><span class="p">:</span>
+</span><span id="RepeatedDataset-40"><a href="#RepeatedDataset-40"><span class="linenos">40</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="RepeatedDataset-41"><a href="#RepeatedDataset-41"><span class="linenos">41</span></a><span class="sd">        Size of the dataset. Will be min_size if drop_last is True.</span>
+</span><span id="RepeatedDataset-42"><a href="#RepeatedDataset-42"><span class="linenos">42</span></a><span class="sd">        Otherwise, min_size ≤ size &lt; min_size + len(dataset).</span>
+</span><span id="RepeatedDataset-43"><a href="#RepeatedDataset-43"><span class="linenos">43</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="RepeatedDataset-44"><a href="#RepeatedDataset-44"><span class="linenos">44</span></a>        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">total_size</span>
+</span><span id="RepeatedDataset-45"><a href="#RepeatedDataset-45"><span class="linenos">45</span></a>
+</span><span id="RepeatedDataset-46"><a href="#RepeatedDataset-46"><span class="linenos">46</span></a>    <span class="k">def</span> <span class="fm">__getitem__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">index</span><span class="p">:</span> <span class="nb">int</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">Any</span><span class="p">:</span>
+</span><span id="RepeatedDataset-47"><a href="#RepeatedDataset-47"><span class="linenos">47</span></a>        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">dataset</span><span class="p">[</span><span class="n">index</span> <span class="o">%</span> <span class="bp">self</span><span class="o">.</span><span class="n">dataset_size</span><span class="p">]</span>
+</span></pre></div>
+
+
+            <div class="docstring"><p>Dataset that cycles through its items to have a size of at least min size.
+If drop_last is True, the size will be exaclty min_size. If drop_last is False,
+the min_size ≤ size &lt; min_size + len(dataset).</p>
+</div>
+
+
+                            <div id="RepeatedDataset.__init__" class="classattr">
+                                        <input id="RepeatedDataset.__init__-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
+<div class="attr function">
+            
+        <span class="name">RepeatedDataset</span><span class="signature pdoc-code multiline">(<span class="param">	<span class="n">dataset</span><span class="p">:</span> <span class="n">shimmer</span><span class="o">.</span><span class="n">dataset</span><span class="o">.</span><span class="n">_SizedDataset</span>,</span><span class="param">	<span class="n">min_size</span><span class="p">:</span> <span class="nb">int</span>,</span><span class="param">	<span class="n">drop_last</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">False</span></span>)</span>
+
+                <label class="view-source-button" for="RepeatedDataset.__init__-view-source"><span>View Source</span></label>
+
+    </div>
+    <a class="headerlink" href="#RepeatedDataset.__init__"></a>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="RepeatedDataset.__init__-20"><a href="#RepeatedDataset.__init__-20"><span class="linenos">20</span></a>    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">dataset</span><span class="p">:</span> <span class="n">_SizedDataset</span><span class="p">,</span> <span class="n">min_size</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span> <span class="n">drop_last</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">False</span><span class="p">):</span>
+</span><span id="RepeatedDataset.__init__-21"><a href="#RepeatedDataset.__init__-21"><span class="linenos">21</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="RepeatedDataset.__init__-22"><a href="#RepeatedDataset.__init__-22"><span class="linenos">22</span></a><span class="sd">        Args:</span>
+</span><span id="RepeatedDataset.__init__-23"><a href="#RepeatedDataset.__init__-23"><span class="linenos">23</span></a><span class="sd">            dataset (SizedDataset): dataset to repeat. The dataset should have a size</span>
+</span><span id="RepeatedDataset.__init__-24"><a href="#RepeatedDataset.__init__-24"><span class="linenos">24</span></a><span class="sd">                (where `__len__` is defined).</span>
+</span><span id="RepeatedDataset.__init__-25"><a href="#RepeatedDataset.__init__-25"><span class="linenos">25</span></a><span class="sd">            min_size (int): minimum size of the final dataset</span>
+</span><span id="RepeatedDataset.__init__-26"><a href="#RepeatedDataset.__init__-26"><span class="linenos">26</span></a><span class="sd">            drop_last (bool): whether to remove overflow when repeating the</span>
+</span><span id="RepeatedDataset.__init__-27"><a href="#RepeatedDataset.__init__-27"><span class="linenos">27</span></a><span class="sd">                dataset.</span>
+</span><span id="RepeatedDataset.__init__-28"><a href="#RepeatedDataset.__init__-28"><span class="linenos">28</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="RepeatedDataset.__init__-29"><a href="#RepeatedDataset.__init__-29"><span class="linenos">29</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">dataset</span> <span class="o">=</span> <span class="n">dataset</span>
+</span><span id="RepeatedDataset.__init__-30"><a href="#RepeatedDataset.__init__-30"><span class="linenos">30</span></a>        <span class="k">assert</span> <span class="n">min_size</span> <span class="o">&gt;=</span> <span class="nb">len</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">dataset</span><span class="p">)</span>
+</span><span id="RepeatedDataset.__init__-31"><a href="#RepeatedDataset.__init__-31"><span class="linenos">31</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">dataset_size</span> <span class="o">=</span> <span class="nb">len</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">dataset</span><span class="p">)</span>
+</span><span id="RepeatedDataset.__init__-32"><a href="#RepeatedDataset.__init__-32"><span class="linenos">32</span></a>        <span class="k">if</span> <span class="n">drop_last</span><span class="p">:</span>
+</span><span id="RepeatedDataset.__init__-33"><a href="#RepeatedDataset.__init__-33"><span class="linenos">33</span></a>            <span class="bp">self</span><span class="o">.</span><span class="n">total_size</span> <span class="o">=</span> <span class="n">min_size</span>
+</span><span id="RepeatedDataset.__init__-34"><a href="#RepeatedDataset.__init__-34"><span class="linenos">34</span></a>        <span class="k">else</span><span class="p">:</span>
+</span><span id="RepeatedDataset.__init__-35"><a href="#RepeatedDataset.__init__-35"><span class="linenos">35</span></a>            <span class="bp">self</span><span class="o">.</span><span class="n">total_size</span> <span class="o">=</span> <span class="p">(</span>
+</span><span id="RepeatedDataset.__init__-36"><a href="#RepeatedDataset.__init__-36"><span class="linenos">36</span></a>                <span class="n">min_size</span> <span class="o">//</span> <span class="bp">self</span><span class="o">.</span><span class="n">dataset_size</span> <span class="o">+</span> <span class="nb">int</span><span class="p">(</span><span class="n">min_size</span> <span class="o">%</span> <span class="bp">self</span><span class="o">.</span><span class="n">dataset_size</span> <span class="o">&gt;</span> <span class="mi">0</span><span class="p">)</span>
+</span><span id="RepeatedDataset.__init__-37"><a href="#RepeatedDataset.__init__-37"><span class="linenos">37</span></a>            <span class="p">)</span> <span class="o">*</span> <span class="bp">self</span><span class="o">.</span><span class="n">dataset_size</span>
+</span></pre></div>
+
+
+            <div class="docstring"><h6 id="arguments">Arguments:</h6>
+
+<ul>
+<li><strong>dataset (SizedDataset):</strong>  dataset to repeat. The dataset should have a size
+(where <code>__len__</code> is defined).</li>
+<li><strong>min_size (int):</strong>  minimum size of the final dataset</li>
+<li><strong>drop_last (bool):</strong>  whether to remove overflow when repeating the
+dataset.</li>
+</ul>
+</div>
+
+
+                            </div>
+                            <div id="RepeatedDataset.dataset" class="classattr">
+                                <div class="attr variable">
+            <span class="name">dataset</span>
+
+        
+    </div>
+    <a class="headerlink" href="#RepeatedDataset.dataset"></a>
+    
+    
+
+                            </div>
+                            <div id="RepeatedDataset.dataset_size" class="classattr">
+                                <div class="attr variable">
+            <span class="name">dataset_size</span>
+
+        
+    </div>
+    <a class="headerlink" href="#RepeatedDataset.dataset_size"></a>
+    
+    
+
+                            </div>
+                </section>
+    </main>
+<script>
+    function escapeHTML(html) {
+        return document.createElement('div').appendChild(document.createTextNode(html)).parentNode.innerHTML;
+    }
+
+    const originalContent = document.querySelector("main.pdoc");
+    let currentContent = originalContent;
+
+    function setContent(innerHTML) {
+        let elem;
+        if (innerHTML) {
+            elem = document.createElement("main");
+            elem.classList.add("pdoc");
+            elem.innerHTML = innerHTML;
+        } else {
+            elem = originalContent;
+        }
+        if (currentContent !== elem) {
+            currentContent.replaceWith(elem);
+            currentContent = elem;
+        }
+    }
+
+    function getSearchTerm() {
+        return (new URL(window.location)).searchParams.get("search");
+    }
+
+    const searchBox = document.querySelector(".pdoc input[type=search]");
+    searchBox.addEventListener("input", function () {
+        let url = new URL(window.location);
+        if (searchBox.value.trim()) {
+            url.hash = "";
+            url.searchParams.set("search", searchBox.value);
+        } else {
+            url.searchParams.delete("search");
+        }
+        history.replaceState("", "", url.toString());
+        onInput();
+    });
+    window.addEventListener("popstate", onInput);
+
+
+    let search, searchErr;
+
+    async function initialize() {
+        try {
+            search = await new Promise((resolve, reject) => {
+                const script = document.createElement("script");
+                script.type = "text/javascript";
+                script.async = true;
+                script.onload = () => resolve(window.pdocSearch);
+                script.onerror = (e) => reject(e);
+                script.src = "../search.js";
+                document.getElementsByTagName("head")[0].appendChild(script);
+            });
+        } catch (e) {
+            console.error("Cannot fetch pdoc search index");
+            searchErr = "Cannot fetch search index.";
+        }
+        onInput();
+
+        document.querySelector("nav.pdoc").addEventListener("click", e => {
+            if (e.target.hash) {
+                searchBox.value = "";
+                searchBox.dispatchEvent(new Event("input"));
+            }
+        });
+    }
+
+    function onInput() {
+        setContent((() => {
+            const term = getSearchTerm();
+            if (!term) {
+                return null
+            }
+            if (searchErr) {
+                return `<h3>Error: ${searchErr}</h3>`
+            }
+            if (!search) {
+                return "<h3>Searching...</h3>"
+            }
+
+            window.scrollTo({top: 0, left: 0, behavior: 'auto'});
+
+            const results = search(term);
+
+            let html;
+            if (results.length === 0) {
+                html = `No search results for '${escapeHTML(term)}'.`
+            } else {
+                html = `<h4>${results.length} search result${results.length > 1 ? "s" : ""} for '${escapeHTML(term)}'.</h4>`;
+            }
+            for (let result of results.slice(0, 10)) {
+                let doc = result.doc;
+                let url = `../${doc.modulename.replaceAll(".", "/")}.html`;
+                if (doc.qualname) {
+                    url += `#${doc.qualname}`;
+                }
+
+                let heading;
+                switch (result.doc.kind) {
+                    case "function":
+                        if (doc.fullname.endsWith(".__init__")) {
+                            heading = `<span class="name">${doc.fullname.replace(/\.__init__$/, "")}</span>${doc.signature}`;
+                        } else {
+                            heading = `<span class="def">${doc.funcdef}</span> <span class="name">${doc.fullname}</span>${doc.signature}`;
+                        }
+                        break;
+                    case "class":
+                        heading = `<span class="def">class</span> <span class="name">${doc.fullname}</span>`;
+                        if (doc.bases)
+                            heading += `<wbr>(<span class="base">${doc.bases}</span>)`;
+                        heading += `:`;
+                        break;
+                    case "variable":
+                        heading = `<span class="name">${doc.fullname}</span>`;
+                        if (doc.annotation)
+                            heading += `<span class="annotation">${doc.annotation}</span>`;
+                        if (doc.default_value)
+                            heading += `<span class="default_value"> = ${doc.default_value}</span>`;
+                        break;
+                    default:
+                        heading = `<span class="name">${doc.fullname}</span>`;
+                        break;
+                }
+                html += `
+                        <section class="search-result">
+                        <a href="${url}" class="attr ${doc.kind}">${heading}</a>
+                        <div class="docstring">${doc.doc}</div>
+                        </section>
+                    `;
+
+            }
+            return html;
+        })());
+    }
+
+    if (getSearchTerm()) {
+        initialize();
+        searchBox.value = getSearchTerm();
+        onInput();
+    } else {
+        searchBox.addEventListener("focus", initialize, {once: true});
+    }
+
+    searchBox.addEventListener("keydown", e => {
+        if (["ArrowDown", "ArrowUp", "Enter"].includes(e.key)) {
+            let focused = currentContent.querySelector(".search-result.focused");
+            if (!focused) {
+                currentContent.querySelector(".search-result").classList.add("focused");
+            } else if (
+                e.key === "ArrowDown"
+                && focused.nextElementSibling
+                && focused.nextElementSibling.classList.contains("search-result")
+            ) {
+                focused.classList.remove("focused");
+                focused.nextElementSibling.classList.add("focused");
+                focused.nextElementSibling.scrollIntoView({
+                    behavior: "smooth",
+                    block: "nearest",
+                    inline: "nearest"
+                });
+            } else if (
+                e.key === "ArrowUp"
+                && focused.previousElementSibling
+                && focused.previousElementSibling.classList.contains("search-result")
+            ) {
+                focused.classList.remove("focused");
+                focused.previousElementSibling.classList.add("focused");
+                focused.previousElementSibling.scrollIntoView({
+                    behavior: "smooth",
+                    block: "nearest",
+                    inline: "nearest"
+                });
+            } else if (
+                e.key === "Enter"
+            ) {
+                focused.querySelector("a").click();
+            }
+        }
+    });
+</script></body>
+</html>
\ No newline at end of file
diff --git a/docs/api/v0.5.1/shimmer/modules/contrastive_loss.html b/docs/api/v0.5.1/shimmer/modules/contrastive_loss.html
new file mode 100644
index 00000000..55fb2e87
--- /dev/null
+++ b/docs/api/v0.5.1/shimmer/modules/contrastive_loss.html
@@ -0,0 +1,797 @@
+<!doctype html>
+<html lang="en">
+<head>
+    <meta charset="utf-8">
+    <meta name="viewport" content="width=device-width, initial-scale=1">
+    <meta name="generator" content="pdoc 14.4.0"/>
+    <title>shimmer.modules.contrastive_loss API documentation</title>
+
+    <style>/*! * Bootstrap Reboot v5.0.0 (https://getbootstrap.com/) * Copyright 2011-2021 The Bootstrap Authors * Copyright 2011-2021 Twitter, Inc. * Licensed under MIT (https://github.com/twbs/bootstrap/blob/main/LICENSE) * Forked from Normalize.css, licensed MIT (https://github.com/necolas/normalize.css/blob/master/LICENSE.md) */*,::after,::before{box-sizing:border-box}@media (prefers-reduced-motion:no-preference){:root{scroll-behavior:smooth}}body{margin:0;font-family:system-ui,-apple-system,"Segoe UI",Roboto,"Helvetica Neue",Arial,"Noto Sans","Liberation Sans",sans-serif,"Apple Color Emoji","Segoe UI Emoji","Segoe UI Symbol","Noto Color Emoji";font-size:1rem;font-weight:400;line-height:1.5;color:#212529;background-color:#fff;-webkit-text-size-adjust:100%;-webkit-tap-highlight-color:transparent}hr{margin:1rem 0;color:inherit;background-color:currentColor;border:0;opacity:.25}hr:not([size]){height:1px}h1,h2,h3,h4,h5,h6{margin-top:0;margin-bottom:.5rem;font-weight:500;line-height:1.2}h1{font-size:calc(1.375rem + 1.5vw)}@media (min-width:1200px){h1{font-size:2.5rem}}h2{font-size:calc(1.325rem + .9vw)}@media (min-width:1200px){h2{font-size:2rem}}h3{font-size:calc(1.3rem + .6vw)}@media (min-width:1200px){h3{font-size:1.75rem}}h4{font-size:calc(1.275rem + .3vw)}@media (min-width:1200px){h4{font-size:1.5rem}}h5{font-size:1.25rem}h6{font-size:1rem}p{margin-top:0;margin-bottom:1rem}abbr[data-bs-original-title],abbr[title]{-webkit-text-decoration:underline dotted;text-decoration:underline dotted;cursor:help;-webkit-text-decoration-skip-ink:none;text-decoration-skip-ink:none}address{margin-bottom:1rem;font-style:normal;line-height:inherit}ol,ul{padding-left:2rem}dl,ol,ul{margin-top:0;margin-bottom:1rem}ol ol,ol ul,ul ol,ul ul{margin-bottom:0}dt{font-weight:700}dd{margin-bottom:.5rem;margin-left:0}blockquote{margin:0 0 1rem}b,strong{font-weight:bolder}small{font-size:.875em}mark{padding:.2em;background-color:#fcf8e3}sub,sup{position:relative;font-size:.75em;line-height:0;vertical-align:baseline}sub{bottom:-.25em}sup{top:-.5em}a{color:#0d6efd;text-decoration:underline}a:hover{color:#0a58ca}a:not([href]):not([class]),a:not([href]):not([class]):hover{color:inherit;text-decoration:none}code,kbd,pre,samp{font-family:SFMono-Regular,Menlo,Monaco,Consolas,"Liberation Mono","Courier New",monospace;font-size:1em;direction:ltr;unicode-bidi:bidi-override}pre{display:block;margin-top:0;margin-bottom:1rem;overflow:auto;font-size:.875em}pre code{font-size:inherit;color:inherit;word-break:normal}code{font-size:.875em;color:#d63384;word-wrap:break-word}a>code{color:inherit}kbd{padding:.2rem .4rem;font-size:.875em;color:#fff;background-color:#212529;border-radius:.2rem}kbd kbd{padding:0;font-size:1em;font-weight:700}figure{margin:0 0 1rem}img,svg{vertical-align:middle}table{caption-side:bottom;border-collapse:collapse}caption{padding-top:.5rem;padding-bottom:.5rem;color:#6c757d;text-align:left}th{text-align:inherit;text-align:-webkit-match-parent}tbody,td,tfoot,th,thead,tr{border-color:inherit;border-style:solid;border-width:0}label{display:inline-block}button{border-radius:0}button:focus:not(:focus-visible){outline:0}button,input,optgroup,select,textarea{margin:0;font-family:inherit;font-size:inherit;line-height:inherit}button,select{text-transform:none}[role=button]{cursor:pointer}select{word-wrap:normal}select:disabled{opacity:1}[list]::-webkit-calendar-picker-indicator{display:none}[type=button],[type=reset],[type=submit],button{-webkit-appearance:button}[type=button]:not(:disabled),[type=reset]:not(:disabled),[type=submit]:not(:disabled),button:not(:disabled){cursor:pointer}::-moz-focus-inner{padding:0;border-style:none}textarea{resize:vertical}fieldset{min-width:0;padding:0;margin:0;border:0}legend{float:left;width:100%;padding:0;margin-bottom:.5rem;font-size:calc(1.275rem + .3vw);line-height:inherit}@media (min-width:1200px){legend{font-size:1.5rem}}legend+*{clear:left}::-webkit-datetime-edit-day-field,::-webkit-datetime-edit-fields-wrapper,::-webkit-datetime-edit-hour-field,::-webkit-datetime-edit-minute,::-webkit-datetime-edit-month-field,::-webkit-datetime-edit-text,::-webkit-datetime-edit-year-field{padding:0}::-webkit-inner-spin-button{height:auto}[type=search]{outline-offset:-2px;-webkit-appearance:textfield}::-webkit-search-decoration{-webkit-appearance:none}::-webkit-color-swatch-wrapper{padding:0}::file-selector-button{font:inherit}::-webkit-file-upload-button{font:inherit;-webkit-appearance:button}output{display:inline-block}iframe{border:0}summary{display:list-item;cursor:pointer}progress{vertical-align:baseline}[hidden]{display:none!important}</style>
+    <style>/*! syntax-highlighting.css */pre{line-height:125%;}span.linenos{color:inherit; background-color:transparent; padding-left:5px; padding-right:20px;}.pdoc-code .hll{background-color:#ffffcc}.pdoc-code{background:#f8f8f8;}.pdoc-code .c{color:#3D7B7B; font-style:italic}.pdoc-code .err{border:1px solid #FF0000}.pdoc-code .k{color:#008000; font-weight:bold}.pdoc-code .o{color:#666666}.pdoc-code .ch{color:#3D7B7B; font-style:italic}.pdoc-code .cm{color:#3D7B7B; font-style:italic}.pdoc-code .cp{color:#9C6500}.pdoc-code .cpf{color:#3D7B7B; font-style:italic}.pdoc-code .c1{color:#3D7B7B; font-style:italic}.pdoc-code .cs{color:#3D7B7B; font-style:italic}.pdoc-code .gd{color:#A00000}.pdoc-code .ge{font-style:italic}.pdoc-code .gr{color:#E40000}.pdoc-code .gh{color:#000080; font-weight:bold}.pdoc-code .gi{color:#008400}.pdoc-code .go{color:#717171}.pdoc-code .gp{color:#000080; font-weight:bold}.pdoc-code .gs{font-weight:bold}.pdoc-code .gu{color:#800080; font-weight:bold}.pdoc-code .gt{color:#0044DD}.pdoc-code .kc{color:#008000; font-weight:bold}.pdoc-code .kd{color:#008000; font-weight:bold}.pdoc-code .kn{color:#008000; font-weight:bold}.pdoc-code .kp{color:#008000}.pdoc-code .kr{color:#008000; font-weight:bold}.pdoc-code .kt{color:#B00040}.pdoc-code .m{color:#666666}.pdoc-code .s{color:#BA2121}.pdoc-code .na{color:#687822}.pdoc-code .nb{color:#008000}.pdoc-code .nc{color:#0000FF; font-weight:bold}.pdoc-code .no{color:#880000}.pdoc-code .nd{color:#AA22FF}.pdoc-code .ni{color:#717171; font-weight:bold}.pdoc-code .ne{color:#CB3F38; font-weight:bold}.pdoc-code .nf{color:#0000FF}.pdoc-code .nl{color:#767600}.pdoc-code .nn{color:#0000FF; font-weight:bold}.pdoc-code .nt{color:#008000; font-weight:bold}.pdoc-code .nv{color:#19177C}.pdoc-code .ow{color:#AA22FF; font-weight:bold}.pdoc-code .w{color:#bbbbbb}.pdoc-code .mb{color:#666666}.pdoc-code .mf{color:#666666}.pdoc-code .mh{color:#666666}.pdoc-code .mi{color:#666666}.pdoc-code .mo{color:#666666}.pdoc-code .sa{color:#BA2121}.pdoc-code .sb{color:#BA2121}.pdoc-code .sc{color:#BA2121}.pdoc-code .dl{color:#BA2121}.pdoc-code .sd{color:#BA2121; font-style:italic}.pdoc-code .s2{color:#BA2121}.pdoc-code .se{color:#AA5D1F; font-weight:bold}.pdoc-code .sh{color:#BA2121}.pdoc-code .si{color:#A45A77; font-weight:bold}.pdoc-code .sx{color:#008000}.pdoc-code .sr{color:#A45A77}.pdoc-code .s1{color:#BA2121}.pdoc-code .ss{color:#19177C}.pdoc-code .bp{color:#008000}.pdoc-code .fm{color:#0000FF}.pdoc-code .vc{color:#19177C}.pdoc-code .vg{color:#19177C}.pdoc-code .vi{color:#19177C}.pdoc-code .vm{color:#19177C}.pdoc-code .il{color:#666666}</style>
+    <style>/*! theme.css */:root{--pdoc-background:#fff;}.pdoc{--text:#212529;--muted:#6c757d;--link:#3660a5;--link-hover:#1659c5;--code:#f8f8f8;--active:#fff598;--accent:#eee;--accent2:#c1c1c1;--nav-hover:rgba(255, 255, 255, 0.5);--name:#0066BB;--def:#008800;--annotation:#007020;}</style>
+    <style>/*! layout.css */html, body{width:100%;height:100%;}html, main{scroll-behavior:smooth;}body{background-color:var(--pdoc-background);}@media (max-width:769px){#navtoggle{cursor:pointer;position:absolute;width:50px;height:40px;top:1rem;right:1rem;border-color:var(--text);color:var(--text);display:flex;opacity:0.8;z-index:999;}#navtoggle:hover{opacity:1;}#togglestate + div{display:none;}#togglestate:checked + div{display:inherit;}main, header{padding:2rem 3vw;}header + main{margin-top:-3rem;}.git-button{display:none !important;}nav input[type="search"]{max-width:77%;}nav input[type="search"]:first-child{margin-top:-6px;}nav input[type="search"]:valid ~ *{display:none !important;}}@media (min-width:770px){:root{--sidebar-width:clamp(12.5rem, 28vw, 22rem);}nav{position:fixed;overflow:auto;height:100vh;width:var(--sidebar-width);}main, header{padding:3rem 2rem 3rem calc(var(--sidebar-width) + 3rem);width:calc(54rem + var(--sidebar-width));max-width:100%;}header + main{margin-top:-4rem;}#navtoggle{display:none;}}#togglestate{position:absolute;height:0;opacity:0;}nav.pdoc{--pad:clamp(0.5rem, 2vw, 1.75rem);--indent:1.5rem;background-color:var(--accent);border-right:1px solid var(--accent2);box-shadow:0 0 20px rgba(50, 50, 50, .2) inset;padding:0 0 0 var(--pad);overflow-wrap:anywhere;scrollbar-width:thin; scrollbar-color:var(--accent2) transparent; z-index:1}nav.pdoc::-webkit-scrollbar{width:.4rem; }nav.pdoc::-webkit-scrollbar-thumb{background-color:var(--accent2); }nav.pdoc > div{padding:var(--pad) 0;}nav.pdoc .module-list-button{display:inline-flex;align-items:center;color:var(--text);border-color:var(--muted);margin-bottom:1rem;}nav.pdoc .module-list-button:hover{border-color:var(--text);}nav.pdoc input[type=search]{display:block;outline-offset:0;width:calc(100% - var(--pad));}nav.pdoc .logo{max-width:calc(100% - var(--pad));max-height:35vh;display:block;margin:0 auto 1rem;transform:translate(calc(-.5 * var(--pad)), 0);}nav.pdoc ul{list-style:none;padding-left:0;}nav.pdoc > div > ul{margin-left:calc(0px - var(--pad));}nav.pdoc li a{padding:.2rem 0 .2rem calc(var(--pad) + var(--indent));}nav.pdoc > div > ul > li > a{padding-left:var(--pad);}nav.pdoc li{transition:all 100ms;}nav.pdoc li:hover{background-color:var(--nav-hover);}nav.pdoc a, nav.pdoc a:hover{color:var(--text);}nav.pdoc a{display:block;}nav.pdoc > h2:first-of-type{margin-top:1.5rem;}nav.pdoc .class:before{content:"class ";color:var(--muted);}nav.pdoc .function:after{content:"()";color:var(--muted);}nav.pdoc footer:before{content:"";display:block;width:calc(100% - var(--pad));border-top:solid var(--accent2) 1px;margin-top:1.5rem;padding-top:.5rem;}nav.pdoc footer{font-size:small;}</style>
+    <style>/*! content.css */.pdoc{color:var(--text);box-sizing:border-box;line-height:1.5;background:none;}.pdoc .pdoc-button{cursor:pointer;display:inline-block;border:solid black 1px;border-radius:2px;font-size:.75rem;padding:calc(0.5em - 1px) 1em;transition:100ms all;}.pdoc .pdoc-alert{padding:1rem 1rem 1rem calc(1.5rem + 24px);border:1px solid transparent;border-radius:.25rem;background-repeat:no-repeat;background-position:1rem center;margin-bottom:1rem;}.pdoc .pdoc-alert > *:last-child{margin-bottom:0;}.pdoc .pdoc-alert-note {color:#084298;background-color:#cfe2ff;border-color:#b6d4fe;background-image:url("data:image/svg+xml,%3Csvg%20xmlns%3D%22http%3A//www.w3.org/2000/svg%22%20width%3D%2224%22%20height%3D%2224%22%20fill%3D%22%23084298%22%20viewBox%3D%220%200%2016%2016%22%3E%3Cpath%20d%3D%22M8%2016A8%208%200%201%200%208%200a8%208%200%200%200%200%2016zm.93-9.412-1%204.705c-.07.34.029.533.304.533.194%200%20.487-.07.686-.246l-.088.416c-.287.346-.92.598-1.465.598-.703%200-1.002-.422-.808-1.319l.738-3.468c.064-.293.006-.399-.287-.47l-.451-.081.082-.381%202.29-.287zM8%205.5a1%201%200%201%201%200-2%201%201%200%200%201%200%202z%22/%3E%3C/svg%3E");}.pdoc .pdoc-alert-warning{color:#664d03;background-color:#fff3cd;border-color:#ffecb5;background-image:url("data:image/svg+xml,%3Csvg%20xmlns%3D%22http%3A//www.w3.org/2000/svg%22%20width%3D%2224%22%20height%3D%2224%22%20fill%3D%22%23664d03%22%20viewBox%3D%220%200%2016%2016%22%3E%3Cpath%20d%3D%22M8.982%201.566a1.13%201.13%200%200%200-1.96%200L.165%2013.233c-.457.778.091%201.767.98%201.767h13.713c.889%200%201.438-.99.98-1.767L8.982%201.566zM8%205c.535%200%20.954.462.9.995l-.35%203.507a.552.552%200%200%201-1.1%200L7.1%205.995A.905.905%200%200%201%208%205zm.002%206a1%201%200%201%201%200%202%201%201%200%200%201%200-2z%22/%3E%3C/svg%3E");}.pdoc .pdoc-alert-danger{color:#842029;background-color:#f8d7da;border-color:#f5c2c7;background-image:url("data:image/svg+xml,%3Csvg%20xmlns%3D%22http%3A//www.w3.org/2000/svg%22%20width%3D%2224%22%20height%3D%2224%22%20fill%3D%22%23842029%22%20viewBox%3D%220%200%2016%2016%22%3E%3Cpath%20d%3D%22M5.52.359A.5.5%200%200%201%206%200h4a.5.5%200%200%201%20.474.658L8.694%206H12.5a.5.5%200%200%201%20.395.807l-7%209a.5.5%200%200%201-.873-.454L6.823%209.5H3.5a.5.5%200%200%201-.48-.641l2.5-8.5z%22/%3E%3C/svg%3E");}.pdoc .visually-hidden{position:absolute !important;width:1px !important;height:1px !important;padding:0 !important;margin:-1px !important;overflow:hidden !important;clip:rect(0, 0, 0, 0) !important;white-space:nowrap !important;border:0 !important;}.pdoc h1, .pdoc h2, .pdoc h3{font-weight:300;margin:.3em 0;padding:.2em 0;}.pdoc > section:not(.module-info) h1{font-size:1.5rem;font-weight:500;}.pdoc > section:not(.module-info) h2{font-size:1.4rem;font-weight:500;}.pdoc > section:not(.module-info) h3{font-size:1.3rem;font-weight:500;}.pdoc > section:not(.module-info) h4{font-size:1.2rem;}.pdoc > section:not(.module-info) h5{font-size:1.1rem;}.pdoc a{text-decoration:none;color:var(--link);}.pdoc a:hover{color:var(--link-hover);}.pdoc blockquote{margin-left:2rem;}.pdoc pre{border-top:1px solid var(--accent2);border-bottom:1px solid var(--accent2);margin-top:0;margin-bottom:1em;padding:.5rem 0 .5rem .5rem;overflow-x:auto;background-color:var(--code);}.pdoc code{color:var(--text);padding:.2em .4em;margin:0;font-size:85%;background-color:var(--accent);border-radius:6px;}.pdoc a > code{color:inherit;}.pdoc pre > code{display:inline-block;font-size:inherit;background:none;border:none;padding:0;}.pdoc > section:not(.module-info){margin-bottom:1.5rem;}.pdoc .modulename{margin-top:0;font-weight:bold;}.pdoc .modulename a{color:var(--link);transition:100ms all;}.pdoc .git-button{float:right;border:solid var(--link) 1px;}.pdoc .git-button:hover{background-color:var(--link);color:var(--pdoc-background);}.view-source-toggle-state,.view-source-toggle-state ~ .pdoc-code{display:none;}.view-source-toggle-state:checked ~ .pdoc-code{display:block;}.view-source-button{display:inline-block;float:right;font-size:.75rem;line-height:1.5rem;color:var(--muted);padding:0 .4rem 0 1.3rem;cursor:pointer;text-indent:-2px;}.view-source-button > span{visibility:hidden;}.module-info .view-source-button{float:none;display:flex;justify-content:flex-end;margin:-1.2rem .4rem -.2rem 0;}.view-source-button::before{position:absolute;content:"View Source";display:list-item;list-style-type:disclosure-closed;}.view-source-toggle-state:checked ~ .attr .view-source-button::before,.view-source-toggle-state:checked ~ .view-source-button::before{list-style-type:disclosure-open;}.pdoc .docstring{margin-bottom:1.5rem;}.pdoc section:not(.module-info) .docstring{margin-left:clamp(0rem, 5vw - 2rem, 1rem);}.pdoc .docstring .pdoc-code{margin-left:1em;margin-right:1em;}.pdoc h1:target,.pdoc h2:target,.pdoc h3:target,.pdoc h4:target,.pdoc h5:target,.pdoc h6:target,.pdoc .pdoc-code > pre > span:target{background-color:var(--active);box-shadow:-1rem 0 0 0 var(--active);}.pdoc .pdoc-code > pre > span:target{display:block;}.pdoc div:target > .attr,.pdoc section:target > .attr,.pdoc dd:target > a{background-color:var(--active);}.pdoc *{scroll-margin:2rem;}.pdoc .pdoc-code .linenos{user-select:none;}.pdoc .attr:hover{filter:contrast(0.95);}.pdoc section, .pdoc .classattr{position:relative;}.pdoc .headerlink{--width:clamp(1rem, 3vw, 2rem);position:absolute;top:0;left:calc(0rem - var(--width));transition:all 100ms ease-in-out;opacity:0;}.pdoc .headerlink::before{content:"#";display:block;text-align:center;width:var(--width);height:2.3rem;line-height:2.3rem;font-size:1.5rem;}.pdoc .attr:hover ~ .headerlink,.pdoc *:target > .headerlink,.pdoc .headerlink:hover{opacity:1;}.pdoc .attr{display:block;margin:.5rem 0 .5rem;padding:.4rem .4rem .4rem 1rem;background-color:var(--accent);overflow-x:auto;}.pdoc .classattr{margin-left:2rem;}.pdoc .name{color:var(--name);font-weight:bold;}.pdoc .def{color:var(--def);font-weight:bold;}.pdoc .signature{background-color:transparent;}.pdoc .param, .pdoc .return-annotation{white-space:pre;}.pdoc .signature.multiline .param{display:block;}.pdoc .signature.condensed .param{display:inline-block;}.pdoc .annotation{color:var(--annotation);}.pdoc .view-value-toggle-state,.pdoc .view-value-toggle-state ~ .default_value{display:none;}.pdoc .view-value-toggle-state:checked ~ .default_value{display:inherit;}.pdoc .view-value-button{font-size:.5rem;vertical-align:middle;border-style:dashed;margin-top:-0.1rem;}.pdoc .view-value-button:hover{background:white;}.pdoc .view-value-button::before{content:"show";text-align:center;width:2.2em;display:inline-block;}.pdoc .view-value-toggle-state:checked ~ .view-value-button::before{content:"hide";}.pdoc .inherited{margin-left:2rem;}.pdoc .inherited dt{font-weight:700;}.pdoc .inherited dt, .pdoc .inherited dd{display:inline;margin-left:0;margin-bottom:.5rem;}.pdoc .inherited dd:not(:last-child):after{content:", ";}.pdoc .inherited .class:before{content:"class ";}.pdoc .inherited .function a:after{content:"()";}.pdoc .search-result .docstring{overflow:auto;max-height:25vh;}.pdoc .search-result.focused > .attr{background-color:var(--active);}.pdoc .attribution{margin-top:2rem;display:block;opacity:0.5;transition:all 200ms;filter:grayscale(100%);}.pdoc .attribution:hover{opacity:1;filter:grayscale(0%);}.pdoc .attribution img{margin-left:5px;height:35px;vertical-align:middle;width:70px;transition:all 200ms;}.pdoc table{display:block;width:max-content;max-width:100%;overflow:auto;margin-bottom:1rem;}.pdoc table th{font-weight:600;}.pdoc table th, .pdoc table td{padding:6px 13px;border:1px solid var(--accent2);}</style>
+    <style>/*! custom.css */</style><script>
+    window.MathJax = {
+        tex: {
+            inlineMath: [['$', '$'], ['\\(', '\\)']]
+        }
+    };
+</script>
+<script src="https://polyfill.io/v3/polyfill.min.js?features=es6"></script>
+<script id="MathJax-script" async src="https://cdn.jsdelivr.net/npm/mathjax@3/es5/tex-mml-chtml.js"></script>
+<script>
+    /* Re-invoke MathJax when DOM content changes, for example during search. */
+    document.addEventListener("DOMContentLoaded", () => {
+        new MutationObserver(() => MathJax.typeset()).observe(
+            document.querySelector("main.pdoc").parentNode,
+            {childList: true}
+        );
+    })
+</script>
+<style>
+    mjx-container {
+        overflow-x: auto;
+    }
+</style></head>
+<body>
+    <nav class="pdoc">
+        <label id="navtoggle" for="togglestate" class="pdoc-button"><svg xmlns='http://www.w3.org/2000/svg' viewBox='0 0 30 30'><path stroke-linecap='round' stroke="currentColor" stroke-miterlimit='10' stroke-width='2' d='M4 7h22M4 15h22M4 23h22'/></svg></label>
+        <input id="togglestate" type="checkbox" aria-hidden="true" tabindex="-1">
+        <div>            <a class="pdoc-button module-list-button" href="../../index.html">
+<svg xmlns="http://www.w3.org/2000/svg" width="16" height="16" fill="currentColor" class="bi bi-box-arrow-in-left" viewBox="0 0 16 16">
+  <path fill-rule="evenodd" d="M10 3.5a.5.5 0 0 0-.5-.5h-8a.5.5 0 0 0-.5.5v9a.5.5 0 0 0 .5.5h8a.5.5 0 0 0 .5-.5v-2a.5.5 0 0 1 1 0v2A1.5 1.5 0 0 1 9.5 14h-8A1.5 1.5 0 0 1 0 12.5v-9A1.5 1.5 0 0 1 1.5 2h8A1.5 1.5 0 0 1 11 3.5v2a.5.5 0 0 1-1 0v-2z"/>
+  <path fill-rule="evenodd" d="M4.146 8.354a.5.5 0 0 1 0-.708l3-3a.5.5 0 1 1 .708.708L5.707 7.5H14.5a.5.5 0 0 1 0 1H5.707l2.147 2.146a.5.5 0 0 1-.708.708l-3-3z"/>
+</svg>                &nbsp;
+                Module Index
+            </a>
+
+
+            <input type="search" placeholder="Search..." role="searchbox" aria-label="search"
+                   pattern=".+" required>
+
+
+
+            <h2>API Documentation</h2>
+                <ul class="memberlist">
+            <li>
+                    <a class="variable" href="#ContrastiveLossType">ContrastiveLossType</a>
+            </li>
+            <li>
+                    <a class="variable" href="#ContrastiveLossBayesianType">ContrastiveLossBayesianType</a>
+            </li>
+            <li>
+                    <a class="function" href="#info_nce">info_nce</a>
+            </li>
+            <li>
+                    <a class="function" href="#contrastive_loss">contrastive_loss</a>
+            </li>
+            <li>
+                    <a class="class" href="#ContrastiveLoss">ContrastiveLoss</a>
+                            <ul class="memberlist">
+                        <li>
+                                <a class="function" href="#ContrastiveLoss.__init__">ContrastiveLoss</a>
+                        </li>
+                        <li>
+                                <a class="variable" href="#ContrastiveLoss.learn_logit_scale">learn_logit_scale</a>
+                        </li>
+                        <li>
+                                <a class="variable" href="#ContrastiveLoss.reduction">reduction</a>
+                        </li>
+                        <li>
+                                <a class="function" href="#ContrastiveLoss.forward">forward</a>
+                        </li>
+                </ul>
+
+            </li>
+    </ul>
+
+
+
+        <a class="attribution" title="pdoc: Python API documentation generator" href="https://pdoc.dev" target="_blank">
+            built with <span class="visually-hidden">pdoc</span><img
+                alt="pdoc logo"
+                src="data:image/svg+xml,%3Csvg%20xmlns%3D%22http%3A//www.w3.org/2000/svg%22%20role%3D%22img%22%20aria-label%3D%22pdoc%20logo%22%20width%3D%22300%22%20height%3D%22150%22%20viewBox%3D%22-1%200%2060%2030%22%3E%3Ctitle%3Epdoc%3C/title%3E%3Cpath%20d%3D%22M29.621%2021.293c-.011-.273-.214-.475-.511-.481a.5.5%200%200%200-.489.503l-.044%201.393c-.097.551-.695%201.215-1.566%201.704-.577.428-1.306.486-2.193.182-1.426-.617-2.467-1.654-3.304-2.487l-.173-.172a3.43%203.43%200%200%200-.365-.306.49.49%200%200%200-.286-.196c-1.718-1.06-4.931-1.47-7.353.191l-.219.15c-1.707%201.187-3.413%202.131-4.328%201.03-.02-.027-.49-.685-.141-1.763.233-.721.546-2.408.772-4.076.042-.09.067-.187.046-.288.166-1.347.277-2.625.241-3.351%201.378-1.008%202.271-2.586%202.271-4.362%200-.976-.272-1.935-.788-2.774-.057-.094-.122-.18-.184-.268.033-.167.052-.339.052-.516%200-1.477-1.202-2.679-2.679-2.679-.791%200-1.496.352-1.987.9a6.3%206.3%200%200%200-1.001.029c-.492-.564-1.207-.929-2.012-.929-1.477%200-2.679%201.202-2.679%202.679A2.65%202.65%200%200%200%20.97%206.554c-.383.747-.595%201.572-.595%202.41%200%202.311%201.507%204.29%203.635%205.107-.037.699-.147%202.27-.423%203.294l-.137.461c-.622%202.042-2.515%208.257%201.727%2010.643%201.614.908%203.06%201.248%204.317%201.248%202.665%200%204.492-1.524%205.322-2.401%201.476-1.559%202.886-1.854%206.491.82%201.877%201.393%203.514%201.753%204.861%201.068%202.223-1.713%202.811-3.867%203.399-6.374.077-.846.056-1.469.054-1.537zm-4.835%204.313c-.054.305-.156.586-.242.629-.034-.007-.131-.022-.307-.157-.145-.111-.314-.478-.456-.908.221.121.432.25.675.355.115.039.219.051.33.081zm-2.251-1.238c-.05.33-.158.648-.252.694-.022.001-.125-.018-.307-.157-.217-.166-.488-.906-.639-1.573.358.344.754.693%201.198%201.036zm-3.887-2.337c-.006-.116-.018-.231-.041-.342.635.145%201.189.368%201.599.625.097.231.166.481.174.642-.03.049-.055.101-.067.158-.046.013-.128.026-.298.004-.278-.037-.901-.57-1.367-1.087zm-1.127-.497c.116.306.176.625.12.71-.019.014-.117.045-.345.016-.206-.027-.604-.332-.986-.695.41-.051.816-.056%201.211-.031zm-4.535%201.535c.209.22.379.47.358.598-.006.041-.088.138-.351.234-.144.055-.539-.063-.979-.259a11.66%2011.66%200%200%200%20.972-.573zm.983-.664c.359-.237.738-.418%201.126-.554.25.237.479.548.457.694-.006.042-.087.138-.351.235-.174.064-.694-.105-1.232-.375zm-3.381%201.794c-.022.145-.061.29-.149.401-.133.166-.358.248-.69.251h-.002c-.133%200-.306-.26-.45-.621.417.091.854.07%201.291-.031zm-2.066-8.077a4.78%204.78%200%200%201-.775-.584c.172-.115.505-.254.88-.378l-.105.962zm-.331%202.302a10.32%2010.32%200%200%201-.828-.502c.202-.143.576-.328.984-.49l-.156.992zm-.45%202.157l-.701-.403c.214-.115.536-.249.891-.376a11.57%2011.57%200%200%201-.19.779zm-.181%201.716c.064.398.194.702.298.893-.194-.051-.435-.162-.736-.398.061-.119.224-.3.438-.495zM8.87%204.141c0%20.152-.123.276-.276.276s-.275-.124-.275-.276.123-.276.276-.276.275.124.275.276zm-.735-.389a1.15%201.15%200%200%200-.314.783%201.16%201.16%200%200%200%201.162%201.162c.457%200%20.842-.27%201.032-.653.026.117.042.238.042.362a1.68%201.68%200%200%201-1.679%201.679%201.68%201.68%200%200%201-1.679-1.679c0-.843.626-1.535%201.436-1.654zM5.059%205.406A1.68%201.68%200%200%201%203.38%207.085a1.68%201.68%200%200%201-1.679-1.679c0-.037.009-.072.011-.109.21.3.541.508.935.508a1.16%201.16%200%200%200%201.162-1.162%201.14%201.14%200%200%200-.474-.912c.015%200%20.03-.005.045-.005.926.001%201.679.754%201.679%201.68zM3.198%204.141c0%20.152-.123.276-.276.276s-.275-.124-.275-.276.123-.276.276-.276.275.124.275.276zM1.375%208.964c0-.52.103-1.035.288-1.52.466.394%201.06.64%201.717.64%201.144%200%202.116-.725%202.499-1.738.383%201.012%201.355%201.738%202.499%201.738.867%200%201.631-.421%202.121-1.062.307.605.478%201.267.478%201.942%200%202.486-2.153%204.51-4.801%204.51s-4.801-2.023-4.801-4.51zm24.342%2019.349c-.985.498-2.267.168-3.813-.979-3.073-2.281-5.453-3.199-7.813-.705-1.315%201.391-4.163%203.365-8.423.97-3.174-1.786-2.239-6.266-1.261-9.479l.146-.492c.276-1.02.395-2.457.444-3.268a6.11%206.11%200%200%200%201.18.115%206.01%206.01%200%200%200%202.536-.562l-.006.175c-.802.215-1.848.612-2.021%201.25-.079.295.021.601.274.837.219.203.415.364.598.501-.667.304-1.243.698-1.311%201.179-.02.144-.022.507.393.787.213.144.395.26.564.365-1.285.521-1.361.96-1.381%201.126-.018.142-.011.496.427.746l.854.489c-.473.389-.971.914-.999%201.429-.018.278.095.532.316.713.675.556%201.231.721%201.653.721.059%200%20.104-.014.158-.02.207.707.641%201.64%201.513%201.64h.013c.8-.008%201.236-.345%201.462-.626.173-.216.268-.457.325-.692.424.195.93.374%201.372.374.151%200%20.294-.021.423-.068.732-.27.944-.704.993-1.021.009-.061.003-.119.002-.179.266.086.538.147.789.147.15%200%20.294-.021.423-.069.542-.2.797-.489.914-.754.237.147.478.258.704.288.106.014.205.021.296.021.356%200%20.595-.101.767-.229.438.435%201.094.992%201.656%201.067.106.014.205.021.296.021a1.56%201.56%200%200%200%20.323-.035c.17.575.453%201.289.866%201.605.358.273.665.362.914.362a.99.99%200%200%200%20.421-.093%201.03%201.03%200%200%200%20.245-.164c.168.428.39.846.68%201.068.358.273.665.362.913.362a.99.99%200%200%200%20.421-.093c.317-.148.512-.448.639-.762.251.157.495.257.726.257.127%200%20.25-.024.37-.071.427-.17.706-.617.841-1.314.022-.015.047-.022.068-.038.067-.051.133-.104.196-.159-.443%201.486-1.107%202.761-2.086%203.257zM8.66%209.925a.5.5%200%201%200-1%200c0%20.653-.818%201.205-1.787%201.205s-1.787-.552-1.787-1.205a.5.5%200%201%200-1%200c0%201.216%201.25%202.205%202.787%202.205s2.787-.989%202.787-2.205zm4.4%2015.965l-.208.097c-2.661%201.258-4.708%201.436-6.086.527-1.542-1.017-1.88-3.19-1.844-4.198a.4.4%200%200%200-.385-.414c-.242-.029-.406.164-.414.385-.046%201.249.367%203.686%202.202%204.896.708.467%201.547.7%202.51.7%201.248%200%202.706-.392%204.362-1.174l.185-.086a.4.4%200%200%200%20.205-.527c-.089-.204-.326-.291-.527-.206zM9.547%202.292c.093.077.205.114.317.114a.5.5%200%200%200%20.318-.886L8.817.397a.5.5%200%200%200-.703.068.5.5%200%200%200%20.069.703l1.364%201.124zm-7.661-.065c.086%200%20.173-.022.253-.068l1.523-.893a.5.5%200%200%200-.506-.863l-1.523.892a.5.5%200%200%200-.179.685c.094.158.261.247.432.247z%22%20transform%3D%22matrix%28-1%200%200%201%2058%200%29%22%20fill%3D%22%233bb300%22/%3E%3Cpath%20d%3D%22M.3%2021.86V10.18q0-.46.02-.68.04-.22.18-.5.28-.54%201.34-.54%201.06%200%201.42.28.38.26.44.78.76-1.04%202.38-1.04%201.64%200%203.1%201.54%201.46%201.54%201.46%203.58%200%202.04-1.46%203.58-1.44%201.54-3.08%201.54-1.64%200-2.38-.92v4.04q0%20.46-.04.68-.02.22-.18.5-.14.3-.5.42-.36.12-.98.12-.62%200-1-.12-.36-.12-.52-.4-.14-.28-.18-.5-.02-.22-.02-.68zm3.96-9.42q-.46.54-.46%201.18%200%20.64.46%201.18.48.52%201.2.52.74%200%201.24-.52.52-.52.52-1.18%200-.66-.48-1.18-.48-.54-1.26-.54-.76%200-1.22.54zm14.741-8.36q.16-.3.54-.42.38-.12%201-.12.64%200%201.02.12.38.12.52.42.16.3.18.54.04.22.04.68v11.94q0%20.46-.04.7-.02.22-.18.5-.3.54-1.7.54-1.38%200-1.54-.98-.84.96-2.34.96-1.8%200-3.28-1.56-1.48-1.58-1.48-3.66%200-2.1%201.48-3.68%201.5-1.58%203.28-1.58%201.48%200%202.3%201v-4.2q0-.46.02-.68.04-.24.18-.52zm-3.24%2010.86q.52.54%201.26.54.74%200%201.22-.54.5-.54.5-1.18%200-.66-.48-1.22-.46-.56-1.26-.56-.8%200-1.28.56-.48.54-.48%201.2%200%20.66.52%201.2zm7.833-1.2q0-2.4%201.68-3.96%201.68-1.56%203.84-1.56%202.16%200%203.82%201.56%201.66%201.54%201.66%203.94%200%201.66-.86%202.96-.86%201.28-2.1%201.9-1.22.6-2.54.6-1.32%200-2.56-.64-1.24-.66-2.1-1.92-.84-1.28-.84-2.88zm4.18%201.44q.64.48%201.3.48.66%200%201.32-.5.66-.5.66-1.48%200-.98-.62-1.46-.62-.48-1.34-.48-.72%200-1.34.5-.62.5-.62%201.48%200%20.96.64%201.46zm11.412-1.44q0%20.84.56%201.32.56.46%201.18.46.64%200%201.18-.36.56-.38.9-.38.6%200%201.46%201.06.46.58.46%201.04%200%20.76-1.1%201.42-1.14.8-2.8.8-1.86%200-3.58-1.34-.82-.64-1.34-1.7-.52-1.08-.52-2.36%200-1.3.52-2.34.52-1.06%201.34-1.7%201.66-1.32%203.54-1.32.76%200%201.48.22.72.2%201.06.4l.32.2q.36.24.56.38.52.4.52.92%200%20.5-.42%201.14-.72%201.1-1.38%201.1-.38%200-1.08-.44-.36-.34-1.04-.34-.66%200-1.24.48-.58.48-.58%201.34z%22%20fill%3D%22green%22/%3E%3C/svg%3E"/>
+        </a>
+</div>
+    </nav>
+    <main class="pdoc">
+            <section class="module-info">
+                    <h1 class="modulename">
+shimmer<wbr>.modules<wbr>.contrastive_loss    </h1>
+
+                        <div class="docstring"><p>Various contrastive loss definitions</p>
+</div>
+
+                        <input id="mod-contrastive_loss-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
+
+                        <label class="view-source-button" for="mod-contrastive_loss-view-source"><span>View Source</span></label>
+
+                        <div class="pdoc-code codehilite"><pre><span></span><span id="L-1"><a href="#L-1"><span class="linenos">  1</span></a><span class="sd">&quot;&quot;&quot;Various contrastive loss definitions&quot;&quot;&quot;</span>
+</span><span id="L-2"><a href="#L-2"><span class="linenos">  2</span></a>
+</span><span id="L-3"><a href="#L-3"><span class="linenos">  3</span></a><span class="kn">from</span> <span class="nn">collections.abc</span> <span class="kn">import</span> <span class="n">Callable</span>
+</span><span id="L-4"><a href="#L-4"><span class="linenos">  4</span></a><span class="kn">from</span> <span class="nn">typing</span> <span class="kn">import</span> <span class="n">Literal</span>
+</span><span id="L-5"><a href="#L-5"><span class="linenos">  5</span></a>
+</span><span id="L-6"><a href="#L-6"><span class="linenos">  6</span></a><span class="kn">import</span> <span class="nn">torch</span>
+</span><span id="L-7"><a href="#L-7"><span class="linenos">  7</span></a><span class="kn">from</span> <span class="nn">torch.nn.functional</span> <span class="kn">import</span> <span class="n">cross_entropy</span><span class="p">,</span> <span class="n">normalize</span>
+</span><span id="L-8"><a href="#L-8"><span class="linenos">  8</span></a>
+</span><span id="L-9"><a href="#L-9"><span class="linenos">  9</span></a><span class="kn">from</span> <span class="nn">shimmer.modules.domain</span> <span class="kn">import</span> <span class="n">LossOutput</span>
+</span><span id="L-10"><a href="#L-10"><span class="linenos"> 10</span></a>
+</span><span id="L-11"><a href="#L-11"><span class="linenos"> 11</span></a><span class="n">ContrastiveLossType</span> <span class="o">=</span> <span class="n">Callable</span><span class="p">[[</span><span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">],</span> <span class="n">LossOutput</span><span class="p">]</span>
+</span><span id="L-12"><a href="#L-12"><span class="linenos"> 12</span></a><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="L-13"><a href="#L-13"><span class="linenos"> 13</span></a><span class="sd">Contrastive loss function type.</span>
+</span><span id="L-14"><a href="#L-14"><span class="linenos"> 14</span></a>
+</span><span id="L-15"><a href="#L-15"><span class="linenos"> 15</span></a><span class="sd">A function taking the prediction and targets and returning a LossOutput.</span>
+</span><span id="L-16"><a href="#L-16"><span class="linenos"> 16</span></a><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="L-17"><a href="#L-17"><span class="linenos"> 17</span></a>
+</span><span id="L-18"><a href="#L-18"><span class="linenos"> 18</span></a><span class="n">ContrastiveLossBayesianType</span> <span class="o">=</span> <span class="n">Callable</span><span class="p">[</span>
+</span><span id="L-19"><a href="#L-19"><span class="linenos"> 19</span></a>    <span class="p">[</span><span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">],</span> <span class="n">LossOutput</span>
+</span><span id="L-20"><a href="#L-20"><span class="linenos"> 20</span></a><span class="p">]</span>
+</span><span id="L-21"><a href="#L-21"><span class="linenos"> 21</span></a><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="L-22"><a href="#L-22"><span class="linenos"> 22</span></a><span class="sd">Contrastive loss function type for GlobalWorkspaceBayesian.</span>
+</span><span id="L-23"><a href="#L-23"><span class="linenos"> 23</span></a>
+</span><span id="L-24"><a href="#L-24"><span class="linenos"> 24</span></a><span class="sd">A function taking the prediction mean, prediction std, target mean and target std and</span>
+</span><span id="L-25"><a href="#L-25"><span class="linenos"> 25</span></a><span class="sd">    returns a LossOutput.</span>
+</span><span id="L-26"><a href="#L-26"><span class="linenos"> 26</span></a><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="L-27"><a href="#L-27"><span class="linenos"> 27</span></a>
+</span><span id="L-28"><a href="#L-28"><span class="linenos"> 28</span></a>
+</span><span id="L-29"><a href="#L-29"><span class="linenos"> 29</span></a><span class="k">def</span> <span class="nf">info_nce</span><span class="p">(</span>
+</span><span id="L-30"><a href="#L-30"><span class="linenos"> 30</span></a>    <span class="n">x</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">,</span>
+</span><span id="L-31"><a href="#L-31"><span class="linenos"> 31</span></a>    <span class="n">y</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">,</span>
+</span><span id="L-32"><a href="#L-32"><span class="linenos"> 32</span></a>    <span class="n">logit_scale</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">,</span>
+</span><span id="L-33"><a href="#L-33"><span class="linenos"> 33</span></a>    <span class="n">reduction</span><span class="p">:</span> <span class="n">Literal</span><span class="p">[</span><span class="s2">&quot;mean&quot;</span><span class="p">,</span> <span class="s2">&quot;sum&quot;</span><span class="p">,</span> <span class="s2">&quot;none&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="s2">&quot;mean&quot;</span><span class="p">,</span>
+</span><span id="L-34"><a href="#L-34"><span class="linenos"> 34</span></a><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">:</span>
+</span><span id="L-35"><a href="#L-35"><span class="linenos"> 35</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="L-36"><a href="#L-36"><span class="linenos"> 36</span></a><span class="sd">    InfoNCE loss</span>
+</span><span id="L-37"><a href="#L-37"><span class="linenos"> 37</span></a>
+</span><span id="L-38"><a href="#L-38"><span class="linenos"> 38</span></a><span class="sd">    Args:</span>
+</span><span id="L-39"><a href="#L-39"><span class="linenos"> 39</span></a><span class="sd">        x (`torch.Tensor`): prediction</span>
+</span><span id="L-40"><a href="#L-40"><span class="linenos"> 40</span></a><span class="sd">        y (`torch.Tensor`): target</span>
+</span><span id="L-41"><a href="#L-41"><span class="linenos"> 41</span></a><span class="sd">        logit_scale (`torch.Tensor`): logit scale</span>
+</span><span id="L-42"><a href="#L-42"><span class="linenos"> 42</span></a><span class="sd">        reduction (`Literal[&quot;mean&quot;, &quot;sum&quot;, &quot;none&quot;]`): reduction to apply</span>
+</span><span id="L-43"><a href="#L-43"><span class="linenos"> 43</span></a>
+</span><span id="L-44"><a href="#L-44"><span class="linenos"> 44</span></a><span class="sd">    Returns: the InfoNCE loss</span>
+</span><span id="L-45"><a href="#L-45"><span class="linenos"> 45</span></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="L-46"><a href="#L-46"><span class="linenos"> 46</span></a>    <span class="n">xn</span> <span class="o">=</span> <span class="n">normalize</span><span class="p">(</span><span class="n">x</span><span class="p">)</span>
+</span><span id="L-47"><a href="#L-47"><span class="linenos"> 47</span></a>    <span class="n">yn</span> <span class="o">=</span> <span class="n">normalize</span><span class="p">(</span><span class="n">y</span><span class="p">)</span>
+</span><span id="L-48"><a href="#L-48"><span class="linenos"> 48</span></a>    <span class="n">logits</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">clamp</span><span class="p">(</span><span class="n">logit_scale</span><span class="o">.</span><span class="n">exp</span><span class="p">(),</span> <span class="nb">max</span><span class="o">=</span><span class="mi">100</span><span class="p">)</span> <span class="o">*</span> <span class="n">xn</span> <span class="o">@</span> <span class="n">yn</span><span class="o">.</span><span class="n">t</span><span class="p">()</span>
+</span><span id="L-49"><a href="#L-49"><span class="linenos"> 49</span></a>    <span class="n">labels</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">arange</span><span class="p">(</span><span class="n">xn</span><span class="o">.</span><span class="n">size</span><span class="p">(</span><span class="mi">0</span><span class="p">))</span><span class="o">.</span><span class="n">to</span><span class="p">(</span><span class="n">logits</span><span class="o">.</span><span class="n">device</span><span class="p">)</span>
+</span><span id="L-50"><a href="#L-50"><span class="linenos"> 50</span></a>    <span class="k">return</span> <span class="n">cross_entropy</span><span class="p">(</span><span class="n">logits</span><span class="p">,</span> <span class="n">labels</span><span class="p">,</span> <span class="n">reduction</span><span class="o">=</span><span class="n">reduction</span><span class="p">)</span>
+</span><span id="L-51"><a href="#L-51"><span class="linenos"> 51</span></a>
+</span><span id="L-52"><a href="#L-52"><span class="linenos"> 52</span></a>
+</span><span id="L-53"><a href="#L-53"><span class="linenos"> 53</span></a><span class="k">def</span> <span class="nf">contrastive_loss</span><span class="p">(</span>
+</span><span id="L-54"><a href="#L-54"><span class="linenos"> 54</span></a>    <span class="n">x</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">,</span>
+</span><span id="L-55"><a href="#L-55"><span class="linenos"> 55</span></a>    <span class="n">y</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">,</span>
+</span><span id="L-56"><a href="#L-56"><span class="linenos"> 56</span></a>    <span class="n">logit_scale</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">,</span>
+</span><span id="L-57"><a href="#L-57"><span class="linenos"> 57</span></a>    <span class="n">reduction</span><span class="p">:</span> <span class="n">Literal</span><span class="p">[</span><span class="s2">&quot;mean&quot;</span><span class="p">,</span> <span class="s2">&quot;sum&quot;</span><span class="p">,</span> <span class="s2">&quot;none&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="s2">&quot;mean&quot;</span><span class="p">,</span>
+</span><span id="L-58"><a href="#L-58"><span class="linenos"> 58</span></a><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">:</span>
+</span><span id="L-59"><a href="#L-59"><span class="linenos"> 59</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="L-60"><a href="#L-60"><span class="linenos"> 60</span></a><span class="sd">    CLIP-like contrastive loss</span>
+</span><span id="L-61"><a href="#L-61"><span class="linenos"> 61</span></a>
+</span><span id="L-62"><a href="#L-62"><span class="linenos"> 62</span></a><span class="sd">    Args:</span>
+</span><span id="L-63"><a href="#L-63"><span class="linenos"> 63</span></a><span class="sd">        x (`torch.Tensor`): prediction</span>
+</span><span id="L-64"><a href="#L-64"><span class="linenos"> 64</span></a><span class="sd">        y (`torch.Tensor`): target</span>
+</span><span id="L-65"><a href="#L-65"><span class="linenos"> 65</span></a><span class="sd">        logit_scale (`torch.Tensor`): logit scale</span>
+</span><span id="L-66"><a href="#L-66"><span class="linenos"> 66</span></a><span class="sd">        reduction (`Literal[&quot;mean&quot;, &quot;sum&quot;, &quot;none&quot;]`): reduction to apply</span>
+</span><span id="L-67"><a href="#L-67"><span class="linenos"> 67</span></a>
+</span><span id="L-68"><a href="#L-68"><span class="linenos"> 68</span></a><span class="sd">    Returns: the contrastive loss</span>
+</span><span id="L-69"><a href="#L-69"><span class="linenos"> 69</span></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="L-70"><a href="#L-70"><span class="linenos"> 70</span></a>    <span class="n">xn</span> <span class="o">=</span> <span class="n">normalize</span><span class="p">(</span><span class="n">x</span><span class="p">)</span>
+</span><span id="L-71"><a href="#L-71"><span class="linenos"> 71</span></a>    <span class="n">yn</span> <span class="o">=</span> <span class="n">normalize</span><span class="p">(</span><span class="n">y</span><span class="p">)</span>
+</span><span id="L-72"><a href="#L-72"><span class="linenos"> 72</span></a>    <span class="n">logits</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">clamp</span><span class="p">(</span><span class="n">logit_scale</span><span class="o">.</span><span class="n">exp</span><span class="p">(),</span> <span class="nb">max</span><span class="o">=</span><span class="mi">100</span><span class="p">)</span> <span class="o">*</span> <span class="n">xn</span> <span class="o">@</span> <span class="n">yn</span><span class="o">.</span><span class="n">t</span><span class="p">()</span>
+</span><span id="L-73"><a href="#L-73"><span class="linenos"> 73</span></a>    <span class="n">labels</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">arange</span><span class="p">(</span><span class="n">xn</span><span class="o">.</span><span class="n">size</span><span class="p">(</span><span class="mi">0</span><span class="p">))</span><span class="o">.</span><span class="n">to</span><span class="p">(</span><span class="n">logits</span><span class="o">.</span><span class="n">device</span><span class="p">)</span>
+</span><span id="L-74"><a href="#L-74"><span class="linenos"> 74</span></a>    <span class="n">ce</span> <span class="o">=</span> <span class="n">cross_entropy</span><span class="p">(</span><span class="n">logits</span><span class="p">,</span> <span class="n">labels</span><span class="p">,</span> <span class="n">reduction</span><span class="o">=</span><span class="n">reduction</span><span class="p">)</span>
+</span><span id="L-75"><a href="#L-75"><span class="linenos"> 75</span></a>    <span class="n">ce_t</span> <span class="o">=</span> <span class="n">cross_entropy</span><span class="p">(</span><span class="n">logits</span><span class="o">.</span><span class="n">t</span><span class="p">(),</span> <span class="n">labels</span><span class="p">,</span> <span class="n">reduction</span><span class="o">=</span><span class="n">reduction</span><span class="p">)</span>
+</span><span id="L-76"><a href="#L-76"><span class="linenos"> 76</span></a>    <span class="k">return</span> <span class="mf">0.5</span> <span class="o">*</span> <span class="p">(</span><span class="n">ce</span> <span class="o">+</span> <span class="n">ce_t</span><span class="p">)</span>
+</span><span id="L-77"><a href="#L-77"><span class="linenos"> 77</span></a>
+</span><span id="L-78"><a href="#L-78"><span class="linenos"> 78</span></a>
+</span><span id="L-79"><a href="#L-79"><span class="linenos"> 79</span></a><span class="k">class</span> <span class="nc">ContrastiveLoss</span><span class="p">(</span><span class="n">torch</span><span class="o">.</span><span class="n">nn</span><span class="o">.</span><span class="n">Module</span><span class="p">):</span>
+</span><span id="L-80"><a href="#L-80"><span class="linenos"> 80</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;CLIP-like ContrastiveLoss torch module.&quot;&quot;&quot;</span>
+</span><span id="L-81"><a href="#L-81"><span class="linenos"> 81</span></a>
+</span><span id="L-82"><a href="#L-82"><span class="linenos"> 82</span></a>    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span>
+</span><span id="L-83"><a href="#L-83"><span class="linenos"> 83</span></a>        <span class="bp">self</span><span class="p">,</span>
+</span><span id="L-84"><a href="#L-84"><span class="linenos"> 84</span></a>        <span class="n">logit_scale</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">,</span>
+</span><span id="L-85"><a href="#L-85"><span class="linenos"> 85</span></a>        <span class="n">reduction</span><span class="p">:</span> <span class="n">Literal</span><span class="p">[</span><span class="s2">&quot;mean&quot;</span><span class="p">,</span> <span class="s2">&quot;sum&quot;</span><span class="p">,</span> <span class="s2">&quot;none&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="s2">&quot;mean&quot;</span><span class="p">,</span>
+</span><span id="L-86"><a href="#L-86"><span class="linenos"> 86</span></a>        <span class="n">learn_logit_scale</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">False</span><span class="p">,</span>
+</span><span id="L-87"><a href="#L-87"><span class="linenos"> 87</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="L-88"><a href="#L-88"><span class="linenos"> 88</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="L-89"><a href="#L-89"><span class="linenos"> 89</span></a><span class="sd">        Initializes a contrastive loss.</span>
+</span><span id="L-90"><a href="#L-90"><span class="linenos"> 90</span></a>
+</span><span id="L-91"><a href="#L-91"><span class="linenos"> 91</span></a><span class="sd">        Args:</span>
+</span><span id="L-92"><a href="#L-92"><span class="linenos"> 92</span></a><span class="sd">            logit_scale (`torch.Tensor`): logit_scale tensor.</span>
+</span><span id="L-93"><a href="#L-93"><span class="linenos"> 93</span></a><span class="sd">            reduction (`Literal[&quot;mean&quot;, &quot;sum&quot;, &quot;none&quot;]`): reduction to apply to the</span>
+</span><span id="L-94"><a href="#L-94"><span class="linenos"> 94</span></a><span class="sd">                loss. Defaults to `&quot;mean&quot;`.</span>
+</span><span id="L-95"><a href="#L-95"><span class="linenos"> 95</span></a><span class="sd">            learn_logit_scale (`torch.Tensor`): whether to learn the `logit_scale`</span>
+</span><span id="L-96"><a href="#L-96"><span class="linenos"> 96</span></a><span class="sd">                parameter. Defaults to `False`.</span>
+</span><span id="L-97"><a href="#L-97"><span class="linenos"> 97</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="L-98"><a href="#L-98"><span class="linenos"> 98</span></a>        <span class="nb">super</span><span class="p">()</span><span class="o">.</span><span class="fm">__init__</span><span class="p">()</span>
+</span><span id="L-99"><a href="#L-99"><span class="linenos"> 99</span></a>
+</span><span id="L-100"><a href="#L-100"><span class="linenos">100</span></a>        <span class="k">if</span> <span class="n">learn_logit_scale</span><span class="p">:</span>
+</span><span id="L-101"><a href="#L-101"><span class="linenos">101</span></a>            <span class="bp">self</span><span class="o">.</span><span class="n">logit_scale</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">nn</span><span class="o">.</span><span class="n">Parameter</span><span class="p">(</span><span class="n">logit_scale</span><span class="p">)</span>
+</span><span id="L-102"><a href="#L-102"><span class="linenos">102</span></a>        <span class="k">else</span><span class="p">:</span>
+</span><span id="L-103"><a href="#L-103"><span class="linenos">103</span></a>            <span class="bp">self</span><span class="o">.</span><span class="n">register_buffer</span><span class="p">(</span><span class="s2">&quot;logit_scale&quot;</span><span class="p">,</span> <span class="n">logit_scale</span><span class="p">)</span>
+</span><span id="L-104"><a href="#L-104"><span class="linenos">104</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">learn_logit_scale</span> <span class="o">=</span> <span class="n">learn_logit_scale</span>
+</span><span id="L-105"><a href="#L-105"><span class="linenos">105</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">reduction</span><span class="p">:</span> <span class="n">Literal</span><span class="p">[</span><span class="s2">&quot;mean&quot;</span><span class="p">,</span> <span class="s2">&quot;sum&quot;</span><span class="p">,</span> <span class="s2">&quot;none&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="n">reduction</span>
+</span><span id="L-106"><a href="#L-106"><span class="linenos">106</span></a>
+</span><span id="L-107"><a href="#L-107"><span class="linenos">107</span></a>    <span class="k">def</span> <span class="nf">forward</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">x</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">,</span> <span class="n">y</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">LossOutput</span><span class="p">:</span>
+</span><span id="L-108"><a href="#L-108"><span class="linenos">108</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="L-109"><a href="#L-109"><span class="linenos">109</span></a><span class="sd">        Computes the loss.</span>
+</span><span id="L-110"><a href="#L-110"><span class="linenos">110</span></a>
+</span><span id="L-111"><a href="#L-111"><span class="linenos">111</span></a><span class="sd">        Args:</span>
+</span><span id="L-112"><a href="#L-112"><span class="linenos">112</span></a><span class="sd">            x (`torch.Tensor`): prediction</span>
+</span><span id="L-113"><a href="#L-113"><span class="linenos">113</span></a><span class="sd">            y (`torch.Tensor`): target</span>
+</span><span id="L-114"><a href="#L-114"><span class="linenos">114</span></a>
+</span><span id="L-115"><a href="#L-115"><span class="linenos">115</span></a><span class="sd">        Returns:</span>
+</span><span id="L-116"><a href="#L-116"><span class="linenos">116</span></a><span class="sd">            LossOutput of the loss. Contains a `logit_scale` metric.</span>
+</span><span id="L-117"><a href="#L-117"><span class="linenos">117</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="L-118"><a href="#L-118"><span class="linenos">118</span></a>        <span class="k">return</span> <span class="n">LossOutput</span><span class="p">(</span>
+</span><span id="L-119"><a href="#L-119"><span class="linenos">119</span></a>            <span class="n">contrastive_loss</span><span class="p">(</span><span class="n">x</span><span class="p">,</span> <span class="n">y</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">logit_scale</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">reduction</span><span class="p">),</span>
+</span><span id="L-120"><a href="#L-120"><span class="linenos">120</span></a>            <span class="p">{</span><span class="s2">&quot;logit_scale&quot;</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">logit_scale</span><span class="o">.</span><span class="n">exp</span><span class="p">()},</span>
+</span><span id="L-121"><a href="#L-121"><span class="linenos">121</span></a>        <span class="p">)</span>
+</span></pre></div>
+
+
+            </section>
+                <section id="ContrastiveLossType">
+                    <div class="attr variable">
+            <span class="name">ContrastiveLossType</span>        =
+<span class="default_value">collections.abc.Callable[[torch.Tensor, torch.Tensor], <a href="domain.html#LossOutput">shimmer.modules.domain.LossOutput</a>]</span>
+
+        
+    </div>
+    <a class="headerlink" href="#ContrastiveLossType"></a>
+    
+            <div class="docstring"><p>Contrastive loss function type.</p>
+
+<p>A function taking the prediction and targets and returning a LossOutput.</p>
+</div>
+
+
+                </section>
+                <section id="ContrastiveLossBayesianType">
+                    <div class="attr variable">
+            <span class="name">ContrastiveLossBayesianType</span>        =
+<input id="ContrastiveLossBayesianType-view-value" class="view-value-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
+            <label class="view-value-button pdoc-button" for="ContrastiveLossBayesianType-view-value"></label><span class="default_value">collections.abc.Callable[[torch.Tensor, torch.Tensor, torch.Tensor, torch.Tensor], <a href="domain.html#LossOutput">shimmer.modules.domain.LossOutput</a>]</span>
+
+        
+    </div>
+    <a class="headerlink" href="#ContrastiveLossBayesianType"></a>
+    
+            <div class="docstring"><p>Contrastive loss function type for GlobalWorkspaceBayesian.</p>
+
+<p>A function taking the prediction mean, prediction std, target mean and target std and
+    returns a LossOutput.</p>
+</div>
+
+
+                </section>
+                <section id="info_nce">
+                            <input id="info_nce-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
+<div class="attr function">
+            
+        <span class="def">def</span>
+        <span class="name">info_nce</span><span class="signature pdoc-code multiline">(<span class="param">	<span class="n">x</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span>,</span><span class="param">	<span class="n">y</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span>,</span><span class="param">	<span class="n">logit_scale</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span>,</span><span class="param">	<span class="n">reduction</span><span class="p">:</span> <span class="n">Literal</span><span class="p">[</span><span class="s1">&#39;mean&#39;</span><span class="p">,</span> <span class="s1">&#39;sum&#39;</span><span class="p">,</span> <span class="s1">&#39;none&#39;</span><span class="p">]</span> <span class="o">=</span> <span class="s1">&#39;mean&#39;</span></span><span class="return-annotation">) -> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span>:</span></span>
+
+                <label class="view-source-button" for="info_nce-view-source"><span>View Source</span></label>
+
+    </div>
+    <a class="headerlink" href="#info_nce"></a>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="info_nce-30"><a href="#info_nce-30"><span class="linenos">30</span></a><span class="k">def</span> <span class="nf">info_nce</span><span class="p">(</span>
+</span><span id="info_nce-31"><a href="#info_nce-31"><span class="linenos">31</span></a>    <span class="n">x</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">,</span>
+</span><span id="info_nce-32"><a href="#info_nce-32"><span class="linenos">32</span></a>    <span class="n">y</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">,</span>
+</span><span id="info_nce-33"><a href="#info_nce-33"><span class="linenos">33</span></a>    <span class="n">logit_scale</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">,</span>
+</span><span id="info_nce-34"><a href="#info_nce-34"><span class="linenos">34</span></a>    <span class="n">reduction</span><span class="p">:</span> <span class="n">Literal</span><span class="p">[</span><span class="s2">&quot;mean&quot;</span><span class="p">,</span> <span class="s2">&quot;sum&quot;</span><span class="p">,</span> <span class="s2">&quot;none&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="s2">&quot;mean&quot;</span><span class="p">,</span>
+</span><span id="info_nce-35"><a href="#info_nce-35"><span class="linenos">35</span></a><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">:</span>
+</span><span id="info_nce-36"><a href="#info_nce-36"><span class="linenos">36</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="info_nce-37"><a href="#info_nce-37"><span class="linenos">37</span></a><span class="sd">    InfoNCE loss</span>
+</span><span id="info_nce-38"><a href="#info_nce-38"><span class="linenos">38</span></a>
+</span><span id="info_nce-39"><a href="#info_nce-39"><span class="linenos">39</span></a><span class="sd">    Args:</span>
+</span><span id="info_nce-40"><a href="#info_nce-40"><span class="linenos">40</span></a><span class="sd">        x (`torch.Tensor`): prediction</span>
+</span><span id="info_nce-41"><a href="#info_nce-41"><span class="linenos">41</span></a><span class="sd">        y (`torch.Tensor`): target</span>
+</span><span id="info_nce-42"><a href="#info_nce-42"><span class="linenos">42</span></a><span class="sd">        logit_scale (`torch.Tensor`): logit scale</span>
+</span><span id="info_nce-43"><a href="#info_nce-43"><span class="linenos">43</span></a><span class="sd">        reduction (`Literal[&quot;mean&quot;, &quot;sum&quot;, &quot;none&quot;]`): reduction to apply</span>
+</span><span id="info_nce-44"><a href="#info_nce-44"><span class="linenos">44</span></a>
+</span><span id="info_nce-45"><a href="#info_nce-45"><span class="linenos">45</span></a><span class="sd">    Returns: the InfoNCE loss</span>
+</span><span id="info_nce-46"><a href="#info_nce-46"><span class="linenos">46</span></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="info_nce-47"><a href="#info_nce-47"><span class="linenos">47</span></a>    <span class="n">xn</span> <span class="o">=</span> <span class="n">normalize</span><span class="p">(</span><span class="n">x</span><span class="p">)</span>
+</span><span id="info_nce-48"><a href="#info_nce-48"><span class="linenos">48</span></a>    <span class="n">yn</span> <span class="o">=</span> <span class="n">normalize</span><span class="p">(</span><span class="n">y</span><span class="p">)</span>
+</span><span id="info_nce-49"><a href="#info_nce-49"><span class="linenos">49</span></a>    <span class="n">logits</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">clamp</span><span class="p">(</span><span class="n">logit_scale</span><span class="o">.</span><span class="n">exp</span><span class="p">(),</span> <span class="nb">max</span><span class="o">=</span><span class="mi">100</span><span class="p">)</span> <span class="o">*</span> <span class="n">xn</span> <span class="o">@</span> <span class="n">yn</span><span class="o">.</span><span class="n">t</span><span class="p">()</span>
+</span><span id="info_nce-50"><a href="#info_nce-50"><span class="linenos">50</span></a>    <span class="n">labels</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">arange</span><span class="p">(</span><span class="n">xn</span><span class="o">.</span><span class="n">size</span><span class="p">(</span><span class="mi">0</span><span class="p">))</span><span class="o">.</span><span class="n">to</span><span class="p">(</span><span class="n">logits</span><span class="o">.</span><span class="n">device</span><span class="p">)</span>
+</span><span id="info_nce-51"><a href="#info_nce-51"><span class="linenos">51</span></a>    <span class="k">return</span> <span class="n">cross_entropy</span><span class="p">(</span><span class="n">logits</span><span class="p">,</span> <span class="n">labels</span><span class="p">,</span> <span class="n">reduction</span><span class="o">=</span><span class="n">reduction</span><span class="p">)</span>
+</span></pre></div>
+
+
+            <div class="docstring"><p>InfoNCE loss</p>
+
+<h6 id="arguments">Arguments:</h6>
+
+<ul>
+<li><strong>x (<code>torch.Tensor</code>):</strong>  prediction</li>
+<li><strong>y (<code>torch.Tensor</code>):</strong>  target</li>
+<li><strong>logit_scale (<code>torch.Tensor</code>):</strong>  logit scale</li>
+<li><strong>reduction (<code>Literal["mean", "sum", "none"]</code>):</strong>  reduction to apply</li>
+</ul>
+
+<p>Returns: the InfoNCE loss</p>
+</div>
+
+
+                </section>
+                <section id="contrastive_loss">
+                            <input id="contrastive_loss-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
+<div class="attr function">
+            
+        <span class="def">def</span>
+        <span class="name">contrastive_loss</span><span class="signature pdoc-code multiline">(<span class="param">	<span class="n">x</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span>,</span><span class="param">	<span class="n">y</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span>,</span><span class="param">	<span class="n">logit_scale</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span>,</span><span class="param">	<span class="n">reduction</span><span class="p">:</span> <span class="n">Literal</span><span class="p">[</span><span class="s1">&#39;mean&#39;</span><span class="p">,</span> <span class="s1">&#39;sum&#39;</span><span class="p">,</span> <span class="s1">&#39;none&#39;</span><span class="p">]</span> <span class="o">=</span> <span class="s1">&#39;mean&#39;</span></span><span class="return-annotation">) -> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span>:</span></span>
+
+                <label class="view-source-button" for="contrastive_loss-view-source"><span>View Source</span></label>
+
+    </div>
+    <a class="headerlink" href="#contrastive_loss"></a>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="contrastive_loss-54"><a href="#contrastive_loss-54"><span class="linenos">54</span></a><span class="k">def</span> <span class="nf">contrastive_loss</span><span class="p">(</span>
+</span><span id="contrastive_loss-55"><a href="#contrastive_loss-55"><span class="linenos">55</span></a>    <span class="n">x</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">,</span>
+</span><span id="contrastive_loss-56"><a href="#contrastive_loss-56"><span class="linenos">56</span></a>    <span class="n">y</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">,</span>
+</span><span id="contrastive_loss-57"><a href="#contrastive_loss-57"><span class="linenos">57</span></a>    <span class="n">logit_scale</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">,</span>
+</span><span id="contrastive_loss-58"><a href="#contrastive_loss-58"><span class="linenos">58</span></a>    <span class="n">reduction</span><span class="p">:</span> <span class="n">Literal</span><span class="p">[</span><span class="s2">&quot;mean&quot;</span><span class="p">,</span> <span class="s2">&quot;sum&quot;</span><span class="p">,</span> <span class="s2">&quot;none&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="s2">&quot;mean&quot;</span><span class="p">,</span>
+</span><span id="contrastive_loss-59"><a href="#contrastive_loss-59"><span class="linenos">59</span></a><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">:</span>
+</span><span id="contrastive_loss-60"><a href="#contrastive_loss-60"><span class="linenos">60</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="contrastive_loss-61"><a href="#contrastive_loss-61"><span class="linenos">61</span></a><span class="sd">    CLIP-like contrastive loss</span>
+</span><span id="contrastive_loss-62"><a href="#contrastive_loss-62"><span class="linenos">62</span></a>
+</span><span id="contrastive_loss-63"><a href="#contrastive_loss-63"><span class="linenos">63</span></a><span class="sd">    Args:</span>
+</span><span id="contrastive_loss-64"><a href="#contrastive_loss-64"><span class="linenos">64</span></a><span class="sd">        x (`torch.Tensor`): prediction</span>
+</span><span id="contrastive_loss-65"><a href="#contrastive_loss-65"><span class="linenos">65</span></a><span class="sd">        y (`torch.Tensor`): target</span>
+</span><span id="contrastive_loss-66"><a href="#contrastive_loss-66"><span class="linenos">66</span></a><span class="sd">        logit_scale (`torch.Tensor`): logit scale</span>
+</span><span id="contrastive_loss-67"><a href="#contrastive_loss-67"><span class="linenos">67</span></a><span class="sd">        reduction (`Literal[&quot;mean&quot;, &quot;sum&quot;, &quot;none&quot;]`): reduction to apply</span>
+</span><span id="contrastive_loss-68"><a href="#contrastive_loss-68"><span class="linenos">68</span></a>
+</span><span id="contrastive_loss-69"><a href="#contrastive_loss-69"><span class="linenos">69</span></a><span class="sd">    Returns: the contrastive loss</span>
+</span><span id="contrastive_loss-70"><a href="#contrastive_loss-70"><span class="linenos">70</span></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="contrastive_loss-71"><a href="#contrastive_loss-71"><span class="linenos">71</span></a>    <span class="n">xn</span> <span class="o">=</span> <span class="n">normalize</span><span class="p">(</span><span class="n">x</span><span class="p">)</span>
+</span><span id="contrastive_loss-72"><a href="#contrastive_loss-72"><span class="linenos">72</span></a>    <span class="n">yn</span> <span class="o">=</span> <span class="n">normalize</span><span class="p">(</span><span class="n">y</span><span class="p">)</span>
+</span><span id="contrastive_loss-73"><a href="#contrastive_loss-73"><span class="linenos">73</span></a>    <span class="n">logits</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">clamp</span><span class="p">(</span><span class="n">logit_scale</span><span class="o">.</span><span class="n">exp</span><span class="p">(),</span> <span class="nb">max</span><span class="o">=</span><span class="mi">100</span><span class="p">)</span> <span class="o">*</span> <span class="n">xn</span> <span class="o">@</span> <span class="n">yn</span><span class="o">.</span><span class="n">t</span><span class="p">()</span>
+</span><span id="contrastive_loss-74"><a href="#contrastive_loss-74"><span class="linenos">74</span></a>    <span class="n">labels</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">arange</span><span class="p">(</span><span class="n">xn</span><span class="o">.</span><span class="n">size</span><span class="p">(</span><span class="mi">0</span><span class="p">))</span><span class="o">.</span><span class="n">to</span><span class="p">(</span><span class="n">logits</span><span class="o">.</span><span class="n">device</span><span class="p">)</span>
+</span><span id="contrastive_loss-75"><a href="#contrastive_loss-75"><span class="linenos">75</span></a>    <span class="n">ce</span> <span class="o">=</span> <span class="n">cross_entropy</span><span class="p">(</span><span class="n">logits</span><span class="p">,</span> <span class="n">labels</span><span class="p">,</span> <span class="n">reduction</span><span class="o">=</span><span class="n">reduction</span><span class="p">)</span>
+</span><span id="contrastive_loss-76"><a href="#contrastive_loss-76"><span class="linenos">76</span></a>    <span class="n">ce_t</span> <span class="o">=</span> <span class="n">cross_entropy</span><span class="p">(</span><span class="n">logits</span><span class="o">.</span><span class="n">t</span><span class="p">(),</span> <span class="n">labels</span><span class="p">,</span> <span class="n">reduction</span><span class="o">=</span><span class="n">reduction</span><span class="p">)</span>
+</span><span id="contrastive_loss-77"><a href="#contrastive_loss-77"><span class="linenos">77</span></a>    <span class="k">return</span> <span class="mf">0.5</span> <span class="o">*</span> <span class="p">(</span><span class="n">ce</span> <span class="o">+</span> <span class="n">ce_t</span><span class="p">)</span>
+</span></pre></div>
+
+
+            <div class="docstring"><p>CLIP-like contrastive loss</p>
+
+<h6 id="arguments">Arguments:</h6>
+
+<ul>
+<li><strong>x (<code>torch.Tensor</code>):</strong>  prediction</li>
+<li><strong>y (<code>torch.Tensor</code>):</strong>  target</li>
+<li><strong>logit_scale (<code>torch.Tensor</code>):</strong>  logit scale</li>
+<li><strong>reduction (<code>Literal["mean", "sum", "none"]</code>):</strong>  reduction to apply</li>
+</ul>
+
+<p>Returns: the contrastive loss</p>
+</div>
+
+
+                </section>
+                <section id="ContrastiveLoss">
+                            <input id="ContrastiveLoss-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
+<div class="attr class">
+            
+    <span class="def">class</span>
+    <span class="name">ContrastiveLoss</span><wbr>(<span class="base">torch.nn.modules.module.Module</span>):
+
+                <label class="view-source-button" for="ContrastiveLoss-view-source"><span>View Source</span></label>
+
+    </div>
+    <a class="headerlink" href="#ContrastiveLoss"></a>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="ContrastiveLoss-80"><a href="#ContrastiveLoss-80"><span class="linenos"> 80</span></a><span class="k">class</span> <span class="nc">ContrastiveLoss</span><span class="p">(</span><span class="n">torch</span><span class="o">.</span><span class="n">nn</span><span class="o">.</span><span class="n">Module</span><span class="p">):</span>
+</span><span id="ContrastiveLoss-81"><a href="#ContrastiveLoss-81"><span class="linenos"> 81</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;CLIP-like ContrastiveLoss torch module.&quot;&quot;&quot;</span>
+</span><span id="ContrastiveLoss-82"><a href="#ContrastiveLoss-82"><span class="linenos"> 82</span></a>
+</span><span id="ContrastiveLoss-83"><a href="#ContrastiveLoss-83"><span class="linenos"> 83</span></a>    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span>
+</span><span id="ContrastiveLoss-84"><a href="#ContrastiveLoss-84"><span class="linenos"> 84</span></a>        <span class="bp">self</span><span class="p">,</span>
+</span><span id="ContrastiveLoss-85"><a href="#ContrastiveLoss-85"><span class="linenos"> 85</span></a>        <span class="n">logit_scale</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">,</span>
+</span><span id="ContrastiveLoss-86"><a href="#ContrastiveLoss-86"><span class="linenos"> 86</span></a>        <span class="n">reduction</span><span class="p">:</span> <span class="n">Literal</span><span class="p">[</span><span class="s2">&quot;mean&quot;</span><span class="p">,</span> <span class="s2">&quot;sum&quot;</span><span class="p">,</span> <span class="s2">&quot;none&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="s2">&quot;mean&quot;</span><span class="p">,</span>
+</span><span id="ContrastiveLoss-87"><a href="#ContrastiveLoss-87"><span class="linenos"> 87</span></a>        <span class="n">learn_logit_scale</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">False</span><span class="p">,</span>
+</span><span id="ContrastiveLoss-88"><a href="#ContrastiveLoss-88"><span class="linenos"> 88</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="ContrastiveLoss-89"><a href="#ContrastiveLoss-89"><span class="linenos"> 89</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="ContrastiveLoss-90"><a href="#ContrastiveLoss-90"><span class="linenos"> 90</span></a><span class="sd">        Initializes a contrastive loss.</span>
+</span><span id="ContrastiveLoss-91"><a href="#ContrastiveLoss-91"><span class="linenos"> 91</span></a>
+</span><span id="ContrastiveLoss-92"><a href="#ContrastiveLoss-92"><span class="linenos"> 92</span></a><span class="sd">        Args:</span>
+</span><span id="ContrastiveLoss-93"><a href="#ContrastiveLoss-93"><span class="linenos"> 93</span></a><span class="sd">            logit_scale (`torch.Tensor`): logit_scale tensor.</span>
+</span><span id="ContrastiveLoss-94"><a href="#ContrastiveLoss-94"><span class="linenos"> 94</span></a><span class="sd">            reduction (`Literal[&quot;mean&quot;, &quot;sum&quot;, &quot;none&quot;]`): reduction to apply to the</span>
+</span><span id="ContrastiveLoss-95"><a href="#ContrastiveLoss-95"><span class="linenos"> 95</span></a><span class="sd">                loss. Defaults to `&quot;mean&quot;`.</span>
+</span><span id="ContrastiveLoss-96"><a href="#ContrastiveLoss-96"><span class="linenos"> 96</span></a><span class="sd">            learn_logit_scale (`torch.Tensor`): whether to learn the `logit_scale`</span>
+</span><span id="ContrastiveLoss-97"><a href="#ContrastiveLoss-97"><span class="linenos"> 97</span></a><span class="sd">                parameter. Defaults to `False`.</span>
+</span><span id="ContrastiveLoss-98"><a href="#ContrastiveLoss-98"><span class="linenos"> 98</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="ContrastiveLoss-99"><a href="#ContrastiveLoss-99"><span class="linenos"> 99</span></a>        <span class="nb">super</span><span class="p">()</span><span class="o">.</span><span class="fm">__init__</span><span class="p">()</span>
+</span><span id="ContrastiveLoss-100"><a href="#ContrastiveLoss-100"><span class="linenos">100</span></a>
+</span><span id="ContrastiveLoss-101"><a href="#ContrastiveLoss-101"><span class="linenos">101</span></a>        <span class="k">if</span> <span class="n">learn_logit_scale</span><span class="p">:</span>
+</span><span id="ContrastiveLoss-102"><a href="#ContrastiveLoss-102"><span class="linenos">102</span></a>            <span class="bp">self</span><span class="o">.</span><span class="n">logit_scale</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">nn</span><span class="o">.</span><span class="n">Parameter</span><span class="p">(</span><span class="n">logit_scale</span><span class="p">)</span>
+</span><span id="ContrastiveLoss-103"><a href="#ContrastiveLoss-103"><span class="linenos">103</span></a>        <span class="k">else</span><span class="p">:</span>
+</span><span id="ContrastiveLoss-104"><a href="#ContrastiveLoss-104"><span class="linenos">104</span></a>            <span class="bp">self</span><span class="o">.</span><span class="n">register_buffer</span><span class="p">(</span><span class="s2">&quot;logit_scale&quot;</span><span class="p">,</span> <span class="n">logit_scale</span><span class="p">)</span>
+</span><span id="ContrastiveLoss-105"><a href="#ContrastiveLoss-105"><span class="linenos">105</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">learn_logit_scale</span> <span class="o">=</span> <span class="n">learn_logit_scale</span>
+</span><span id="ContrastiveLoss-106"><a href="#ContrastiveLoss-106"><span class="linenos">106</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">reduction</span><span class="p">:</span> <span class="n">Literal</span><span class="p">[</span><span class="s2">&quot;mean&quot;</span><span class="p">,</span> <span class="s2">&quot;sum&quot;</span><span class="p">,</span> <span class="s2">&quot;none&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="n">reduction</span>
+</span><span id="ContrastiveLoss-107"><a href="#ContrastiveLoss-107"><span class="linenos">107</span></a>
+</span><span id="ContrastiveLoss-108"><a href="#ContrastiveLoss-108"><span class="linenos">108</span></a>    <span class="k">def</span> <span class="nf">forward</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">x</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">,</span> <span class="n">y</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">LossOutput</span><span class="p">:</span>
+</span><span id="ContrastiveLoss-109"><a href="#ContrastiveLoss-109"><span class="linenos">109</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="ContrastiveLoss-110"><a href="#ContrastiveLoss-110"><span class="linenos">110</span></a><span class="sd">        Computes the loss.</span>
+</span><span id="ContrastiveLoss-111"><a href="#ContrastiveLoss-111"><span class="linenos">111</span></a>
+</span><span id="ContrastiveLoss-112"><a href="#ContrastiveLoss-112"><span class="linenos">112</span></a><span class="sd">        Args:</span>
+</span><span id="ContrastiveLoss-113"><a href="#ContrastiveLoss-113"><span class="linenos">113</span></a><span class="sd">            x (`torch.Tensor`): prediction</span>
+</span><span id="ContrastiveLoss-114"><a href="#ContrastiveLoss-114"><span class="linenos">114</span></a><span class="sd">            y (`torch.Tensor`): target</span>
+</span><span id="ContrastiveLoss-115"><a href="#ContrastiveLoss-115"><span class="linenos">115</span></a>
+</span><span id="ContrastiveLoss-116"><a href="#ContrastiveLoss-116"><span class="linenos">116</span></a><span class="sd">        Returns:</span>
+</span><span id="ContrastiveLoss-117"><a href="#ContrastiveLoss-117"><span class="linenos">117</span></a><span class="sd">            LossOutput of the loss. Contains a `logit_scale` metric.</span>
+</span><span id="ContrastiveLoss-118"><a href="#ContrastiveLoss-118"><span class="linenos">118</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="ContrastiveLoss-119"><a href="#ContrastiveLoss-119"><span class="linenos">119</span></a>        <span class="k">return</span> <span class="n">LossOutput</span><span class="p">(</span>
+</span><span id="ContrastiveLoss-120"><a href="#ContrastiveLoss-120"><span class="linenos">120</span></a>            <span class="n">contrastive_loss</span><span class="p">(</span><span class="n">x</span><span class="p">,</span> <span class="n">y</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">logit_scale</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">reduction</span><span class="p">),</span>
+</span><span id="ContrastiveLoss-121"><a href="#ContrastiveLoss-121"><span class="linenos">121</span></a>            <span class="p">{</span><span class="s2">&quot;logit_scale&quot;</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">logit_scale</span><span class="o">.</span><span class="n">exp</span><span class="p">()},</span>
+</span><span id="ContrastiveLoss-122"><a href="#ContrastiveLoss-122"><span class="linenos">122</span></a>        <span class="p">)</span>
+</span></pre></div>
+
+
+            <div class="docstring"><p>CLIP-like ContrastiveLoss torch module.</p>
+</div>
+
+
+                            <div id="ContrastiveLoss.__init__" class="classattr">
+                                        <input id="ContrastiveLoss.__init__-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
+<div class="attr function">
+            
+        <span class="name">ContrastiveLoss</span><span class="signature pdoc-code multiline">(<span class="param">	<span class="n">logit_scale</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span>,</span><span class="param">	<span class="n">reduction</span><span class="p">:</span> <span class="n">Literal</span><span class="p">[</span><span class="s1">&#39;mean&#39;</span><span class="p">,</span> <span class="s1">&#39;sum&#39;</span><span class="p">,</span> <span class="s1">&#39;none&#39;</span><span class="p">]</span> <span class="o">=</span> <span class="s1">&#39;mean&#39;</span>,</span><span class="param">	<span class="n">learn_logit_scale</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">False</span></span>)</span>
+
+                <label class="view-source-button" for="ContrastiveLoss.__init__-view-source"><span>View Source</span></label>
+
+    </div>
+    <a class="headerlink" href="#ContrastiveLoss.__init__"></a>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="ContrastiveLoss.__init__-83"><a href="#ContrastiveLoss.__init__-83"><span class="linenos"> 83</span></a>    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span>
+</span><span id="ContrastiveLoss.__init__-84"><a href="#ContrastiveLoss.__init__-84"><span class="linenos"> 84</span></a>        <span class="bp">self</span><span class="p">,</span>
+</span><span id="ContrastiveLoss.__init__-85"><a href="#ContrastiveLoss.__init__-85"><span class="linenos"> 85</span></a>        <span class="n">logit_scale</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">,</span>
+</span><span id="ContrastiveLoss.__init__-86"><a href="#ContrastiveLoss.__init__-86"><span class="linenos"> 86</span></a>        <span class="n">reduction</span><span class="p">:</span> <span class="n">Literal</span><span class="p">[</span><span class="s2">&quot;mean&quot;</span><span class="p">,</span> <span class="s2">&quot;sum&quot;</span><span class="p">,</span> <span class="s2">&quot;none&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="s2">&quot;mean&quot;</span><span class="p">,</span>
+</span><span id="ContrastiveLoss.__init__-87"><a href="#ContrastiveLoss.__init__-87"><span class="linenos"> 87</span></a>        <span class="n">learn_logit_scale</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">False</span><span class="p">,</span>
+</span><span id="ContrastiveLoss.__init__-88"><a href="#ContrastiveLoss.__init__-88"><span class="linenos"> 88</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="ContrastiveLoss.__init__-89"><a href="#ContrastiveLoss.__init__-89"><span class="linenos"> 89</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="ContrastiveLoss.__init__-90"><a href="#ContrastiveLoss.__init__-90"><span class="linenos"> 90</span></a><span class="sd">        Initializes a contrastive loss.</span>
+</span><span id="ContrastiveLoss.__init__-91"><a href="#ContrastiveLoss.__init__-91"><span class="linenos"> 91</span></a>
+</span><span id="ContrastiveLoss.__init__-92"><a href="#ContrastiveLoss.__init__-92"><span class="linenos"> 92</span></a><span class="sd">        Args:</span>
+</span><span id="ContrastiveLoss.__init__-93"><a href="#ContrastiveLoss.__init__-93"><span class="linenos"> 93</span></a><span class="sd">            logit_scale (`torch.Tensor`): logit_scale tensor.</span>
+</span><span id="ContrastiveLoss.__init__-94"><a href="#ContrastiveLoss.__init__-94"><span class="linenos"> 94</span></a><span class="sd">            reduction (`Literal[&quot;mean&quot;, &quot;sum&quot;, &quot;none&quot;]`): reduction to apply to the</span>
+</span><span id="ContrastiveLoss.__init__-95"><a href="#ContrastiveLoss.__init__-95"><span class="linenos"> 95</span></a><span class="sd">                loss. Defaults to `&quot;mean&quot;`.</span>
+</span><span id="ContrastiveLoss.__init__-96"><a href="#ContrastiveLoss.__init__-96"><span class="linenos"> 96</span></a><span class="sd">            learn_logit_scale (`torch.Tensor`): whether to learn the `logit_scale`</span>
+</span><span id="ContrastiveLoss.__init__-97"><a href="#ContrastiveLoss.__init__-97"><span class="linenos"> 97</span></a><span class="sd">                parameter. Defaults to `False`.</span>
+</span><span id="ContrastiveLoss.__init__-98"><a href="#ContrastiveLoss.__init__-98"><span class="linenos"> 98</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="ContrastiveLoss.__init__-99"><a href="#ContrastiveLoss.__init__-99"><span class="linenos"> 99</span></a>        <span class="nb">super</span><span class="p">()</span><span class="o">.</span><span class="fm">__init__</span><span class="p">()</span>
+</span><span id="ContrastiveLoss.__init__-100"><a href="#ContrastiveLoss.__init__-100"><span class="linenos">100</span></a>
+</span><span id="ContrastiveLoss.__init__-101"><a href="#ContrastiveLoss.__init__-101"><span class="linenos">101</span></a>        <span class="k">if</span> <span class="n">learn_logit_scale</span><span class="p">:</span>
+</span><span id="ContrastiveLoss.__init__-102"><a href="#ContrastiveLoss.__init__-102"><span class="linenos">102</span></a>            <span class="bp">self</span><span class="o">.</span><span class="n">logit_scale</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">nn</span><span class="o">.</span><span class="n">Parameter</span><span class="p">(</span><span class="n">logit_scale</span><span class="p">)</span>
+</span><span id="ContrastiveLoss.__init__-103"><a href="#ContrastiveLoss.__init__-103"><span class="linenos">103</span></a>        <span class="k">else</span><span class="p">:</span>
+</span><span id="ContrastiveLoss.__init__-104"><a href="#ContrastiveLoss.__init__-104"><span class="linenos">104</span></a>            <span class="bp">self</span><span class="o">.</span><span class="n">register_buffer</span><span class="p">(</span><span class="s2">&quot;logit_scale&quot;</span><span class="p">,</span> <span class="n">logit_scale</span><span class="p">)</span>
+</span><span id="ContrastiveLoss.__init__-105"><a href="#ContrastiveLoss.__init__-105"><span class="linenos">105</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">learn_logit_scale</span> <span class="o">=</span> <span class="n">learn_logit_scale</span>
+</span><span id="ContrastiveLoss.__init__-106"><a href="#ContrastiveLoss.__init__-106"><span class="linenos">106</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">reduction</span><span class="p">:</span> <span class="n">Literal</span><span class="p">[</span><span class="s2">&quot;mean&quot;</span><span class="p">,</span> <span class="s2">&quot;sum&quot;</span><span class="p">,</span> <span class="s2">&quot;none&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="n">reduction</span>
+</span></pre></div>
+
+
+            <div class="docstring"><p>Initializes a contrastive loss.</p>
+
+<h6 id="arguments">Arguments:</h6>
+
+<ul>
+<li><strong>logit_scale (<code>torch.Tensor</code>):</strong>  logit_scale tensor.</li>
+<li><strong>reduction (<code>Literal["mean", "sum", "none"]</code>):</strong>  reduction to apply to the
+loss. Defaults to <code>"mean"</code>.</li>
+<li><strong>learn_logit_scale (<code>torch.Tensor</code>):</strong>  whether to learn the <code>logit_scale</code>
+parameter. Defaults to <code>False</code>.</li>
+</ul>
+</div>
+
+
+                            </div>
+                            <div id="ContrastiveLoss.learn_logit_scale" class="classattr">
+                                <div class="attr variable">
+            <span class="name">learn_logit_scale</span>
+
+        
+    </div>
+    <a class="headerlink" href="#ContrastiveLoss.learn_logit_scale"></a>
+    
+    
+
+                            </div>
+                            <div id="ContrastiveLoss.reduction" class="classattr">
+                                <div class="attr variable">
+            <span class="name">reduction</span><span class="annotation">: Literal[&#39;mean&#39;, &#39;sum&#39;, &#39;none&#39;]</span>
+
+        
+    </div>
+    <a class="headerlink" href="#ContrastiveLoss.reduction"></a>
+    
+    
+
+                            </div>
+                            <div id="ContrastiveLoss.forward" class="classattr">
+                                        <input id="ContrastiveLoss.forward-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
+<div class="attr function">
+            
+        <span class="def">def</span>
+        <span class="name">forward</span><span class="signature pdoc-code multiline">(<span class="param">	<span class="bp">self</span>,</span><span class="param">	<span class="n">x</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span>,</span><span class="param">	<span class="n">y</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span></span><span class="return-annotation">) -> <span class="n"><a href="domain.html#LossOutput">shimmer.modules.domain.LossOutput</a></span>:</span></span>
+
+                <label class="view-source-button" for="ContrastiveLoss.forward-view-source"><span>View Source</span></label>
+
+    </div>
+    <a class="headerlink" href="#ContrastiveLoss.forward"></a>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="ContrastiveLoss.forward-108"><a href="#ContrastiveLoss.forward-108"><span class="linenos">108</span></a>    <span class="k">def</span> <span class="nf">forward</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">x</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">,</span> <span class="n">y</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">LossOutput</span><span class="p">:</span>
+</span><span id="ContrastiveLoss.forward-109"><a href="#ContrastiveLoss.forward-109"><span class="linenos">109</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="ContrastiveLoss.forward-110"><a href="#ContrastiveLoss.forward-110"><span class="linenos">110</span></a><span class="sd">        Computes the loss.</span>
+</span><span id="ContrastiveLoss.forward-111"><a href="#ContrastiveLoss.forward-111"><span class="linenos">111</span></a>
+</span><span id="ContrastiveLoss.forward-112"><a href="#ContrastiveLoss.forward-112"><span class="linenos">112</span></a><span class="sd">        Args:</span>
+</span><span id="ContrastiveLoss.forward-113"><a href="#ContrastiveLoss.forward-113"><span class="linenos">113</span></a><span class="sd">            x (`torch.Tensor`): prediction</span>
+</span><span id="ContrastiveLoss.forward-114"><a href="#ContrastiveLoss.forward-114"><span class="linenos">114</span></a><span class="sd">            y (`torch.Tensor`): target</span>
+</span><span id="ContrastiveLoss.forward-115"><a href="#ContrastiveLoss.forward-115"><span class="linenos">115</span></a>
+</span><span id="ContrastiveLoss.forward-116"><a href="#ContrastiveLoss.forward-116"><span class="linenos">116</span></a><span class="sd">        Returns:</span>
+</span><span id="ContrastiveLoss.forward-117"><a href="#ContrastiveLoss.forward-117"><span class="linenos">117</span></a><span class="sd">            LossOutput of the loss. Contains a `logit_scale` metric.</span>
+</span><span id="ContrastiveLoss.forward-118"><a href="#ContrastiveLoss.forward-118"><span class="linenos">118</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="ContrastiveLoss.forward-119"><a href="#ContrastiveLoss.forward-119"><span class="linenos">119</span></a>        <span class="k">return</span> <span class="n">LossOutput</span><span class="p">(</span>
+</span><span id="ContrastiveLoss.forward-120"><a href="#ContrastiveLoss.forward-120"><span class="linenos">120</span></a>            <span class="n">contrastive_loss</span><span class="p">(</span><span class="n">x</span><span class="p">,</span> <span class="n">y</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">logit_scale</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">reduction</span><span class="p">),</span>
+</span><span id="ContrastiveLoss.forward-121"><a href="#ContrastiveLoss.forward-121"><span class="linenos">121</span></a>            <span class="p">{</span><span class="s2">&quot;logit_scale&quot;</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">logit_scale</span><span class="o">.</span><span class="n">exp</span><span class="p">()},</span>
+</span><span id="ContrastiveLoss.forward-122"><a href="#ContrastiveLoss.forward-122"><span class="linenos">122</span></a>        <span class="p">)</span>
+</span></pre></div>
+
+
+            <div class="docstring"><p>Computes the loss.</p>
+
+<h6 id="arguments">Arguments:</h6>
+
+<ul>
+<li><strong>x (<code>torch.Tensor</code>):</strong>  prediction</li>
+<li><strong>y (<code>torch.Tensor</code>):</strong>  target</li>
+</ul>
+
+<h6 id="returns">Returns:</h6>
+
+<blockquote>
+  <p>LossOutput of the loss. Contains a <code>logit_scale</code> metric.</p>
+</blockquote>
+</div>
+
+
+                            </div>
+                            <div class="inherited">
+                                <h5>Inherited Members</h5>
+                                <dl>
+                                    <div><dt>torch.nn.modules.module.Module</dt>
+                                <dd id="ContrastiveLoss.dump_patches" class="variable">dump_patches</dd>
+                <dd id="ContrastiveLoss.training" class="variable">training</dd>
+                <dd id="ContrastiveLoss.call_super_init" class="variable">call_super_init</dd>
+                <dd id="ContrastiveLoss.register_buffer" class="function">register_buffer</dd>
+                <dd id="ContrastiveLoss.register_parameter" class="function">register_parameter</dd>
+                <dd id="ContrastiveLoss.add_module" class="function">add_module</dd>
+                <dd id="ContrastiveLoss.register_module" class="function">register_module</dd>
+                <dd id="ContrastiveLoss.get_submodule" class="function">get_submodule</dd>
+                <dd id="ContrastiveLoss.get_parameter" class="function">get_parameter</dd>
+                <dd id="ContrastiveLoss.get_buffer" class="function">get_buffer</dd>
+                <dd id="ContrastiveLoss.get_extra_state" class="function">get_extra_state</dd>
+                <dd id="ContrastiveLoss.set_extra_state" class="function">set_extra_state</dd>
+                <dd id="ContrastiveLoss.apply" class="function">apply</dd>
+                <dd id="ContrastiveLoss.cuda" class="function">cuda</dd>
+                <dd id="ContrastiveLoss.ipu" class="function">ipu</dd>
+                <dd id="ContrastiveLoss.xpu" class="function">xpu</dd>
+                <dd id="ContrastiveLoss.cpu" class="function">cpu</dd>
+                <dd id="ContrastiveLoss.type" class="function">type</dd>
+                <dd id="ContrastiveLoss.float" class="function">float</dd>
+                <dd id="ContrastiveLoss.double" class="function">double</dd>
+                <dd id="ContrastiveLoss.half" class="function">half</dd>
+                <dd id="ContrastiveLoss.bfloat16" class="function">bfloat16</dd>
+                <dd id="ContrastiveLoss.to_empty" class="function">to_empty</dd>
+                <dd id="ContrastiveLoss.to" class="function">to</dd>
+                <dd id="ContrastiveLoss.register_full_backward_pre_hook" class="function">register_full_backward_pre_hook</dd>
+                <dd id="ContrastiveLoss.register_backward_hook" class="function">register_backward_hook</dd>
+                <dd id="ContrastiveLoss.register_full_backward_hook" class="function">register_full_backward_hook</dd>
+                <dd id="ContrastiveLoss.register_forward_pre_hook" class="function">register_forward_pre_hook</dd>
+                <dd id="ContrastiveLoss.register_forward_hook" class="function">register_forward_hook</dd>
+                <dd id="ContrastiveLoss.register_state_dict_pre_hook" class="function">register_state_dict_pre_hook</dd>
+                <dd id="ContrastiveLoss.state_dict" class="function">state_dict</dd>
+                <dd id="ContrastiveLoss.register_load_state_dict_post_hook" class="function">register_load_state_dict_post_hook</dd>
+                <dd id="ContrastiveLoss.load_state_dict" class="function">load_state_dict</dd>
+                <dd id="ContrastiveLoss.parameters" class="function">parameters</dd>
+                <dd id="ContrastiveLoss.named_parameters" class="function">named_parameters</dd>
+                <dd id="ContrastiveLoss.buffers" class="function">buffers</dd>
+                <dd id="ContrastiveLoss.named_buffers" class="function">named_buffers</dd>
+                <dd id="ContrastiveLoss.children" class="function">children</dd>
+                <dd id="ContrastiveLoss.named_children" class="function">named_children</dd>
+                <dd id="ContrastiveLoss.modules" class="function">modules</dd>
+                <dd id="ContrastiveLoss.named_modules" class="function">named_modules</dd>
+                <dd id="ContrastiveLoss.train" class="function">train</dd>
+                <dd id="ContrastiveLoss.eval" class="function">eval</dd>
+                <dd id="ContrastiveLoss.requires_grad_" class="function">requires_grad_</dd>
+                <dd id="ContrastiveLoss.zero_grad" class="function">zero_grad</dd>
+                <dd id="ContrastiveLoss.share_memory" class="function">share_memory</dd>
+                <dd id="ContrastiveLoss.extra_repr" class="function">extra_repr</dd>
+                <dd id="ContrastiveLoss.compile" class="function">compile</dd>
+
+            </div>
+                                </dl>
+                            </div>
+                </section>
+    </main>
+<script>
+    function escapeHTML(html) {
+        return document.createElement('div').appendChild(document.createTextNode(html)).parentNode.innerHTML;
+    }
+
+    const originalContent = document.querySelector("main.pdoc");
+    let currentContent = originalContent;
+
+    function setContent(innerHTML) {
+        let elem;
+        if (innerHTML) {
+            elem = document.createElement("main");
+            elem.classList.add("pdoc");
+            elem.innerHTML = innerHTML;
+        } else {
+            elem = originalContent;
+        }
+        if (currentContent !== elem) {
+            currentContent.replaceWith(elem);
+            currentContent = elem;
+        }
+    }
+
+    function getSearchTerm() {
+        return (new URL(window.location)).searchParams.get("search");
+    }
+
+    const searchBox = document.querySelector(".pdoc input[type=search]");
+    searchBox.addEventListener("input", function () {
+        let url = new URL(window.location);
+        if (searchBox.value.trim()) {
+            url.hash = "";
+            url.searchParams.set("search", searchBox.value);
+        } else {
+            url.searchParams.delete("search");
+        }
+        history.replaceState("", "", url.toString());
+        onInput();
+    });
+    window.addEventListener("popstate", onInput);
+
+
+    let search, searchErr;
+
+    async function initialize() {
+        try {
+            search = await new Promise((resolve, reject) => {
+                const script = document.createElement("script");
+                script.type = "text/javascript";
+                script.async = true;
+                script.onload = () => resolve(window.pdocSearch);
+                script.onerror = (e) => reject(e);
+                script.src = "../../search.js";
+                document.getElementsByTagName("head")[0].appendChild(script);
+            });
+        } catch (e) {
+            console.error("Cannot fetch pdoc search index");
+            searchErr = "Cannot fetch search index.";
+        }
+        onInput();
+
+        document.querySelector("nav.pdoc").addEventListener("click", e => {
+            if (e.target.hash) {
+                searchBox.value = "";
+                searchBox.dispatchEvent(new Event("input"));
+            }
+        });
+    }
+
+    function onInput() {
+        setContent((() => {
+            const term = getSearchTerm();
+            if (!term) {
+                return null
+            }
+            if (searchErr) {
+                return `<h3>Error: ${searchErr}</h3>`
+            }
+            if (!search) {
+                return "<h3>Searching...</h3>"
+            }
+
+            window.scrollTo({top: 0, left: 0, behavior: 'auto'});
+
+            const results = search(term);
+
+            let html;
+            if (results.length === 0) {
+                html = `No search results for '${escapeHTML(term)}'.`
+            } else {
+                html = `<h4>${results.length} search result${results.length > 1 ? "s" : ""} for '${escapeHTML(term)}'.</h4>`;
+            }
+            for (let result of results.slice(0, 10)) {
+                let doc = result.doc;
+                let url = `../../${doc.modulename.replaceAll(".", "/")}.html`;
+                if (doc.qualname) {
+                    url += `#${doc.qualname}`;
+                }
+
+                let heading;
+                switch (result.doc.kind) {
+                    case "function":
+                        if (doc.fullname.endsWith(".__init__")) {
+                            heading = `<span class="name">${doc.fullname.replace(/\.__init__$/, "")}</span>${doc.signature}`;
+                        } else {
+                            heading = `<span class="def">${doc.funcdef}</span> <span class="name">${doc.fullname}</span>${doc.signature}`;
+                        }
+                        break;
+                    case "class":
+                        heading = `<span class="def">class</span> <span class="name">${doc.fullname}</span>`;
+                        if (doc.bases)
+                            heading += `<wbr>(<span class="base">${doc.bases}</span>)`;
+                        heading += `:`;
+                        break;
+                    case "variable":
+                        heading = `<span class="name">${doc.fullname}</span>`;
+                        if (doc.annotation)
+                            heading += `<span class="annotation">${doc.annotation}</span>`;
+                        if (doc.default_value)
+                            heading += `<span class="default_value"> = ${doc.default_value}</span>`;
+                        break;
+                    default:
+                        heading = `<span class="name">${doc.fullname}</span>`;
+                        break;
+                }
+                html += `
+                        <section class="search-result">
+                        <a href="${url}" class="attr ${doc.kind}">${heading}</a>
+                        <div class="docstring">${doc.doc}</div>
+                        </section>
+                    `;
+
+            }
+            return html;
+        })());
+    }
+
+    if (getSearchTerm()) {
+        initialize();
+        searchBox.value = getSearchTerm();
+        onInput();
+    } else {
+        searchBox.addEventListener("focus", initialize, {once: true});
+    }
+
+    searchBox.addEventListener("keydown", e => {
+        if (["ArrowDown", "ArrowUp", "Enter"].includes(e.key)) {
+            let focused = currentContent.querySelector(".search-result.focused");
+            if (!focused) {
+                currentContent.querySelector(".search-result").classList.add("focused");
+            } else if (
+                e.key === "ArrowDown"
+                && focused.nextElementSibling
+                && focused.nextElementSibling.classList.contains("search-result")
+            ) {
+                focused.classList.remove("focused");
+                focused.nextElementSibling.classList.add("focused");
+                focused.nextElementSibling.scrollIntoView({
+                    behavior: "smooth",
+                    block: "nearest",
+                    inline: "nearest"
+                });
+            } else if (
+                e.key === "ArrowUp"
+                && focused.previousElementSibling
+                && focused.previousElementSibling.classList.contains("search-result")
+            ) {
+                focused.classList.remove("focused");
+                focused.previousElementSibling.classList.add("focused");
+                focused.previousElementSibling.scrollIntoView({
+                    behavior: "smooth",
+                    block: "nearest",
+                    inline: "nearest"
+                });
+            } else if (
+                e.key === "Enter"
+            ) {
+                focused.querySelector("a").click();
+            }
+        }
+    });
+</script></body>
+</html>
\ No newline at end of file
diff --git a/docs/api/v0.5.1/shimmer/modules/domain.html b/docs/api/v0.5.1/shimmer/modules/domain.html
new file mode 100644
index 00000000..5462b500
--- /dev/null
+++ b/docs/api/v0.5.1/shimmer/modules/domain.html
@@ -0,0 +1,1220 @@
+<!doctype html>
+<html lang="en">
+<head>
+    <meta charset="utf-8">
+    <meta name="viewport" content="width=device-width, initial-scale=1">
+    <meta name="generator" content="pdoc 14.4.0"/>
+    <title>shimmer.modules.domain API documentation</title>
+
+    <style>/*! * Bootstrap Reboot v5.0.0 (https://getbootstrap.com/) * Copyright 2011-2021 The Bootstrap Authors * Copyright 2011-2021 Twitter, Inc. * Licensed under MIT (https://github.com/twbs/bootstrap/blob/main/LICENSE) * Forked from Normalize.css, licensed MIT (https://github.com/necolas/normalize.css/blob/master/LICENSE.md) */*,::after,::before{box-sizing:border-box}@media (prefers-reduced-motion:no-preference){:root{scroll-behavior:smooth}}body{margin:0;font-family:system-ui,-apple-system,"Segoe UI",Roboto,"Helvetica Neue",Arial,"Noto Sans","Liberation Sans",sans-serif,"Apple Color Emoji","Segoe UI Emoji","Segoe UI Symbol","Noto Color Emoji";font-size:1rem;font-weight:400;line-height:1.5;color:#212529;background-color:#fff;-webkit-text-size-adjust:100%;-webkit-tap-highlight-color:transparent}hr{margin:1rem 0;color:inherit;background-color:currentColor;border:0;opacity:.25}hr:not([size]){height:1px}h1,h2,h3,h4,h5,h6{margin-top:0;margin-bottom:.5rem;font-weight:500;line-height:1.2}h1{font-size:calc(1.375rem + 1.5vw)}@media (min-width:1200px){h1{font-size:2.5rem}}h2{font-size:calc(1.325rem + .9vw)}@media (min-width:1200px){h2{font-size:2rem}}h3{font-size:calc(1.3rem + .6vw)}@media (min-width:1200px){h3{font-size:1.75rem}}h4{font-size:calc(1.275rem + .3vw)}@media (min-width:1200px){h4{font-size:1.5rem}}h5{font-size:1.25rem}h6{font-size:1rem}p{margin-top:0;margin-bottom:1rem}abbr[data-bs-original-title],abbr[title]{-webkit-text-decoration:underline dotted;text-decoration:underline dotted;cursor:help;-webkit-text-decoration-skip-ink:none;text-decoration-skip-ink:none}address{margin-bottom:1rem;font-style:normal;line-height:inherit}ol,ul{padding-left:2rem}dl,ol,ul{margin-top:0;margin-bottom:1rem}ol ol,ol ul,ul ol,ul ul{margin-bottom:0}dt{font-weight:700}dd{margin-bottom:.5rem;margin-left:0}blockquote{margin:0 0 1rem}b,strong{font-weight:bolder}small{font-size:.875em}mark{padding:.2em;background-color:#fcf8e3}sub,sup{position:relative;font-size:.75em;line-height:0;vertical-align:baseline}sub{bottom:-.25em}sup{top:-.5em}a{color:#0d6efd;text-decoration:underline}a:hover{color:#0a58ca}a:not([href]):not([class]),a:not([href]):not([class]):hover{color:inherit;text-decoration:none}code,kbd,pre,samp{font-family:SFMono-Regular,Menlo,Monaco,Consolas,"Liberation Mono","Courier New",monospace;font-size:1em;direction:ltr;unicode-bidi:bidi-override}pre{display:block;margin-top:0;margin-bottom:1rem;overflow:auto;font-size:.875em}pre code{font-size:inherit;color:inherit;word-break:normal}code{font-size:.875em;color:#d63384;word-wrap:break-word}a>code{color:inherit}kbd{padding:.2rem .4rem;font-size:.875em;color:#fff;background-color:#212529;border-radius:.2rem}kbd kbd{padding:0;font-size:1em;font-weight:700}figure{margin:0 0 1rem}img,svg{vertical-align:middle}table{caption-side:bottom;border-collapse:collapse}caption{padding-top:.5rem;padding-bottom:.5rem;color:#6c757d;text-align:left}th{text-align:inherit;text-align:-webkit-match-parent}tbody,td,tfoot,th,thead,tr{border-color:inherit;border-style:solid;border-width:0}label{display:inline-block}button{border-radius:0}button:focus:not(:focus-visible){outline:0}button,input,optgroup,select,textarea{margin:0;font-family:inherit;font-size:inherit;line-height:inherit}button,select{text-transform:none}[role=button]{cursor:pointer}select{word-wrap:normal}select:disabled{opacity:1}[list]::-webkit-calendar-picker-indicator{display:none}[type=button],[type=reset],[type=submit],button{-webkit-appearance:button}[type=button]:not(:disabled),[type=reset]:not(:disabled),[type=submit]:not(:disabled),button:not(:disabled){cursor:pointer}::-moz-focus-inner{padding:0;border-style:none}textarea{resize:vertical}fieldset{min-width:0;padding:0;margin:0;border:0}legend{float:left;width:100%;padding:0;margin-bottom:.5rem;font-size:calc(1.275rem + .3vw);line-height:inherit}@media (min-width:1200px){legend{font-size:1.5rem}}legend+*{clear:left}::-webkit-datetime-edit-day-field,::-webkit-datetime-edit-fields-wrapper,::-webkit-datetime-edit-hour-field,::-webkit-datetime-edit-minute,::-webkit-datetime-edit-month-field,::-webkit-datetime-edit-text,::-webkit-datetime-edit-year-field{padding:0}::-webkit-inner-spin-button{height:auto}[type=search]{outline-offset:-2px;-webkit-appearance:textfield}::-webkit-search-decoration{-webkit-appearance:none}::-webkit-color-swatch-wrapper{padding:0}::file-selector-button{font:inherit}::-webkit-file-upload-button{font:inherit;-webkit-appearance:button}output{display:inline-block}iframe{border:0}summary{display:list-item;cursor:pointer}progress{vertical-align:baseline}[hidden]{display:none!important}</style>
+    <style>/*! syntax-highlighting.css */pre{line-height:125%;}span.linenos{color:inherit; background-color:transparent; padding-left:5px; padding-right:20px;}.pdoc-code .hll{background-color:#ffffcc}.pdoc-code{background:#f8f8f8;}.pdoc-code .c{color:#3D7B7B; font-style:italic}.pdoc-code .err{border:1px solid #FF0000}.pdoc-code .k{color:#008000; font-weight:bold}.pdoc-code .o{color:#666666}.pdoc-code .ch{color:#3D7B7B; font-style:italic}.pdoc-code .cm{color:#3D7B7B; font-style:italic}.pdoc-code .cp{color:#9C6500}.pdoc-code .cpf{color:#3D7B7B; font-style:italic}.pdoc-code .c1{color:#3D7B7B; font-style:italic}.pdoc-code .cs{color:#3D7B7B; font-style:italic}.pdoc-code .gd{color:#A00000}.pdoc-code .ge{font-style:italic}.pdoc-code .gr{color:#E40000}.pdoc-code .gh{color:#000080; font-weight:bold}.pdoc-code .gi{color:#008400}.pdoc-code .go{color:#717171}.pdoc-code .gp{color:#000080; font-weight:bold}.pdoc-code .gs{font-weight:bold}.pdoc-code .gu{color:#800080; font-weight:bold}.pdoc-code .gt{color:#0044DD}.pdoc-code .kc{color:#008000; font-weight:bold}.pdoc-code .kd{color:#008000; font-weight:bold}.pdoc-code .kn{color:#008000; font-weight:bold}.pdoc-code .kp{color:#008000}.pdoc-code .kr{color:#008000; font-weight:bold}.pdoc-code .kt{color:#B00040}.pdoc-code .m{color:#666666}.pdoc-code .s{color:#BA2121}.pdoc-code .na{color:#687822}.pdoc-code .nb{color:#008000}.pdoc-code .nc{color:#0000FF; font-weight:bold}.pdoc-code .no{color:#880000}.pdoc-code .nd{color:#AA22FF}.pdoc-code .ni{color:#717171; font-weight:bold}.pdoc-code .ne{color:#CB3F38; font-weight:bold}.pdoc-code .nf{color:#0000FF}.pdoc-code .nl{color:#767600}.pdoc-code .nn{color:#0000FF; font-weight:bold}.pdoc-code .nt{color:#008000; font-weight:bold}.pdoc-code .nv{color:#19177C}.pdoc-code .ow{color:#AA22FF; font-weight:bold}.pdoc-code .w{color:#bbbbbb}.pdoc-code .mb{color:#666666}.pdoc-code .mf{color:#666666}.pdoc-code .mh{color:#666666}.pdoc-code .mi{color:#666666}.pdoc-code .mo{color:#666666}.pdoc-code .sa{color:#BA2121}.pdoc-code .sb{color:#BA2121}.pdoc-code .sc{color:#BA2121}.pdoc-code .dl{color:#BA2121}.pdoc-code .sd{color:#BA2121; font-style:italic}.pdoc-code .s2{color:#BA2121}.pdoc-code .se{color:#AA5D1F; font-weight:bold}.pdoc-code .sh{color:#BA2121}.pdoc-code .si{color:#A45A77; font-weight:bold}.pdoc-code .sx{color:#008000}.pdoc-code .sr{color:#A45A77}.pdoc-code .s1{color:#BA2121}.pdoc-code .ss{color:#19177C}.pdoc-code .bp{color:#008000}.pdoc-code .fm{color:#0000FF}.pdoc-code .vc{color:#19177C}.pdoc-code .vg{color:#19177C}.pdoc-code .vi{color:#19177C}.pdoc-code .vm{color:#19177C}.pdoc-code .il{color:#666666}</style>
+    <style>/*! theme.css */:root{--pdoc-background:#fff;}.pdoc{--text:#212529;--muted:#6c757d;--link:#3660a5;--link-hover:#1659c5;--code:#f8f8f8;--active:#fff598;--accent:#eee;--accent2:#c1c1c1;--nav-hover:rgba(255, 255, 255, 0.5);--name:#0066BB;--def:#008800;--annotation:#007020;}</style>
+    <style>/*! layout.css */html, body{width:100%;height:100%;}html, main{scroll-behavior:smooth;}body{background-color:var(--pdoc-background);}@media (max-width:769px){#navtoggle{cursor:pointer;position:absolute;width:50px;height:40px;top:1rem;right:1rem;border-color:var(--text);color:var(--text);display:flex;opacity:0.8;z-index:999;}#navtoggle:hover{opacity:1;}#togglestate + div{display:none;}#togglestate:checked + div{display:inherit;}main, header{padding:2rem 3vw;}header + main{margin-top:-3rem;}.git-button{display:none !important;}nav input[type="search"]{max-width:77%;}nav input[type="search"]:first-child{margin-top:-6px;}nav input[type="search"]:valid ~ *{display:none !important;}}@media (min-width:770px){:root{--sidebar-width:clamp(12.5rem, 28vw, 22rem);}nav{position:fixed;overflow:auto;height:100vh;width:var(--sidebar-width);}main, header{padding:3rem 2rem 3rem calc(var(--sidebar-width) + 3rem);width:calc(54rem + var(--sidebar-width));max-width:100%;}header + main{margin-top:-4rem;}#navtoggle{display:none;}}#togglestate{position:absolute;height:0;opacity:0;}nav.pdoc{--pad:clamp(0.5rem, 2vw, 1.75rem);--indent:1.5rem;background-color:var(--accent);border-right:1px solid var(--accent2);box-shadow:0 0 20px rgba(50, 50, 50, .2) inset;padding:0 0 0 var(--pad);overflow-wrap:anywhere;scrollbar-width:thin; scrollbar-color:var(--accent2) transparent; z-index:1}nav.pdoc::-webkit-scrollbar{width:.4rem; }nav.pdoc::-webkit-scrollbar-thumb{background-color:var(--accent2); }nav.pdoc > div{padding:var(--pad) 0;}nav.pdoc .module-list-button{display:inline-flex;align-items:center;color:var(--text);border-color:var(--muted);margin-bottom:1rem;}nav.pdoc .module-list-button:hover{border-color:var(--text);}nav.pdoc input[type=search]{display:block;outline-offset:0;width:calc(100% - var(--pad));}nav.pdoc .logo{max-width:calc(100% - var(--pad));max-height:35vh;display:block;margin:0 auto 1rem;transform:translate(calc(-.5 * var(--pad)), 0);}nav.pdoc ul{list-style:none;padding-left:0;}nav.pdoc > div > ul{margin-left:calc(0px - var(--pad));}nav.pdoc li a{padding:.2rem 0 .2rem calc(var(--pad) + var(--indent));}nav.pdoc > div > ul > li > a{padding-left:var(--pad);}nav.pdoc li{transition:all 100ms;}nav.pdoc li:hover{background-color:var(--nav-hover);}nav.pdoc a, nav.pdoc a:hover{color:var(--text);}nav.pdoc a{display:block;}nav.pdoc > h2:first-of-type{margin-top:1.5rem;}nav.pdoc .class:before{content:"class ";color:var(--muted);}nav.pdoc .function:after{content:"()";color:var(--muted);}nav.pdoc footer:before{content:"";display:block;width:calc(100% - var(--pad));border-top:solid var(--accent2) 1px;margin-top:1.5rem;padding-top:.5rem;}nav.pdoc footer{font-size:small;}</style>
+    <style>/*! content.css */.pdoc{color:var(--text);box-sizing:border-box;line-height:1.5;background:none;}.pdoc .pdoc-button{cursor:pointer;display:inline-block;border:solid black 1px;border-radius:2px;font-size:.75rem;padding:calc(0.5em - 1px) 1em;transition:100ms all;}.pdoc .pdoc-alert{padding:1rem 1rem 1rem calc(1.5rem + 24px);border:1px solid transparent;border-radius:.25rem;background-repeat:no-repeat;background-position:1rem center;margin-bottom:1rem;}.pdoc .pdoc-alert > *:last-child{margin-bottom:0;}.pdoc .pdoc-alert-note {color:#084298;background-color:#cfe2ff;border-color:#b6d4fe;background-image:url("data:image/svg+xml,%3Csvg%20xmlns%3D%22http%3A//www.w3.org/2000/svg%22%20width%3D%2224%22%20height%3D%2224%22%20fill%3D%22%23084298%22%20viewBox%3D%220%200%2016%2016%22%3E%3Cpath%20d%3D%22M8%2016A8%208%200%201%200%208%200a8%208%200%200%200%200%2016zm.93-9.412-1%204.705c-.07.34.029.533.304.533.194%200%20.487-.07.686-.246l-.088.416c-.287.346-.92.598-1.465.598-.703%200-1.002-.422-.808-1.319l.738-3.468c.064-.293.006-.399-.287-.47l-.451-.081.082-.381%202.29-.287zM8%205.5a1%201%200%201%201%200-2%201%201%200%200%201%200%202z%22/%3E%3C/svg%3E");}.pdoc .pdoc-alert-warning{color:#664d03;background-color:#fff3cd;border-color:#ffecb5;background-image:url("data:image/svg+xml,%3Csvg%20xmlns%3D%22http%3A//www.w3.org/2000/svg%22%20width%3D%2224%22%20height%3D%2224%22%20fill%3D%22%23664d03%22%20viewBox%3D%220%200%2016%2016%22%3E%3Cpath%20d%3D%22M8.982%201.566a1.13%201.13%200%200%200-1.96%200L.165%2013.233c-.457.778.091%201.767.98%201.767h13.713c.889%200%201.438-.99.98-1.767L8.982%201.566zM8%205c.535%200%20.954.462.9.995l-.35%203.507a.552.552%200%200%201-1.1%200L7.1%205.995A.905.905%200%200%201%208%205zm.002%206a1%201%200%201%201%200%202%201%201%200%200%201%200-2z%22/%3E%3C/svg%3E");}.pdoc .pdoc-alert-danger{color:#842029;background-color:#f8d7da;border-color:#f5c2c7;background-image:url("data:image/svg+xml,%3Csvg%20xmlns%3D%22http%3A//www.w3.org/2000/svg%22%20width%3D%2224%22%20height%3D%2224%22%20fill%3D%22%23842029%22%20viewBox%3D%220%200%2016%2016%22%3E%3Cpath%20d%3D%22M5.52.359A.5.5%200%200%201%206%200h4a.5.5%200%200%201%20.474.658L8.694%206H12.5a.5.5%200%200%201%20.395.807l-7%209a.5.5%200%200%201-.873-.454L6.823%209.5H3.5a.5.5%200%200%201-.48-.641l2.5-8.5z%22/%3E%3C/svg%3E");}.pdoc .visually-hidden{position:absolute !important;width:1px !important;height:1px !important;padding:0 !important;margin:-1px !important;overflow:hidden !important;clip:rect(0, 0, 0, 0) !important;white-space:nowrap !important;border:0 !important;}.pdoc h1, .pdoc h2, .pdoc h3{font-weight:300;margin:.3em 0;padding:.2em 0;}.pdoc > section:not(.module-info) h1{font-size:1.5rem;font-weight:500;}.pdoc > section:not(.module-info) h2{font-size:1.4rem;font-weight:500;}.pdoc > section:not(.module-info) h3{font-size:1.3rem;font-weight:500;}.pdoc > section:not(.module-info) h4{font-size:1.2rem;}.pdoc > section:not(.module-info) h5{font-size:1.1rem;}.pdoc a{text-decoration:none;color:var(--link);}.pdoc a:hover{color:var(--link-hover);}.pdoc blockquote{margin-left:2rem;}.pdoc pre{border-top:1px solid var(--accent2);border-bottom:1px solid var(--accent2);margin-top:0;margin-bottom:1em;padding:.5rem 0 .5rem .5rem;overflow-x:auto;background-color:var(--code);}.pdoc code{color:var(--text);padding:.2em .4em;margin:0;font-size:85%;background-color:var(--accent);border-radius:6px;}.pdoc a > code{color:inherit;}.pdoc pre > code{display:inline-block;font-size:inherit;background:none;border:none;padding:0;}.pdoc > section:not(.module-info){margin-bottom:1.5rem;}.pdoc .modulename{margin-top:0;font-weight:bold;}.pdoc .modulename a{color:var(--link);transition:100ms all;}.pdoc .git-button{float:right;border:solid var(--link) 1px;}.pdoc .git-button:hover{background-color:var(--link);color:var(--pdoc-background);}.view-source-toggle-state,.view-source-toggle-state ~ .pdoc-code{display:none;}.view-source-toggle-state:checked ~ .pdoc-code{display:block;}.view-source-button{display:inline-block;float:right;font-size:.75rem;line-height:1.5rem;color:var(--muted);padding:0 .4rem 0 1.3rem;cursor:pointer;text-indent:-2px;}.view-source-button > span{visibility:hidden;}.module-info .view-source-button{float:none;display:flex;justify-content:flex-end;margin:-1.2rem .4rem -.2rem 0;}.view-source-button::before{position:absolute;content:"View Source";display:list-item;list-style-type:disclosure-closed;}.view-source-toggle-state:checked ~ .attr .view-source-button::before,.view-source-toggle-state:checked ~ .view-source-button::before{list-style-type:disclosure-open;}.pdoc .docstring{margin-bottom:1.5rem;}.pdoc section:not(.module-info) .docstring{margin-left:clamp(0rem, 5vw - 2rem, 1rem);}.pdoc .docstring .pdoc-code{margin-left:1em;margin-right:1em;}.pdoc h1:target,.pdoc h2:target,.pdoc h3:target,.pdoc h4:target,.pdoc h5:target,.pdoc h6:target,.pdoc .pdoc-code > pre > span:target{background-color:var(--active);box-shadow:-1rem 0 0 0 var(--active);}.pdoc .pdoc-code > pre > span:target{display:block;}.pdoc div:target > .attr,.pdoc section:target > .attr,.pdoc dd:target > a{background-color:var(--active);}.pdoc *{scroll-margin:2rem;}.pdoc .pdoc-code .linenos{user-select:none;}.pdoc .attr:hover{filter:contrast(0.95);}.pdoc section, .pdoc .classattr{position:relative;}.pdoc .headerlink{--width:clamp(1rem, 3vw, 2rem);position:absolute;top:0;left:calc(0rem - var(--width));transition:all 100ms ease-in-out;opacity:0;}.pdoc .headerlink::before{content:"#";display:block;text-align:center;width:var(--width);height:2.3rem;line-height:2.3rem;font-size:1.5rem;}.pdoc .attr:hover ~ .headerlink,.pdoc *:target > .headerlink,.pdoc .headerlink:hover{opacity:1;}.pdoc .attr{display:block;margin:.5rem 0 .5rem;padding:.4rem .4rem .4rem 1rem;background-color:var(--accent);overflow-x:auto;}.pdoc .classattr{margin-left:2rem;}.pdoc .name{color:var(--name);font-weight:bold;}.pdoc .def{color:var(--def);font-weight:bold;}.pdoc .signature{background-color:transparent;}.pdoc .param, .pdoc .return-annotation{white-space:pre;}.pdoc .signature.multiline .param{display:block;}.pdoc .signature.condensed .param{display:inline-block;}.pdoc .annotation{color:var(--annotation);}.pdoc .view-value-toggle-state,.pdoc .view-value-toggle-state ~ .default_value{display:none;}.pdoc .view-value-toggle-state:checked ~ .default_value{display:inherit;}.pdoc .view-value-button{font-size:.5rem;vertical-align:middle;border-style:dashed;margin-top:-0.1rem;}.pdoc .view-value-button:hover{background:white;}.pdoc .view-value-button::before{content:"show";text-align:center;width:2.2em;display:inline-block;}.pdoc .view-value-toggle-state:checked ~ .view-value-button::before{content:"hide";}.pdoc .inherited{margin-left:2rem;}.pdoc .inherited dt{font-weight:700;}.pdoc .inherited dt, .pdoc .inherited dd{display:inline;margin-left:0;margin-bottom:.5rem;}.pdoc .inherited dd:not(:last-child):after{content:", ";}.pdoc .inherited .class:before{content:"class ";}.pdoc .inherited .function a:after{content:"()";}.pdoc .search-result .docstring{overflow:auto;max-height:25vh;}.pdoc .search-result.focused > .attr{background-color:var(--active);}.pdoc .attribution{margin-top:2rem;display:block;opacity:0.5;transition:all 200ms;filter:grayscale(100%);}.pdoc .attribution:hover{opacity:1;filter:grayscale(0%);}.pdoc .attribution img{margin-left:5px;height:35px;vertical-align:middle;width:70px;transition:all 200ms;}.pdoc table{display:block;width:max-content;max-width:100%;overflow:auto;margin-bottom:1rem;}.pdoc table th{font-weight:600;}.pdoc table th, .pdoc table td{padding:6px 13px;border:1px solid var(--accent2);}</style>
+    <style>/*! custom.css */</style><script>
+    window.MathJax = {
+        tex: {
+            inlineMath: [['$', '$'], ['\\(', '\\)']]
+        }
+    };
+</script>
+<script src="https://polyfill.io/v3/polyfill.min.js?features=es6"></script>
+<script id="MathJax-script" async src="https://cdn.jsdelivr.net/npm/mathjax@3/es5/tex-mml-chtml.js"></script>
+<script>
+    /* Re-invoke MathJax when DOM content changes, for example during search. */
+    document.addEventListener("DOMContentLoaded", () => {
+        new MutationObserver(() => MathJax.typeset()).observe(
+            document.querySelector("main.pdoc").parentNode,
+            {childList: true}
+        );
+    })
+</script>
+<style>
+    mjx-container {
+        overflow-x: auto;
+    }
+</style></head>
+<body>
+    <nav class="pdoc">
+        <label id="navtoggle" for="togglestate" class="pdoc-button"><svg xmlns='http://www.w3.org/2000/svg' viewBox='0 0 30 30'><path stroke-linecap='round' stroke="currentColor" stroke-miterlimit='10' stroke-width='2' d='M4 7h22M4 15h22M4 23h22'/></svg></label>
+        <input id="togglestate" type="checkbox" aria-hidden="true" tabindex="-1">
+        <div>            <a class="pdoc-button module-list-button" href="../../index.html">
+<svg xmlns="http://www.w3.org/2000/svg" width="16" height="16" fill="currentColor" class="bi bi-box-arrow-in-left" viewBox="0 0 16 16">
+  <path fill-rule="evenodd" d="M10 3.5a.5.5 0 0 0-.5-.5h-8a.5.5 0 0 0-.5.5v9a.5.5 0 0 0 .5.5h8a.5.5 0 0 0 .5-.5v-2a.5.5 0 0 1 1 0v2A1.5 1.5 0 0 1 9.5 14h-8A1.5 1.5 0 0 1 0 12.5v-9A1.5 1.5 0 0 1 1.5 2h8A1.5 1.5 0 0 1 11 3.5v2a.5.5 0 0 1-1 0v-2z"/>
+  <path fill-rule="evenodd" d="M4.146 8.354a.5.5 0 0 1 0-.708l3-3a.5.5 0 1 1 .708.708L5.707 7.5H14.5a.5.5 0 0 1 0 1H5.707l2.147 2.146a.5.5 0 0 1-.708.708l-3-3z"/>
+</svg>                &nbsp;
+                Module Index
+            </a>
+
+
+            <input type="search" placeholder="Search..." role="searchbox" aria-label="search"
+                   pattern=".+" required>
+
+
+
+            <h2>API Documentation</h2>
+                <ul class="memberlist">
+            <li>
+                    <a class="class" href="#LossOutput">LossOutput</a>
+                            <ul class="memberlist">
+                        <li>
+                                <a class="function" href="#LossOutput.__init__">LossOutput</a>
+                        </li>
+                        <li>
+                                <a class="variable" href="#LossOutput.loss">loss</a>
+                        </li>
+                        <li>
+                                <a class="variable" href="#LossOutput.metrics">metrics</a>
+                        </li>
+                        <li>
+                                <a class="variable" href="#LossOutput.all">all</a>
+                        </li>
+                </ul>
+
+            </li>
+            <li>
+                    <a class="class" href="#DomainModule">DomainModule</a>
+                            <ul class="memberlist">
+                        <li>
+                                <a class="function" href="#DomainModule.__init__">DomainModule</a>
+                        </li>
+                        <li>
+                                <a class="variable" href="#DomainModule.latent_dim">latent_dim</a>
+                        </li>
+                        <li>
+                                <a class="function" href="#DomainModule.encode">encode</a>
+                        </li>
+                        <li>
+                                <a class="function" href="#DomainModule.decode">decode</a>
+                        </li>
+                        <li>
+                                <a class="function" href="#DomainModule.compute_loss">compute_loss</a>
+                        </li>
+                        <li>
+                                <a class="function" href="#DomainModule.compute_dcy_loss">compute_dcy_loss</a>
+                        </li>
+                        <li>
+                                <a class="function" href="#DomainModule.compute_cy_loss">compute_cy_loss</a>
+                        </li>
+                        <li>
+                                <a class="function" href="#DomainModule.compute_tr_loss">compute_tr_loss</a>
+                        </li>
+                        <li>
+                                <a class="function" href="#DomainModule.compute_broadcast_loss">compute_broadcast_loss</a>
+                        </li>
+                </ul>
+
+            </li>
+    </ul>
+
+
+
+        <a class="attribution" title="pdoc: Python API documentation generator" href="https://pdoc.dev" target="_blank">
+            built with <span class="visually-hidden">pdoc</span><img
+                alt="pdoc logo"
+                src="data:image/svg+xml,%3Csvg%20xmlns%3D%22http%3A//www.w3.org/2000/svg%22%20role%3D%22img%22%20aria-label%3D%22pdoc%20logo%22%20width%3D%22300%22%20height%3D%22150%22%20viewBox%3D%22-1%200%2060%2030%22%3E%3Ctitle%3Epdoc%3C/title%3E%3Cpath%20d%3D%22M29.621%2021.293c-.011-.273-.214-.475-.511-.481a.5.5%200%200%200-.489.503l-.044%201.393c-.097.551-.695%201.215-1.566%201.704-.577.428-1.306.486-2.193.182-1.426-.617-2.467-1.654-3.304-2.487l-.173-.172a3.43%203.43%200%200%200-.365-.306.49.49%200%200%200-.286-.196c-1.718-1.06-4.931-1.47-7.353.191l-.219.15c-1.707%201.187-3.413%202.131-4.328%201.03-.02-.027-.49-.685-.141-1.763.233-.721.546-2.408.772-4.076.042-.09.067-.187.046-.288.166-1.347.277-2.625.241-3.351%201.378-1.008%202.271-2.586%202.271-4.362%200-.976-.272-1.935-.788-2.774-.057-.094-.122-.18-.184-.268.033-.167.052-.339.052-.516%200-1.477-1.202-2.679-2.679-2.679-.791%200-1.496.352-1.987.9a6.3%206.3%200%200%200-1.001.029c-.492-.564-1.207-.929-2.012-.929-1.477%200-2.679%201.202-2.679%202.679A2.65%202.65%200%200%200%20.97%206.554c-.383.747-.595%201.572-.595%202.41%200%202.311%201.507%204.29%203.635%205.107-.037.699-.147%202.27-.423%203.294l-.137.461c-.622%202.042-2.515%208.257%201.727%2010.643%201.614.908%203.06%201.248%204.317%201.248%202.665%200%204.492-1.524%205.322-2.401%201.476-1.559%202.886-1.854%206.491.82%201.877%201.393%203.514%201.753%204.861%201.068%202.223-1.713%202.811-3.867%203.399-6.374.077-.846.056-1.469.054-1.537zm-4.835%204.313c-.054.305-.156.586-.242.629-.034-.007-.131-.022-.307-.157-.145-.111-.314-.478-.456-.908.221.121.432.25.675.355.115.039.219.051.33.081zm-2.251-1.238c-.05.33-.158.648-.252.694-.022.001-.125-.018-.307-.157-.217-.166-.488-.906-.639-1.573.358.344.754.693%201.198%201.036zm-3.887-2.337c-.006-.116-.018-.231-.041-.342.635.145%201.189.368%201.599.625.097.231.166.481.174.642-.03.049-.055.101-.067.158-.046.013-.128.026-.298.004-.278-.037-.901-.57-1.367-1.087zm-1.127-.497c.116.306.176.625.12.71-.019.014-.117.045-.345.016-.206-.027-.604-.332-.986-.695.41-.051.816-.056%201.211-.031zm-4.535%201.535c.209.22.379.47.358.598-.006.041-.088.138-.351.234-.144.055-.539-.063-.979-.259a11.66%2011.66%200%200%200%20.972-.573zm.983-.664c.359-.237.738-.418%201.126-.554.25.237.479.548.457.694-.006.042-.087.138-.351.235-.174.064-.694-.105-1.232-.375zm-3.381%201.794c-.022.145-.061.29-.149.401-.133.166-.358.248-.69.251h-.002c-.133%200-.306-.26-.45-.621.417.091.854.07%201.291-.031zm-2.066-8.077a4.78%204.78%200%200%201-.775-.584c.172-.115.505-.254.88-.378l-.105.962zm-.331%202.302a10.32%2010.32%200%200%201-.828-.502c.202-.143.576-.328.984-.49l-.156.992zm-.45%202.157l-.701-.403c.214-.115.536-.249.891-.376a11.57%2011.57%200%200%201-.19.779zm-.181%201.716c.064.398.194.702.298.893-.194-.051-.435-.162-.736-.398.061-.119.224-.3.438-.495zM8.87%204.141c0%20.152-.123.276-.276.276s-.275-.124-.275-.276.123-.276.276-.276.275.124.275.276zm-.735-.389a1.15%201.15%200%200%200-.314.783%201.16%201.16%200%200%200%201.162%201.162c.457%200%20.842-.27%201.032-.653.026.117.042.238.042.362a1.68%201.68%200%200%201-1.679%201.679%201.68%201.68%200%200%201-1.679-1.679c0-.843.626-1.535%201.436-1.654zM5.059%205.406A1.68%201.68%200%200%201%203.38%207.085a1.68%201.68%200%200%201-1.679-1.679c0-.037.009-.072.011-.109.21.3.541.508.935.508a1.16%201.16%200%200%200%201.162-1.162%201.14%201.14%200%200%200-.474-.912c.015%200%20.03-.005.045-.005.926.001%201.679.754%201.679%201.68zM3.198%204.141c0%20.152-.123.276-.276.276s-.275-.124-.275-.276.123-.276.276-.276.275.124.275.276zM1.375%208.964c0-.52.103-1.035.288-1.52.466.394%201.06.64%201.717.64%201.144%200%202.116-.725%202.499-1.738.383%201.012%201.355%201.738%202.499%201.738.867%200%201.631-.421%202.121-1.062.307.605.478%201.267.478%201.942%200%202.486-2.153%204.51-4.801%204.51s-4.801-2.023-4.801-4.51zm24.342%2019.349c-.985.498-2.267.168-3.813-.979-3.073-2.281-5.453-3.199-7.813-.705-1.315%201.391-4.163%203.365-8.423.97-3.174-1.786-2.239-6.266-1.261-9.479l.146-.492c.276-1.02.395-2.457.444-3.268a6.11%206.11%200%200%200%201.18.115%206.01%206.01%200%200%200%202.536-.562l-.006.175c-.802.215-1.848.612-2.021%201.25-.079.295.021.601.274.837.219.203.415.364.598.501-.667.304-1.243.698-1.311%201.179-.02.144-.022.507.393.787.213.144.395.26.564.365-1.285.521-1.361.96-1.381%201.126-.018.142-.011.496.427.746l.854.489c-.473.389-.971.914-.999%201.429-.018.278.095.532.316.713.675.556%201.231.721%201.653.721.059%200%20.104-.014.158-.02.207.707.641%201.64%201.513%201.64h.013c.8-.008%201.236-.345%201.462-.626.173-.216.268-.457.325-.692.424.195.93.374%201.372.374.151%200%20.294-.021.423-.068.732-.27.944-.704.993-1.021.009-.061.003-.119.002-.179.266.086.538.147.789.147.15%200%20.294-.021.423-.069.542-.2.797-.489.914-.754.237.147.478.258.704.288.106.014.205.021.296.021.356%200%20.595-.101.767-.229.438.435%201.094.992%201.656%201.067.106.014.205.021.296.021a1.56%201.56%200%200%200%20.323-.035c.17.575.453%201.289.866%201.605.358.273.665.362.914.362a.99.99%200%200%200%20.421-.093%201.03%201.03%200%200%200%20.245-.164c.168.428.39.846.68%201.068.358.273.665.362.913.362a.99.99%200%200%200%20.421-.093c.317-.148.512-.448.639-.762.251.157.495.257.726.257.127%200%20.25-.024.37-.071.427-.17.706-.617.841-1.314.022-.015.047-.022.068-.038.067-.051.133-.104.196-.159-.443%201.486-1.107%202.761-2.086%203.257zM8.66%209.925a.5.5%200%201%200-1%200c0%20.653-.818%201.205-1.787%201.205s-1.787-.552-1.787-1.205a.5.5%200%201%200-1%200c0%201.216%201.25%202.205%202.787%202.205s2.787-.989%202.787-2.205zm4.4%2015.965l-.208.097c-2.661%201.258-4.708%201.436-6.086.527-1.542-1.017-1.88-3.19-1.844-4.198a.4.4%200%200%200-.385-.414c-.242-.029-.406.164-.414.385-.046%201.249.367%203.686%202.202%204.896.708.467%201.547.7%202.51.7%201.248%200%202.706-.392%204.362-1.174l.185-.086a.4.4%200%200%200%20.205-.527c-.089-.204-.326-.291-.527-.206zM9.547%202.292c.093.077.205.114.317.114a.5.5%200%200%200%20.318-.886L8.817.397a.5.5%200%200%200-.703.068.5.5%200%200%200%20.069.703l1.364%201.124zm-7.661-.065c.086%200%20.173-.022.253-.068l1.523-.893a.5.5%200%200%200-.506-.863l-1.523.892a.5.5%200%200%200-.179.685c.094.158.261.247.432.247z%22%20transform%3D%22matrix%28-1%200%200%201%2058%200%29%22%20fill%3D%22%233bb300%22/%3E%3Cpath%20d%3D%22M.3%2021.86V10.18q0-.46.02-.68.04-.22.18-.5.28-.54%201.34-.54%201.06%200%201.42.28.38.26.44.78.76-1.04%202.38-1.04%201.64%200%203.1%201.54%201.46%201.54%201.46%203.58%200%202.04-1.46%203.58-1.44%201.54-3.08%201.54-1.64%200-2.38-.92v4.04q0%20.46-.04.68-.02.22-.18.5-.14.3-.5.42-.36.12-.98.12-.62%200-1-.12-.36-.12-.52-.4-.14-.28-.18-.5-.02-.22-.02-.68zm3.96-9.42q-.46.54-.46%201.18%200%20.64.46%201.18.48.52%201.2.52.74%200%201.24-.52.52-.52.52-1.18%200-.66-.48-1.18-.48-.54-1.26-.54-.76%200-1.22.54zm14.741-8.36q.16-.3.54-.42.38-.12%201-.12.64%200%201.02.12.38.12.52.42.16.3.18.54.04.22.04.68v11.94q0%20.46-.04.7-.02.22-.18.5-.3.54-1.7.54-1.38%200-1.54-.98-.84.96-2.34.96-1.8%200-3.28-1.56-1.48-1.58-1.48-3.66%200-2.1%201.48-3.68%201.5-1.58%203.28-1.58%201.48%200%202.3%201v-4.2q0-.46.02-.68.04-.24.18-.52zm-3.24%2010.86q.52.54%201.26.54.74%200%201.22-.54.5-.54.5-1.18%200-.66-.48-1.22-.46-.56-1.26-.56-.8%200-1.28.56-.48.54-.48%201.2%200%20.66.52%201.2zm7.833-1.2q0-2.4%201.68-3.96%201.68-1.56%203.84-1.56%202.16%200%203.82%201.56%201.66%201.54%201.66%203.94%200%201.66-.86%202.96-.86%201.28-2.1%201.9-1.22.6-2.54.6-1.32%200-2.56-.64-1.24-.66-2.1-1.92-.84-1.28-.84-2.88zm4.18%201.44q.64.48%201.3.48.66%200%201.32-.5.66-.5.66-1.48%200-.98-.62-1.46-.62-.48-1.34-.48-.72%200-1.34.5-.62.5-.62%201.48%200%20.96.64%201.46zm11.412-1.44q0%20.84.56%201.32.56.46%201.18.46.64%200%201.18-.36.56-.38.9-.38.6%200%201.46%201.06.46.58.46%201.04%200%20.76-1.1%201.42-1.14.8-2.8.8-1.86%200-3.58-1.34-.82-.64-1.34-1.7-.52-1.08-.52-2.36%200-1.3.52-2.34.52-1.06%201.34-1.7%201.66-1.32%203.54-1.32.76%200%201.48.22.72.2%201.06.4l.32.2q.36.24.56.38.52.4.52.92%200%20.5-.42%201.14-.72%201.1-1.38%201.1-.38%200-1.08-.44-.36-.34-1.04-.34-.66%200-1.24.48-.58.48-.58%201.34z%22%20fill%3D%22green%22/%3E%3C/svg%3E"/>
+        </a>
+</div>
+    </nav>
+    <main class="pdoc">
+            <section class="module-info">
+                    <h1 class="modulename">
+shimmer<wbr>.modules<wbr>.domain    </h1>
+
+                
+                        <input id="mod-domain-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
+
+                        <label class="view-source-button" for="mod-domain-view-source"><span>View Source</span></label>
+
+                        <div class="pdoc-code codehilite"><pre><span></span><span id="L-1"><a href="#L-1"><span class="linenos">  1</span></a><span class="kn">from</span> <span class="nn">dataclasses</span> <span class="kn">import</span> <span class="n">dataclass</span><span class="p">,</span> <span class="n">field</span>
+</span><span id="L-2"><a href="#L-2"><span class="linenos">  2</span></a><span class="kn">from</span> <span class="nn">typing</span> <span class="kn">import</span> <span class="n">Any</span>
+</span><span id="L-3"><a href="#L-3"><span class="linenos">  3</span></a>
+</span><span id="L-4"><a href="#L-4"><span class="linenos">  4</span></a><span class="kn">import</span> <span class="nn">lightning.pytorch</span> <span class="k">as</span> <span class="nn">pl</span>
+</span><span id="L-5"><a href="#L-5"><span class="linenos">  5</span></a><span class="kn">import</span> <span class="nn">torch</span>
+</span><span id="L-6"><a href="#L-6"><span class="linenos">  6</span></a>
+</span><span id="L-7"><a href="#L-7"><span class="linenos">  7</span></a>
+</span><span id="L-8"><a href="#L-8"><span class="linenos">  8</span></a><span class="nd">@dataclass</span>
+</span><span id="L-9"><a href="#L-9"><span class="linenos">  9</span></a><span class="k">class</span> <span class="nc">LossOutput</span><span class="p">:</span>
+</span><span id="L-10"><a href="#L-10"><span class="linenos"> 10</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="L-11"><a href="#L-11"><span class="linenos"> 11</span></a><span class="sd">    This is a python dataclass use as a returned value for losses.</span>
+</span><span id="L-12"><a href="#L-12"><span class="linenos"> 12</span></a><span class="sd">    It keeps track of what is used for training (`loss`) and what is used</span>
+</span><span id="L-13"><a href="#L-13"><span class="linenos"> 13</span></a><span class="sd">    only for logging (`metrics`).</span>
+</span><span id="L-14"><a href="#L-14"><span class="linenos"> 14</span></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="L-15"><a href="#L-15"><span class="linenos"> 15</span></a>
+</span><span id="L-16"><a href="#L-16"><span class="linenos"> 16</span></a>    <span class="n">loss</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span>
+</span><span id="L-17"><a href="#L-17"><span class="linenos"> 17</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Loss used during training.&quot;&quot;&quot;</span>
+</span><span id="L-18"><a href="#L-18"><span class="linenos"> 18</span></a>
+</span><span id="L-19"><a href="#L-19"><span class="linenos"> 19</span></a>    <span class="n">metrics</span><span class="p">:</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]</span> <span class="o">=</span> <span class="n">field</span><span class="p">(</span><span class="n">default_factory</span><span class="o">=</span><span class="nb">dict</span><span class="p">)</span>
+</span><span id="L-20"><a href="#L-20"><span class="linenos"> 20</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Some additional metrics to log (not used during training).&quot;&quot;&quot;</span>
+</span><span id="L-21"><a href="#L-21"><span class="linenos"> 21</span></a>
+</span><span id="L-22"><a href="#L-22"><span class="linenos"> 22</span></a>    <span class="k">def</span> <span class="nf">__post_init__</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
+</span><span id="L-23"><a href="#L-23"><span class="linenos"> 23</span></a>        <span class="k">if</span> <span class="s2">&quot;loss&quot;</span> <span class="ow">in</span> <span class="bp">self</span><span class="o">.</span><span class="n">metrics</span><span class="p">:</span>
+</span><span id="L-24"><a href="#L-24"><span class="linenos"> 24</span></a>            <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s2">&quot;&#39;loss&#39; cannot be a key of metrics.&quot;</span><span class="p">)</span>
+</span><span id="L-25"><a href="#L-25"><span class="linenos"> 25</span></a>
+</span><span id="L-26"><a href="#L-26"><span class="linenos"> 26</span></a>    <span class="nd">@property</span>
+</span><span id="L-27"><a href="#L-27"><span class="linenos"> 27</span></a>    <span class="k">def</span> <span class="nf">all</span><span class="p">(</span><span class="bp">self</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]:</span>
+</span><span id="L-28"><a href="#L-28"><span class="linenos"> 28</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="L-29"><a href="#L-29"><span class="linenos"> 29</span></a><span class="sd">        Returns a dict with all metrics and loss with &quot;loss&quot; key.</span>
+</span><span id="L-30"><a href="#L-30"><span class="linenos"> 30</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="L-31"><a href="#L-31"><span class="linenos"> 31</span></a>        <span class="k">return</span> <span class="p">{</span><span class="o">**</span><span class="bp">self</span><span class="o">.</span><span class="n">metrics</span><span class="p">,</span> <span class="s2">&quot;loss&quot;</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">loss</span><span class="p">}</span>
+</span><span id="L-32"><a href="#L-32"><span class="linenos"> 32</span></a>
+</span><span id="L-33"><a href="#L-33"><span class="linenos"> 33</span></a>
+</span><span id="L-34"><a href="#L-34"><span class="linenos"> 34</span></a><span class="k">class</span> <span class="nc">DomainModule</span><span class="p">(</span><span class="n">pl</span><span class="o">.</span><span class="n">LightningModule</span><span class="p">):</span>
+</span><span id="L-35"><a href="#L-35"><span class="linenos"> 35</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="L-36"><a href="#L-36"><span class="linenos"> 36</span></a><span class="sd">    Base class for a DomainModule that defines domain specific modules of the GW.</span>
+</span><span id="L-37"><a href="#L-37"><span class="linenos"> 37</span></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="L-38"><a href="#L-38"><span class="linenos"> 38</span></a>
+</span><span id="L-39"><a href="#L-39"><span class="linenos"> 39</span></a>    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span>
+</span><span id="L-40"><a href="#L-40"><span class="linenos"> 40</span></a>        <span class="bp">self</span><span class="p">,</span>
+</span><span id="L-41"><a href="#L-41"><span class="linenos"> 41</span></a>        <span class="n">latent_dim</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span>
+</span><span id="L-42"><a href="#L-42"><span class="linenos"> 42</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="L-43"><a href="#L-43"><span class="linenos"> 43</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="L-44"><a href="#L-44"><span class="linenos"> 44</span></a><span class="sd">        Initializes a DomainModule.</span>
+</span><span id="L-45"><a href="#L-45"><span class="linenos"> 45</span></a>
+</span><span id="L-46"><a href="#L-46"><span class="linenos"> 46</span></a><span class="sd">        Args:</span>
+</span><span id="L-47"><a href="#L-47"><span class="linenos"> 47</span></a><span class="sd">            latent_dim (`int`): latent dimension of the unimodal module</span>
+</span><span id="L-48"><a href="#L-48"><span class="linenos"> 48</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="L-49"><a href="#L-49"><span class="linenos"> 49</span></a>        <span class="nb">super</span><span class="p">()</span><span class="o">.</span><span class="fm">__init__</span><span class="p">()</span>
+</span><span id="L-50"><a href="#L-50"><span class="linenos"> 50</span></a>
+</span><span id="L-51"><a href="#L-51"><span class="linenos"> 51</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">latent_dim</span> <span class="o">=</span> <span class="n">latent_dim</span>
+</span><span id="L-52"><a href="#L-52"><span class="linenos"> 52</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;The latent dimension of the module.&quot;&quot;&quot;</span>
+</span><span id="L-53"><a href="#L-53"><span class="linenos"> 53</span></a>
+</span><span id="L-54"><a href="#L-54"><span class="linenos"> 54</span></a>    <span class="k">def</span> <span class="nf">encode</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">x</span><span class="p">:</span> <span class="n">Any</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">:</span>
+</span><span id="L-55"><a href="#L-55"><span class="linenos"> 55</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="L-56"><a href="#L-56"><span class="linenos"> 56</span></a><span class="sd">        Encode the domain data into a unimodal representation.</span>
+</span><span id="L-57"><a href="#L-57"><span class="linenos"> 57</span></a>
+</span><span id="L-58"><a href="#L-58"><span class="linenos"> 58</span></a><span class="sd">        Args:</span>
+</span><span id="L-59"><a href="#L-59"><span class="linenos"> 59</span></a><span class="sd">            x (`Any`): data of the domain.</span>
+</span><span id="L-60"><a href="#L-60"><span class="linenos"> 60</span></a><span class="sd">        Returns:</span>
+</span><span id="L-61"><a href="#L-61"><span class="linenos"> 61</span></a><span class="sd">            `torch.Tensor`: a unimodal representation.</span>
+</span><span id="L-62"><a href="#L-62"><span class="linenos"> 62</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="L-63"><a href="#L-63"><span class="linenos"> 63</span></a>        <span class="k">raise</span> <span class="ne">NotImplementedError</span>
+</span><span id="L-64"><a href="#L-64"><span class="linenos"> 64</span></a>
+</span><span id="L-65"><a href="#L-65"><span class="linenos"> 65</span></a>    <span class="k">def</span> <span class="nf">decode</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">z</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">Any</span><span class="p">:</span>
+</span><span id="L-66"><a href="#L-66"><span class="linenos"> 66</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="L-67"><a href="#L-67"><span class="linenos"> 67</span></a><span class="sd">        Decode data from unimodal representation back to the domain data.</span>
+</span><span id="L-68"><a href="#L-68"><span class="linenos"> 68</span></a>
+</span><span id="L-69"><a href="#L-69"><span class="linenos"> 69</span></a><span class="sd">        Args:</span>
+</span><span id="L-70"><a href="#L-70"><span class="linenos"> 70</span></a><span class="sd">            z (`torch.Tensor`): unimodal representation of the domain.</span>
+</span><span id="L-71"><a href="#L-71"><span class="linenos"> 71</span></a><span class="sd">        Returns:</span>
+</span><span id="L-72"><a href="#L-72"><span class="linenos"> 72</span></a><span class="sd">            `Any`: the original domain data.</span>
+</span><span id="L-73"><a href="#L-73"><span class="linenos"> 73</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="L-74"><a href="#L-74"><span class="linenos"> 74</span></a>        <span class="k">raise</span> <span class="ne">NotImplementedError</span>
+</span><span id="L-75"><a href="#L-75"><span class="linenos"> 75</span></a>
+</span><span id="L-76"><a href="#L-76"><span class="linenos"> 76</span></a>    <span class="k">def</span> <span class="nf">compute_loss</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">pred</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">,</span> <span class="n">target</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">LossOutput</span><span class="p">:</span>
+</span><span id="L-77"><a href="#L-77"><span class="linenos"> 77</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="L-78"><a href="#L-78"><span class="linenos"> 78</span></a><span class="sd">        Generic loss computation  the modality.</span>
+</span><span id="L-79"><a href="#L-79"><span class="linenos"> 79</span></a>
+</span><span id="L-80"><a href="#L-80"><span class="linenos"> 80</span></a><span class="sd">        Args:</span>
+</span><span id="L-81"><a href="#L-81"><span class="linenos"> 81</span></a><span class="sd">            pred (`torch.Tensor`): prediction of the model</span>
+</span><span id="L-82"><a href="#L-82"><span class="linenos"> 82</span></a><span class="sd">            target (`torch.Tensor`): target tensor</span>
+</span><span id="L-83"><a href="#L-83"><span class="linenos"> 83</span></a><span class="sd">        Results:</span>
+</span><span id="L-84"><a href="#L-84"><span class="linenos"> 84</span></a><span class="sd">            `LossOutput`: LossOuput with training loss and additional metrics.</span>
+</span><span id="L-85"><a href="#L-85"><span class="linenos"> 85</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="L-86"><a href="#L-86"><span class="linenos"> 86</span></a>        <span class="k">raise</span> <span class="ne">NotImplementedError</span>
+</span><span id="L-87"><a href="#L-87"><span class="linenos"> 87</span></a>
+</span><span id="L-88"><a href="#L-88"><span class="linenos"> 88</span></a>    <span class="k">def</span> <span class="nf">compute_dcy_loss</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">pred</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">,</span> <span class="n">target</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">LossOutput</span><span class="p">:</span>
+</span><span id="L-89"><a href="#L-89"><span class="linenos"> 89</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="L-90"><a href="#L-90"><span class="linenos"> 90</span></a><span class="sd">        Computes the loss for a demi-cycle. Override if the demi-cycle loss is</span>
+</span><span id="L-91"><a href="#L-91"><span class="linenos"> 91</span></a><span class="sd">        different that the generic loss.</span>
+</span><span id="L-92"><a href="#L-92"><span class="linenos"> 92</span></a>
+</span><span id="L-93"><a href="#L-93"><span class="linenos"> 93</span></a><span class="sd">        Args:</span>
+</span><span id="L-94"><a href="#L-94"><span class="linenos"> 94</span></a><span class="sd">            pred (`torch.Tensor`): prediction of the model</span>
+</span><span id="L-95"><a href="#L-95"><span class="linenos"> 95</span></a><span class="sd">            target (`torch.Tensor`): target tensor</span>
+</span><span id="L-96"><a href="#L-96"><span class="linenos"> 96</span></a><span class="sd">        Results:</span>
+</span><span id="L-97"><a href="#L-97"><span class="linenos"> 97</span></a><span class="sd">            `LossOutput`: LossOuput with training loss and additional metrics.</span>
+</span><span id="L-98"><a href="#L-98"><span class="linenos"> 98</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="L-99"><a href="#L-99"><span class="linenos"> 99</span></a>        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">compute_loss</span><span class="p">(</span><span class="n">pred</span><span class="p">,</span> <span class="n">target</span><span class="p">)</span>
+</span><span id="L-100"><a href="#L-100"><span class="linenos">100</span></a>
+</span><span id="L-101"><a href="#L-101"><span class="linenos">101</span></a>    <span class="k">def</span> <span class="nf">compute_cy_loss</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">pred</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">,</span> <span class="n">target</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">LossOutput</span><span class="p">:</span>
+</span><span id="L-102"><a href="#L-102"><span class="linenos">102</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="L-103"><a href="#L-103"><span class="linenos">103</span></a><span class="sd">        Computes the loss for a cycle. Override if the cycle loss is</span>
+</span><span id="L-104"><a href="#L-104"><span class="linenos">104</span></a><span class="sd">        different that the generic loss.</span>
+</span><span id="L-105"><a href="#L-105"><span class="linenos">105</span></a>
+</span><span id="L-106"><a href="#L-106"><span class="linenos">106</span></a><span class="sd">        Args:</span>
+</span><span id="L-107"><a href="#L-107"><span class="linenos">107</span></a><span class="sd">            pred (`torch.Tensor`): prediction of the model</span>
+</span><span id="L-108"><a href="#L-108"><span class="linenos">108</span></a><span class="sd">            target (`torch.Tensor`): target tensor</span>
+</span><span id="L-109"><a href="#L-109"><span class="linenos">109</span></a><span class="sd">        Results:</span>
+</span><span id="L-110"><a href="#L-110"><span class="linenos">110</span></a><span class="sd">            `LossOutput`: LossOuput with training loss and additional metrics.</span>
+</span><span id="L-111"><a href="#L-111"><span class="linenos">111</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="L-112"><a href="#L-112"><span class="linenos">112</span></a>        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">compute_loss</span><span class="p">(</span><span class="n">pred</span><span class="p">,</span> <span class="n">target</span><span class="p">)</span>
+</span><span id="L-113"><a href="#L-113"><span class="linenos">113</span></a>
+</span><span id="L-114"><a href="#L-114"><span class="linenos">114</span></a>    <span class="k">def</span> <span class="nf">compute_tr_loss</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">pred</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">,</span> <span class="n">target</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">LossOutput</span><span class="p">:</span>
+</span><span id="L-115"><a href="#L-115"><span class="linenos">115</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="L-116"><a href="#L-116"><span class="linenos">116</span></a><span class="sd">        Computes the loss for a translation. Override if the translation loss is</span>
+</span><span id="L-117"><a href="#L-117"><span class="linenos">117</span></a><span class="sd">        different that the generic loss.</span>
+</span><span id="L-118"><a href="#L-118"><span class="linenos">118</span></a>
+</span><span id="L-119"><a href="#L-119"><span class="linenos">119</span></a><span class="sd">        Args:</span>
+</span><span id="L-120"><a href="#L-120"><span class="linenos">120</span></a><span class="sd">            pred (`torch.Tensor`): prediction of the model</span>
+</span><span id="L-121"><a href="#L-121"><span class="linenos">121</span></a><span class="sd">            target (`torch.Tensor`): target tensor</span>
+</span><span id="L-122"><a href="#L-122"><span class="linenos">122</span></a><span class="sd">        Results:</span>
+</span><span id="L-123"><a href="#L-123"><span class="linenos">123</span></a><span class="sd">            `LossOutput`: LossOuput with training loss and additional metrics.</span>
+</span><span id="L-124"><a href="#L-124"><span class="linenos">124</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="L-125"><a href="#L-125"><span class="linenos">125</span></a>        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">compute_loss</span><span class="p">(</span><span class="n">pred</span><span class="p">,</span> <span class="n">target</span><span class="p">)</span>
+</span><span id="L-126"><a href="#L-126"><span class="linenos">126</span></a>
+</span><span id="L-127"><a href="#L-127"><span class="linenos">127</span></a>    <span class="k">def</span> <span class="nf">compute_broadcast_loss</span><span class="p">(</span>
+</span><span id="L-128"><a href="#L-128"><span class="linenos">128</span></a>        <span class="bp">self</span><span class="p">,</span> <span class="n">pred</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">,</span> <span class="n">target</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span>
+</span><span id="L-129"><a href="#L-129"><span class="linenos">129</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="n">LossOutput</span><span class="p">:</span>
+</span><span id="L-130"><a href="#L-130"><span class="linenos">130</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="L-131"><a href="#L-131"><span class="linenos">131</span></a><span class="sd">        Computes the loss for a broadcast (fusion). Override if the broadcast loss is</span>
+</span><span id="L-132"><a href="#L-132"><span class="linenos">132</span></a><span class="sd">        different that the generic loss.</span>
+</span><span id="L-133"><a href="#L-133"><span class="linenos">133</span></a>
+</span><span id="L-134"><a href="#L-134"><span class="linenos">134</span></a><span class="sd">        Args:</span>
+</span><span id="L-135"><a href="#L-135"><span class="linenos">135</span></a><span class="sd">            pred (`torch.Tensor`): prediction of the model</span>
+</span><span id="L-136"><a href="#L-136"><span class="linenos">136</span></a><span class="sd">            target (`torch.Tensor`): target tensor</span>
+</span><span id="L-137"><a href="#L-137"><span class="linenos">137</span></a><span class="sd">        Results:</span>
+</span><span id="L-138"><a href="#L-138"><span class="linenos">138</span></a><span class="sd">            `LossOutput`: LossOuput with training loss and additional metrics.</span>
+</span><span id="L-139"><a href="#L-139"><span class="linenos">139</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="L-140"><a href="#L-140"><span class="linenos">140</span></a>        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">compute_loss</span><span class="p">(</span><span class="n">pred</span><span class="p">,</span> <span class="n">target</span><span class="p">)</span>
+</span></pre></div>
+
+
+            </section>
+                <section id="LossOutput">
+                            <input id="LossOutput-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
+<div class="attr class">
+                    <div class="decorator">@dataclass</div>
+
+    <span class="def">class</span>
+    <span class="name">LossOutput</span>:
+
+                <label class="view-source-button" for="LossOutput-view-source"><span>View Source</span></label>
+
+    </div>
+    <a class="headerlink" href="#LossOutput"></a>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="LossOutput-9"><a href="#LossOutput-9"><span class="linenos"> 9</span></a><span class="nd">@dataclass</span>
+</span><span id="LossOutput-10"><a href="#LossOutput-10"><span class="linenos">10</span></a><span class="k">class</span> <span class="nc">LossOutput</span><span class="p">:</span>
+</span><span id="LossOutput-11"><a href="#LossOutput-11"><span class="linenos">11</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="LossOutput-12"><a href="#LossOutput-12"><span class="linenos">12</span></a><span class="sd">    This is a python dataclass use as a returned value for losses.</span>
+</span><span id="LossOutput-13"><a href="#LossOutput-13"><span class="linenos">13</span></a><span class="sd">    It keeps track of what is used for training (`loss`) and what is used</span>
+</span><span id="LossOutput-14"><a href="#LossOutput-14"><span class="linenos">14</span></a><span class="sd">    only for logging (`metrics`).</span>
+</span><span id="LossOutput-15"><a href="#LossOutput-15"><span class="linenos">15</span></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="LossOutput-16"><a href="#LossOutput-16"><span class="linenos">16</span></a>
+</span><span id="LossOutput-17"><a href="#LossOutput-17"><span class="linenos">17</span></a>    <span class="n">loss</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span>
+</span><span id="LossOutput-18"><a href="#LossOutput-18"><span class="linenos">18</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Loss used during training.&quot;&quot;&quot;</span>
+</span><span id="LossOutput-19"><a href="#LossOutput-19"><span class="linenos">19</span></a>
+</span><span id="LossOutput-20"><a href="#LossOutput-20"><span class="linenos">20</span></a>    <span class="n">metrics</span><span class="p">:</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]</span> <span class="o">=</span> <span class="n">field</span><span class="p">(</span><span class="n">default_factory</span><span class="o">=</span><span class="nb">dict</span><span class="p">)</span>
+</span><span id="LossOutput-21"><a href="#LossOutput-21"><span class="linenos">21</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Some additional metrics to log (not used during training).&quot;&quot;&quot;</span>
+</span><span id="LossOutput-22"><a href="#LossOutput-22"><span class="linenos">22</span></a>
+</span><span id="LossOutput-23"><a href="#LossOutput-23"><span class="linenos">23</span></a>    <span class="k">def</span> <span class="nf">__post_init__</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
+</span><span id="LossOutput-24"><a href="#LossOutput-24"><span class="linenos">24</span></a>        <span class="k">if</span> <span class="s2">&quot;loss&quot;</span> <span class="ow">in</span> <span class="bp">self</span><span class="o">.</span><span class="n">metrics</span><span class="p">:</span>
+</span><span id="LossOutput-25"><a href="#LossOutput-25"><span class="linenos">25</span></a>            <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s2">&quot;&#39;loss&#39; cannot be a key of metrics.&quot;</span><span class="p">)</span>
+</span><span id="LossOutput-26"><a href="#LossOutput-26"><span class="linenos">26</span></a>
+</span><span id="LossOutput-27"><a href="#LossOutput-27"><span class="linenos">27</span></a>    <span class="nd">@property</span>
+</span><span id="LossOutput-28"><a href="#LossOutput-28"><span class="linenos">28</span></a>    <span class="k">def</span> <span class="nf">all</span><span class="p">(</span><span class="bp">self</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]:</span>
+</span><span id="LossOutput-29"><a href="#LossOutput-29"><span class="linenos">29</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="LossOutput-30"><a href="#LossOutput-30"><span class="linenos">30</span></a><span class="sd">        Returns a dict with all metrics and loss with &quot;loss&quot; key.</span>
+</span><span id="LossOutput-31"><a href="#LossOutput-31"><span class="linenos">31</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="LossOutput-32"><a href="#LossOutput-32"><span class="linenos">32</span></a>        <span class="k">return</span> <span class="p">{</span><span class="o">**</span><span class="bp">self</span><span class="o">.</span><span class="n">metrics</span><span class="p">,</span> <span class="s2">&quot;loss&quot;</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">loss</span><span class="p">}</span>
+</span></pre></div>
+
+
+            <div class="docstring"><p>This is a python dataclass use as a returned value for losses.
+It keeps track of what is used for training (<code><a href="#LossOutput.loss">loss</a></code>) and what is used
+only for logging (<code><a href="#LossOutput.metrics">metrics</a></code>).</p>
+</div>
+
+
+                            <div id="LossOutput.__init__" class="classattr">
+                                <div class="attr function">
+            
+        <span class="name">LossOutput</span><span class="signature pdoc-code condensed">(<span class="param"><span class="n">loss</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span>, </span><span class="param"><span class="n">metrics</span><span class="p">:</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]</span> <span class="o">=</span> <span class="o">&lt;</span><span class="n">factory</span><span class="o">&gt;</span></span>)</span>
+
+        
+    </div>
+    <a class="headerlink" href="#LossOutput.__init__"></a>
+    
+    
+
+                            </div>
+                            <div id="LossOutput.loss" class="classattr">
+                                <div class="attr variable">
+            <span class="name">loss</span><span class="annotation">: torch.Tensor</span>
+
+        
+    </div>
+    <a class="headerlink" href="#LossOutput.loss"></a>
+    
+            <div class="docstring"><p>Loss used during training.</p>
+</div>
+
+
+                            </div>
+                            <div id="LossOutput.metrics" class="classattr">
+                                <div class="attr variable">
+            <span class="name">metrics</span><span class="annotation">: dict[str, torch.Tensor]</span>
+
+        
+    </div>
+    <a class="headerlink" href="#LossOutput.metrics"></a>
+    
+            <div class="docstring"><p>Some additional metrics to log (not used during training).</p>
+</div>
+
+
+                            </div>
+                            <div id="LossOutput.all" class="classattr">
+                                        <input id="LossOutput.all-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
+<div class="attr variable">
+            <span class="name">all</span><span class="annotation">: dict[str, torch.Tensor]</span>
+
+                <label class="view-source-button" for="LossOutput.all-view-source"><span>View Source</span></label>
+
+    </div>
+    <a class="headerlink" href="#LossOutput.all"></a>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="LossOutput.all-27"><a href="#LossOutput.all-27"><span class="linenos">27</span></a>    <span class="nd">@property</span>
+</span><span id="LossOutput.all-28"><a href="#LossOutput.all-28"><span class="linenos">28</span></a>    <span class="k">def</span> <span class="nf">all</span><span class="p">(</span><span class="bp">self</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]:</span>
+</span><span id="LossOutput.all-29"><a href="#LossOutput.all-29"><span class="linenos">29</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="LossOutput.all-30"><a href="#LossOutput.all-30"><span class="linenos">30</span></a><span class="sd">        Returns a dict with all metrics and loss with &quot;loss&quot; key.</span>
+</span><span id="LossOutput.all-31"><a href="#LossOutput.all-31"><span class="linenos">31</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="LossOutput.all-32"><a href="#LossOutput.all-32"><span class="linenos">32</span></a>        <span class="k">return</span> <span class="p">{</span><span class="o">**</span><span class="bp">self</span><span class="o">.</span><span class="n">metrics</span><span class="p">,</span> <span class="s2">&quot;loss&quot;</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">loss</span><span class="p">}</span>
+</span></pre></div>
+
+
+            <div class="docstring"><p>Returns a dict with all metrics and loss with "loss" key.</p>
+</div>
+
+
+                            </div>
+                </section>
+                <section id="DomainModule">
+                            <input id="DomainModule-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
+<div class="attr class">
+            
+    <span class="def">class</span>
+    <span class="name">DomainModule</span><wbr>(<span class="base">lightning.pytorch.core.module.LightningModule</span>):
+
+                <label class="view-source-button" for="DomainModule-view-source"><span>View Source</span></label>
+
+    </div>
+    <a class="headerlink" href="#DomainModule"></a>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="DomainModule-35"><a href="#DomainModule-35"><span class="linenos"> 35</span></a><span class="k">class</span> <span class="nc">DomainModule</span><span class="p">(</span><span class="n">pl</span><span class="o">.</span><span class="n">LightningModule</span><span class="p">):</span>
+</span><span id="DomainModule-36"><a href="#DomainModule-36"><span class="linenos"> 36</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="DomainModule-37"><a href="#DomainModule-37"><span class="linenos"> 37</span></a><span class="sd">    Base class for a DomainModule that defines domain specific modules of the GW.</span>
+</span><span id="DomainModule-38"><a href="#DomainModule-38"><span class="linenos"> 38</span></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="DomainModule-39"><a href="#DomainModule-39"><span class="linenos"> 39</span></a>
+</span><span id="DomainModule-40"><a href="#DomainModule-40"><span class="linenos"> 40</span></a>    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span>
+</span><span id="DomainModule-41"><a href="#DomainModule-41"><span class="linenos"> 41</span></a>        <span class="bp">self</span><span class="p">,</span>
+</span><span id="DomainModule-42"><a href="#DomainModule-42"><span class="linenos"> 42</span></a>        <span class="n">latent_dim</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span>
+</span><span id="DomainModule-43"><a href="#DomainModule-43"><span class="linenos"> 43</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="DomainModule-44"><a href="#DomainModule-44"><span class="linenos"> 44</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="DomainModule-45"><a href="#DomainModule-45"><span class="linenos"> 45</span></a><span class="sd">        Initializes a DomainModule.</span>
+</span><span id="DomainModule-46"><a href="#DomainModule-46"><span class="linenos"> 46</span></a>
+</span><span id="DomainModule-47"><a href="#DomainModule-47"><span class="linenos"> 47</span></a><span class="sd">        Args:</span>
+</span><span id="DomainModule-48"><a href="#DomainModule-48"><span class="linenos"> 48</span></a><span class="sd">            latent_dim (`int`): latent dimension of the unimodal module</span>
+</span><span id="DomainModule-49"><a href="#DomainModule-49"><span class="linenos"> 49</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="DomainModule-50"><a href="#DomainModule-50"><span class="linenos"> 50</span></a>        <span class="nb">super</span><span class="p">()</span><span class="o">.</span><span class="fm">__init__</span><span class="p">()</span>
+</span><span id="DomainModule-51"><a href="#DomainModule-51"><span class="linenos"> 51</span></a>
+</span><span id="DomainModule-52"><a href="#DomainModule-52"><span class="linenos"> 52</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">latent_dim</span> <span class="o">=</span> <span class="n">latent_dim</span>
+</span><span id="DomainModule-53"><a href="#DomainModule-53"><span class="linenos"> 53</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;The latent dimension of the module.&quot;&quot;&quot;</span>
+</span><span id="DomainModule-54"><a href="#DomainModule-54"><span class="linenos"> 54</span></a>
+</span><span id="DomainModule-55"><a href="#DomainModule-55"><span class="linenos"> 55</span></a>    <span class="k">def</span> <span class="nf">encode</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">x</span><span class="p">:</span> <span class="n">Any</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">:</span>
+</span><span id="DomainModule-56"><a href="#DomainModule-56"><span class="linenos"> 56</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="DomainModule-57"><a href="#DomainModule-57"><span class="linenos"> 57</span></a><span class="sd">        Encode the domain data into a unimodal representation.</span>
+</span><span id="DomainModule-58"><a href="#DomainModule-58"><span class="linenos"> 58</span></a>
+</span><span id="DomainModule-59"><a href="#DomainModule-59"><span class="linenos"> 59</span></a><span class="sd">        Args:</span>
+</span><span id="DomainModule-60"><a href="#DomainModule-60"><span class="linenos"> 60</span></a><span class="sd">            x (`Any`): data of the domain.</span>
+</span><span id="DomainModule-61"><a href="#DomainModule-61"><span class="linenos"> 61</span></a><span class="sd">        Returns:</span>
+</span><span id="DomainModule-62"><a href="#DomainModule-62"><span class="linenos"> 62</span></a><span class="sd">            `torch.Tensor`: a unimodal representation.</span>
+</span><span id="DomainModule-63"><a href="#DomainModule-63"><span class="linenos"> 63</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="DomainModule-64"><a href="#DomainModule-64"><span class="linenos"> 64</span></a>        <span class="k">raise</span> <span class="ne">NotImplementedError</span>
+</span><span id="DomainModule-65"><a href="#DomainModule-65"><span class="linenos"> 65</span></a>
+</span><span id="DomainModule-66"><a href="#DomainModule-66"><span class="linenos"> 66</span></a>    <span class="k">def</span> <span class="nf">decode</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">z</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">Any</span><span class="p">:</span>
+</span><span id="DomainModule-67"><a href="#DomainModule-67"><span class="linenos"> 67</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="DomainModule-68"><a href="#DomainModule-68"><span class="linenos"> 68</span></a><span class="sd">        Decode data from unimodal representation back to the domain data.</span>
+</span><span id="DomainModule-69"><a href="#DomainModule-69"><span class="linenos"> 69</span></a>
+</span><span id="DomainModule-70"><a href="#DomainModule-70"><span class="linenos"> 70</span></a><span class="sd">        Args:</span>
+</span><span id="DomainModule-71"><a href="#DomainModule-71"><span class="linenos"> 71</span></a><span class="sd">            z (`torch.Tensor`): unimodal representation of the domain.</span>
+</span><span id="DomainModule-72"><a href="#DomainModule-72"><span class="linenos"> 72</span></a><span class="sd">        Returns:</span>
+</span><span id="DomainModule-73"><a href="#DomainModule-73"><span class="linenos"> 73</span></a><span class="sd">            `Any`: the original domain data.</span>
+</span><span id="DomainModule-74"><a href="#DomainModule-74"><span class="linenos"> 74</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="DomainModule-75"><a href="#DomainModule-75"><span class="linenos"> 75</span></a>        <span class="k">raise</span> <span class="ne">NotImplementedError</span>
+</span><span id="DomainModule-76"><a href="#DomainModule-76"><span class="linenos"> 76</span></a>
+</span><span id="DomainModule-77"><a href="#DomainModule-77"><span class="linenos"> 77</span></a>    <span class="k">def</span> <span class="nf">compute_loss</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">pred</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">,</span> <span class="n">target</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">LossOutput</span><span class="p">:</span>
+</span><span id="DomainModule-78"><a href="#DomainModule-78"><span class="linenos"> 78</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="DomainModule-79"><a href="#DomainModule-79"><span class="linenos"> 79</span></a><span class="sd">        Generic loss computation  the modality.</span>
+</span><span id="DomainModule-80"><a href="#DomainModule-80"><span class="linenos"> 80</span></a>
+</span><span id="DomainModule-81"><a href="#DomainModule-81"><span class="linenos"> 81</span></a><span class="sd">        Args:</span>
+</span><span id="DomainModule-82"><a href="#DomainModule-82"><span class="linenos"> 82</span></a><span class="sd">            pred (`torch.Tensor`): prediction of the model</span>
+</span><span id="DomainModule-83"><a href="#DomainModule-83"><span class="linenos"> 83</span></a><span class="sd">            target (`torch.Tensor`): target tensor</span>
+</span><span id="DomainModule-84"><a href="#DomainModule-84"><span class="linenos"> 84</span></a><span class="sd">        Results:</span>
+</span><span id="DomainModule-85"><a href="#DomainModule-85"><span class="linenos"> 85</span></a><span class="sd">            `LossOutput`: LossOuput with training loss and additional metrics.</span>
+</span><span id="DomainModule-86"><a href="#DomainModule-86"><span class="linenos"> 86</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="DomainModule-87"><a href="#DomainModule-87"><span class="linenos"> 87</span></a>        <span class="k">raise</span> <span class="ne">NotImplementedError</span>
+</span><span id="DomainModule-88"><a href="#DomainModule-88"><span class="linenos"> 88</span></a>
+</span><span id="DomainModule-89"><a href="#DomainModule-89"><span class="linenos"> 89</span></a>    <span class="k">def</span> <span class="nf">compute_dcy_loss</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">pred</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">,</span> <span class="n">target</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">LossOutput</span><span class="p">:</span>
+</span><span id="DomainModule-90"><a href="#DomainModule-90"><span class="linenos"> 90</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="DomainModule-91"><a href="#DomainModule-91"><span class="linenos"> 91</span></a><span class="sd">        Computes the loss for a demi-cycle. Override if the demi-cycle loss is</span>
+</span><span id="DomainModule-92"><a href="#DomainModule-92"><span class="linenos"> 92</span></a><span class="sd">        different that the generic loss.</span>
+</span><span id="DomainModule-93"><a href="#DomainModule-93"><span class="linenos"> 93</span></a>
+</span><span id="DomainModule-94"><a href="#DomainModule-94"><span class="linenos"> 94</span></a><span class="sd">        Args:</span>
+</span><span id="DomainModule-95"><a href="#DomainModule-95"><span class="linenos"> 95</span></a><span class="sd">            pred (`torch.Tensor`): prediction of the model</span>
+</span><span id="DomainModule-96"><a href="#DomainModule-96"><span class="linenos"> 96</span></a><span class="sd">            target (`torch.Tensor`): target tensor</span>
+</span><span id="DomainModule-97"><a href="#DomainModule-97"><span class="linenos"> 97</span></a><span class="sd">        Results:</span>
+</span><span id="DomainModule-98"><a href="#DomainModule-98"><span class="linenos"> 98</span></a><span class="sd">            `LossOutput`: LossOuput with training loss and additional metrics.</span>
+</span><span id="DomainModule-99"><a href="#DomainModule-99"><span class="linenos"> 99</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="DomainModule-100"><a href="#DomainModule-100"><span class="linenos">100</span></a>        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">compute_loss</span><span class="p">(</span><span class="n">pred</span><span class="p">,</span> <span class="n">target</span><span class="p">)</span>
+</span><span id="DomainModule-101"><a href="#DomainModule-101"><span class="linenos">101</span></a>
+</span><span id="DomainModule-102"><a href="#DomainModule-102"><span class="linenos">102</span></a>    <span class="k">def</span> <span class="nf">compute_cy_loss</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">pred</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">,</span> <span class="n">target</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">LossOutput</span><span class="p">:</span>
+</span><span id="DomainModule-103"><a href="#DomainModule-103"><span class="linenos">103</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="DomainModule-104"><a href="#DomainModule-104"><span class="linenos">104</span></a><span class="sd">        Computes the loss for a cycle. Override if the cycle loss is</span>
+</span><span id="DomainModule-105"><a href="#DomainModule-105"><span class="linenos">105</span></a><span class="sd">        different that the generic loss.</span>
+</span><span id="DomainModule-106"><a href="#DomainModule-106"><span class="linenos">106</span></a>
+</span><span id="DomainModule-107"><a href="#DomainModule-107"><span class="linenos">107</span></a><span class="sd">        Args:</span>
+</span><span id="DomainModule-108"><a href="#DomainModule-108"><span class="linenos">108</span></a><span class="sd">            pred (`torch.Tensor`): prediction of the model</span>
+</span><span id="DomainModule-109"><a href="#DomainModule-109"><span class="linenos">109</span></a><span class="sd">            target (`torch.Tensor`): target tensor</span>
+</span><span id="DomainModule-110"><a href="#DomainModule-110"><span class="linenos">110</span></a><span class="sd">        Results:</span>
+</span><span id="DomainModule-111"><a href="#DomainModule-111"><span class="linenos">111</span></a><span class="sd">            `LossOutput`: LossOuput with training loss and additional metrics.</span>
+</span><span id="DomainModule-112"><a href="#DomainModule-112"><span class="linenos">112</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="DomainModule-113"><a href="#DomainModule-113"><span class="linenos">113</span></a>        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">compute_loss</span><span class="p">(</span><span class="n">pred</span><span class="p">,</span> <span class="n">target</span><span class="p">)</span>
+</span><span id="DomainModule-114"><a href="#DomainModule-114"><span class="linenos">114</span></a>
+</span><span id="DomainModule-115"><a href="#DomainModule-115"><span class="linenos">115</span></a>    <span class="k">def</span> <span class="nf">compute_tr_loss</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">pred</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">,</span> <span class="n">target</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">LossOutput</span><span class="p">:</span>
+</span><span id="DomainModule-116"><a href="#DomainModule-116"><span class="linenos">116</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="DomainModule-117"><a href="#DomainModule-117"><span class="linenos">117</span></a><span class="sd">        Computes the loss for a translation. Override if the translation loss is</span>
+</span><span id="DomainModule-118"><a href="#DomainModule-118"><span class="linenos">118</span></a><span class="sd">        different that the generic loss.</span>
+</span><span id="DomainModule-119"><a href="#DomainModule-119"><span class="linenos">119</span></a>
+</span><span id="DomainModule-120"><a href="#DomainModule-120"><span class="linenos">120</span></a><span class="sd">        Args:</span>
+</span><span id="DomainModule-121"><a href="#DomainModule-121"><span class="linenos">121</span></a><span class="sd">            pred (`torch.Tensor`): prediction of the model</span>
+</span><span id="DomainModule-122"><a href="#DomainModule-122"><span class="linenos">122</span></a><span class="sd">            target (`torch.Tensor`): target tensor</span>
+</span><span id="DomainModule-123"><a href="#DomainModule-123"><span class="linenos">123</span></a><span class="sd">        Results:</span>
+</span><span id="DomainModule-124"><a href="#DomainModule-124"><span class="linenos">124</span></a><span class="sd">            `LossOutput`: LossOuput with training loss and additional metrics.</span>
+</span><span id="DomainModule-125"><a href="#DomainModule-125"><span class="linenos">125</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="DomainModule-126"><a href="#DomainModule-126"><span class="linenos">126</span></a>        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">compute_loss</span><span class="p">(</span><span class="n">pred</span><span class="p">,</span> <span class="n">target</span><span class="p">)</span>
+</span><span id="DomainModule-127"><a href="#DomainModule-127"><span class="linenos">127</span></a>
+</span><span id="DomainModule-128"><a href="#DomainModule-128"><span class="linenos">128</span></a>    <span class="k">def</span> <span class="nf">compute_broadcast_loss</span><span class="p">(</span>
+</span><span id="DomainModule-129"><a href="#DomainModule-129"><span class="linenos">129</span></a>        <span class="bp">self</span><span class="p">,</span> <span class="n">pred</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">,</span> <span class="n">target</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span>
+</span><span id="DomainModule-130"><a href="#DomainModule-130"><span class="linenos">130</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="n">LossOutput</span><span class="p">:</span>
+</span><span id="DomainModule-131"><a href="#DomainModule-131"><span class="linenos">131</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="DomainModule-132"><a href="#DomainModule-132"><span class="linenos">132</span></a><span class="sd">        Computes the loss for a broadcast (fusion). Override if the broadcast loss is</span>
+</span><span id="DomainModule-133"><a href="#DomainModule-133"><span class="linenos">133</span></a><span class="sd">        different that the generic loss.</span>
+</span><span id="DomainModule-134"><a href="#DomainModule-134"><span class="linenos">134</span></a>
+</span><span id="DomainModule-135"><a href="#DomainModule-135"><span class="linenos">135</span></a><span class="sd">        Args:</span>
+</span><span id="DomainModule-136"><a href="#DomainModule-136"><span class="linenos">136</span></a><span class="sd">            pred (`torch.Tensor`): prediction of the model</span>
+</span><span id="DomainModule-137"><a href="#DomainModule-137"><span class="linenos">137</span></a><span class="sd">            target (`torch.Tensor`): target tensor</span>
+</span><span id="DomainModule-138"><a href="#DomainModule-138"><span class="linenos">138</span></a><span class="sd">        Results:</span>
+</span><span id="DomainModule-139"><a href="#DomainModule-139"><span class="linenos">139</span></a><span class="sd">            `LossOutput`: LossOuput with training loss and additional metrics.</span>
+</span><span id="DomainModule-140"><a href="#DomainModule-140"><span class="linenos">140</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="DomainModule-141"><a href="#DomainModule-141"><span class="linenos">141</span></a>        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">compute_loss</span><span class="p">(</span><span class="n">pred</span><span class="p">,</span> <span class="n">target</span><span class="p">)</span>
+</span></pre></div>
+
+
+            <div class="docstring"><p>Base class for a DomainModule that defines domain specific modules of the GW.</p>
+</div>
+
+
+                            <div id="DomainModule.__init__" class="classattr">
+                                        <input id="DomainModule.__init__-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
+<div class="attr function">
+            
+        <span class="name">DomainModule</span><span class="signature pdoc-code condensed">(<span class="param"><span class="n">latent_dim</span><span class="p">:</span> <span class="nb">int</span></span>)</span>
+
+                <label class="view-source-button" for="DomainModule.__init__-view-source"><span>View Source</span></label>
+
+    </div>
+    <a class="headerlink" href="#DomainModule.__init__"></a>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="DomainModule.__init__-40"><a href="#DomainModule.__init__-40"><span class="linenos">40</span></a>    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span>
+</span><span id="DomainModule.__init__-41"><a href="#DomainModule.__init__-41"><span class="linenos">41</span></a>        <span class="bp">self</span><span class="p">,</span>
+</span><span id="DomainModule.__init__-42"><a href="#DomainModule.__init__-42"><span class="linenos">42</span></a>        <span class="n">latent_dim</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span>
+</span><span id="DomainModule.__init__-43"><a href="#DomainModule.__init__-43"><span class="linenos">43</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="DomainModule.__init__-44"><a href="#DomainModule.__init__-44"><span class="linenos">44</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="DomainModule.__init__-45"><a href="#DomainModule.__init__-45"><span class="linenos">45</span></a><span class="sd">        Initializes a DomainModule.</span>
+</span><span id="DomainModule.__init__-46"><a href="#DomainModule.__init__-46"><span class="linenos">46</span></a>
+</span><span id="DomainModule.__init__-47"><a href="#DomainModule.__init__-47"><span class="linenos">47</span></a><span class="sd">        Args:</span>
+</span><span id="DomainModule.__init__-48"><a href="#DomainModule.__init__-48"><span class="linenos">48</span></a><span class="sd">            latent_dim (`int`): latent dimension of the unimodal module</span>
+</span><span id="DomainModule.__init__-49"><a href="#DomainModule.__init__-49"><span class="linenos">49</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="DomainModule.__init__-50"><a href="#DomainModule.__init__-50"><span class="linenos">50</span></a>        <span class="nb">super</span><span class="p">()</span><span class="o">.</span><span class="fm">__init__</span><span class="p">()</span>
+</span><span id="DomainModule.__init__-51"><a href="#DomainModule.__init__-51"><span class="linenos">51</span></a>
+</span><span id="DomainModule.__init__-52"><a href="#DomainModule.__init__-52"><span class="linenos">52</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">latent_dim</span> <span class="o">=</span> <span class="n">latent_dim</span>
+</span><span id="DomainModule.__init__-53"><a href="#DomainModule.__init__-53"><span class="linenos">53</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;The latent dimension of the module.&quot;&quot;&quot;</span>
+</span></pre></div>
+
+
+            <div class="docstring"><p>Initializes a DomainModule.</p>
+
+<h6 id="arguments">Arguments:</h6>
+
+<ul>
+<li><strong>latent_dim (<code>int</code>):</strong>  latent dimension of the unimodal module</li>
+</ul>
+</div>
+
+
+                            </div>
+                            <div id="DomainModule.latent_dim" class="classattr">
+                                <div class="attr variable">
+            <span class="name">latent_dim</span>
+
+        
+    </div>
+    <a class="headerlink" href="#DomainModule.latent_dim"></a>
+    
+            <div class="docstring"><p>The latent dimension of the module.</p>
+</div>
+
+
+                            </div>
+                            <div id="DomainModule.encode" class="classattr">
+                                        <input id="DomainModule.encode-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
+<div class="attr function">
+            
+        <span class="def">def</span>
+        <span class="name">encode</span><span class="signature pdoc-code condensed">(<span class="param"><span class="bp">self</span>, </span><span class="param"><span class="n">x</span><span class="p">:</span> <span class="n">Any</span></span><span class="return-annotation">) -> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span>:</span></span>
+
+                <label class="view-source-button" for="DomainModule.encode-view-source"><span>View Source</span></label>
+
+    </div>
+    <a class="headerlink" href="#DomainModule.encode"></a>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="DomainModule.encode-55"><a href="#DomainModule.encode-55"><span class="linenos">55</span></a>    <span class="k">def</span> <span class="nf">encode</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">x</span><span class="p">:</span> <span class="n">Any</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">:</span>
+</span><span id="DomainModule.encode-56"><a href="#DomainModule.encode-56"><span class="linenos">56</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="DomainModule.encode-57"><a href="#DomainModule.encode-57"><span class="linenos">57</span></a><span class="sd">        Encode the domain data into a unimodal representation.</span>
+</span><span id="DomainModule.encode-58"><a href="#DomainModule.encode-58"><span class="linenos">58</span></a>
+</span><span id="DomainModule.encode-59"><a href="#DomainModule.encode-59"><span class="linenos">59</span></a><span class="sd">        Args:</span>
+</span><span id="DomainModule.encode-60"><a href="#DomainModule.encode-60"><span class="linenos">60</span></a><span class="sd">            x (`Any`): data of the domain.</span>
+</span><span id="DomainModule.encode-61"><a href="#DomainModule.encode-61"><span class="linenos">61</span></a><span class="sd">        Returns:</span>
+</span><span id="DomainModule.encode-62"><a href="#DomainModule.encode-62"><span class="linenos">62</span></a><span class="sd">            `torch.Tensor`: a unimodal representation.</span>
+</span><span id="DomainModule.encode-63"><a href="#DomainModule.encode-63"><span class="linenos">63</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="DomainModule.encode-64"><a href="#DomainModule.encode-64"><span class="linenos">64</span></a>        <span class="k">raise</span> <span class="ne">NotImplementedError</span>
+</span></pre></div>
+
+
+            <div class="docstring"><p>Encode the domain data into a unimodal representation.</p>
+
+<h6 id="arguments">Arguments:</h6>
+
+<ul>
+<li><strong>x (<code>Any</code>):</strong>  data of the domain.</li>
+</ul>
+
+<h6 id="returns">Returns:</h6>
+
+<blockquote>
+  <p><code>torch.Tensor</code>: a unimodal representation.</p>
+</blockquote>
+</div>
+
+
+                            </div>
+                            <div id="DomainModule.decode" class="classattr">
+                                        <input id="DomainModule.decode-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
+<div class="attr function">
+            
+        <span class="def">def</span>
+        <span class="name">decode</span><span class="signature pdoc-code condensed">(<span class="param"><span class="bp">self</span>, </span><span class="param"><span class="n">z</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span></span><span class="return-annotation">) -> <span class="n">Any</span>:</span></span>
+
+                <label class="view-source-button" for="DomainModule.decode-view-source"><span>View Source</span></label>
+
+    </div>
+    <a class="headerlink" href="#DomainModule.decode"></a>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="DomainModule.decode-66"><a href="#DomainModule.decode-66"><span class="linenos">66</span></a>    <span class="k">def</span> <span class="nf">decode</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">z</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">Any</span><span class="p">:</span>
+</span><span id="DomainModule.decode-67"><a href="#DomainModule.decode-67"><span class="linenos">67</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="DomainModule.decode-68"><a href="#DomainModule.decode-68"><span class="linenos">68</span></a><span class="sd">        Decode data from unimodal representation back to the domain data.</span>
+</span><span id="DomainModule.decode-69"><a href="#DomainModule.decode-69"><span class="linenos">69</span></a>
+</span><span id="DomainModule.decode-70"><a href="#DomainModule.decode-70"><span class="linenos">70</span></a><span class="sd">        Args:</span>
+</span><span id="DomainModule.decode-71"><a href="#DomainModule.decode-71"><span class="linenos">71</span></a><span class="sd">            z (`torch.Tensor`): unimodal representation of the domain.</span>
+</span><span id="DomainModule.decode-72"><a href="#DomainModule.decode-72"><span class="linenos">72</span></a><span class="sd">        Returns:</span>
+</span><span id="DomainModule.decode-73"><a href="#DomainModule.decode-73"><span class="linenos">73</span></a><span class="sd">            `Any`: the original domain data.</span>
+</span><span id="DomainModule.decode-74"><a href="#DomainModule.decode-74"><span class="linenos">74</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="DomainModule.decode-75"><a href="#DomainModule.decode-75"><span class="linenos">75</span></a>        <span class="k">raise</span> <span class="ne">NotImplementedError</span>
+</span></pre></div>
+
+
+            <div class="docstring"><p>Decode data from unimodal representation back to the domain data.</p>
+
+<h6 id="arguments">Arguments:</h6>
+
+<ul>
+<li><strong>z (<code>torch.Tensor</code>):</strong>  unimodal representation of the domain.</li>
+</ul>
+
+<h6 id="returns">Returns:</h6>
+
+<blockquote>
+  <p><code>Any</code>: the original domain data.</p>
+</blockquote>
+</div>
+
+
+                            </div>
+                            <div id="DomainModule.compute_loss" class="classattr">
+                                        <input id="DomainModule.compute_loss-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
+<div class="attr function">
+            
+        <span class="def">def</span>
+        <span class="name">compute_loss</span><span class="signature pdoc-code multiline">(<span class="param">	<span class="bp">self</span>,</span><span class="param">	<span class="n">pred</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span>,</span><span class="param">	<span class="n">target</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span></span><span class="return-annotation">) -> <span class="n"><a href="#LossOutput">LossOutput</a></span>:</span></span>
+
+                <label class="view-source-button" for="DomainModule.compute_loss-view-source"><span>View Source</span></label>
+
+    </div>
+    <a class="headerlink" href="#DomainModule.compute_loss"></a>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="DomainModule.compute_loss-77"><a href="#DomainModule.compute_loss-77"><span class="linenos">77</span></a>    <span class="k">def</span> <span class="nf">compute_loss</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">pred</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">,</span> <span class="n">target</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">LossOutput</span><span class="p">:</span>
+</span><span id="DomainModule.compute_loss-78"><a href="#DomainModule.compute_loss-78"><span class="linenos">78</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="DomainModule.compute_loss-79"><a href="#DomainModule.compute_loss-79"><span class="linenos">79</span></a><span class="sd">        Generic loss computation  the modality.</span>
+</span><span id="DomainModule.compute_loss-80"><a href="#DomainModule.compute_loss-80"><span class="linenos">80</span></a>
+</span><span id="DomainModule.compute_loss-81"><a href="#DomainModule.compute_loss-81"><span class="linenos">81</span></a><span class="sd">        Args:</span>
+</span><span id="DomainModule.compute_loss-82"><a href="#DomainModule.compute_loss-82"><span class="linenos">82</span></a><span class="sd">            pred (`torch.Tensor`): prediction of the model</span>
+</span><span id="DomainModule.compute_loss-83"><a href="#DomainModule.compute_loss-83"><span class="linenos">83</span></a><span class="sd">            target (`torch.Tensor`): target tensor</span>
+</span><span id="DomainModule.compute_loss-84"><a href="#DomainModule.compute_loss-84"><span class="linenos">84</span></a><span class="sd">        Results:</span>
+</span><span id="DomainModule.compute_loss-85"><a href="#DomainModule.compute_loss-85"><span class="linenos">85</span></a><span class="sd">            `LossOutput`: LossOuput with training loss and additional metrics.</span>
+</span><span id="DomainModule.compute_loss-86"><a href="#DomainModule.compute_loss-86"><span class="linenos">86</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="DomainModule.compute_loss-87"><a href="#DomainModule.compute_loss-87"><span class="linenos">87</span></a>        <span class="k">raise</span> <span class="ne">NotImplementedError</span>
+</span></pre></div>
+
+
+            <div class="docstring"><p>Generic loss computation  the modality.</p>
+
+<h6 id="arguments">Arguments:</h6>
+
+<ul>
+<li><strong>pred (<code>torch.Tensor</code>):</strong>  prediction of the model</li>
+<li><strong>target (<code>torch.Tensor</code>):</strong>  target tensor</li>
+</ul>
+
+<h6 id="results">Results:</h6>
+
+<blockquote>
+  <p><code><a href="#LossOutput">LossOutput</a></code>: LossOuput with training loss and additional metrics.</p>
+</blockquote>
+</div>
+
+
+                            </div>
+                            <div id="DomainModule.compute_dcy_loss" class="classattr">
+                                        <input id="DomainModule.compute_dcy_loss-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
+<div class="attr function">
+            
+        <span class="def">def</span>
+        <span class="name">compute_dcy_loss</span><span class="signature pdoc-code multiline">(<span class="param">	<span class="bp">self</span>,</span><span class="param">	<span class="n">pred</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span>,</span><span class="param">	<span class="n">target</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span></span><span class="return-annotation">) -> <span class="n"><a href="#LossOutput">LossOutput</a></span>:</span></span>
+
+                <label class="view-source-button" for="DomainModule.compute_dcy_loss-view-source"><span>View Source</span></label>
+
+    </div>
+    <a class="headerlink" href="#DomainModule.compute_dcy_loss"></a>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="DomainModule.compute_dcy_loss-89"><a href="#DomainModule.compute_dcy_loss-89"><span class="linenos"> 89</span></a>    <span class="k">def</span> <span class="nf">compute_dcy_loss</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">pred</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">,</span> <span class="n">target</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">LossOutput</span><span class="p">:</span>
+</span><span id="DomainModule.compute_dcy_loss-90"><a href="#DomainModule.compute_dcy_loss-90"><span class="linenos"> 90</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="DomainModule.compute_dcy_loss-91"><a href="#DomainModule.compute_dcy_loss-91"><span class="linenos"> 91</span></a><span class="sd">        Computes the loss for a demi-cycle. Override if the demi-cycle loss is</span>
+</span><span id="DomainModule.compute_dcy_loss-92"><a href="#DomainModule.compute_dcy_loss-92"><span class="linenos"> 92</span></a><span class="sd">        different that the generic loss.</span>
+</span><span id="DomainModule.compute_dcy_loss-93"><a href="#DomainModule.compute_dcy_loss-93"><span class="linenos"> 93</span></a>
+</span><span id="DomainModule.compute_dcy_loss-94"><a href="#DomainModule.compute_dcy_loss-94"><span class="linenos"> 94</span></a><span class="sd">        Args:</span>
+</span><span id="DomainModule.compute_dcy_loss-95"><a href="#DomainModule.compute_dcy_loss-95"><span class="linenos"> 95</span></a><span class="sd">            pred (`torch.Tensor`): prediction of the model</span>
+</span><span id="DomainModule.compute_dcy_loss-96"><a href="#DomainModule.compute_dcy_loss-96"><span class="linenos"> 96</span></a><span class="sd">            target (`torch.Tensor`): target tensor</span>
+</span><span id="DomainModule.compute_dcy_loss-97"><a href="#DomainModule.compute_dcy_loss-97"><span class="linenos"> 97</span></a><span class="sd">        Results:</span>
+</span><span id="DomainModule.compute_dcy_loss-98"><a href="#DomainModule.compute_dcy_loss-98"><span class="linenos"> 98</span></a><span class="sd">            `LossOutput`: LossOuput with training loss and additional metrics.</span>
+</span><span id="DomainModule.compute_dcy_loss-99"><a href="#DomainModule.compute_dcy_loss-99"><span class="linenos"> 99</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="DomainModule.compute_dcy_loss-100"><a href="#DomainModule.compute_dcy_loss-100"><span class="linenos">100</span></a>        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">compute_loss</span><span class="p">(</span><span class="n">pred</span><span class="p">,</span> <span class="n">target</span><span class="p">)</span>
+</span></pre></div>
+
+
+            <div class="docstring"><p>Computes the loss for a demi-cycle. Override if the demi-cycle loss is
+different that the generic loss.</p>
+
+<h6 id="arguments">Arguments:</h6>
+
+<ul>
+<li><strong>pred (<code>torch.Tensor</code>):</strong>  prediction of the model</li>
+<li><strong>target (<code>torch.Tensor</code>):</strong>  target tensor</li>
+</ul>
+
+<h6 id="results">Results:</h6>
+
+<blockquote>
+  <p><code><a href="#LossOutput">LossOutput</a></code>: LossOuput with training loss and additional metrics.</p>
+</blockquote>
+</div>
+
+
+                            </div>
+                            <div id="DomainModule.compute_cy_loss" class="classattr">
+                                        <input id="DomainModule.compute_cy_loss-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
+<div class="attr function">
+            
+        <span class="def">def</span>
+        <span class="name">compute_cy_loss</span><span class="signature pdoc-code multiline">(<span class="param">	<span class="bp">self</span>,</span><span class="param">	<span class="n">pred</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span>,</span><span class="param">	<span class="n">target</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span></span><span class="return-annotation">) -> <span class="n"><a href="#LossOutput">LossOutput</a></span>:</span></span>
+
+                <label class="view-source-button" for="DomainModule.compute_cy_loss-view-source"><span>View Source</span></label>
+
+    </div>
+    <a class="headerlink" href="#DomainModule.compute_cy_loss"></a>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="DomainModule.compute_cy_loss-102"><a href="#DomainModule.compute_cy_loss-102"><span class="linenos">102</span></a>    <span class="k">def</span> <span class="nf">compute_cy_loss</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">pred</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">,</span> <span class="n">target</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">LossOutput</span><span class="p">:</span>
+</span><span id="DomainModule.compute_cy_loss-103"><a href="#DomainModule.compute_cy_loss-103"><span class="linenos">103</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="DomainModule.compute_cy_loss-104"><a href="#DomainModule.compute_cy_loss-104"><span class="linenos">104</span></a><span class="sd">        Computes the loss for a cycle. Override if the cycle loss is</span>
+</span><span id="DomainModule.compute_cy_loss-105"><a href="#DomainModule.compute_cy_loss-105"><span class="linenos">105</span></a><span class="sd">        different that the generic loss.</span>
+</span><span id="DomainModule.compute_cy_loss-106"><a href="#DomainModule.compute_cy_loss-106"><span class="linenos">106</span></a>
+</span><span id="DomainModule.compute_cy_loss-107"><a href="#DomainModule.compute_cy_loss-107"><span class="linenos">107</span></a><span class="sd">        Args:</span>
+</span><span id="DomainModule.compute_cy_loss-108"><a href="#DomainModule.compute_cy_loss-108"><span class="linenos">108</span></a><span class="sd">            pred (`torch.Tensor`): prediction of the model</span>
+</span><span id="DomainModule.compute_cy_loss-109"><a href="#DomainModule.compute_cy_loss-109"><span class="linenos">109</span></a><span class="sd">            target (`torch.Tensor`): target tensor</span>
+</span><span id="DomainModule.compute_cy_loss-110"><a href="#DomainModule.compute_cy_loss-110"><span class="linenos">110</span></a><span class="sd">        Results:</span>
+</span><span id="DomainModule.compute_cy_loss-111"><a href="#DomainModule.compute_cy_loss-111"><span class="linenos">111</span></a><span class="sd">            `LossOutput`: LossOuput with training loss and additional metrics.</span>
+</span><span id="DomainModule.compute_cy_loss-112"><a href="#DomainModule.compute_cy_loss-112"><span class="linenos">112</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="DomainModule.compute_cy_loss-113"><a href="#DomainModule.compute_cy_loss-113"><span class="linenos">113</span></a>        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">compute_loss</span><span class="p">(</span><span class="n">pred</span><span class="p">,</span> <span class="n">target</span><span class="p">)</span>
+</span></pre></div>
+
+
+            <div class="docstring"><p>Computes the loss for a cycle. Override if the cycle loss is
+different that the generic loss.</p>
+
+<h6 id="arguments">Arguments:</h6>
+
+<ul>
+<li><strong>pred (<code>torch.Tensor</code>):</strong>  prediction of the model</li>
+<li><strong>target (<code>torch.Tensor</code>):</strong>  target tensor</li>
+</ul>
+
+<h6 id="results">Results:</h6>
+
+<blockquote>
+  <p><code><a href="#LossOutput">LossOutput</a></code>: LossOuput with training loss and additional metrics.</p>
+</blockquote>
+</div>
+
+
+                            </div>
+                            <div id="DomainModule.compute_tr_loss" class="classattr">
+                                        <input id="DomainModule.compute_tr_loss-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
+<div class="attr function">
+            
+        <span class="def">def</span>
+        <span class="name">compute_tr_loss</span><span class="signature pdoc-code multiline">(<span class="param">	<span class="bp">self</span>,</span><span class="param">	<span class="n">pred</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span>,</span><span class="param">	<span class="n">target</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span></span><span class="return-annotation">) -> <span class="n"><a href="#LossOutput">LossOutput</a></span>:</span></span>
+
+                <label class="view-source-button" for="DomainModule.compute_tr_loss-view-source"><span>View Source</span></label>
+
+    </div>
+    <a class="headerlink" href="#DomainModule.compute_tr_loss"></a>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="DomainModule.compute_tr_loss-115"><a href="#DomainModule.compute_tr_loss-115"><span class="linenos">115</span></a>    <span class="k">def</span> <span class="nf">compute_tr_loss</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">pred</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">,</span> <span class="n">target</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">LossOutput</span><span class="p">:</span>
+</span><span id="DomainModule.compute_tr_loss-116"><a href="#DomainModule.compute_tr_loss-116"><span class="linenos">116</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="DomainModule.compute_tr_loss-117"><a href="#DomainModule.compute_tr_loss-117"><span class="linenos">117</span></a><span class="sd">        Computes the loss for a translation. Override if the translation loss is</span>
+</span><span id="DomainModule.compute_tr_loss-118"><a href="#DomainModule.compute_tr_loss-118"><span class="linenos">118</span></a><span class="sd">        different that the generic loss.</span>
+</span><span id="DomainModule.compute_tr_loss-119"><a href="#DomainModule.compute_tr_loss-119"><span class="linenos">119</span></a>
+</span><span id="DomainModule.compute_tr_loss-120"><a href="#DomainModule.compute_tr_loss-120"><span class="linenos">120</span></a><span class="sd">        Args:</span>
+</span><span id="DomainModule.compute_tr_loss-121"><a href="#DomainModule.compute_tr_loss-121"><span class="linenos">121</span></a><span class="sd">            pred (`torch.Tensor`): prediction of the model</span>
+</span><span id="DomainModule.compute_tr_loss-122"><a href="#DomainModule.compute_tr_loss-122"><span class="linenos">122</span></a><span class="sd">            target (`torch.Tensor`): target tensor</span>
+</span><span id="DomainModule.compute_tr_loss-123"><a href="#DomainModule.compute_tr_loss-123"><span class="linenos">123</span></a><span class="sd">        Results:</span>
+</span><span id="DomainModule.compute_tr_loss-124"><a href="#DomainModule.compute_tr_loss-124"><span class="linenos">124</span></a><span class="sd">            `LossOutput`: LossOuput with training loss and additional metrics.</span>
+</span><span id="DomainModule.compute_tr_loss-125"><a href="#DomainModule.compute_tr_loss-125"><span class="linenos">125</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="DomainModule.compute_tr_loss-126"><a href="#DomainModule.compute_tr_loss-126"><span class="linenos">126</span></a>        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">compute_loss</span><span class="p">(</span><span class="n">pred</span><span class="p">,</span> <span class="n">target</span><span class="p">)</span>
+</span></pre></div>
+
+
+            <div class="docstring"><p>Computes the loss for a translation. Override if the translation loss is
+different that the generic loss.</p>
+
+<h6 id="arguments">Arguments:</h6>
+
+<ul>
+<li><strong>pred (<code>torch.Tensor</code>):</strong>  prediction of the model</li>
+<li><strong>target (<code>torch.Tensor</code>):</strong>  target tensor</li>
+</ul>
+
+<h6 id="results">Results:</h6>
+
+<blockquote>
+  <p><code><a href="#LossOutput">LossOutput</a></code>: LossOuput with training loss and additional metrics.</p>
+</blockquote>
+</div>
+
+
+                            </div>
+                            <div id="DomainModule.compute_broadcast_loss" class="classattr">
+                                        <input id="DomainModule.compute_broadcast_loss-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
+<div class="attr function">
+            
+        <span class="def">def</span>
+        <span class="name">compute_broadcast_loss</span><span class="signature pdoc-code multiline">(<span class="param">	<span class="bp">self</span>,</span><span class="param">	<span class="n">pred</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span>,</span><span class="param">	<span class="n">target</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span></span><span class="return-annotation">) -> <span class="n"><a href="#LossOutput">LossOutput</a></span>:</span></span>
+
+                <label class="view-source-button" for="DomainModule.compute_broadcast_loss-view-source"><span>View Source</span></label>
+
+    </div>
+    <a class="headerlink" href="#DomainModule.compute_broadcast_loss"></a>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="DomainModule.compute_broadcast_loss-128"><a href="#DomainModule.compute_broadcast_loss-128"><span class="linenos">128</span></a>    <span class="k">def</span> <span class="nf">compute_broadcast_loss</span><span class="p">(</span>
+</span><span id="DomainModule.compute_broadcast_loss-129"><a href="#DomainModule.compute_broadcast_loss-129"><span class="linenos">129</span></a>        <span class="bp">self</span><span class="p">,</span> <span class="n">pred</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">,</span> <span class="n">target</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span>
+</span><span id="DomainModule.compute_broadcast_loss-130"><a href="#DomainModule.compute_broadcast_loss-130"><span class="linenos">130</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="n">LossOutput</span><span class="p">:</span>
+</span><span id="DomainModule.compute_broadcast_loss-131"><a href="#DomainModule.compute_broadcast_loss-131"><span class="linenos">131</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="DomainModule.compute_broadcast_loss-132"><a href="#DomainModule.compute_broadcast_loss-132"><span class="linenos">132</span></a><span class="sd">        Computes the loss for a broadcast (fusion). Override if the broadcast loss is</span>
+</span><span id="DomainModule.compute_broadcast_loss-133"><a href="#DomainModule.compute_broadcast_loss-133"><span class="linenos">133</span></a><span class="sd">        different that the generic loss.</span>
+</span><span id="DomainModule.compute_broadcast_loss-134"><a href="#DomainModule.compute_broadcast_loss-134"><span class="linenos">134</span></a>
+</span><span id="DomainModule.compute_broadcast_loss-135"><a href="#DomainModule.compute_broadcast_loss-135"><span class="linenos">135</span></a><span class="sd">        Args:</span>
+</span><span id="DomainModule.compute_broadcast_loss-136"><a href="#DomainModule.compute_broadcast_loss-136"><span class="linenos">136</span></a><span class="sd">            pred (`torch.Tensor`): prediction of the model</span>
+</span><span id="DomainModule.compute_broadcast_loss-137"><a href="#DomainModule.compute_broadcast_loss-137"><span class="linenos">137</span></a><span class="sd">            target (`torch.Tensor`): target tensor</span>
+</span><span id="DomainModule.compute_broadcast_loss-138"><a href="#DomainModule.compute_broadcast_loss-138"><span class="linenos">138</span></a><span class="sd">        Results:</span>
+</span><span id="DomainModule.compute_broadcast_loss-139"><a href="#DomainModule.compute_broadcast_loss-139"><span class="linenos">139</span></a><span class="sd">            `LossOutput`: LossOuput with training loss and additional metrics.</span>
+</span><span id="DomainModule.compute_broadcast_loss-140"><a href="#DomainModule.compute_broadcast_loss-140"><span class="linenos">140</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="DomainModule.compute_broadcast_loss-141"><a href="#DomainModule.compute_broadcast_loss-141"><span class="linenos">141</span></a>        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">compute_loss</span><span class="p">(</span><span class="n">pred</span><span class="p">,</span> <span class="n">target</span><span class="p">)</span>
+</span></pre></div>
+
+
+            <div class="docstring"><p>Computes the loss for a broadcast (fusion). Override if the broadcast loss is
+different that the generic loss.</p>
+
+<h6 id="arguments">Arguments:</h6>
+
+<ul>
+<li><strong>pred (<code>torch.Tensor</code>):</strong>  prediction of the model</li>
+<li><strong>target (<code>torch.Tensor</code>):</strong>  target tensor</li>
+</ul>
+
+<h6 id="results">Results:</h6>
+
+<blockquote>
+  <p><code><a href="#LossOutput">LossOutput</a></code>: LossOuput with training loss and additional metrics.</p>
+</blockquote>
+</div>
+
+
+                            </div>
+                            <div class="inherited">
+                                <h5>Inherited Members</h5>
+                                <dl>
+                                    <div><dt>lightning.pytorch.core.module.LightningModule</dt>
+                                <dd id="DomainModule.CHECKPOINT_HYPER_PARAMS_KEY" class="variable">CHECKPOINT_HYPER_PARAMS_KEY</dd>
+                <dd id="DomainModule.CHECKPOINT_HYPER_PARAMS_NAME" class="variable">CHECKPOINT_HYPER_PARAMS_NAME</dd>
+                <dd id="DomainModule.CHECKPOINT_HYPER_PARAMS_TYPE" class="variable">CHECKPOINT_HYPER_PARAMS_TYPE</dd>
+                <dd id="DomainModule.optimizers" class="function">optimizers</dd>
+                <dd id="DomainModule.lr_schedulers" class="function">lr_schedulers</dd>
+                <dd id="DomainModule.trainer" class="variable">trainer</dd>
+                <dd id="DomainModule.fabric" class="variable">fabric</dd>
+                <dd id="DomainModule.example_input_array" class="variable">example_input_array</dd>
+                <dd id="DomainModule.current_epoch" class="variable">current_epoch</dd>
+                <dd id="DomainModule.global_step" class="variable">global_step</dd>
+                <dd id="DomainModule.global_rank" class="variable">global_rank</dd>
+                <dd id="DomainModule.local_rank" class="variable">local_rank</dd>
+                <dd id="DomainModule.on_gpu" class="variable">on_gpu</dd>
+                <dd id="DomainModule.automatic_optimization" class="variable">automatic_optimization</dd>
+                <dd id="DomainModule.strict_loading" class="variable">strict_loading</dd>
+                <dd id="DomainModule.logger" class="variable">logger</dd>
+                <dd id="DomainModule.loggers" class="variable">loggers</dd>
+                <dd id="DomainModule.print" class="function">print</dd>
+                <dd id="DomainModule.log" class="function">log</dd>
+                <dd id="DomainModule.log_dict" class="function">log_dict</dd>
+                <dd id="DomainModule.all_gather" class="function">all_gather</dd>
+                <dd id="DomainModule.forward" class="function">forward</dd>
+                <dd id="DomainModule.training_step" class="function">training_step</dd>
+                <dd id="DomainModule.validation_step" class="function">validation_step</dd>
+                <dd id="DomainModule.test_step" class="function">test_step</dd>
+                <dd id="DomainModule.predict_step" class="function">predict_step</dd>
+                <dd id="DomainModule.configure_callbacks" class="function">configure_callbacks</dd>
+                <dd id="DomainModule.configure_optimizers" class="function">configure_optimizers</dd>
+                <dd id="DomainModule.manual_backward" class="function">manual_backward</dd>
+                <dd id="DomainModule.backward" class="function">backward</dd>
+                <dd id="DomainModule.toggle_optimizer" class="function">toggle_optimizer</dd>
+                <dd id="DomainModule.untoggle_optimizer" class="function">untoggle_optimizer</dd>
+                <dd id="DomainModule.clip_gradients" class="function">clip_gradients</dd>
+                <dd id="DomainModule.configure_gradient_clipping" class="function">configure_gradient_clipping</dd>
+                <dd id="DomainModule.lr_scheduler_step" class="function">lr_scheduler_step</dd>
+                <dd id="DomainModule.optimizer_step" class="function">optimizer_step</dd>
+                <dd id="DomainModule.optimizer_zero_grad" class="function">optimizer_zero_grad</dd>
+                <dd id="DomainModule.freeze" class="function">freeze</dd>
+                <dd id="DomainModule.unfreeze" class="function">unfreeze</dd>
+                <dd id="DomainModule.to_onnx" class="function">to_onnx</dd>
+                <dd id="DomainModule.to_torchscript" class="function">to_torchscript</dd>
+                <dd id="DomainModule.load_from_checkpoint" class="function">load_from_checkpoint</dd>
+
+            </div>
+            <div><dt>lightning.fabric.utilities.device_dtype_mixin._DeviceDtypeModuleMixin</dt>
+                                <dd id="DomainModule.dtype" class="variable">dtype</dd>
+                <dd id="DomainModule.device" class="variable">device</dd>
+                <dd id="DomainModule.to" class="function">to</dd>
+                <dd id="DomainModule.cuda" class="function">cuda</dd>
+                <dd id="DomainModule.cpu" class="function">cpu</dd>
+                <dd id="DomainModule.type" class="function">type</dd>
+                <dd id="DomainModule.float" class="function">float</dd>
+                <dd id="DomainModule.double" class="function">double</dd>
+                <dd id="DomainModule.half" class="function">half</dd>
+
+            </div>
+            <div><dt>lightning.pytorch.core.mixins.hparams_mixin.HyperparametersMixin</dt>
+                                <dd id="DomainModule.save_hyperparameters" class="function">save_hyperparameters</dd>
+                <dd id="DomainModule.hparams" class="variable">hparams</dd>
+                <dd id="DomainModule.hparams_initial" class="variable">hparams_initial</dd>
+
+            </div>
+            <div><dt>lightning.pytorch.core.hooks.ModelHooks</dt>
+                                <dd id="DomainModule.on_fit_start" class="function">on_fit_start</dd>
+                <dd id="DomainModule.on_fit_end" class="function">on_fit_end</dd>
+                <dd id="DomainModule.on_train_start" class="function">on_train_start</dd>
+                <dd id="DomainModule.on_train_end" class="function">on_train_end</dd>
+                <dd id="DomainModule.on_validation_start" class="function">on_validation_start</dd>
+                <dd id="DomainModule.on_validation_end" class="function">on_validation_end</dd>
+                <dd id="DomainModule.on_test_start" class="function">on_test_start</dd>
+                <dd id="DomainModule.on_test_end" class="function">on_test_end</dd>
+                <dd id="DomainModule.on_predict_start" class="function">on_predict_start</dd>
+                <dd id="DomainModule.on_predict_end" class="function">on_predict_end</dd>
+                <dd id="DomainModule.on_train_batch_start" class="function">on_train_batch_start</dd>
+                <dd id="DomainModule.on_train_batch_end" class="function">on_train_batch_end</dd>
+                <dd id="DomainModule.on_validation_batch_start" class="function">on_validation_batch_start</dd>
+                <dd id="DomainModule.on_validation_batch_end" class="function">on_validation_batch_end</dd>
+                <dd id="DomainModule.on_test_batch_start" class="function">on_test_batch_start</dd>
+                <dd id="DomainModule.on_test_batch_end" class="function">on_test_batch_end</dd>
+                <dd id="DomainModule.on_predict_batch_start" class="function">on_predict_batch_start</dd>
+                <dd id="DomainModule.on_predict_batch_end" class="function">on_predict_batch_end</dd>
+                <dd id="DomainModule.on_validation_model_zero_grad" class="function">on_validation_model_zero_grad</dd>
+                <dd id="DomainModule.on_validation_model_eval" class="function">on_validation_model_eval</dd>
+                <dd id="DomainModule.on_validation_model_train" class="function">on_validation_model_train</dd>
+                <dd id="DomainModule.on_test_model_eval" class="function">on_test_model_eval</dd>
+                <dd id="DomainModule.on_test_model_train" class="function">on_test_model_train</dd>
+                <dd id="DomainModule.on_predict_model_eval" class="function">on_predict_model_eval</dd>
+                <dd id="DomainModule.on_train_epoch_start" class="function">on_train_epoch_start</dd>
+                <dd id="DomainModule.on_train_epoch_end" class="function">on_train_epoch_end</dd>
+                <dd id="DomainModule.on_validation_epoch_start" class="function">on_validation_epoch_start</dd>
+                <dd id="DomainModule.on_validation_epoch_end" class="function">on_validation_epoch_end</dd>
+                <dd id="DomainModule.on_test_epoch_start" class="function">on_test_epoch_start</dd>
+                <dd id="DomainModule.on_test_epoch_end" class="function">on_test_epoch_end</dd>
+                <dd id="DomainModule.on_predict_epoch_start" class="function">on_predict_epoch_start</dd>
+                <dd id="DomainModule.on_predict_epoch_end" class="function">on_predict_epoch_end</dd>
+                <dd id="DomainModule.on_before_zero_grad" class="function">on_before_zero_grad</dd>
+                <dd id="DomainModule.on_before_backward" class="function">on_before_backward</dd>
+                <dd id="DomainModule.on_after_backward" class="function">on_after_backward</dd>
+                <dd id="DomainModule.on_before_optimizer_step" class="function">on_before_optimizer_step</dd>
+                <dd id="DomainModule.configure_sharded_model" class="function">configure_sharded_model</dd>
+                <dd id="DomainModule.configure_model" class="function">configure_model</dd>
+
+            </div>
+            <div><dt>lightning.pytorch.core.hooks.DataHooks</dt>
+                                <dd id="DomainModule.prepare_data_per_node" class="variable">prepare_data_per_node</dd>
+                <dd id="DomainModule.allow_zero_length_dataloader_with_multiple_devices" class="variable">allow_zero_length_dataloader_with_multiple_devices</dd>
+                <dd id="DomainModule.prepare_data" class="function">prepare_data</dd>
+                <dd id="DomainModule.setup" class="function">setup</dd>
+                <dd id="DomainModule.teardown" class="function">teardown</dd>
+                <dd id="DomainModule.train_dataloader" class="function">train_dataloader</dd>
+                <dd id="DomainModule.test_dataloader" class="function">test_dataloader</dd>
+                <dd id="DomainModule.val_dataloader" class="function">val_dataloader</dd>
+                <dd id="DomainModule.predict_dataloader" class="function">predict_dataloader</dd>
+                <dd id="DomainModule.transfer_batch_to_device" class="function">transfer_batch_to_device</dd>
+                <dd id="DomainModule.on_before_batch_transfer" class="function">on_before_batch_transfer</dd>
+                <dd id="DomainModule.on_after_batch_transfer" class="function">on_after_batch_transfer</dd>
+
+            </div>
+            <div><dt>lightning.pytorch.core.hooks.CheckpointHooks</dt>
+                                <dd id="DomainModule.on_load_checkpoint" class="function">on_load_checkpoint</dd>
+                <dd id="DomainModule.on_save_checkpoint" class="function">on_save_checkpoint</dd>
+
+            </div>
+            <div><dt>torch.nn.modules.module.Module</dt>
+                                <dd id="DomainModule.dump_patches" class="variable">dump_patches</dd>
+                <dd id="DomainModule.training" class="variable">training</dd>
+                <dd id="DomainModule.call_super_init" class="variable">call_super_init</dd>
+                <dd id="DomainModule.register_buffer" class="function">register_buffer</dd>
+                <dd id="DomainModule.register_parameter" class="function">register_parameter</dd>
+                <dd id="DomainModule.add_module" class="function">add_module</dd>
+                <dd id="DomainModule.register_module" class="function">register_module</dd>
+                <dd id="DomainModule.get_submodule" class="function">get_submodule</dd>
+                <dd id="DomainModule.get_parameter" class="function">get_parameter</dd>
+                <dd id="DomainModule.get_buffer" class="function">get_buffer</dd>
+                <dd id="DomainModule.get_extra_state" class="function">get_extra_state</dd>
+                <dd id="DomainModule.set_extra_state" class="function">set_extra_state</dd>
+                <dd id="DomainModule.apply" class="function">apply</dd>
+                <dd id="DomainModule.ipu" class="function">ipu</dd>
+                <dd id="DomainModule.xpu" class="function">xpu</dd>
+                <dd id="DomainModule.bfloat16" class="function">bfloat16</dd>
+                <dd id="DomainModule.to_empty" class="function">to_empty</dd>
+                <dd id="DomainModule.register_full_backward_pre_hook" class="function">register_full_backward_pre_hook</dd>
+                <dd id="DomainModule.register_backward_hook" class="function">register_backward_hook</dd>
+                <dd id="DomainModule.register_full_backward_hook" class="function">register_full_backward_hook</dd>
+                <dd id="DomainModule.register_forward_pre_hook" class="function">register_forward_pre_hook</dd>
+                <dd id="DomainModule.register_forward_hook" class="function">register_forward_hook</dd>
+                <dd id="DomainModule.register_state_dict_pre_hook" class="function">register_state_dict_pre_hook</dd>
+                <dd id="DomainModule.state_dict" class="function">state_dict</dd>
+                <dd id="DomainModule.register_load_state_dict_post_hook" class="function">register_load_state_dict_post_hook</dd>
+                <dd id="DomainModule.load_state_dict" class="function">load_state_dict</dd>
+                <dd id="DomainModule.parameters" class="function">parameters</dd>
+                <dd id="DomainModule.named_parameters" class="function">named_parameters</dd>
+                <dd id="DomainModule.buffers" class="function">buffers</dd>
+                <dd id="DomainModule.named_buffers" class="function">named_buffers</dd>
+                <dd id="DomainModule.children" class="function">children</dd>
+                <dd id="DomainModule.named_children" class="function">named_children</dd>
+                <dd id="DomainModule.modules" class="function">modules</dd>
+                <dd id="DomainModule.named_modules" class="function">named_modules</dd>
+                <dd id="DomainModule.train" class="function">train</dd>
+                <dd id="DomainModule.eval" class="function">eval</dd>
+                <dd id="DomainModule.requires_grad_" class="function">requires_grad_</dd>
+                <dd id="DomainModule.zero_grad" class="function">zero_grad</dd>
+                <dd id="DomainModule.share_memory" class="function">share_memory</dd>
+                <dd id="DomainModule.extra_repr" class="function">extra_repr</dd>
+                <dd id="DomainModule.compile" class="function">compile</dd>
+
+            </div>
+                                </dl>
+                            </div>
+                </section>
+    </main>
+<script>
+    function escapeHTML(html) {
+        return document.createElement('div').appendChild(document.createTextNode(html)).parentNode.innerHTML;
+    }
+
+    const originalContent = document.querySelector("main.pdoc");
+    let currentContent = originalContent;
+
+    function setContent(innerHTML) {
+        let elem;
+        if (innerHTML) {
+            elem = document.createElement("main");
+            elem.classList.add("pdoc");
+            elem.innerHTML = innerHTML;
+        } else {
+            elem = originalContent;
+        }
+        if (currentContent !== elem) {
+            currentContent.replaceWith(elem);
+            currentContent = elem;
+        }
+    }
+
+    function getSearchTerm() {
+        return (new URL(window.location)).searchParams.get("search");
+    }
+
+    const searchBox = document.querySelector(".pdoc input[type=search]");
+    searchBox.addEventListener("input", function () {
+        let url = new URL(window.location);
+        if (searchBox.value.trim()) {
+            url.hash = "";
+            url.searchParams.set("search", searchBox.value);
+        } else {
+            url.searchParams.delete("search");
+        }
+        history.replaceState("", "", url.toString());
+        onInput();
+    });
+    window.addEventListener("popstate", onInput);
+
+
+    let search, searchErr;
+
+    async function initialize() {
+        try {
+            search = await new Promise((resolve, reject) => {
+                const script = document.createElement("script");
+                script.type = "text/javascript";
+                script.async = true;
+                script.onload = () => resolve(window.pdocSearch);
+                script.onerror = (e) => reject(e);
+                script.src = "../../search.js";
+                document.getElementsByTagName("head")[0].appendChild(script);
+            });
+        } catch (e) {
+            console.error("Cannot fetch pdoc search index");
+            searchErr = "Cannot fetch search index.";
+        }
+        onInput();
+
+        document.querySelector("nav.pdoc").addEventListener("click", e => {
+            if (e.target.hash) {
+                searchBox.value = "";
+                searchBox.dispatchEvent(new Event("input"));
+            }
+        });
+    }
+
+    function onInput() {
+        setContent((() => {
+            const term = getSearchTerm();
+            if (!term) {
+                return null
+            }
+            if (searchErr) {
+                return `<h3>Error: ${searchErr}</h3>`
+            }
+            if (!search) {
+                return "<h3>Searching...</h3>"
+            }
+
+            window.scrollTo({top: 0, left: 0, behavior: 'auto'});
+
+            const results = search(term);
+
+            let html;
+            if (results.length === 0) {
+                html = `No search results for '${escapeHTML(term)}'.`
+            } else {
+                html = `<h4>${results.length} search result${results.length > 1 ? "s" : ""} for '${escapeHTML(term)}'.</h4>`;
+            }
+            for (let result of results.slice(0, 10)) {
+                let doc = result.doc;
+                let url = `../../${doc.modulename.replaceAll(".", "/")}.html`;
+                if (doc.qualname) {
+                    url += `#${doc.qualname}`;
+                }
+
+                let heading;
+                switch (result.doc.kind) {
+                    case "function":
+                        if (doc.fullname.endsWith(".__init__")) {
+                            heading = `<span class="name">${doc.fullname.replace(/\.__init__$/, "")}</span>${doc.signature}`;
+                        } else {
+                            heading = `<span class="def">${doc.funcdef}</span> <span class="name">${doc.fullname}</span>${doc.signature}`;
+                        }
+                        break;
+                    case "class":
+                        heading = `<span class="def">class</span> <span class="name">${doc.fullname}</span>`;
+                        if (doc.bases)
+                            heading += `<wbr>(<span class="base">${doc.bases}</span>)`;
+                        heading += `:`;
+                        break;
+                    case "variable":
+                        heading = `<span class="name">${doc.fullname}</span>`;
+                        if (doc.annotation)
+                            heading += `<span class="annotation">${doc.annotation}</span>`;
+                        if (doc.default_value)
+                            heading += `<span class="default_value"> = ${doc.default_value}</span>`;
+                        break;
+                    default:
+                        heading = `<span class="name">${doc.fullname}</span>`;
+                        break;
+                }
+                html += `
+                        <section class="search-result">
+                        <a href="${url}" class="attr ${doc.kind}">${heading}</a>
+                        <div class="docstring">${doc.doc}</div>
+                        </section>
+                    `;
+
+            }
+            return html;
+        })());
+    }
+
+    if (getSearchTerm()) {
+        initialize();
+        searchBox.value = getSearchTerm();
+        onInput();
+    } else {
+        searchBox.addEventListener("focus", initialize, {once: true});
+    }
+
+    searchBox.addEventListener("keydown", e => {
+        if (["ArrowDown", "ArrowUp", "Enter"].includes(e.key)) {
+            let focused = currentContent.querySelector(".search-result.focused");
+            if (!focused) {
+                currentContent.querySelector(".search-result").classList.add("focused");
+            } else if (
+                e.key === "ArrowDown"
+                && focused.nextElementSibling
+                && focused.nextElementSibling.classList.contains("search-result")
+            ) {
+                focused.classList.remove("focused");
+                focused.nextElementSibling.classList.add("focused");
+                focused.nextElementSibling.scrollIntoView({
+                    behavior: "smooth",
+                    block: "nearest",
+                    inline: "nearest"
+                });
+            } else if (
+                e.key === "ArrowUp"
+                && focused.previousElementSibling
+                && focused.previousElementSibling.classList.contains("search-result")
+            ) {
+                focused.classList.remove("focused");
+                focused.previousElementSibling.classList.add("focused");
+                focused.previousElementSibling.scrollIntoView({
+                    behavior: "smooth",
+                    block: "nearest",
+                    inline: "nearest"
+                });
+            } else if (
+                e.key === "Enter"
+            ) {
+                focused.querySelector("a").click();
+            }
+        }
+    });
+</script></body>
+</html>
\ No newline at end of file
diff --git a/docs/api/v0.5.1/shimmer/modules/global_workspace.html b/docs/api/v0.5.1/shimmer/modules/global_workspace.html
new file mode 100644
index 00000000..03727560
--- /dev/null
+++ b/docs/api/v0.5.1/shimmer/modules/global_workspace.html
@@ -0,0 +1,4260 @@
+<!doctype html>
+<html lang="en">
+<head>
+    <meta charset="utf-8">
+    <meta name="viewport" content="width=device-width, initial-scale=1">
+    <meta name="generator" content="pdoc 14.4.0"/>
+    <title>shimmer.modules.global_workspace API documentation</title>
+
+    <style>/*! * Bootstrap Reboot v5.0.0 (https://getbootstrap.com/) * Copyright 2011-2021 The Bootstrap Authors * Copyright 2011-2021 Twitter, Inc. * Licensed under MIT (https://github.com/twbs/bootstrap/blob/main/LICENSE) * Forked from Normalize.css, licensed MIT (https://github.com/necolas/normalize.css/blob/master/LICENSE.md) */*,::after,::before{box-sizing:border-box}@media (prefers-reduced-motion:no-preference){:root{scroll-behavior:smooth}}body{margin:0;font-family:system-ui,-apple-system,"Segoe UI",Roboto,"Helvetica Neue",Arial,"Noto Sans","Liberation Sans",sans-serif,"Apple Color Emoji","Segoe UI Emoji","Segoe UI Symbol","Noto Color Emoji";font-size:1rem;font-weight:400;line-height:1.5;color:#212529;background-color:#fff;-webkit-text-size-adjust:100%;-webkit-tap-highlight-color:transparent}hr{margin:1rem 0;color:inherit;background-color:currentColor;border:0;opacity:.25}hr:not([size]){height:1px}h1,h2,h3,h4,h5,h6{margin-top:0;margin-bottom:.5rem;font-weight:500;line-height:1.2}h1{font-size:calc(1.375rem + 1.5vw)}@media (min-width:1200px){h1{font-size:2.5rem}}h2{font-size:calc(1.325rem + .9vw)}@media (min-width:1200px){h2{font-size:2rem}}h3{font-size:calc(1.3rem + .6vw)}@media (min-width:1200px){h3{font-size:1.75rem}}h4{font-size:calc(1.275rem + .3vw)}@media (min-width:1200px){h4{font-size:1.5rem}}h5{font-size:1.25rem}h6{font-size:1rem}p{margin-top:0;margin-bottom:1rem}abbr[data-bs-original-title],abbr[title]{-webkit-text-decoration:underline dotted;text-decoration:underline dotted;cursor:help;-webkit-text-decoration-skip-ink:none;text-decoration-skip-ink:none}address{margin-bottom:1rem;font-style:normal;line-height:inherit}ol,ul{padding-left:2rem}dl,ol,ul{margin-top:0;margin-bottom:1rem}ol ol,ol ul,ul ol,ul ul{margin-bottom:0}dt{font-weight:700}dd{margin-bottom:.5rem;margin-left:0}blockquote{margin:0 0 1rem}b,strong{font-weight:bolder}small{font-size:.875em}mark{padding:.2em;background-color:#fcf8e3}sub,sup{position:relative;font-size:.75em;line-height:0;vertical-align:baseline}sub{bottom:-.25em}sup{top:-.5em}a{color:#0d6efd;text-decoration:underline}a:hover{color:#0a58ca}a:not([href]):not([class]),a:not([href]):not([class]):hover{color:inherit;text-decoration:none}code,kbd,pre,samp{font-family:SFMono-Regular,Menlo,Monaco,Consolas,"Liberation Mono","Courier New",monospace;font-size:1em;direction:ltr;unicode-bidi:bidi-override}pre{display:block;margin-top:0;margin-bottom:1rem;overflow:auto;font-size:.875em}pre code{font-size:inherit;color:inherit;word-break:normal}code{font-size:.875em;color:#d63384;word-wrap:break-word}a>code{color:inherit}kbd{padding:.2rem .4rem;font-size:.875em;color:#fff;background-color:#212529;border-radius:.2rem}kbd kbd{padding:0;font-size:1em;font-weight:700}figure{margin:0 0 1rem}img,svg{vertical-align:middle}table{caption-side:bottom;border-collapse:collapse}caption{padding-top:.5rem;padding-bottom:.5rem;color:#6c757d;text-align:left}th{text-align:inherit;text-align:-webkit-match-parent}tbody,td,tfoot,th,thead,tr{border-color:inherit;border-style:solid;border-width:0}label{display:inline-block}button{border-radius:0}button:focus:not(:focus-visible){outline:0}button,input,optgroup,select,textarea{margin:0;font-family:inherit;font-size:inherit;line-height:inherit}button,select{text-transform:none}[role=button]{cursor:pointer}select{word-wrap:normal}select:disabled{opacity:1}[list]::-webkit-calendar-picker-indicator{display:none}[type=button],[type=reset],[type=submit],button{-webkit-appearance:button}[type=button]:not(:disabled),[type=reset]:not(:disabled),[type=submit]:not(:disabled),button:not(:disabled){cursor:pointer}::-moz-focus-inner{padding:0;border-style:none}textarea{resize:vertical}fieldset{min-width:0;padding:0;margin:0;border:0}legend{float:left;width:100%;padding:0;margin-bottom:.5rem;font-size:calc(1.275rem + .3vw);line-height:inherit}@media (min-width:1200px){legend{font-size:1.5rem}}legend+*{clear:left}::-webkit-datetime-edit-day-field,::-webkit-datetime-edit-fields-wrapper,::-webkit-datetime-edit-hour-field,::-webkit-datetime-edit-minute,::-webkit-datetime-edit-month-field,::-webkit-datetime-edit-text,::-webkit-datetime-edit-year-field{padding:0}::-webkit-inner-spin-button{height:auto}[type=search]{outline-offset:-2px;-webkit-appearance:textfield}::-webkit-search-decoration{-webkit-appearance:none}::-webkit-color-swatch-wrapper{padding:0}::file-selector-button{font:inherit}::-webkit-file-upload-button{font:inherit;-webkit-appearance:button}output{display:inline-block}iframe{border:0}summary{display:list-item;cursor:pointer}progress{vertical-align:baseline}[hidden]{display:none!important}</style>
+    <style>/*! syntax-highlighting.css */pre{line-height:125%;}span.linenos{color:inherit; background-color:transparent; padding-left:5px; padding-right:20px;}.pdoc-code .hll{background-color:#ffffcc}.pdoc-code{background:#f8f8f8;}.pdoc-code .c{color:#3D7B7B; font-style:italic}.pdoc-code .err{border:1px solid #FF0000}.pdoc-code .k{color:#008000; font-weight:bold}.pdoc-code .o{color:#666666}.pdoc-code .ch{color:#3D7B7B; font-style:italic}.pdoc-code .cm{color:#3D7B7B; font-style:italic}.pdoc-code .cp{color:#9C6500}.pdoc-code .cpf{color:#3D7B7B; font-style:italic}.pdoc-code .c1{color:#3D7B7B; font-style:italic}.pdoc-code .cs{color:#3D7B7B; font-style:italic}.pdoc-code .gd{color:#A00000}.pdoc-code .ge{font-style:italic}.pdoc-code .gr{color:#E40000}.pdoc-code .gh{color:#000080; font-weight:bold}.pdoc-code .gi{color:#008400}.pdoc-code .go{color:#717171}.pdoc-code .gp{color:#000080; font-weight:bold}.pdoc-code .gs{font-weight:bold}.pdoc-code .gu{color:#800080; font-weight:bold}.pdoc-code .gt{color:#0044DD}.pdoc-code .kc{color:#008000; font-weight:bold}.pdoc-code .kd{color:#008000; font-weight:bold}.pdoc-code .kn{color:#008000; font-weight:bold}.pdoc-code .kp{color:#008000}.pdoc-code .kr{color:#008000; font-weight:bold}.pdoc-code .kt{color:#B00040}.pdoc-code .m{color:#666666}.pdoc-code .s{color:#BA2121}.pdoc-code .na{color:#687822}.pdoc-code .nb{color:#008000}.pdoc-code .nc{color:#0000FF; font-weight:bold}.pdoc-code .no{color:#880000}.pdoc-code .nd{color:#AA22FF}.pdoc-code .ni{color:#717171; font-weight:bold}.pdoc-code .ne{color:#CB3F38; font-weight:bold}.pdoc-code .nf{color:#0000FF}.pdoc-code .nl{color:#767600}.pdoc-code .nn{color:#0000FF; font-weight:bold}.pdoc-code .nt{color:#008000; font-weight:bold}.pdoc-code .nv{color:#19177C}.pdoc-code .ow{color:#AA22FF; font-weight:bold}.pdoc-code .w{color:#bbbbbb}.pdoc-code .mb{color:#666666}.pdoc-code .mf{color:#666666}.pdoc-code .mh{color:#666666}.pdoc-code .mi{color:#666666}.pdoc-code .mo{color:#666666}.pdoc-code .sa{color:#BA2121}.pdoc-code .sb{color:#BA2121}.pdoc-code .sc{color:#BA2121}.pdoc-code .dl{color:#BA2121}.pdoc-code .sd{color:#BA2121; font-style:italic}.pdoc-code .s2{color:#BA2121}.pdoc-code .se{color:#AA5D1F; font-weight:bold}.pdoc-code .sh{color:#BA2121}.pdoc-code .si{color:#A45A77; font-weight:bold}.pdoc-code .sx{color:#008000}.pdoc-code .sr{color:#A45A77}.pdoc-code .s1{color:#BA2121}.pdoc-code .ss{color:#19177C}.pdoc-code .bp{color:#008000}.pdoc-code .fm{color:#0000FF}.pdoc-code .vc{color:#19177C}.pdoc-code .vg{color:#19177C}.pdoc-code .vi{color:#19177C}.pdoc-code .vm{color:#19177C}.pdoc-code .il{color:#666666}</style>
+    <style>/*! theme.css */:root{--pdoc-background:#fff;}.pdoc{--text:#212529;--muted:#6c757d;--link:#3660a5;--link-hover:#1659c5;--code:#f8f8f8;--active:#fff598;--accent:#eee;--accent2:#c1c1c1;--nav-hover:rgba(255, 255, 255, 0.5);--name:#0066BB;--def:#008800;--annotation:#007020;}</style>
+    <style>/*! layout.css */html, body{width:100%;height:100%;}html, main{scroll-behavior:smooth;}body{background-color:var(--pdoc-background);}@media (max-width:769px){#navtoggle{cursor:pointer;position:absolute;width:50px;height:40px;top:1rem;right:1rem;border-color:var(--text);color:var(--text);display:flex;opacity:0.8;z-index:999;}#navtoggle:hover{opacity:1;}#togglestate + div{display:none;}#togglestate:checked + div{display:inherit;}main, header{padding:2rem 3vw;}header + main{margin-top:-3rem;}.git-button{display:none !important;}nav input[type="search"]{max-width:77%;}nav input[type="search"]:first-child{margin-top:-6px;}nav input[type="search"]:valid ~ *{display:none !important;}}@media (min-width:770px){:root{--sidebar-width:clamp(12.5rem, 28vw, 22rem);}nav{position:fixed;overflow:auto;height:100vh;width:var(--sidebar-width);}main, header{padding:3rem 2rem 3rem calc(var(--sidebar-width) + 3rem);width:calc(54rem + var(--sidebar-width));max-width:100%;}header + main{margin-top:-4rem;}#navtoggle{display:none;}}#togglestate{position:absolute;height:0;opacity:0;}nav.pdoc{--pad:clamp(0.5rem, 2vw, 1.75rem);--indent:1.5rem;background-color:var(--accent);border-right:1px solid var(--accent2);box-shadow:0 0 20px rgba(50, 50, 50, .2) inset;padding:0 0 0 var(--pad);overflow-wrap:anywhere;scrollbar-width:thin; scrollbar-color:var(--accent2) transparent; z-index:1}nav.pdoc::-webkit-scrollbar{width:.4rem; }nav.pdoc::-webkit-scrollbar-thumb{background-color:var(--accent2); }nav.pdoc > div{padding:var(--pad) 0;}nav.pdoc .module-list-button{display:inline-flex;align-items:center;color:var(--text);border-color:var(--muted);margin-bottom:1rem;}nav.pdoc .module-list-button:hover{border-color:var(--text);}nav.pdoc input[type=search]{display:block;outline-offset:0;width:calc(100% - var(--pad));}nav.pdoc .logo{max-width:calc(100% - var(--pad));max-height:35vh;display:block;margin:0 auto 1rem;transform:translate(calc(-.5 * var(--pad)), 0);}nav.pdoc ul{list-style:none;padding-left:0;}nav.pdoc > div > ul{margin-left:calc(0px - var(--pad));}nav.pdoc li a{padding:.2rem 0 .2rem calc(var(--pad) + var(--indent));}nav.pdoc > div > ul > li > a{padding-left:var(--pad);}nav.pdoc li{transition:all 100ms;}nav.pdoc li:hover{background-color:var(--nav-hover);}nav.pdoc a, nav.pdoc a:hover{color:var(--text);}nav.pdoc a{display:block;}nav.pdoc > h2:first-of-type{margin-top:1.5rem;}nav.pdoc .class:before{content:"class ";color:var(--muted);}nav.pdoc .function:after{content:"()";color:var(--muted);}nav.pdoc footer:before{content:"";display:block;width:calc(100% - var(--pad));border-top:solid var(--accent2) 1px;margin-top:1.5rem;padding-top:.5rem;}nav.pdoc footer{font-size:small;}</style>
+    <style>/*! content.css */.pdoc{color:var(--text);box-sizing:border-box;line-height:1.5;background:none;}.pdoc .pdoc-button{cursor:pointer;display:inline-block;border:solid black 1px;border-radius:2px;font-size:.75rem;padding:calc(0.5em - 1px) 1em;transition:100ms all;}.pdoc .pdoc-alert{padding:1rem 1rem 1rem calc(1.5rem + 24px);border:1px solid transparent;border-radius:.25rem;background-repeat:no-repeat;background-position:1rem center;margin-bottom:1rem;}.pdoc .pdoc-alert > *:last-child{margin-bottom:0;}.pdoc .pdoc-alert-note {color:#084298;background-color:#cfe2ff;border-color:#b6d4fe;background-image:url("data:image/svg+xml,%3Csvg%20xmlns%3D%22http%3A//www.w3.org/2000/svg%22%20width%3D%2224%22%20height%3D%2224%22%20fill%3D%22%23084298%22%20viewBox%3D%220%200%2016%2016%22%3E%3Cpath%20d%3D%22M8%2016A8%208%200%201%200%208%200a8%208%200%200%200%200%2016zm.93-9.412-1%204.705c-.07.34.029.533.304.533.194%200%20.487-.07.686-.246l-.088.416c-.287.346-.92.598-1.465.598-.703%200-1.002-.422-.808-1.319l.738-3.468c.064-.293.006-.399-.287-.47l-.451-.081.082-.381%202.29-.287zM8%205.5a1%201%200%201%201%200-2%201%201%200%200%201%200%202z%22/%3E%3C/svg%3E");}.pdoc .pdoc-alert-warning{color:#664d03;background-color:#fff3cd;border-color:#ffecb5;background-image:url("data:image/svg+xml,%3Csvg%20xmlns%3D%22http%3A//www.w3.org/2000/svg%22%20width%3D%2224%22%20height%3D%2224%22%20fill%3D%22%23664d03%22%20viewBox%3D%220%200%2016%2016%22%3E%3Cpath%20d%3D%22M8.982%201.566a1.13%201.13%200%200%200-1.96%200L.165%2013.233c-.457.778.091%201.767.98%201.767h13.713c.889%200%201.438-.99.98-1.767L8.982%201.566zM8%205c.535%200%20.954.462.9.995l-.35%203.507a.552.552%200%200%201-1.1%200L7.1%205.995A.905.905%200%200%201%208%205zm.002%206a1%201%200%201%201%200%202%201%201%200%200%201%200-2z%22/%3E%3C/svg%3E");}.pdoc .pdoc-alert-danger{color:#842029;background-color:#f8d7da;border-color:#f5c2c7;background-image:url("data:image/svg+xml,%3Csvg%20xmlns%3D%22http%3A//www.w3.org/2000/svg%22%20width%3D%2224%22%20height%3D%2224%22%20fill%3D%22%23842029%22%20viewBox%3D%220%200%2016%2016%22%3E%3Cpath%20d%3D%22M5.52.359A.5.5%200%200%201%206%200h4a.5.5%200%200%201%20.474.658L8.694%206H12.5a.5.5%200%200%201%20.395.807l-7%209a.5.5%200%200%201-.873-.454L6.823%209.5H3.5a.5.5%200%200%201-.48-.641l2.5-8.5z%22/%3E%3C/svg%3E");}.pdoc .visually-hidden{position:absolute !important;width:1px !important;height:1px !important;padding:0 !important;margin:-1px !important;overflow:hidden !important;clip:rect(0, 0, 0, 0) !important;white-space:nowrap !important;border:0 !important;}.pdoc h1, .pdoc h2, .pdoc h3{font-weight:300;margin:.3em 0;padding:.2em 0;}.pdoc > section:not(.module-info) h1{font-size:1.5rem;font-weight:500;}.pdoc > section:not(.module-info) h2{font-size:1.4rem;font-weight:500;}.pdoc > section:not(.module-info) h3{font-size:1.3rem;font-weight:500;}.pdoc > section:not(.module-info) h4{font-size:1.2rem;}.pdoc > section:not(.module-info) h5{font-size:1.1rem;}.pdoc a{text-decoration:none;color:var(--link);}.pdoc a:hover{color:var(--link-hover);}.pdoc blockquote{margin-left:2rem;}.pdoc pre{border-top:1px solid var(--accent2);border-bottom:1px solid var(--accent2);margin-top:0;margin-bottom:1em;padding:.5rem 0 .5rem .5rem;overflow-x:auto;background-color:var(--code);}.pdoc code{color:var(--text);padding:.2em .4em;margin:0;font-size:85%;background-color:var(--accent);border-radius:6px;}.pdoc a > code{color:inherit;}.pdoc pre > code{display:inline-block;font-size:inherit;background:none;border:none;padding:0;}.pdoc > section:not(.module-info){margin-bottom:1.5rem;}.pdoc .modulename{margin-top:0;font-weight:bold;}.pdoc .modulename a{color:var(--link);transition:100ms all;}.pdoc .git-button{float:right;border:solid var(--link) 1px;}.pdoc .git-button:hover{background-color:var(--link);color:var(--pdoc-background);}.view-source-toggle-state,.view-source-toggle-state ~ .pdoc-code{display:none;}.view-source-toggle-state:checked ~ .pdoc-code{display:block;}.view-source-button{display:inline-block;float:right;font-size:.75rem;line-height:1.5rem;color:var(--muted);padding:0 .4rem 0 1.3rem;cursor:pointer;text-indent:-2px;}.view-source-button > span{visibility:hidden;}.module-info .view-source-button{float:none;display:flex;justify-content:flex-end;margin:-1.2rem .4rem -.2rem 0;}.view-source-button::before{position:absolute;content:"View Source";display:list-item;list-style-type:disclosure-closed;}.view-source-toggle-state:checked ~ .attr .view-source-button::before,.view-source-toggle-state:checked ~ .view-source-button::before{list-style-type:disclosure-open;}.pdoc .docstring{margin-bottom:1.5rem;}.pdoc section:not(.module-info) .docstring{margin-left:clamp(0rem, 5vw - 2rem, 1rem);}.pdoc .docstring .pdoc-code{margin-left:1em;margin-right:1em;}.pdoc h1:target,.pdoc h2:target,.pdoc h3:target,.pdoc h4:target,.pdoc h5:target,.pdoc h6:target,.pdoc .pdoc-code > pre > span:target{background-color:var(--active);box-shadow:-1rem 0 0 0 var(--active);}.pdoc .pdoc-code > pre > span:target{display:block;}.pdoc div:target > .attr,.pdoc section:target > .attr,.pdoc dd:target > a{background-color:var(--active);}.pdoc *{scroll-margin:2rem;}.pdoc .pdoc-code .linenos{user-select:none;}.pdoc .attr:hover{filter:contrast(0.95);}.pdoc section, .pdoc .classattr{position:relative;}.pdoc .headerlink{--width:clamp(1rem, 3vw, 2rem);position:absolute;top:0;left:calc(0rem - var(--width));transition:all 100ms ease-in-out;opacity:0;}.pdoc .headerlink::before{content:"#";display:block;text-align:center;width:var(--width);height:2.3rem;line-height:2.3rem;font-size:1.5rem;}.pdoc .attr:hover ~ .headerlink,.pdoc *:target > .headerlink,.pdoc .headerlink:hover{opacity:1;}.pdoc .attr{display:block;margin:.5rem 0 .5rem;padding:.4rem .4rem .4rem 1rem;background-color:var(--accent);overflow-x:auto;}.pdoc .classattr{margin-left:2rem;}.pdoc .name{color:var(--name);font-weight:bold;}.pdoc .def{color:var(--def);font-weight:bold;}.pdoc .signature{background-color:transparent;}.pdoc .param, .pdoc .return-annotation{white-space:pre;}.pdoc .signature.multiline .param{display:block;}.pdoc .signature.condensed .param{display:inline-block;}.pdoc .annotation{color:var(--annotation);}.pdoc .view-value-toggle-state,.pdoc .view-value-toggle-state ~ .default_value{display:none;}.pdoc .view-value-toggle-state:checked ~ .default_value{display:inherit;}.pdoc .view-value-button{font-size:.5rem;vertical-align:middle;border-style:dashed;margin-top:-0.1rem;}.pdoc .view-value-button:hover{background:white;}.pdoc .view-value-button::before{content:"show";text-align:center;width:2.2em;display:inline-block;}.pdoc .view-value-toggle-state:checked ~ .view-value-button::before{content:"hide";}.pdoc .inherited{margin-left:2rem;}.pdoc .inherited dt{font-weight:700;}.pdoc .inherited dt, .pdoc .inherited dd{display:inline;margin-left:0;margin-bottom:.5rem;}.pdoc .inherited dd:not(:last-child):after{content:", ";}.pdoc .inherited .class:before{content:"class ";}.pdoc .inherited .function a:after{content:"()";}.pdoc .search-result .docstring{overflow:auto;max-height:25vh;}.pdoc .search-result.focused > .attr{background-color:var(--active);}.pdoc .attribution{margin-top:2rem;display:block;opacity:0.5;transition:all 200ms;filter:grayscale(100%);}.pdoc .attribution:hover{opacity:1;filter:grayscale(0%);}.pdoc .attribution img{margin-left:5px;height:35px;vertical-align:middle;width:70px;transition:all 200ms;}.pdoc table{display:block;width:max-content;max-width:100%;overflow:auto;margin-bottom:1rem;}.pdoc table th{font-weight:600;}.pdoc table th, .pdoc table td{padding:6px 13px;border:1px solid var(--accent2);}</style>
+    <style>/*! custom.css */</style><script>
+    window.MathJax = {
+        tex: {
+            inlineMath: [['$', '$'], ['\\(', '\\)']]
+        }
+    };
+</script>
+<script src="https://polyfill.io/v3/polyfill.min.js?features=es6"></script>
+<script id="MathJax-script" async src="https://cdn.jsdelivr.net/npm/mathjax@3/es5/tex-mml-chtml.js"></script>
+<script>
+    /* Re-invoke MathJax when DOM content changes, for example during search. */
+    document.addEventListener("DOMContentLoaded", () => {
+        new MutationObserver(() => MathJax.typeset()).observe(
+            document.querySelector("main.pdoc").parentNode,
+            {childList: true}
+        );
+    })
+</script>
+<style>
+    mjx-container {
+        overflow-x: auto;
+    }
+</style></head>
+<body>
+    <nav class="pdoc">
+        <label id="navtoggle" for="togglestate" class="pdoc-button"><svg xmlns='http://www.w3.org/2000/svg' viewBox='0 0 30 30'><path stroke-linecap='round' stroke="currentColor" stroke-miterlimit='10' stroke-width='2' d='M4 7h22M4 15h22M4 23h22'/></svg></label>
+        <input id="togglestate" type="checkbox" aria-hidden="true" tabindex="-1">
+        <div>            <a class="pdoc-button module-list-button" href="../../index.html">
+<svg xmlns="http://www.w3.org/2000/svg" width="16" height="16" fill="currentColor" class="bi bi-box-arrow-in-left" viewBox="0 0 16 16">
+  <path fill-rule="evenodd" d="M10 3.5a.5.5 0 0 0-.5-.5h-8a.5.5 0 0 0-.5.5v9a.5.5 0 0 0 .5.5h8a.5.5 0 0 0 .5-.5v-2a.5.5 0 0 1 1 0v2A1.5 1.5 0 0 1 9.5 14h-8A1.5 1.5 0 0 1 0 12.5v-9A1.5 1.5 0 0 1 1.5 2h8A1.5 1.5 0 0 1 11 3.5v2a.5.5 0 0 1-1 0v-2z"/>
+  <path fill-rule="evenodd" d="M4.146 8.354a.5.5 0 0 1 0-.708l3-3a.5.5 0 1 1 .708.708L5.707 7.5H14.5a.5.5 0 0 1 0 1H5.707l2.147 2.146a.5.5 0 0 1-.708.708l-3-3z"/>
+</svg>                &nbsp;
+                Module Index
+            </a>
+
+
+            <input type="search" placeholder="Search..." role="searchbox" aria-label="search"
+                   pattern=".+" required>
+
+
+
+            <h2>API Documentation</h2>
+                <ul class="memberlist">
+            <li>
+                    <a class="class" href="#SchedulerArgs">SchedulerArgs</a>
+                            <ul class="memberlist">
+                        <li>
+                                <a class="variable" href="#SchedulerArgs.max_lr">max_lr</a>
+                        </li>
+                        <li>
+                                <a class="variable" href="#SchedulerArgs.total_steps">total_steps</a>
+                        </li>
+                </ul>
+
+            </li>
+            <li>
+                    <a class="class" href="#GWPredictionsBase">GWPredictionsBase</a>
+                            <ul class="memberlist">
+                        <li>
+                                <a class="variable" href="#GWPredictionsBase.states">states</a>
+                        </li>
+                </ul>
+
+            </li>
+            <li>
+                    <a class="class" href="#GlobalWorkspaceBase">GlobalWorkspaceBase</a>
+                            <ul class="memberlist">
+                        <li>
+                                <a class="variable" href="#GlobalWorkspaceBase.gw_mod">gw_mod</a>
+                        </li>
+                        <li>
+                                <a class="variable" href="#GlobalWorkspaceBase.selection_mod">selection_mod</a>
+                        </li>
+                        <li>
+                                <a class="variable" href="#GlobalWorkspaceBase.loss_mod">loss_mod</a>
+                        </li>
+                        <li>
+                                <a class="variable" href="#GlobalWorkspaceBase.optim_lr">optim_lr</a>
+                        </li>
+                        <li>
+                                <a class="variable" href="#GlobalWorkspaceBase.optim_weight_decay">optim_weight_decay</a>
+                        </li>
+                        <li>
+                                <a class="variable" href="#GlobalWorkspaceBase.scheduler_args">scheduler_args</a>
+                        </li>
+                        <li>
+                                <a class="variable" href="#GlobalWorkspaceBase.domain_mods">domain_mods</a>
+                        </li>
+                        <li>
+                                <a class="variable" href="#GlobalWorkspaceBase.workspace_dim">workspace_dim</a>
+                        </li>
+                        <li>
+                                <a class="function" href="#GlobalWorkspaceBase.encode_and_fuse">encode_and_fuse</a>
+                        </li>
+                        <li>
+                                <a class="function" href="#GlobalWorkspaceBase.encode">encode</a>
+                        </li>
+                        <li>
+                                <a class="function" href="#GlobalWorkspaceBase.fuse">fuse</a>
+                        </li>
+                        <li>
+                                <a class="function" href="#GlobalWorkspaceBase.decode">decode</a>
+                        </li>
+                        <li>
+                                <a class="function" href="#GlobalWorkspaceBase.batch_gw_states">batch_gw_states</a>
+                        </li>
+                        <li>
+                                <a class="function" href="#GlobalWorkspaceBase.encode_domain">encode_domain</a>
+                        </li>
+                        <li>
+                                <a class="function" href="#GlobalWorkspaceBase.encode_domains">encode_domains</a>
+                        </li>
+                        <li>
+                                <a class="function" href="#GlobalWorkspaceBase.decode_domain">decode_domain</a>
+                        </li>
+                        <li>
+                                <a class="function" href="#GlobalWorkspaceBase.decode_domains">decode_domains</a>
+                        </li>
+                        <li>
+                                <a class="function" href="#GlobalWorkspaceBase.generic_step">generic_step</a>
+                        </li>
+                </ul>
+
+            </li>
+            <li>
+                    <a class="function" href="#freeze_domain_modules">freeze_domain_modules</a>
+            </li>
+            <li>
+                    <a class="class" href="#GWPredictions">GWPredictions</a>
+                            <ul class="memberlist">
+                        <li>
+                                <a class="variable" href="#GWPredictions.demi_cycles">demi_cycles</a>
+                        </li>
+                        <li>
+                                <a class="variable" href="#GWPredictions.cycles">cycles</a>
+                        </li>
+                        <li>
+                                <a class="variable" href="#GWPredictions.translations">translations</a>
+                        </li>
+                        <li>
+                                <a class="variable" href="#GWPredictions.states">states</a>
+                        </li>
+                </ul>
+
+            </li>
+            <li>
+                    <a class="class" href="#GlobalWorkspace2Domains">GlobalWorkspace2Domains</a>
+                            <ul class="memberlist">
+                        <li>
+                                <a class="function" href="#GlobalWorkspace2Domains.__init__">GlobalWorkspace2Domains</a>
+                        </li>
+                        <li>
+                                <a class="function" href="#GlobalWorkspace2Domains.forward">forward</a>
+                        </li>
+                </ul>
+
+            </li>
+            <li>
+                    <a class="class" href="#GlobalWorkspace">GlobalWorkspace</a>
+                            <ul class="memberlist">
+                        <li>
+                                <a class="function" href="#GlobalWorkspace.__init__">GlobalWorkspace</a>
+                        </li>
+                        <li>
+                                <a class="function" href="#GlobalWorkspace.forward">forward</a>
+                        </li>
+                </ul>
+
+            </li>
+            <li>
+                    <a class="class" href="#GlobalWorkspaceBayesian">GlobalWorkspaceBayesian</a>
+                            <ul class="memberlist">
+                        <li>
+                                <a class="function" href="#GlobalWorkspaceBayesian.__init__">GlobalWorkspaceBayesian</a>
+                        </li>
+                        <li>
+                                <a class="function" href="#GlobalWorkspaceBayesian.forward">forward</a>
+                        </li>
+                </ul>
+
+            </li>
+            <li>
+                    <a class="function" href="#pretrained_global_workspace">pretrained_global_workspace</a>
+            </li>
+    </ul>
+
+
+
+        <a class="attribution" title="pdoc: Python API documentation generator" href="https://pdoc.dev" target="_blank">
+            built with <span class="visually-hidden">pdoc</span><img
+                alt="pdoc logo"
+                src="data:image/svg+xml,%3Csvg%20xmlns%3D%22http%3A//www.w3.org/2000/svg%22%20role%3D%22img%22%20aria-label%3D%22pdoc%20logo%22%20width%3D%22300%22%20height%3D%22150%22%20viewBox%3D%22-1%200%2060%2030%22%3E%3Ctitle%3Epdoc%3C/title%3E%3Cpath%20d%3D%22M29.621%2021.293c-.011-.273-.214-.475-.511-.481a.5.5%200%200%200-.489.503l-.044%201.393c-.097.551-.695%201.215-1.566%201.704-.577.428-1.306.486-2.193.182-1.426-.617-2.467-1.654-3.304-2.487l-.173-.172a3.43%203.43%200%200%200-.365-.306.49.49%200%200%200-.286-.196c-1.718-1.06-4.931-1.47-7.353.191l-.219.15c-1.707%201.187-3.413%202.131-4.328%201.03-.02-.027-.49-.685-.141-1.763.233-.721.546-2.408.772-4.076.042-.09.067-.187.046-.288.166-1.347.277-2.625.241-3.351%201.378-1.008%202.271-2.586%202.271-4.362%200-.976-.272-1.935-.788-2.774-.057-.094-.122-.18-.184-.268.033-.167.052-.339.052-.516%200-1.477-1.202-2.679-2.679-2.679-.791%200-1.496.352-1.987.9a6.3%206.3%200%200%200-1.001.029c-.492-.564-1.207-.929-2.012-.929-1.477%200-2.679%201.202-2.679%202.679A2.65%202.65%200%200%200%20.97%206.554c-.383.747-.595%201.572-.595%202.41%200%202.311%201.507%204.29%203.635%205.107-.037.699-.147%202.27-.423%203.294l-.137.461c-.622%202.042-2.515%208.257%201.727%2010.643%201.614.908%203.06%201.248%204.317%201.248%202.665%200%204.492-1.524%205.322-2.401%201.476-1.559%202.886-1.854%206.491.82%201.877%201.393%203.514%201.753%204.861%201.068%202.223-1.713%202.811-3.867%203.399-6.374.077-.846.056-1.469.054-1.537zm-4.835%204.313c-.054.305-.156.586-.242.629-.034-.007-.131-.022-.307-.157-.145-.111-.314-.478-.456-.908.221.121.432.25.675.355.115.039.219.051.33.081zm-2.251-1.238c-.05.33-.158.648-.252.694-.022.001-.125-.018-.307-.157-.217-.166-.488-.906-.639-1.573.358.344.754.693%201.198%201.036zm-3.887-2.337c-.006-.116-.018-.231-.041-.342.635.145%201.189.368%201.599.625.097.231.166.481.174.642-.03.049-.055.101-.067.158-.046.013-.128.026-.298.004-.278-.037-.901-.57-1.367-1.087zm-1.127-.497c.116.306.176.625.12.71-.019.014-.117.045-.345.016-.206-.027-.604-.332-.986-.695.41-.051.816-.056%201.211-.031zm-4.535%201.535c.209.22.379.47.358.598-.006.041-.088.138-.351.234-.144.055-.539-.063-.979-.259a11.66%2011.66%200%200%200%20.972-.573zm.983-.664c.359-.237.738-.418%201.126-.554.25.237.479.548.457.694-.006.042-.087.138-.351.235-.174.064-.694-.105-1.232-.375zm-3.381%201.794c-.022.145-.061.29-.149.401-.133.166-.358.248-.69.251h-.002c-.133%200-.306-.26-.45-.621.417.091.854.07%201.291-.031zm-2.066-8.077a4.78%204.78%200%200%201-.775-.584c.172-.115.505-.254.88-.378l-.105.962zm-.331%202.302a10.32%2010.32%200%200%201-.828-.502c.202-.143.576-.328.984-.49l-.156.992zm-.45%202.157l-.701-.403c.214-.115.536-.249.891-.376a11.57%2011.57%200%200%201-.19.779zm-.181%201.716c.064.398.194.702.298.893-.194-.051-.435-.162-.736-.398.061-.119.224-.3.438-.495zM8.87%204.141c0%20.152-.123.276-.276.276s-.275-.124-.275-.276.123-.276.276-.276.275.124.275.276zm-.735-.389a1.15%201.15%200%200%200-.314.783%201.16%201.16%200%200%200%201.162%201.162c.457%200%20.842-.27%201.032-.653.026.117.042.238.042.362a1.68%201.68%200%200%201-1.679%201.679%201.68%201.68%200%200%201-1.679-1.679c0-.843.626-1.535%201.436-1.654zM5.059%205.406A1.68%201.68%200%200%201%203.38%207.085a1.68%201.68%200%200%201-1.679-1.679c0-.037.009-.072.011-.109.21.3.541.508.935.508a1.16%201.16%200%200%200%201.162-1.162%201.14%201.14%200%200%200-.474-.912c.015%200%20.03-.005.045-.005.926.001%201.679.754%201.679%201.68zM3.198%204.141c0%20.152-.123.276-.276.276s-.275-.124-.275-.276.123-.276.276-.276.275.124.275.276zM1.375%208.964c0-.52.103-1.035.288-1.52.466.394%201.06.64%201.717.64%201.144%200%202.116-.725%202.499-1.738.383%201.012%201.355%201.738%202.499%201.738.867%200%201.631-.421%202.121-1.062.307.605.478%201.267.478%201.942%200%202.486-2.153%204.51-4.801%204.51s-4.801-2.023-4.801-4.51zm24.342%2019.349c-.985.498-2.267.168-3.813-.979-3.073-2.281-5.453-3.199-7.813-.705-1.315%201.391-4.163%203.365-8.423.97-3.174-1.786-2.239-6.266-1.261-9.479l.146-.492c.276-1.02.395-2.457.444-3.268a6.11%206.11%200%200%200%201.18.115%206.01%206.01%200%200%200%202.536-.562l-.006.175c-.802.215-1.848.612-2.021%201.25-.079.295.021.601.274.837.219.203.415.364.598.501-.667.304-1.243.698-1.311%201.179-.02.144-.022.507.393.787.213.144.395.26.564.365-1.285.521-1.361.96-1.381%201.126-.018.142-.011.496.427.746l.854.489c-.473.389-.971.914-.999%201.429-.018.278.095.532.316.713.675.556%201.231.721%201.653.721.059%200%20.104-.014.158-.02.207.707.641%201.64%201.513%201.64h.013c.8-.008%201.236-.345%201.462-.626.173-.216.268-.457.325-.692.424.195.93.374%201.372.374.151%200%20.294-.021.423-.068.732-.27.944-.704.993-1.021.009-.061.003-.119.002-.179.266.086.538.147.789.147.15%200%20.294-.021.423-.069.542-.2.797-.489.914-.754.237.147.478.258.704.288.106.014.205.021.296.021.356%200%20.595-.101.767-.229.438.435%201.094.992%201.656%201.067.106.014.205.021.296.021a1.56%201.56%200%200%200%20.323-.035c.17.575.453%201.289.866%201.605.358.273.665.362.914.362a.99.99%200%200%200%20.421-.093%201.03%201.03%200%200%200%20.245-.164c.168.428.39.846.68%201.068.358.273.665.362.913.362a.99.99%200%200%200%20.421-.093c.317-.148.512-.448.639-.762.251.157.495.257.726.257.127%200%20.25-.024.37-.071.427-.17.706-.617.841-1.314.022-.015.047-.022.068-.038.067-.051.133-.104.196-.159-.443%201.486-1.107%202.761-2.086%203.257zM8.66%209.925a.5.5%200%201%200-1%200c0%20.653-.818%201.205-1.787%201.205s-1.787-.552-1.787-1.205a.5.5%200%201%200-1%200c0%201.216%201.25%202.205%202.787%202.205s2.787-.989%202.787-2.205zm4.4%2015.965l-.208.097c-2.661%201.258-4.708%201.436-6.086.527-1.542-1.017-1.88-3.19-1.844-4.198a.4.4%200%200%200-.385-.414c-.242-.029-.406.164-.414.385-.046%201.249.367%203.686%202.202%204.896.708.467%201.547.7%202.51.7%201.248%200%202.706-.392%204.362-1.174l.185-.086a.4.4%200%200%200%20.205-.527c-.089-.204-.326-.291-.527-.206zM9.547%202.292c.093.077.205.114.317.114a.5.5%200%200%200%20.318-.886L8.817.397a.5.5%200%200%200-.703.068.5.5%200%200%200%20.069.703l1.364%201.124zm-7.661-.065c.086%200%20.173-.022.253-.068l1.523-.893a.5.5%200%200%200-.506-.863l-1.523.892a.5.5%200%200%200-.179.685c.094.158.261.247.432.247z%22%20transform%3D%22matrix%28-1%200%200%201%2058%200%29%22%20fill%3D%22%233bb300%22/%3E%3Cpath%20d%3D%22M.3%2021.86V10.18q0-.46.02-.68.04-.22.18-.5.28-.54%201.34-.54%201.06%200%201.42.28.38.26.44.78.76-1.04%202.38-1.04%201.64%200%203.1%201.54%201.46%201.54%201.46%203.58%200%202.04-1.46%203.58-1.44%201.54-3.08%201.54-1.64%200-2.38-.92v4.04q0%20.46-.04.68-.02.22-.18.5-.14.3-.5.42-.36.12-.98.12-.62%200-1-.12-.36-.12-.52-.4-.14-.28-.18-.5-.02-.22-.02-.68zm3.96-9.42q-.46.54-.46%201.18%200%20.64.46%201.18.48.52%201.2.52.74%200%201.24-.52.52-.52.52-1.18%200-.66-.48-1.18-.48-.54-1.26-.54-.76%200-1.22.54zm14.741-8.36q.16-.3.54-.42.38-.12%201-.12.64%200%201.02.12.38.12.52.42.16.3.18.54.04.22.04.68v11.94q0%20.46-.04.7-.02.22-.18.5-.3.54-1.7.54-1.38%200-1.54-.98-.84.96-2.34.96-1.8%200-3.28-1.56-1.48-1.58-1.48-3.66%200-2.1%201.48-3.68%201.5-1.58%203.28-1.58%201.48%200%202.3%201v-4.2q0-.46.02-.68.04-.24.18-.52zm-3.24%2010.86q.52.54%201.26.54.74%200%201.22-.54.5-.54.5-1.18%200-.66-.48-1.22-.46-.56-1.26-.56-.8%200-1.28.56-.48.54-.48%201.2%200%20.66.52%201.2zm7.833-1.2q0-2.4%201.68-3.96%201.68-1.56%203.84-1.56%202.16%200%203.82%201.56%201.66%201.54%201.66%203.94%200%201.66-.86%202.96-.86%201.28-2.1%201.9-1.22.6-2.54.6-1.32%200-2.56-.64-1.24-.66-2.1-1.92-.84-1.28-.84-2.88zm4.18%201.44q.64.48%201.3.48.66%200%201.32-.5.66-.5.66-1.48%200-.98-.62-1.46-.62-.48-1.34-.48-.72%200-1.34.5-.62.5-.62%201.48%200%20.96.64%201.46zm11.412-1.44q0%20.84.56%201.32.56.46%201.18.46.64%200%201.18-.36.56-.38.9-.38.6%200%201.46%201.06.46.58.46%201.04%200%20.76-1.1%201.42-1.14.8-2.8.8-1.86%200-3.58-1.34-.82-.64-1.34-1.7-.52-1.08-.52-2.36%200-1.3.52-2.34.52-1.06%201.34-1.7%201.66-1.32%203.54-1.32.76%200%201.48.22.72.2%201.06.4l.32.2q.36.24.56.38.52.4.52.92%200%20.5-.42%201.14-.72%201.1-1.38%201.1-.38%200-1.08-.44-.36-.34-1.04-.34-.66%200-1.24.48-.58.48-.58%201.34z%22%20fill%3D%22green%22/%3E%3C/svg%3E"/>
+        </a>
+</div>
+    </nav>
+    <main class="pdoc">
+            <section class="module-info">
+                    <h1 class="modulename">
+shimmer<wbr>.modules<wbr>.global_workspace    </h1>
+
+                
+                        <input id="mod-global_workspace-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
+
+                        <label class="view-source-button" for="mod-global_workspace-view-source"><span>View Source</span></label>
+
+                        <div class="pdoc-code codehilite"><pre><span></span><span id="L-1"><a href="#L-1"><span class="linenos">  1</span></a><span class="kn">from</span> <span class="nn">collections.abc</span> <span class="kn">import</span> <span class="n">Iterable</span><span class="p">,</span> <span class="n">Mapping</span>
+</span><span id="L-2"><a href="#L-2"><span class="linenos">  2</span></a><span class="kn">from</span> <span class="nn">pathlib</span> <span class="kn">import</span> <span class="n">Path</span>
+</span><span id="L-3"><a href="#L-3"><span class="linenos">  3</span></a><span class="kn">from</span> <span class="nn">typing</span> <span class="kn">import</span> <span class="n">Any</span><span class="p">,</span> <span class="n">Generic</span><span class="p">,</span> <span class="n">TypedDict</span><span class="p">,</span> <span class="n">TypeVar</span><span class="p">,</span> <span class="n">cast</span>
+</span><span id="L-4"><a href="#L-4"><span class="linenos">  4</span></a>
+</span><span id="L-5"><a href="#L-5"><span class="linenos">  5</span></a><span class="kn">import</span> <span class="nn">torch</span>
+</span><span id="L-6"><a href="#L-6"><span class="linenos">  6</span></a><span class="kn">from</span> <span class="nn">lightning.pytorch</span> <span class="kn">import</span> <span class="n">LightningModule</span>
+</span><span id="L-7"><a href="#L-7"><span class="linenos">  7</span></a><span class="kn">from</span> <span class="nn">lightning.pytorch.utilities.types</span> <span class="kn">import</span> <span class="n">OptimizerLRSchedulerConfig</span>
+</span><span id="L-8"><a href="#L-8"><span class="linenos">  8</span></a><span class="kn">from</span> <span class="nn">torch.nn</span> <span class="kn">import</span> <span class="n">Module</span><span class="p">,</span> <span class="n">ModuleDict</span>
+</span><span id="L-9"><a href="#L-9"><span class="linenos">  9</span></a><span class="kn">from</span> <span class="nn">torch.optim.lr_scheduler</span> <span class="kn">import</span> <span class="n">OneCycleLR</span>
+</span><span id="L-10"><a href="#L-10"><span class="linenos"> 10</span></a>
+</span><span id="L-11"><a href="#L-11"><span class="linenos"> 11</span></a><span class="kn">from</span> <span class="nn">shimmer.modules.contrastive_loss</span> <span class="kn">import</span> <span class="n">ContrastiveLoss</span><span class="p">,</span> <span class="n">ContrastiveLossType</span>
+</span><span id="L-12"><a href="#L-12"><span class="linenos"> 12</span></a><span class="kn">from</span> <span class="nn">shimmer.modules.domain</span> <span class="kn">import</span> <span class="n">DomainModule</span>
+</span><span id="L-13"><a href="#L-13"><span class="linenos"> 13</span></a><span class="kn">from</span> <span class="nn">shimmer.modules.gw_module</span> <span class="kn">import</span> <span class="p">(</span>
+</span><span id="L-14"><a href="#L-14"><span class="linenos"> 14</span></a>    <span class="n">GWModule</span><span class="p">,</span>
+</span><span id="L-15"><a href="#L-15"><span class="linenos"> 15</span></a>    <span class="n">GWModuleBase</span><span class="p">,</span>
+</span><span id="L-16"><a href="#L-16"><span class="linenos"> 16</span></a>    <span class="n">GWModuleBayesian</span><span class="p">,</span>
+</span><span id="L-17"><a href="#L-17"><span class="linenos"> 17</span></a><span class="p">)</span>
+</span><span id="L-18"><a href="#L-18"><span class="linenos"> 18</span></a><span class="kn">from</span> <span class="nn">shimmer.modules.losses</span> <span class="kn">import</span> <span class="p">(</span>
+</span><span id="L-19"><a href="#L-19"><span class="linenos"> 19</span></a>    <span class="n">BroadcastLossCoefs</span><span class="p">,</span>
+</span><span id="L-20"><a href="#L-20"><span class="linenos"> 20</span></a>    <span class="n">GWLosses</span><span class="p">,</span>
+</span><span id="L-21"><a href="#L-21"><span class="linenos"> 21</span></a>    <span class="n">GWLosses2Domains</span><span class="p">,</span>
+</span><span id="L-22"><a href="#L-22"><span class="linenos"> 22</span></a>    <span class="n">GWLossesBase</span><span class="p">,</span>
+</span><span id="L-23"><a href="#L-23"><span class="linenos"> 23</span></a>    <span class="n">GWLossesBayesian</span><span class="p">,</span>
+</span><span id="L-24"><a href="#L-24"><span class="linenos"> 24</span></a>    <span class="n">LossCoefs</span><span class="p">,</span>
+</span><span id="L-25"><a href="#L-25"><span class="linenos"> 25</span></a><span class="p">)</span>
+</span><span id="L-26"><a href="#L-26"><span class="linenos"> 26</span></a><span class="kn">from</span> <span class="nn">shimmer.modules.selection</span> <span class="kn">import</span> <span class="p">(</span>
+</span><span id="L-27"><a href="#L-27"><span class="linenos"> 27</span></a>    <span class="n">FixedSharedSelection</span><span class="p">,</span>
+</span><span id="L-28"><a href="#L-28"><span class="linenos"> 28</span></a>    <span class="n">RandomSelection</span><span class="p">,</span>
+</span><span id="L-29"><a href="#L-29"><span class="linenos"> 29</span></a>    <span class="n">SelectionBase</span><span class="p">,</span>
+</span><span id="L-30"><a href="#L-30"><span class="linenos"> 30</span></a>    <span class="n">SingleDomainSelection</span><span class="p">,</span>
+</span><span id="L-31"><a href="#L-31"><span class="linenos"> 31</span></a><span class="p">)</span>
+</span><span id="L-32"><a href="#L-32"><span class="linenos"> 32</span></a><span class="kn">from</span> <span class="nn">shimmer.modules.utils</span> <span class="kn">import</span> <span class="n">batch_cycles</span><span class="p">,</span> <span class="n">batch_demi_cycles</span><span class="p">,</span> <span class="n">batch_translations</span>
+</span><span id="L-33"><a href="#L-33"><span class="linenos"> 33</span></a><span class="kn">from</span> <span class="nn">shimmer.types</span> <span class="kn">import</span> <span class="p">(</span>
+</span><span id="L-34"><a href="#L-34"><span class="linenos"> 34</span></a>    <span class="n">LatentsDomainGroupsDT</span><span class="p">,</span>
+</span><span id="L-35"><a href="#L-35"><span class="linenos"> 35</span></a>    <span class="n">LatentsDomainGroupsT</span><span class="p">,</span>
+</span><span id="L-36"><a href="#L-36"><span class="linenos"> 36</span></a>    <span class="n">ModelModeT</span><span class="p">,</span>
+</span><span id="L-37"><a href="#L-37"><span class="linenos"> 37</span></a>    <span class="n">RawDomainGroupsDT</span><span class="p">,</span>
+</span><span id="L-38"><a href="#L-38"><span class="linenos"> 38</span></a>    <span class="n">RawDomainGroupsT</span><span class="p">,</span>
+</span><span id="L-39"><a href="#L-39"><span class="linenos"> 39</span></a>    <span class="n">RawDomainGroupT</span><span class="p">,</span>
+</span><span id="L-40"><a href="#L-40"><span class="linenos"> 40</span></a><span class="p">)</span>
+</span><span id="L-41"><a href="#L-41"><span class="linenos"> 41</span></a><span class="kn">from</span> <span class="nn">shimmer.utils</span> <span class="kn">import</span> <span class="n">groups_batch_size</span>
+</span><span id="L-42"><a href="#L-42"><span class="linenos"> 42</span></a>
+</span><span id="L-43"><a href="#L-43"><span class="linenos"> 43</span></a>
+</span><span id="L-44"><a href="#L-44"><span class="linenos"> 44</span></a><span class="k">class</span> <span class="nc">SchedulerArgs</span><span class="p">(</span><span class="n">TypedDict</span><span class="p">,</span> <span class="n">total</span><span class="o">=</span><span class="kc">False</span><span class="p">):</span>
+</span><span id="L-45"><a href="#L-45"><span class="linenos"> 45</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;TypedDict of arguments passed to the OneCycle scheduler&quot;&quot;&quot;</span>
+</span><span id="L-46"><a href="#L-46"><span class="linenos"> 46</span></a>
+</span><span id="L-47"><a href="#L-47"><span class="linenos"> 47</span></a>    <span class="n">max_lr</span><span class="p">:</span> <span class="nb">float</span>
+</span><span id="L-48"><a href="#L-48"><span class="linenos"> 48</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Maximum learning rate&quot;&quot;&quot;</span>
+</span><span id="L-49"><a href="#L-49"><span class="linenos"> 49</span></a>
+</span><span id="L-50"><a href="#L-50"><span class="linenos"> 50</span></a>    <span class="n">total_steps</span><span class="p">:</span> <span class="nb">int</span>
+</span><span id="L-51"><a href="#L-51"><span class="linenos"> 51</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Total number of steps&quot;&quot;&quot;</span>
+</span><span id="L-52"><a href="#L-52"><span class="linenos"> 52</span></a>
+</span><span id="L-53"><a href="#L-53"><span class="linenos"> 53</span></a>
+</span><span id="L-54"><a href="#L-54"><span class="linenos"> 54</span></a><span class="k">class</span> <span class="nc">GWPredictionsBase</span><span class="p">(</span><span class="n">TypedDict</span><span class="p">):</span>
+</span><span id="L-55"><a href="#L-55"><span class="linenos"> 55</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;TypedDict of the output given when calling `GlobalWorkspaceBase.predict`&quot;&quot;&quot;</span>
+</span><span id="L-56"><a href="#L-56"><span class="linenos"> 56</span></a>
+</span><span id="L-57"><a href="#L-57"><span class="linenos"> 57</span></a>    <span class="n">states</span><span class="p">:</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]</span>
+</span><span id="L-58"><a href="#L-58"><span class="linenos"> 58</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="L-59"><a href="#L-59"><span class="linenos"> 59</span></a><span class="sd">    GW state representation from domain groups with only one domain.</span>
+</span><span id="L-60"><a href="#L-60"><span class="linenos"> 60</span></a><span class="sd">    The key represent the domain&#39;s name.</span>
+</span><span id="L-61"><a href="#L-61"><span class="linenos"> 61</span></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="L-62"><a href="#L-62"><span class="linenos"> 62</span></a>
+</span><span id="L-63"><a href="#L-63"><span class="linenos"> 63</span></a>
+</span><span id="L-64"><a href="#L-64"><span class="linenos"> 64</span></a><span class="n">_T_gw_mod</span> <span class="o">=</span> <span class="n">TypeVar</span><span class="p">(</span><span class="s2">&quot;_T_gw_mod&quot;</span><span class="p">,</span> <span class="n">bound</span><span class="o">=</span><span class="n">GWModuleBase</span><span class="p">)</span>
+</span><span id="L-65"><a href="#L-65"><span class="linenos"> 65</span></a><span class="n">_T_selection_mod</span> <span class="o">=</span> <span class="n">TypeVar</span><span class="p">(</span><span class="s2">&quot;_T_selection_mod&quot;</span><span class="p">,</span> <span class="n">bound</span><span class="o">=</span><span class="n">SelectionBase</span><span class="p">)</span>
+</span><span id="L-66"><a href="#L-66"><span class="linenos"> 66</span></a><span class="n">_T_loss_mod</span> <span class="o">=</span> <span class="n">TypeVar</span><span class="p">(</span><span class="s2">&quot;_T_loss_mod&quot;</span><span class="p">,</span> <span class="n">bound</span><span class="o">=</span><span class="n">GWLossesBase</span><span class="p">)</span>
+</span><span id="L-67"><a href="#L-67"><span class="linenos"> 67</span></a>
+</span><span id="L-68"><a href="#L-68"><span class="linenos"> 68</span></a>
+</span><span id="L-69"><a href="#L-69"><span class="linenos"> 69</span></a><span class="k">class</span> <span class="nc">GlobalWorkspaceBase</span><span class="p">(</span>
+</span><span id="L-70"><a href="#L-70"><span class="linenos"> 70</span></a>    <span class="n">Generic</span><span class="p">[</span><span class="n">_T_gw_mod</span><span class="p">,</span> <span class="n">_T_selection_mod</span><span class="p">,</span> <span class="n">_T_loss_mod</span><span class="p">],</span> <span class="n">LightningModule</span>
+</span><span id="L-71"><a href="#L-71"><span class="linenos"> 71</span></a><span class="p">):</span>
+</span><span id="L-72"><a href="#L-72"><span class="linenos"> 72</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="L-73"><a href="#L-73"><span class="linenos"> 73</span></a><span class="sd">    Global Workspace Lightning Module.</span>
+</span><span id="L-74"><a href="#L-74"><span class="linenos"> 74</span></a>
+</span><span id="L-75"><a href="#L-75"><span class="linenos"> 75</span></a><span class="sd">    This is the base class to build the Global Workspace.</span>
+</span><span id="L-76"><a href="#L-76"><span class="linenos"> 76</span></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="L-77"><a href="#L-77"><span class="linenos"> 77</span></a>
+</span><span id="L-78"><a href="#L-78"><span class="linenos"> 78</span></a>    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span>
+</span><span id="L-79"><a href="#L-79"><span class="linenos"> 79</span></a>        <span class="bp">self</span><span class="p">,</span>
+</span><span id="L-80"><a href="#L-80"><span class="linenos"> 80</span></a>        <span class="n">gw_mod</span><span class="p">:</span> <span class="n">_T_gw_mod</span><span class="p">,</span>
+</span><span id="L-81"><a href="#L-81"><span class="linenos"> 81</span></a>        <span class="n">selection_mod</span><span class="p">:</span> <span class="n">_T_selection_mod</span><span class="p">,</span>
+</span><span id="L-82"><a href="#L-82"><span class="linenos"> 82</span></a>        <span class="n">loss_mod</span><span class="p">:</span> <span class="n">_T_loss_mod</span><span class="p">,</span>
+</span><span id="L-83"><a href="#L-83"><span class="linenos"> 83</span></a>        <span class="n">optim_lr</span><span class="p">:</span> <span class="nb">float</span> <span class="o">=</span> <span class="mf">1e-3</span><span class="p">,</span>
+</span><span id="L-84"><a href="#L-84"><span class="linenos"> 84</span></a>        <span class="n">optim_weight_decay</span><span class="p">:</span> <span class="nb">float</span> <span class="o">=</span> <span class="mf">0.0</span><span class="p">,</span>
+</span><span id="L-85"><a href="#L-85"><span class="linenos"> 85</span></a>        <span class="n">scheduler_args</span><span class="p">:</span> <span class="n">SchedulerArgs</span> <span class="o">|</span> <span class="kc">None</span> <span class="o">=</span> <span class="kc">None</span><span class="p">,</span>
+</span><span id="L-86"><a href="#L-86"><span class="linenos"> 86</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="L-87"><a href="#L-87"><span class="linenos"> 87</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="L-88"><a href="#L-88"><span class="linenos"> 88</span></a><span class="sd">        Initializes a GW</span>
+</span><span id="L-89"><a href="#L-89"><span class="linenos"> 89</span></a>
+</span><span id="L-90"><a href="#L-90"><span class="linenos"> 90</span></a><span class="sd">        Args:</span>
+</span><span id="L-91"><a href="#L-91"><span class="linenos"> 91</span></a><span class="sd">            gw_mod (`GWModuleBase`): the GWModule</span>
+</span><span id="L-92"><a href="#L-92"><span class="linenos"> 92</span></a><span class="sd">            selection_mod (`SelectionBase`): selection module</span>
+</span><span id="L-93"><a href="#L-93"><span class="linenos"> 93</span></a><span class="sd">            loss_mod (`GWLossesBase`): module to compute the GW losses.</span>
+</span><span id="L-94"><a href="#L-94"><span class="linenos"> 94</span></a><span class="sd">            optim_lr (`float`): learning rate</span>
+</span><span id="L-95"><a href="#L-95"><span class="linenos"> 95</span></a><span class="sd">            optim_weight_decay (`float`): weight decay</span>
+</span><span id="L-96"><a href="#L-96"><span class="linenos"> 96</span></a><span class="sd">            scheduler_args (`SchedulerArgs`): `SchedulerArgs` instance to define</span>
+</span><span id="L-97"><a href="#L-97"><span class="linenos"> 97</span></a><span class="sd">                scheduler parameters.</span>
+</span><span id="L-98"><a href="#L-98"><span class="linenos"> 98</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="L-99"><a href="#L-99"><span class="linenos"> 99</span></a>        <span class="nb">super</span><span class="p">()</span><span class="o">.</span><span class="fm">__init__</span><span class="p">()</span>
+</span><span id="L-100"><a href="#L-100"><span class="linenos">100</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">save_hyperparameters</span><span class="p">(</span>
+</span><span id="L-101"><a href="#L-101"><span class="linenos">101</span></a>            <span class="n">ignore</span><span class="o">=</span><span class="p">[</span>
+</span><span id="L-102"><a href="#L-102"><span class="linenos">102</span></a>                <span class="s2">&quot;gw_mod&quot;</span><span class="p">,</span>
+</span><span id="L-103"><a href="#L-103"><span class="linenos">103</span></a>                <span class="s2">&quot;selection_mod&quot;</span><span class="p">,</span>
+</span><span id="L-104"><a href="#L-104"><span class="linenos">104</span></a>                <span class="s2">&quot;domain_mods&quot;</span><span class="p">,</span>
+</span><span id="L-105"><a href="#L-105"><span class="linenos">105</span></a>                <span class="s2">&quot;loss_mod&quot;</span><span class="p">,</span>
+</span><span id="L-106"><a href="#L-106"><span class="linenos">106</span></a>                <span class="s2">&quot;domain_descriptions&quot;</span><span class="p">,</span>
+</span><span id="L-107"><a href="#L-107"><span class="linenos">107</span></a>                <span class="s2">&quot;contrastive_loss&quot;</span><span class="p">,</span>
+</span><span id="L-108"><a href="#L-108"><span class="linenos">108</span></a>                <span class="s2">&quot;cont_loss_bayesian&quot;</span><span class="p">,</span>
+</span><span id="L-109"><a href="#L-109"><span class="linenos">109</span></a>                <span class="s2">&quot;gw_encoders&quot;</span><span class="p">,</span>
+</span><span id="L-110"><a href="#L-110"><span class="linenos">110</span></a>                <span class="s2">&quot;gw_decoders&quot;</span><span class="p">,</span>
+</span><span id="L-111"><a href="#L-111"><span class="linenos">111</span></a>            <span class="p">]</span>
+</span><span id="L-112"><a href="#L-112"><span class="linenos">112</span></a>        <span class="p">)</span>
+</span><span id="L-113"><a href="#L-113"><span class="linenos">113</span></a>
+</span><span id="L-114"><a href="#L-114"><span class="linenos">114</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">gw_mod</span> <span class="o">=</span> <span class="n">gw_mod</span>
+</span><span id="L-115"><a href="#L-115"><span class="linenos">115</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot; a `GWModuleBase` implementation.&quot;&quot;&quot;</span>
+</span><span id="L-116"><a href="#L-116"><span class="linenos">116</span></a>
+</span><span id="L-117"><a href="#L-117"><span class="linenos">117</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">selection_mod</span> <span class="o">=</span> <span class="n">selection_mod</span>
+</span><span id="L-118"><a href="#L-118"><span class="linenos">118</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;A `SelectionBase` implementation.&quot;&quot;&quot;</span>
+</span><span id="L-119"><a href="#L-119"><span class="linenos">119</span></a>
+</span><span id="L-120"><a href="#L-120"><span class="linenos">120</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">loss_mod</span> <span class="o">=</span> <span class="n">loss_mod</span>
+</span><span id="L-121"><a href="#L-121"><span class="linenos">121</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;The module that computes losses of the GW&quot;&quot;&quot;</span>
+</span><span id="L-122"><a href="#L-122"><span class="linenos">122</span></a>
+</span><span id="L-123"><a href="#L-123"><span class="linenos">123</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">optim_lr</span> <span class="o">=</span> <span class="n">optim_lr</span>
+</span><span id="L-124"><a href="#L-124"><span class="linenos">124</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">optim_weight_decay</span> <span class="o">=</span> <span class="n">optim_weight_decay</span>
+</span><span id="L-125"><a href="#L-125"><span class="linenos">125</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">scheduler_args</span> <span class="o">=</span> <span class="n">SchedulerArgs</span><span class="p">(</span><span class="n">max_lr</span><span class="o">=</span><span class="n">optim_lr</span><span class="p">,</span> <span class="n">total_steps</span><span class="o">=</span><span class="mi">1</span><span class="p">)</span>
+</span><span id="L-126"><a href="#L-126"><span class="linenos">126</span></a>        <span class="k">if</span> <span class="n">scheduler_args</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="L-127"><a href="#L-127"><span class="linenos">127</span></a>            <span class="bp">self</span><span class="o">.</span><span class="n">scheduler_args</span><span class="o">.</span><span class="n">update</span><span class="p">(</span><span class="n">scheduler_args</span><span class="p">)</span>
+</span><span id="L-128"><a href="#L-128"><span class="linenos">128</span></a>
+</span><span id="L-129"><a href="#L-129"><span class="linenos">129</span></a>    <span class="nd">@property</span>
+</span><span id="L-130"><a href="#L-130"><span class="linenos">130</span></a>    <span class="k">def</span> <span class="nf">domain_mods</span><span class="p">(</span><span class="bp">self</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">Mapping</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">DomainModule</span><span class="p">]:</span>
+</span><span id="L-131"><a href="#L-131"><span class="linenos">131</span></a>        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">gw_mod</span><span class="o">.</span><span class="n">domain_mods</span>
+</span><span id="L-132"><a href="#L-132"><span class="linenos">132</span></a>
+</span><span id="L-133"><a href="#L-133"><span class="linenos">133</span></a>    <span class="nd">@property</span>
+</span><span id="L-134"><a href="#L-134"><span class="linenos">134</span></a>    <span class="k">def</span> <span class="nf">workspace_dim</span><span class="p">(</span><span class="bp">self</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">int</span><span class="p">:</span>
+</span><span id="L-135"><a href="#L-135"><span class="linenos">135</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;Dimension of the GW.&quot;&quot;&quot;</span>
+</span><span id="L-136"><a href="#L-136"><span class="linenos">136</span></a>        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">gw_mod</span><span class="o">.</span><span class="n">workspace_dim</span>
+</span><span id="L-137"><a href="#L-137"><span class="linenos">137</span></a>
+</span><span id="L-138"><a href="#L-138"><span class="linenos">138</span></a>    <span class="k">def</span> <span class="nf">encode_and_fuse</span><span class="p">(</span>
+</span><span id="L-139"><a href="#L-139"><span class="linenos">139</span></a>        <span class="bp">self</span><span class="p">,</span> <span class="n">x</span><span class="p">:</span> <span class="n">LatentsDomainGroupsT</span><span class="p">,</span> <span class="n">selection_module</span><span class="p">:</span> <span class="n">SelectionBase</span>
+</span><span id="L-140"><a href="#L-140"><span class="linenos">140</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">frozenset</span><span class="p">[</span><span class="nb">str</span><span class="p">],</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]:</span>
+</span><span id="L-141"><a href="#L-141"><span class="linenos">141</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="L-142"><a href="#L-142"><span class="linenos">142</span></a><span class="sd">        Encode a group of latent representations into the GW representation.</span>
+</span><span id="L-143"><a href="#L-143"><span class="linenos">143</span></a>
+</span><span id="L-144"><a href="#L-144"><span class="linenos">144</span></a><span class="sd">        Args:</span>
+</span><span id="L-145"><a href="#L-145"><span class="linenos">145</span></a><span class="sd">            x (`LatentsDomainGroupsT`): the input domain representations.</span>
+</span><span id="L-146"><a href="#L-146"><span class="linenos">146</span></a><span class="sd">            selection_scores (`Mapping[str, torch.Tensor]`):</span>
+</span><span id="L-147"><a href="#L-147"><span class="linenos">147</span></a>
+</span><span id="L-148"><a href="#L-148"><span class="linenos">148</span></a><span class="sd">        Returns:</span>
+</span><span id="L-149"><a href="#L-149"><span class="linenos">149</span></a><span class="sd">            `dict[frozenset[str], torch.Tensor]`: the GW representations.</span>
+</span><span id="L-150"><a href="#L-150"><span class="linenos">150</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="L-151"><a href="#L-151"><span class="linenos">151</span></a>        <span class="k">return</span> <span class="p">{</span>
+</span><span id="L-152"><a href="#L-152"><span class="linenos">152</span></a>            <span class="n">domains</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">gw_mod</span><span class="o">.</span><span class="n">encode_and_fuse</span><span class="p">(</span><span class="n">latents</span><span class="p">,</span> <span class="n">selection_module</span><span class="p">)</span>
+</span><span id="L-153"><a href="#L-153"><span class="linenos">153</span></a>            <span class="k">for</span> <span class="n">domains</span><span class="p">,</span> <span class="n">latents</span> <span class="ow">in</span> <span class="n">x</span><span class="o">.</span><span class="n">items</span><span class="p">()</span>
+</span><span id="L-154"><a href="#L-154"><span class="linenos">154</span></a>        <span class="p">}</span>
+</span><span id="L-155"><a href="#L-155"><span class="linenos">155</span></a>
+</span><span id="L-156"><a href="#L-156"><span class="linenos">156</span></a>    <span class="k">def</span> <span class="nf">encode</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">x</span><span class="p">:</span> <span class="n">LatentsDomainGroupsT</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">LatentsDomainGroupsDT</span><span class="p">:</span>
+</span><span id="L-157"><a href="#L-157"><span class="linenos">157</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="L-158"><a href="#L-158"><span class="linenos">158</span></a><span class="sd">        Encode a group of latent representations into the pre-fusion GW representation.</span>
+</span><span id="L-159"><a href="#L-159"><span class="linenos">159</span></a>
+</span><span id="L-160"><a href="#L-160"><span class="linenos">160</span></a><span class="sd">        Args:</span>
+</span><span id="L-161"><a href="#L-161"><span class="linenos">161</span></a><span class="sd">            x (`LatentsDomainGroupsT`): the input domain representations.</span>
+</span><span id="L-162"><a href="#L-162"><span class="linenos">162</span></a>
+</span><span id="L-163"><a href="#L-163"><span class="linenos">163</span></a><span class="sd">        Returns:</span>
+</span><span id="L-164"><a href="#L-164"><span class="linenos">164</span></a><span class="sd">            `LatensDomainGroupsDT`: the GW representations.</span>
+</span><span id="L-165"><a href="#L-165"><span class="linenos">165</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="L-166"><a href="#L-166"><span class="linenos">166</span></a>        <span class="k">return</span> <span class="p">{</span><span class="n">domains</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">gw_mod</span><span class="o">.</span><span class="n">encode</span><span class="p">(</span><span class="n">latents</span><span class="p">)</span> <span class="k">for</span> <span class="n">domains</span><span class="p">,</span> <span class="n">latents</span> <span class="ow">in</span> <span class="n">x</span><span class="o">.</span><span class="n">items</span><span class="p">()}</span>
+</span><span id="L-167"><a href="#L-167"><span class="linenos">167</span></a>
+</span><span id="L-168"><a href="#L-168"><span class="linenos">168</span></a>    <span class="k">def</span> <span class="nf">fuse</span><span class="p">(</span>
+</span><span id="L-169"><a href="#L-169"><span class="linenos">169</span></a>        <span class="bp">self</span><span class="p">,</span>
+</span><span id="L-170"><a href="#L-170"><span class="linenos">170</span></a>        <span class="n">x</span><span class="p">:</span> <span class="n">LatentsDomainGroupsT</span><span class="p">,</span>
+</span><span id="L-171"><a href="#L-171"><span class="linenos">171</span></a>        <span class="n">selection_scores</span><span class="p">:</span> <span class="n">Mapping</span><span class="p">[</span><span class="nb">frozenset</span><span class="p">[</span><span class="nb">str</span><span class="p">],</span> <span class="n">Mapping</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]],</span>
+</span><span id="L-172"><a href="#L-172"><span class="linenos">172</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">frozenset</span><span class="p">[</span><span class="nb">str</span><span class="p">],</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]:</span>
+</span><span id="L-173"><a href="#L-173"><span class="linenos">173</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="L-174"><a href="#L-174"><span class="linenos">174</span></a><span class="sd">        Fuses a group of latent representations into the GW representation.</span>
+</span><span id="L-175"><a href="#L-175"><span class="linenos">175</span></a>
+</span><span id="L-176"><a href="#L-176"><span class="linenos">176</span></a><span class="sd">        Args:</span>
+</span><span id="L-177"><a href="#L-177"><span class="linenos">177</span></a><span class="sd">            x (`LatentsDomainGroupsT`): the pre-fusion latent representations</span>
+</span><span id="L-178"><a href="#L-178"><span class="linenos">178</span></a><span class="sd">            selection_scores (`Mapping[frozenset[str], Mapping[str, torch.Tensor]]`):</span>
+</span><span id="L-179"><a href="#L-179"><span class="linenos">179</span></a><span class="sd">                selection scores for each group</span>
+</span><span id="L-180"><a href="#L-180"><span class="linenos">180</span></a>
+</span><span id="L-181"><a href="#L-181"><span class="linenos">181</span></a><span class="sd">        Returns:</span>
+</span><span id="L-182"><a href="#L-182"><span class="linenos">182</span></a><span class="sd">            `dict[frozenset[str], torch.Tensor]`: GW representation of each group</span>
+</span><span id="L-183"><a href="#L-183"><span class="linenos">183</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="L-184"><a href="#L-184"><span class="linenos">184</span></a>        <span class="k">return</span> <span class="p">{</span>
+</span><span id="L-185"><a href="#L-185"><span class="linenos">185</span></a>            <span class="n">domains</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">gw_mod</span><span class="o">.</span><span class="n">fuse</span><span class="p">(</span><span class="n">latents</span><span class="p">,</span> <span class="n">selection_scores</span><span class="p">[</span><span class="n">domains</span><span class="p">])</span>
+</span><span id="L-186"><a href="#L-186"><span class="linenos">186</span></a>            <span class="k">for</span> <span class="n">domains</span><span class="p">,</span> <span class="n">latents</span> <span class="ow">in</span> <span class="n">x</span><span class="o">.</span><span class="n">items</span><span class="p">()</span>
+</span><span id="L-187"><a href="#L-187"><span class="linenos">187</span></a>        <span class="p">}</span>
+</span><span id="L-188"><a href="#L-188"><span class="linenos">188</span></a>
+</span><span id="L-189"><a href="#L-189"><span class="linenos">189</span></a>    <span class="k">def</span> <span class="nf">decode</span><span class="p">(</span>
+</span><span id="L-190"><a href="#L-190"><span class="linenos">190</span></a>        <span class="bp">self</span><span class="p">,</span>
+</span><span id="L-191"><a href="#L-191"><span class="linenos">191</span></a>        <span class="n">z</span><span class="p">:</span> <span class="n">Mapping</span><span class="p">[</span><span class="nb">frozenset</span><span class="p">[</span><span class="nb">str</span><span class="p">],</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">],</span>
+</span><span id="L-192"><a href="#L-192"><span class="linenos">192</span></a>        <span class="n">domains</span><span class="p">:</span> <span class="n">Iterable</span><span class="p">[</span><span class="nb">str</span><span class="p">]</span> <span class="o">|</span> <span class="kc">None</span> <span class="o">=</span> <span class="kc">None</span><span class="p">,</span>
+</span><span id="L-193"><a href="#L-193"><span class="linenos">193</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="n">LatentsDomainGroupsDT</span><span class="p">:</span>
+</span><span id="L-194"><a href="#L-194"><span class="linenos">194</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="L-195"><a href="#L-195"><span class="linenos">195</span></a><span class="sd">        Decode the group GW representation into given `domains`.</span>
+</span><span id="L-196"><a href="#L-196"><span class="linenos">196</span></a>
+</span><span id="L-197"><a href="#L-197"><span class="linenos">197</span></a><span class="sd">        Args:</span>
+</span><span id="L-198"><a href="#L-198"><span class="linenos">198</span></a><span class="sd">            z (`torch.Tensor`): the GW representation.</span>
+</span><span id="L-199"><a href="#L-199"><span class="linenos">199</span></a><span class="sd">            domains (`Iterable[str]`): iterable of domains to decode.</span>
+</span><span id="L-200"><a href="#L-200"><span class="linenos">200</span></a>
+</span><span id="L-201"><a href="#L-201"><span class="linenos">201</span></a><span class="sd">        Returns:</span>
+</span><span id="L-202"><a href="#L-202"><span class="linenos">202</span></a><span class="sd">            `dict[str, torch.Tensor]`: the decoded unimodal representations.</span>
+</span><span id="L-203"><a href="#L-203"><span class="linenos">203</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="L-204"><a href="#L-204"><span class="linenos">204</span></a>        <span class="k">return</span> <span class="p">{</span>
+</span><span id="L-205"><a href="#L-205"><span class="linenos">205</span></a>            <span class="n">domain_names</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">gw_mod</span><span class="o">.</span><span class="n">decode</span><span class="p">(</span><span class="n">gw_rep</span><span class="p">,</span> <span class="n">domains</span><span class="p">)</span>
+</span><span id="L-206"><a href="#L-206"><span class="linenos">206</span></a>            <span class="k">for</span> <span class="n">domain_names</span><span class="p">,</span> <span class="n">gw_rep</span> <span class="ow">in</span> <span class="n">z</span><span class="o">.</span><span class="n">items</span><span class="p">()</span>
+</span><span id="L-207"><a href="#L-207"><span class="linenos">207</span></a>        <span class="p">}</span>
+</span><span id="L-208"><a href="#L-208"><span class="linenos">208</span></a>
+</span><span id="L-209"><a href="#L-209"><span class="linenos">209</span></a>    <span class="k">def</span> <span class="nf">forward</span><span class="p">(</span>  <span class="c1"># type: ignore</span>
+</span><span id="L-210"><a href="#L-210"><span class="linenos">210</span></a>        <span class="bp">self</span><span class="p">,</span>
+</span><span id="L-211"><a href="#L-211"><span class="linenos">211</span></a>        <span class="n">latent_domains</span><span class="p">:</span> <span class="n">LatentsDomainGroupsT</span><span class="p">,</span>
+</span><span id="L-212"><a href="#L-212"><span class="linenos">212</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="n">GWPredictionsBase</span><span class="p">:</span>
+</span><span id="L-213"><a href="#L-213"><span class="linenos">213</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="L-214"><a href="#L-214"><span class="linenos">214</span></a><span class="sd">        Computes demi-cycles, cycles, and translations.</span>
+</span><span id="L-215"><a href="#L-215"><span class="linenos">215</span></a>
+</span><span id="L-216"><a href="#L-216"><span class="linenos">216</span></a><span class="sd">        Args:</span>
+</span><span id="L-217"><a href="#L-217"><span class="linenos">217</span></a><span class="sd">            latent_domains (`LatentsT`): Groups of domains for the computation.</span>
+</span><span id="L-218"><a href="#L-218"><span class="linenos">218</span></a>
+</span><span id="L-219"><a href="#L-219"><span class="linenos">219</span></a><span class="sd">        Returns:</span>
+</span><span id="L-220"><a href="#L-220"><span class="linenos">220</span></a><span class="sd">            `GWPredictionsBase`: the predictions on the batch.</span>
+</span><span id="L-221"><a href="#L-221"><span class="linenos">221</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="L-222"><a href="#L-222"><span class="linenos">222</span></a>
+</span><span id="L-223"><a href="#L-223"><span class="linenos">223</span></a>        <span class="k">return</span> <span class="n">GWPredictionsBase</span><span class="p">(</span><span class="n">states</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">batch_gw_states</span><span class="p">(</span><span class="n">latent_domains</span><span class="p">))</span>
+</span><span id="L-224"><a href="#L-224"><span class="linenos">224</span></a>
+</span><span id="L-225"><a href="#L-225"><span class="linenos">225</span></a>    <span class="k">def</span> <span class="nf">batch_gw_states</span><span class="p">(</span>
+</span><span id="L-226"><a href="#L-226"><span class="linenos">226</span></a>        <span class="bp">self</span><span class="p">,</span> <span class="n">latent_domains</span><span class="p">:</span> <span class="n">LatentsDomainGroupsT</span>
+</span><span id="L-227"><a href="#L-227"><span class="linenos">227</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]:</span>
+</span><span id="L-228"><a href="#L-228"><span class="linenos">228</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="L-229"><a href="#L-229"><span class="linenos">229</span></a><span class="sd">        Comptues GW states of a batch of groups of domains.</span>
+</span><span id="L-230"><a href="#L-230"><span class="linenos">230</span></a>
+</span><span id="L-231"><a href="#L-231"><span class="linenos">231</span></a><span class="sd">        Args:</span>
+</span><span id="L-232"><a href="#L-232"><span class="linenos">232</span></a><span class="sd">            latent_domains (`LatentsT`): the batch of groups of domains</span>
+</span><span id="L-233"><a href="#L-233"><span class="linenos">233</span></a>
+</span><span id="L-234"><a href="#L-234"><span class="linenos">234</span></a><span class="sd">        Returns:</span>
+</span><span id="L-235"><a href="#L-235"><span class="linenos">235</span></a><span class="sd">            `dict[str, torch.Tensor]`: states for each domain.</span>
+</span><span id="L-236"><a href="#L-236"><span class="linenos">236</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="L-237"><a href="#L-237"><span class="linenos">237</span></a>        <span class="n">predictions</span><span class="p">:</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]</span> <span class="o">=</span> <span class="p">{}</span>
+</span><span id="L-238"><a href="#L-238"><span class="linenos">238</span></a>        <span class="k">for</span> <span class="n">domains</span><span class="p">,</span> <span class="n">latents</span> <span class="ow">in</span> <span class="n">latent_domains</span><span class="o">.</span><span class="n">items</span><span class="p">():</span>
+</span><span id="L-239"><a href="#L-239"><span class="linenos">239</span></a>            <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">domains</span><span class="p">)</span> <span class="o">&gt;</span> <span class="mi">1</span><span class="p">:</span>
+</span><span id="L-240"><a href="#L-240"><span class="linenos">240</span></a>                <span class="k">continue</span>
+</span><span id="L-241"><a href="#L-241"><span class="linenos">241</span></a>            <span class="n">domain_name</span> <span class="o">=</span> <span class="nb">list</span><span class="p">(</span><span class="n">domains</span><span class="p">)[</span><span class="mi">0</span><span class="p">]</span>
+</span><span id="L-242"><a href="#L-242"><span class="linenos">242</span></a>            <span class="n">z</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">gw_mod</span><span class="o">.</span><span class="n">encode_and_fuse</span><span class="p">(</span>
+</span><span id="L-243"><a href="#L-243"><span class="linenos">243</span></a>                <span class="n">latents</span><span class="p">,</span> <span class="n">selection_module</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">selection_mod</span>
+</span><span id="L-244"><a href="#L-244"><span class="linenos">244</span></a>            <span class="p">)</span>
+</span><span id="L-245"><a href="#L-245"><span class="linenos">245</span></a>            <span class="n">predictions</span><span class="p">[</span><span class="n">domain_name</span><span class="p">]</span> <span class="o">=</span> <span class="n">z</span>
+</span><span id="L-246"><a href="#L-246"><span class="linenos">246</span></a>        <span class="k">return</span> <span class="n">predictions</span>
+</span><span id="L-247"><a href="#L-247"><span class="linenos">247</span></a>
+</span><span id="L-248"><a href="#L-248"><span class="linenos">248</span></a>    <span class="k">def</span> <span class="nf">encode_domain</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">domain</span><span class="p">:</span> <span class="n">Any</span><span class="p">,</span> <span class="n">name</span><span class="p">:</span> <span class="nb">str</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">:</span>
+</span><span id="L-249"><a href="#L-249"><span class="linenos">249</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="L-250"><a href="#L-250"><span class="linenos">250</span></a><span class="sd">        Encodes a domain from the domain data into the unimodal representation.</span>
+</span><span id="L-251"><a href="#L-251"><span class="linenos">251</span></a>
+</span><span id="L-252"><a href="#L-252"><span class="linenos">252</span></a><span class="sd">        This is a convenient proxy for the `DomainModule.encode` method and is</span>
+</span><span id="L-253"><a href="#L-253"><span class="linenos">253</span></a><span class="sd">        equivalent to:</span>
+</span><span id="L-254"><a href="#L-254"><span class="linenos">254</span></a><span class="sd">        ```python</span>
+</span><span id="L-255"><a href="#L-255"><span class="linenos">255</span></a><span class="sd">        self.domain_mods[name].encode(domain)</span>
+</span><span id="L-256"><a href="#L-256"><span class="linenos">256</span></a><span class="sd">        ```</span>
+</span><span id="L-257"><a href="#L-257"><span class="linenos">257</span></a>
+</span><span id="L-258"><a href="#L-258"><span class="linenos">258</span></a><span class="sd">        Args:</span>
+</span><span id="L-259"><a href="#L-259"><span class="linenos">259</span></a><span class="sd">            domain (`Any`): the domain data</span>
+</span><span id="L-260"><a href="#L-260"><span class="linenos">260</span></a><span class="sd">            name (`str`): domain name to encode</span>
+</span><span id="L-261"><a href="#L-261"><span class="linenos">261</span></a>
+</span><span id="L-262"><a href="#L-262"><span class="linenos">262</span></a><span class="sd">        Returns:</span>
+</span><span id="L-263"><a href="#L-263"><span class="linenos">263</span></a><span class="sd">            `torch.Tensor`: the domain&#39;s unimodal representation.</span>
+</span><span id="L-264"><a href="#L-264"><span class="linenos">264</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="L-265"><a href="#L-265"><span class="linenos">265</span></a>        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">domain_mods</span><span class="p">[</span><span class="n">name</span><span class="p">]</span><span class="o">.</span><span class="n">encode</span><span class="p">(</span><span class="n">domain</span><span class="p">)</span>
+</span><span id="L-266"><a href="#L-266"><span class="linenos">266</span></a>
+</span><span id="L-267"><a href="#L-267"><span class="linenos">267</span></a>    <span class="k">def</span> <span class="nf">encode_domains</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">batch</span><span class="p">:</span> <span class="n">RawDomainGroupsT</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">LatentsDomainGroupsDT</span><span class="p">:</span>
+</span><span id="L-268"><a href="#L-268"><span class="linenos">268</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="L-269"><a href="#L-269"><span class="linenos">269</span></a><span class="sd">        Encode all domains in the batch.</span>
+</span><span id="L-270"><a href="#L-270"><span class="linenos">270</span></a>
+</span><span id="L-271"><a href="#L-271"><span class="linenos">271</span></a><span class="sd">        Args:</span>
+</span><span id="L-272"><a href="#L-272"><span class="linenos">272</span></a><span class="sd">            batch (`RawDomainGroupsT`): the batch of</span>
+</span><span id="L-273"><a href="#L-273"><span class="linenos">273</span></a><span class="sd">                domain groups with raw unimodal data to encode into groups of latent</span>
+</span><span id="L-274"><a href="#L-274"><span class="linenos">274</span></a><span class="sd">                representations.</span>
+</span><span id="L-275"><a href="#L-275"><span class="linenos">275</span></a>
+</span><span id="L-276"><a href="#L-276"><span class="linenos">276</span></a><span class="sd">        Returns:</span>
+</span><span id="L-277"><a href="#L-277"><span class="linenos">277</span></a><span class="sd">            `LatentsDomainGroupsDT`: the domains&#39; unimodal representations.</span>
+</span><span id="L-278"><a href="#L-278"><span class="linenos">278</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="L-279"><a href="#L-279"><span class="linenos">279</span></a>        <span class="k">return</span> <span class="p">{</span>
+</span><span id="L-280"><a href="#L-280"><span class="linenos">280</span></a>            <span class="n">domains</span><span class="p">:</span> <span class="p">{</span>
+</span><span id="L-281"><a href="#L-281"><span class="linenos">281</span></a>                <span class="n">name</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">domain_mods</span><span class="p">[</span><span class="n">name</span><span class="p">]</span><span class="o">.</span><span class="n">encode</span><span class="p">(</span><span class="n">domain</span><span class="p">)</span>
+</span><span id="L-282"><a href="#L-282"><span class="linenos">282</span></a>                <span class="k">for</span> <span class="n">name</span><span class="p">,</span> <span class="n">domain</span> <span class="ow">in</span> <span class="n">data</span><span class="o">.</span><span class="n">items</span><span class="p">()</span>
+</span><span id="L-283"><a href="#L-283"><span class="linenos">283</span></a>            <span class="p">}</span>
+</span><span id="L-284"><a href="#L-284"><span class="linenos">284</span></a>            <span class="k">for</span> <span class="n">domains</span><span class="p">,</span> <span class="n">data</span> <span class="ow">in</span> <span class="n">batch</span><span class="o">.</span><span class="n">items</span><span class="p">()</span>
+</span><span id="L-285"><a href="#L-285"><span class="linenos">285</span></a>        <span class="p">}</span>
+</span><span id="L-286"><a href="#L-286"><span class="linenos">286</span></a>
+</span><span id="L-287"><a href="#L-287"><span class="linenos">287</span></a>    <span class="k">def</span> <span class="nf">decode_domain</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">domain</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">,</span> <span class="n">name</span><span class="p">:</span> <span class="nb">str</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">Any</span><span class="p">:</span>
+</span><span id="L-288"><a href="#L-288"><span class="linenos">288</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="L-289"><a href="#L-289"><span class="linenos">289</span></a><span class="sd">        Decodes a domain from the unimodal representation into the domain data.</span>
+</span><span id="L-290"><a href="#L-290"><span class="linenos">290</span></a>
+</span><span id="L-291"><a href="#L-291"><span class="linenos">291</span></a><span class="sd">        This is a convenient proxy for the `DomainModule.encode` method and is</span>
+</span><span id="L-292"><a href="#L-292"><span class="linenos">292</span></a><span class="sd">        equivalent to:</span>
+</span><span id="L-293"><a href="#L-293"><span class="linenos">293</span></a><span class="sd">        ```python</span>
+</span><span id="L-294"><a href="#L-294"><span class="linenos">294</span></a><span class="sd">        self.domain_mods[name].decode(domain)</span>
+</span><span id="L-295"><a href="#L-295"><span class="linenos">295</span></a><span class="sd">        ```</span>
+</span><span id="L-296"><a href="#L-296"><span class="linenos">296</span></a>
+</span><span id="L-297"><a href="#L-297"><span class="linenos">297</span></a><span class="sd">        Args:</span>
+</span><span id="L-298"><a href="#L-298"><span class="linenos">298</span></a><span class="sd">            domain (`torch.Tensor`): the domain data</span>
+</span><span id="L-299"><a href="#L-299"><span class="linenos">299</span></a><span class="sd">            name (`str`): domain name to encode</span>
+</span><span id="L-300"><a href="#L-300"><span class="linenos">300</span></a>
+</span><span id="L-301"><a href="#L-301"><span class="linenos">301</span></a><span class="sd">        Returns:</span>
+</span><span id="L-302"><a href="#L-302"><span class="linenos">302</span></a><span class="sd">            `Any`: the domain&#39;s raw data.</span>
+</span><span id="L-303"><a href="#L-303"><span class="linenos">303</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="L-304"><a href="#L-304"><span class="linenos">304</span></a>        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">domain_mods</span><span class="p">[</span><span class="n">name</span><span class="p">]</span><span class="o">.</span><span class="n">decode</span><span class="p">(</span><span class="n">domain</span><span class="p">)</span>
+</span><span id="L-305"><a href="#L-305"><span class="linenos">305</span></a>
+</span><span id="L-306"><a href="#L-306"><span class="linenos">306</span></a>    <span class="k">def</span> <span class="nf">decode_domains</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">latents_domain</span><span class="p">:</span> <span class="n">LatentsDomainGroupsT</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">RawDomainGroupsDT</span><span class="p">:</span>
+</span><span id="L-307"><a href="#L-307"><span class="linenos">307</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="L-308"><a href="#L-308"><span class="linenos">308</span></a><span class="sd">        Decodes all domains in the batch.</span>
+</span><span id="L-309"><a href="#L-309"><span class="linenos">309</span></a>
+</span><span id="L-310"><a href="#L-310"><span class="linenos">310</span></a><span class="sd">        Args:</span>
+</span><span id="L-311"><a href="#L-311"><span class="linenos">311</span></a><span class="sd">            batch (`LatentsDomainGroupsT`): the batch of</span>
+</span><span id="L-312"><a href="#L-312"><span class="linenos">312</span></a><span class="sd">                domain groups with unimodal latent representation to decode into</span>
+</span><span id="L-313"><a href="#L-313"><span class="linenos">313</span></a><span class="sd">                groups of raw data.</span>
+</span><span id="L-314"><a href="#L-314"><span class="linenos">314</span></a>
+</span><span id="L-315"><a href="#L-315"><span class="linenos">315</span></a><span class="sd">        Returns:</span>
+</span><span id="L-316"><a href="#L-316"><span class="linenos">316</span></a><span class="sd">            `LatentsDomainGroupsDT`: the domains&#39; raw data.</span>
+</span><span id="L-317"><a href="#L-317"><span class="linenos">317</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="L-318"><a href="#L-318"><span class="linenos">318</span></a>        <span class="k">return</span> <span class="p">{</span>
+</span><span id="L-319"><a href="#L-319"><span class="linenos">319</span></a>            <span class="n">domains</span><span class="p">:</span> <span class="p">{</span>
+</span><span id="L-320"><a href="#L-320"><span class="linenos">320</span></a>                <span class="n">name</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">domain_mods</span><span class="p">[</span><span class="n">name</span><span class="p">]</span><span class="o">.</span><span class="n">decode</span><span class="p">(</span><span class="n">domain</span><span class="p">)</span>
+</span><span id="L-321"><a href="#L-321"><span class="linenos">321</span></a>                <span class="k">for</span> <span class="n">name</span><span class="p">,</span> <span class="n">domain</span> <span class="ow">in</span> <span class="n">latents</span><span class="o">.</span><span class="n">items</span><span class="p">()</span>
+</span><span id="L-322"><a href="#L-322"><span class="linenos">322</span></a>            <span class="p">}</span>
+</span><span id="L-323"><a href="#L-323"><span class="linenos">323</span></a>            <span class="k">for</span> <span class="n">domains</span><span class="p">,</span> <span class="n">latents</span> <span class="ow">in</span> <span class="n">latents_domain</span><span class="o">.</span><span class="n">items</span><span class="p">()</span>
+</span><span id="L-324"><a href="#L-324"><span class="linenos">324</span></a>        <span class="p">}</span>
+</span><span id="L-325"><a href="#L-325"><span class="linenos">325</span></a>
+</span><span id="L-326"><a href="#L-326"><span class="linenos">326</span></a>    <span class="k">def</span> <span class="nf">generic_step</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">batch</span><span class="p">:</span> <span class="n">RawDomainGroupsT</span><span class="p">,</span> <span class="n">mode</span><span class="p">:</span> <span class="n">ModelModeT</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">:</span>
+</span><span id="L-327"><a href="#L-327"><span class="linenos">327</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="L-328"><a href="#L-328"><span class="linenos">328</span></a><span class="sd">        The generic step used in `training_step`, `validation_step` and</span>
+</span><span id="L-329"><a href="#L-329"><span class="linenos">329</span></a><span class="sd">        `test_step`.</span>
+</span><span id="L-330"><a href="#L-330"><span class="linenos">330</span></a>
+</span><span id="L-331"><a href="#L-331"><span class="linenos">331</span></a><span class="sd">        Args:</span>
+</span><span id="L-332"><a href="#L-332"><span class="linenos">332</span></a><span class="sd">            batch (`RawDomainGroupsT`): the batch of groups of raw unimodal data.</span>
+</span><span id="L-333"><a href="#L-333"><span class="linenos">333</span></a><span class="sd">            mode (`ModelModeT`):</span>
+</span><span id="L-334"><a href="#L-334"><span class="linenos">334</span></a>
+</span><span id="L-335"><a href="#L-335"><span class="linenos">335</span></a><span class="sd">        Returns:</span>
+</span><span id="L-336"><a href="#L-336"><span class="linenos">336</span></a><span class="sd">            `torch.Tensor`: the loss to train on.</span>
+</span><span id="L-337"><a href="#L-337"><span class="linenos">337</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="L-338"><a href="#L-338"><span class="linenos">338</span></a>        <span class="n">domain_latents</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">encode_domains</span><span class="p">(</span><span class="n">batch</span><span class="p">)</span>
+</span><span id="L-339"><a href="#L-339"><span class="linenos">339</span></a>        <span class="n">batch_size</span> <span class="o">=</span> <span class="n">groups_batch_size</span><span class="p">(</span><span class="n">domain_latents</span><span class="p">)</span>
+</span><span id="L-340"><a href="#L-340"><span class="linenos">340</span></a>
+</span><span id="L-341"><a href="#L-341"><span class="linenos">341</span></a>        <span class="n">loss_output</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">loss_mod</span><span class="o">.</span><span class="n">step</span><span class="p">(</span><span class="n">domain_latents</span><span class="p">,</span> <span class="n">mode</span><span class="p">)</span>
+</span><span id="L-342"><a href="#L-342"><span class="linenos">342</span></a>
+</span><span id="L-343"><a href="#L-343"><span class="linenos">343</span></a>        <span class="k">for</span> <span class="n">name</span><span class="p">,</span> <span class="n">metric</span> <span class="ow">in</span> <span class="n">loss_output</span><span class="o">.</span><span class="n">all</span><span class="o">.</span><span class="n">items</span><span class="p">():</span>
+</span><span id="L-344"><a href="#L-344"><span class="linenos">344</span></a>            <span class="bp">self</span><span class="o">.</span><span class="n">log</span><span class="p">(</span>
+</span><span id="L-345"><a href="#L-345"><span class="linenos">345</span></a>                <span class="sa">f</span><span class="s2">&quot;</span><span class="si">{</span><span class="n">mode</span><span class="si">}</span><span class="s2">/</span><span class="si">{</span><span class="n">name</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">,</span>
+</span><span id="L-346"><a href="#L-346"><span class="linenos">346</span></a>                <span class="n">metric</span><span class="p">,</span>
+</span><span id="L-347"><a href="#L-347"><span class="linenos">347</span></a>                <span class="n">batch_size</span><span class="o">=</span><span class="n">batch_size</span><span class="p">,</span>
+</span><span id="L-348"><a href="#L-348"><span class="linenos">348</span></a>                <span class="n">add_dataloader_idx</span><span class="o">=</span><span class="kc">False</span><span class="p">,</span>
+</span><span id="L-349"><a href="#L-349"><span class="linenos">349</span></a>            <span class="p">)</span>
+</span><span id="L-350"><a href="#L-350"><span class="linenos">350</span></a>
+</span><span id="L-351"><a href="#L-351"><span class="linenos">351</span></a>        <span class="k">return</span> <span class="n">loss_output</span><span class="o">.</span><span class="n">loss</span>
+</span><span id="L-352"><a href="#L-352"><span class="linenos">352</span></a>
+</span><span id="L-353"><a href="#L-353"><span class="linenos">353</span></a>    <span class="k">def</span> <span class="nf">validation_step</span><span class="p">(</span>  <span class="c1"># type: ignore</span>
+</span><span id="L-354"><a href="#L-354"><span class="linenos">354</span></a>        <span class="bp">self</span><span class="p">,</span> <span class="n">data</span><span class="p">:</span> <span class="n">RawDomainGroupT</span><span class="p">,</span> <span class="n">batch_idx</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span> <span class="n">dataloader_idx</span><span class="p">:</span> <span class="nb">int</span> <span class="o">=</span> <span class="mi">0</span>
+</span><span id="L-355"><a href="#L-355"><span class="linenos">355</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">:</span>
+</span><span id="L-356"><a href="#L-356"><span class="linenos">356</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;Validation step used by lightning&quot;&quot;&quot;</span>
+</span><span id="L-357"><a href="#L-357"><span class="linenos">357</span></a>
+</span><span id="L-358"><a href="#L-358"><span class="linenos">358</span></a>        <span class="n">batch</span> <span class="o">=</span> <span class="p">{</span><span class="nb">frozenset</span><span class="p">(</span><span class="n">data</span><span class="o">.</span><span class="n">keys</span><span class="p">()):</span> <span class="n">data</span><span class="p">}</span>
+</span><span id="L-359"><a href="#L-359"><span class="linenos">359</span></a>        <span class="k">for</span> <span class="n">domain</span> <span class="ow">in</span> <span class="n">data</span><span class="p">:</span>
+</span><span id="L-360"><a href="#L-360"><span class="linenos">360</span></a>            <span class="n">batch</span><span class="p">[</span><span class="nb">frozenset</span><span class="p">([</span><span class="n">domain</span><span class="p">])]</span> <span class="o">=</span> <span class="p">{</span><span class="n">domain</span><span class="p">:</span> <span class="n">data</span><span class="p">[</span><span class="n">domain</span><span class="p">]}</span>
+</span><span id="L-361"><a href="#L-361"><span class="linenos">361</span></a>        <span class="k">if</span> <span class="n">dataloader_idx</span> <span class="o">==</span> <span class="mi">0</span><span class="p">:</span>
+</span><span id="L-362"><a href="#L-362"><span class="linenos">362</span></a>            <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">generic_step</span><span class="p">(</span><span class="n">batch</span><span class="p">,</span> <span class="n">mode</span><span class="o">=</span><span class="s2">&quot;val&quot;</span><span class="p">)</span>
+</span><span id="L-363"><a href="#L-363"><span class="linenos">363</span></a>        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">generic_step</span><span class="p">(</span><span class="n">batch</span><span class="p">,</span> <span class="n">mode</span><span class="o">=</span><span class="s2">&quot;val/ood&quot;</span><span class="p">)</span>
+</span><span id="L-364"><a href="#L-364"><span class="linenos">364</span></a>
+</span><span id="L-365"><a href="#L-365"><span class="linenos">365</span></a>    <span class="k">def</span> <span class="nf">test_step</span><span class="p">(</span>  <span class="c1"># type: ignore</span>
+</span><span id="L-366"><a href="#L-366"><span class="linenos">366</span></a>        <span class="bp">self</span><span class="p">,</span> <span class="n">data</span><span class="p">:</span> <span class="n">Mapping</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">Any</span><span class="p">],</span> <span class="n">batch_idx</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span> <span class="n">dataloader_idx</span><span class="p">:</span> <span class="nb">int</span> <span class="o">=</span> <span class="mi">0</span>
+</span><span id="L-367"><a href="#L-367"><span class="linenos">367</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">:</span>
+</span><span id="L-368"><a href="#L-368"><span class="linenos">368</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;Test step used by lightning&quot;&quot;&quot;</span>
+</span><span id="L-369"><a href="#L-369"><span class="linenos">369</span></a>
+</span><span id="L-370"><a href="#L-370"><span class="linenos">370</span></a>        <span class="n">batch</span> <span class="o">=</span> <span class="p">{</span><span class="nb">frozenset</span><span class="p">(</span><span class="n">data</span><span class="o">.</span><span class="n">keys</span><span class="p">()):</span> <span class="n">data</span><span class="p">}</span>
+</span><span id="L-371"><a href="#L-371"><span class="linenos">371</span></a>        <span class="k">for</span> <span class="n">domain</span> <span class="ow">in</span> <span class="n">data</span><span class="p">:</span>
+</span><span id="L-372"><a href="#L-372"><span class="linenos">372</span></a>            <span class="n">batch</span><span class="p">[</span><span class="nb">frozenset</span><span class="p">([</span><span class="n">domain</span><span class="p">])]</span> <span class="o">=</span> <span class="p">{</span><span class="n">domain</span><span class="p">:</span> <span class="n">data</span><span class="p">[</span><span class="n">domain</span><span class="p">]}</span>
+</span><span id="L-373"><a href="#L-373"><span class="linenos">373</span></a>        <span class="k">if</span> <span class="n">dataloader_idx</span> <span class="o">==</span> <span class="mi">0</span><span class="p">:</span>
+</span><span id="L-374"><a href="#L-374"><span class="linenos">374</span></a>            <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">generic_step</span><span class="p">(</span><span class="n">batch</span><span class="p">,</span> <span class="n">mode</span><span class="o">=</span><span class="s2">&quot;test&quot;</span><span class="p">)</span>
+</span><span id="L-375"><a href="#L-375"><span class="linenos">375</span></a>        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">generic_step</span><span class="p">(</span><span class="n">batch</span><span class="p">,</span> <span class="n">mode</span><span class="o">=</span><span class="s2">&quot;test/ood&quot;</span><span class="p">)</span>
+</span><span id="L-376"><a href="#L-376"><span class="linenos">376</span></a>
+</span><span id="L-377"><a href="#L-377"><span class="linenos">377</span></a>    <span class="k">def</span> <span class="nf">training_step</span><span class="p">(</span>  <span class="c1"># type: ignore</span>
+</span><span id="L-378"><a href="#L-378"><span class="linenos">378</span></a>        <span class="bp">self</span><span class="p">,</span> <span class="n">batch</span><span class="p">:</span> <span class="n">Mapping</span><span class="p">[</span><span class="nb">frozenset</span><span class="p">[</span><span class="nb">str</span><span class="p">],</span> <span class="n">Mapping</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">Any</span><span class="p">]],</span> <span class="n">batch_idx</span><span class="p">:</span> <span class="nb">int</span>
+</span><span id="L-379"><a href="#L-379"><span class="linenos">379</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">:</span>
+</span><span id="L-380"><a href="#L-380"><span class="linenos">380</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;Training step used by lightning&quot;&quot;&quot;</span>
+</span><span id="L-381"><a href="#L-381"><span class="linenos">381</span></a>
+</span><span id="L-382"><a href="#L-382"><span class="linenos">382</span></a>        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">generic_step</span><span class="p">(</span><span class="n">batch</span><span class="p">,</span> <span class="n">mode</span><span class="o">=</span><span class="s2">&quot;train&quot;</span><span class="p">)</span>
+</span><span id="L-383"><a href="#L-383"><span class="linenos">383</span></a>
+</span><span id="L-384"><a href="#L-384"><span class="linenos">384</span></a>    <span class="k">def</span> <span class="nf">predict_step</span><span class="p">(</span>  <span class="c1"># type: ignore</span>
+</span><span id="L-385"><a href="#L-385"><span class="linenos">385</span></a>        <span class="bp">self</span><span class="p">,</span> <span class="n">data</span><span class="p">:</span> <span class="n">Mapping</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">Any</span><span class="p">],</span> <span class="n">batch_idx</span><span class="p">:</span> <span class="nb">int</span>
+</span><span id="L-386"><a href="#L-386"><span class="linenos">386</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="n">GWPredictionsBase</span><span class="p">:</span>
+</span><span id="L-387"><a href="#L-387"><span class="linenos">387</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;Predict step used by lightning&quot;&quot;&quot;</span>
+</span><span id="L-388"><a href="#L-388"><span class="linenos">388</span></a>
+</span><span id="L-389"><a href="#L-389"><span class="linenos">389</span></a>        <span class="n">batch</span> <span class="o">=</span> <span class="p">{</span><span class="nb">frozenset</span><span class="p">(</span><span class="n">data</span><span class="o">.</span><span class="n">keys</span><span class="p">()):</span> <span class="n">data</span><span class="p">}</span>
+</span><span id="L-390"><a href="#L-390"><span class="linenos">390</span></a>        <span class="k">for</span> <span class="n">domain</span> <span class="ow">in</span> <span class="n">data</span><span class="p">:</span>
+</span><span id="L-391"><a href="#L-391"><span class="linenos">391</span></a>            <span class="n">batch</span><span class="p">[</span><span class="nb">frozenset</span><span class="p">([</span><span class="n">domain</span><span class="p">])]</span> <span class="o">=</span> <span class="p">{</span><span class="n">domain</span><span class="p">:</span> <span class="n">data</span><span class="p">[</span><span class="n">domain</span><span class="p">]}</span>
+</span><span id="L-392"><a href="#L-392"><span class="linenos">392</span></a>
+</span><span id="L-393"><a href="#L-393"><span class="linenos">393</span></a>        <span class="n">domain_latents</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">encode_domains</span><span class="p">(</span><span class="n">batch</span><span class="p">)</span>
+</span><span id="L-394"><a href="#L-394"><span class="linenos">394</span></a>        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">forward</span><span class="p">(</span><span class="n">domain_latents</span><span class="p">)</span>
+</span><span id="L-395"><a href="#L-395"><span class="linenos">395</span></a>
+</span><span id="L-396"><a href="#L-396"><span class="linenos">396</span></a>    <span class="k">def</span> <span class="nf">configure_optimizers</span><span class="p">(</span><span class="bp">self</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">OptimizerLRSchedulerConfig</span><span class="p">:</span>
+</span><span id="L-397"><a href="#L-397"><span class="linenos">397</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="L-398"><a href="#L-398"><span class="linenos">398</span></a><span class="sd">        Configure models optimizers.</span>
+</span><span id="L-399"><a href="#L-399"><span class="linenos">399</span></a>
+</span><span id="L-400"><a href="#L-400"><span class="linenos">400</span></a><span class="sd">        Here we use `AdamW` for the optimizer and `OneCycleLR` for the learning-rate</span>
+</span><span id="L-401"><a href="#L-401"><span class="linenos">401</span></a><span class="sd">        scheduler.</span>
+</span><span id="L-402"><a href="#L-402"><span class="linenos">402</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="L-403"><a href="#L-403"><span class="linenos">403</span></a>
+</span><span id="L-404"><a href="#L-404"><span class="linenos">404</span></a>        <span class="n">optimizer</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">optim</span><span class="o">.</span><span class="n">AdamW</span><span class="p">(</span>
+</span><span id="L-405"><a href="#L-405"><span class="linenos">405</span></a>            <span class="bp">self</span><span class="o">.</span><span class="n">parameters</span><span class="p">(),</span>
+</span><span id="L-406"><a href="#L-406"><span class="linenos">406</span></a>            <span class="n">lr</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">optim_lr</span><span class="p">,</span>
+</span><span id="L-407"><a href="#L-407"><span class="linenos">407</span></a>            <span class="n">weight_decay</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">optim_weight_decay</span><span class="p">,</span>
+</span><span id="L-408"><a href="#L-408"><span class="linenos">408</span></a>        <span class="p">)</span>
+</span><span id="L-409"><a href="#L-409"><span class="linenos">409</span></a>
+</span><span id="L-410"><a href="#L-410"><span class="linenos">410</span></a>        <span class="n">lr_scheduler</span> <span class="o">=</span> <span class="n">OneCycleLR</span><span class="p">(</span><span class="n">optimizer</span><span class="p">,</span> <span class="o">**</span><span class="bp">self</span><span class="o">.</span><span class="n">scheduler_args</span><span class="p">)</span>
+</span><span id="L-411"><a href="#L-411"><span class="linenos">411</span></a>
+</span><span id="L-412"><a href="#L-412"><span class="linenos">412</span></a>        <span class="k">return</span> <span class="p">{</span>
+</span><span id="L-413"><a href="#L-413"><span class="linenos">413</span></a>            <span class="s2">&quot;optimizer&quot;</span><span class="p">:</span> <span class="n">optimizer</span><span class="p">,</span>
+</span><span id="L-414"><a href="#L-414"><span class="linenos">414</span></a>            <span class="s2">&quot;lr_scheduler&quot;</span><span class="p">:</span> <span class="p">{</span>
+</span><span id="L-415"><a href="#L-415"><span class="linenos">415</span></a>                <span class="s2">&quot;scheduler&quot;</span><span class="p">:</span> <span class="n">lr_scheduler</span><span class="p">,</span>
+</span><span id="L-416"><a href="#L-416"><span class="linenos">416</span></a>                <span class="s2">&quot;interval&quot;</span><span class="p">:</span> <span class="s2">&quot;step&quot;</span><span class="p">,</span>
+</span><span id="L-417"><a href="#L-417"><span class="linenos">417</span></a>            <span class="p">},</span>
+</span><span id="L-418"><a href="#L-418"><span class="linenos">418</span></a>        <span class="p">}</span>
+</span><span id="L-419"><a href="#L-419"><span class="linenos">419</span></a>
+</span><span id="L-420"><a href="#L-420"><span class="linenos">420</span></a>
+</span><span id="L-421"><a href="#L-421"><span class="linenos">421</span></a><span class="k">def</span> <span class="nf">freeze_domain_modules</span><span class="p">(</span>
+</span><span id="L-422"><a href="#L-422"><span class="linenos">422</span></a>    <span class="n">domain_mods</span><span class="p">:</span> <span class="n">Mapping</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">DomainModule</span><span class="p">],</span>
+</span><span id="L-423"><a href="#L-423"><span class="linenos">423</span></a><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">DomainModule</span><span class="p">]:</span>
+</span><span id="L-424"><a href="#L-424"><span class="linenos">424</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="L-425"><a href="#L-425"><span class="linenos">425</span></a><span class="sd">    Freezes weights and set to eval mode the domain modules.</span>
+</span><span id="L-426"><a href="#L-426"><span class="linenos">426</span></a>
+</span><span id="L-427"><a href="#L-427"><span class="linenos">427</span></a><span class="sd">    .. note::</span>
+</span><span id="L-428"><a href="#L-428"><span class="linenos">428</span></a><span class="sd">        The output is casted as `dict[str, DomainModule]` type for better</span>
+</span><span id="L-429"><a href="#L-429"><span class="linenos">429</span></a><span class="sd">        auto-completion, but is actually a torch `ModuleDict`.</span>
+</span><span id="L-430"><a href="#L-430"><span class="linenos">430</span></a>
+</span><span id="L-431"><a href="#L-431"><span class="linenos">431</span></a><span class="sd">    Args:</span>
+</span><span id="L-432"><a href="#L-432"><span class="linenos">432</span></a><span class="sd">        domain_mods (`Mapping[str, DomainModule]`): mapping of domain modules to freeze</span>
+</span><span id="L-433"><a href="#L-433"><span class="linenos">433</span></a>
+</span><span id="L-434"><a href="#L-434"><span class="linenos">434</span></a><span class="sd">    Returns:</span>
+</span><span id="L-435"><a href="#L-435"><span class="linenos">435</span></a><span class="sd">        `ModuleDict`: frozen modules.</span>
+</span><span id="L-436"><a href="#L-436"><span class="linenos">436</span></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="L-437"><a href="#L-437"><span class="linenos">437</span></a>
+</span><span id="L-438"><a href="#L-438"><span class="linenos">438</span></a>    <span class="k">for</span> <span class="n">mod</span> <span class="ow">in</span> <span class="n">domain_mods</span><span class="o">.</span><span class="n">values</span><span class="p">():</span>
+</span><span id="L-439"><a href="#L-439"><span class="linenos">439</span></a>        <span class="n">mod</span><span class="o">.</span><span class="n">freeze</span><span class="p">()</span>
+</span><span id="L-440"><a href="#L-440"><span class="linenos">440</span></a>    <span class="c1"># Cast for better auto-completion at the expense of ModuleDict</span>
+</span><span id="L-441"><a href="#L-441"><span class="linenos">441</span></a>    <span class="k">return</span> <span class="n">cast</span><span class="p">(</span><span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">DomainModule</span><span class="p">],</span> <span class="n">ModuleDict</span><span class="p">(</span><span class="n">domain_mods</span><span class="p">))</span>
+</span><span id="L-442"><a href="#L-442"><span class="linenos">442</span></a>
+</span><span id="L-443"><a href="#L-443"><span class="linenos">443</span></a>
+</span><span id="L-444"><a href="#L-444"><span class="linenos">444</span></a><span class="k">class</span> <span class="nc">GWPredictions</span><span class="p">(</span><span class="n">GWPredictionsBase</span><span class="p">):</span>
+</span><span id="L-445"><a href="#L-445"><span class="linenos">445</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;TypedDict of the output given when calling `GlobalWorkspaceBase.predict`&quot;&quot;&quot;</span>
+</span><span id="L-446"><a href="#L-446"><span class="linenos">446</span></a>
+</span><span id="L-447"><a href="#L-447"><span class="linenos">447</span></a>    <span class="n">demi_cycles</span><span class="p">:</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]</span>
+</span><span id="L-448"><a href="#L-448"><span class="linenos">448</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="L-449"><a href="#L-449"><span class="linenos">449</span></a><span class="sd">    Demi-cycle predictions of the model for each domain. Only computed on domain</span>
+</span><span id="L-450"><a href="#L-450"><span class="linenos">450</span></a><span class="sd">    groups with only one domain.</span>
+</span><span id="L-451"><a href="#L-451"><span class="linenos">451</span></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="L-452"><a href="#L-452"><span class="linenos">452</span></a>
+</span><span id="L-453"><a href="#L-453"><span class="linenos">453</span></a>    <span class="n">cycles</span><span class="p">:</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">tuple</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="nb">str</span><span class="p">],</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]</span>
+</span><span id="L-454"><a href="#L-454"><span class="linenos">454</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="L-455"><a href="#L-455"><span class="linenos">455</span></a><span class="sd">    Cycle predictions of the model from one domain through another one.</span>
+</span><span id="L-456"><a href="#L-456"><span class="linenos">456</span></a><span class="sd">    Only computed on domain groups with more than one domain.</span>
+</span><span id="L-457"><a href="#L-457"><span class="linenos">457</span></a><span class="sd">    The keys are tuple with start domain and intermediary domain.</span>
+</span><span id="L-458"><a href="#L-458"><span class="linenos">458</span></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="L-459"><a href="#L-459"><span class="linenos">459</span></a>
+</span><span id="L-460"><a href="#L-460"><span class="linenos">460</span></a>    <span class="n">translations</span><span class="p">:</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">tuple</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="nb">str</span><span class="p">],</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]</span>
+</span><span id="L-461"><a href="#L-461"><span class="linenos">461</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="L-462"><a href="#L-462"><span class="linenos">462</span></a><span class="sd">    Translation predictions of the model from one domain through another one.</span>
+</span><span id="L-463"><a href="#L-463"><span class="linenos">463</span></a>
+</span><span id="L-464"><a href="#L-464"><span class="linenos">464</span></a><span class="sd">    Only computed on domain groups with more than one domain.</span>
+</span><span id="L-465"><a href="#L-465"><span class="linenos">465</span></a><span class="sd">    The keys are tuples with start domain and target domain.</span>
+</span><span id="L-466"><a href="#L-466"><span class="linenos">466</span></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="L-467"><a href="#L-467"><span class="linenos">467</span></a>
+</span><span id="L-468"><a href="#L-468"><span class="linenos">468</span></a>
+</span><span id="L-469"><a href="#L-469"><span class="linenos">469</span></a><span class="k">class</span> <span class="nc">GlobalWorkspace2Domains</span><span class="p">(</span>
+</span><span id="L-470"><a href="#L-470"><span class="linenos">470</span></a>    <span class="n">GlobalWorkspaceBase</span><span class="p">[</span><span class="n">GWModule</span><span class="p">,</span> <span class="n">SingleDomainSelection</span><span class="p">,</span> <span class="n">GWLosses2Domains</span><span class="p">]</span>
+</span><span id="L-471"><a href="#L-471"><span class="linenos">471</span></a><span class="p">):</span>
+</span><span id="L-472"><a href="#L-472"><span class="linenos">472</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="L-473"><a href="#L-473"><span class="linenos">473</span></a><span class="sd">    A simple 2-domains max flavor of GlobalWorkspaceBase.</span>
+</span><span id="L-474"><a href="#L-474"><span class="linenos">474</span></a>
+</span><span id="L-475"><a href="#L-475"><span class="linenos">475</span></a><span class="sd">    This is used to simplify a Global Workspace instanciation and only overrides the</span>
+</span><span id="L-476"><a href="#L-476"><span class="linenos">476</span></a><span class="sd">    `__init__` method.</span>
+</span><span id="L-477"><a href="#L-477"><span class="linenos">477</span></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="L-478"><a href="#L-478"><span class="linenos">478</span></a>
+</span><span id="L-479"><a href="#L-479"><span class="linenos">479</span></a>    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span>
+</span><span id="L-480"><a href="#L-480"><span class="linenos">480</span></a>        <span class="bp">self</span><span class="p">,</span>
+</span><span id="L-481"><a href="#L-481"><span class="linenos">481</span></a>        <span class="n">domain_mods</span><span class="p">:</span> <span class="n">Mapping</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">DomainModule</span><span class="p">],</span>
+</span><span id="L-482"><a href="#L-482"><span class="linenos">482</span></a>        <span class="n">gw_encoders</span><span class="p">:</span> <span class="n">Mapping</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">Module</span><span class="p">],</span>
+</span><span id="L-483"><a href="#L-483"><span class="linenos">483</span></a>        <span class="n">gw_decoders</span><span class="p">:</span> <span class="n">Mapping</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">Module</span><span class="p">],</span>
+</span><span id="L-484"><a href="#L-484"><span class="linenos">484</span></a>        <span class="n">workspace_dim</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span>
+</span><span id="L-485"><a href="#L-485"><span class="linenos">485</span></a>        <span class="n">loss_coefs</span><span class="p">:</span> <span class="n">LossCoefs</span><span class="p">,</span>
+</span><span id="L-486"><a href="#L-486"><span class="linenos">486</span></a>        <span class="n">optim_lr</span><span class="p">:</span> <span class="nb">float</span> <span class="o">=</span> <span class="mf">1e-3</span><span class="p">,</span>
+</span><span id="L-487"><a href="#L-487"><span class="linenos">487</span></a>        <span class="n">optim_weight_decay</span><span class="p">:</span> <span class="nb">float</span> <span class="o">=</span> <span class="mf">0.0</span><span class="p">,</span>
+</span><span id="L-488"><a href="#L-488"><span class="linenos">488</span></a>        <span class="n">scheduler_args</span><span class="p">:</span> <span class="n">SchedulerArgs</span> <span class="o">|</span> <span class="kc">None</span> <span class="o">=</span> <span class="kc">None</span><span class="p">,</span>
+</span><span id="L-489"><a href="#L-489"><span class="linenos">489</span></a>        <span class="n">learn_logit_scale</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">False</span><span class="p">,</span>
+</span><span id="L-490"><a href="#L-490"><span class="linenos">490</span></a>        <span class="n">contrastive_loss</span><span class="p">:</span> <span class="n">ContrastiveLossType</span> <span class="o">|</span> <span class="kc">None</span> <span class="o">=</span> <span class="kc">None</span><span class="p">,</span>
+</span><span id="L-491"><a href="#L-491"><span class="linenos">491</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="L-492"><a href="#L-492"><span class="linenos">492</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="L-493"><a href="#L-493"><span class="linenos">493</span></a><span class="sd">        Initializes a Global Workspace</span>
+</span><span id="L-494"><a href="#L-494"><span class="linenos">494</span></a>
+</span><span id="L-495"><a href="#L-495"><span class="linenos">495</span></a><span class="sd">        Args:</span>
+</span><span id="L-496"><a href="#L-496"><span class="linenos">496</span></a><span class="sd">            domain_mods (`Mapping[str, DomainModule]`): mapping of the domains</span>
+</span><span id="L-497"><a href="#L-497"><span class="linenos">497</span></a><span class="sd">                connected to the GW. Keys are domain names, values are the</span>
+</span><span id="L-498"><a href="#L-498"><span class="linenos">498</span></a><span class="sd">                `DomainModule`.</span>
+</span><span id="L-499"><a href="#L-499"><span class="linenos">499</span></a><span class="sd">            gw_encoders (`Mapping[str, torch.nn.Module]`): mapping for each domain</span>
+</span><span id="L-500"><a href="#L-500"><span class="linenos">500</span></a><span class="sd">                name to a `torch.nn.Module` class which role is to encode a</span>
+</span><span id="L-501"><a href="#L-501"><span class="linenos">501</span></a><span class="sd">                unimodal latent representations into a GW representation (pre fusion).</span>
+</span><span id="L-502"><a href="#L-502"><span class="linenos">502</span></a><span class="sd">            gw_decoders (`Mapping[str, torch.nn.Module]`): mapping for each domain</span>
+</span><span id="L-503"><a href="#L-503"><span class="linenos">503</span></a><span class="sd">                name to a `torch.nn.Module` class which role is to decode a</span>
+</span><span id="L-504"><a href="#L-504"><span class="linenos">504</span></a><span class="sd">                GW representation into a unimodal latent representations.</span>
+</span><span id="L-505"><a href="#L-505"><span class="linenos">505</span></a><span class="sd">            workspace_dim (`int`): dimension of the GW.</span>
+</span><span id="L-506"><a href="#L-506"><span class="linenos">506</span></a><span class="sd">            loss_coefs (`LossCoefs`): loss coefficients</span>
+</span><span id="L-507"><a href="#L-507"><span class="linenos">507</span></a><span class="sd">            optim_lr (`float`): learning rate</span>
+</span><span id="L-508"><a href="#L-508"><span class="linenos">508</span></a><span class="sd">            optim_weight_decay (`float`): weight decay</span>
+</span><span id="L-509"><a href="#L-509"><span class="linenos">509</span></a><span class="sd">            scheduler_args (`SchedulerArgs | None`): optimization scheduler&#39;s arguments</span>
+</span><span id="L-510"><a href="#L-510"><span class="linenos">510</span></a><span class="sd">            learn_logit_scale (`bool`): whether to learn the contrastive learning</span>
+</span><span id="L-511"><a href="#L-511"><span class="linenos">511</span></a><span class="sd">                contrastive loss when using the default contrastive loss.</span>
+</span><span id="L-512"><a href="#L-512"><span class="linenos">512</span></a><span class="sd">            contrastive_loss (`ContrastiveLossType | None`): a contrastive loss</span>
+</span><span id="L-513"><a href="#L-513"><span class="linenos">513</span></a><span class="sd">                function used for alignment. `learn_logit_scale` will not affect custom</span>
+</span><span id="L-514"><a href="#L-514"><span class="linenos">514</span></a><span class="sd">                contrastive losses.</span>
+</span><span id="L-515"><a href="#L-515"><span class="linenos">515</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="L-516"><a href="#L-516"><span class="linenos">516</span></a>        <span class="n">domain_mods</span> <span class="o">=</span> <span class="n">freeze_domain_modules</span><span class="p">(</span><span class="n">domain_mods</span><span class="p">)</span>
+</span><span id="L-517"><a href="#L-517"><span class="linenos">517</span></a>
+</span><span id="L-518"><a href="#L-518"><span class="linenos">518</span></a>        <span class="n">gw_mod</span> <span class="o">=</span> <span class="n">GWModule</span><span class="p">(</span><span class="n">domain_mods</span><span class="p">,</span> <span class="n">workspace_dim</span><span class="p">,</span> <span class="n">gw_encoders</span><span class="p">,</span> <span class="n">gw_decoders</span><span class="p">)</span>
+</span><span id="L-519"><a href="#L-519"><span class="linenos">519</span></a>        <span class="k">if</span> <span class="n">contrastive_loss</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="L-520"><a href="#L-520"><span class="linenos">520</span></a>            <span class="n">contrastive_loss</span> <span class="o">=</span> <span class="n">ContrastiveLoss</span><span class="p">(</span>
+</span><span id="L-521"><a href="#L-521"><span class="linenos">521</span></a>                <span class="n">torch</span><span class="o">.</span><span class="n">tensor</span><span class="p">([</span><span class="mi">1</span> <span class="o">/</span> <span class="mf">0.07</span><span class="p">])</span><span class="o">.</span><span class="n">log</span><span class="p">(),</span> <span class="s2">&quot;mean&quot;</span><span class="p">,</span> <span class="n">learn_logit_scale</span>
+</span><span id="L-522"><a href="#L-522"><span class="linenos">522</span></a>            <span class="p">)</span>
+</span><span id="L-523"><a href="#L-523"><span class="linenos">523</span></a>        <span class="n">selection_mod</span> <span class="o">=</span> <span class="n">SingleDomainSelection</span><span class="p">()</span>
+</span><span id="L-524"><a href="#L-524"><span class="linenos">524</span></a>        <span class="n">loss_mod</span> <span class="o">=</span> <span class="n">GWLosses2Domains</span><span class="p">(</span>
+</span><span id="L-525"><a href="#L-525"><span class="linenos">525</span></a>            <span class="n">gw_mod</span><span class="p">,</span> <span class="n">selection_mod</span><span class="p">,</span> <span class="n">domain_mods</span><span class="p">,</span> <span class="n">loss_coefs</span><span class="p">,</span> <span class="n">contrastive_loss</span>
+</span><span id="L-526"><a href="#L-526"><span class="linenos">526</span></a>        <span class="p">)</span>
+</span><span id="L-527"><a href="#L-527"><span class="linenos">527</span></a>
+</span><span id="L-528"><a href="#L-528"><span class="linenos">528</span></a>        <span class="nb">super</span><span class="p">()</span><span class="o">.</span><span class="fm">__init__</span><span class="p">(</span>
+</span><span id="L-529"><a href="#L-529"><span class="linenos">529</span></a>            <span class="n">gw_mod</span><span class="p">,</span>
+</span><span id="L-530"><a href="#L-530"><span class="linenos">530</span></a>            <span class="n">selection_mod</span><span class="p">,</span>
+</span><span id="L-531"><a href="#L-531"><span class="linenos">531</span></a>            <span class="n">loss_mod</span><span class="p">,</span>
+</span><span id="L-532"><a href="#L-532"><span class="linenos">532</span></a>            <span class="n">optim_lr</span><span class="p">,</span>
+</span><span id="L-533"><a href="#L-533"><span class="linenos">533</span></a>            <span class="n">optim_weight_decay</span><span class="p">,</span>
+</span><span id="L-534"><a href="#L-534"><span class="linenos">534</span></a>            <span class="n">scheduler_args</span><span class="p">,</span>
+</span><span id="L-535"><a href="#L-535"><span class="linenos">535</span></a>        <span class="p">)</span>
+</span><span id="L-536"><a href="#L-536"><span class="linenos">536</span></a>
+</span><span id="L-537"><a href="#L-537"><span class="linenos">537</span></a>    <span class="k">def</span> <span class="nf">forward</span><span class="p">(</span>  <span class="c1"># type: ignore</span>
+</span><span id="L-538"><a href="#L-538"><span class="linenos">538</span></a>        <span class="bp">self</span><span class="p">,</span>
+</span><span id="L-539"><a href="#L-539"><span class="linenos">539</span></a>        <span class="n">latent_domains</span><span class="p">:</span> <span class="n">LatentsDomainGroupsT</span><span class="p">,</span>
+</span><span id="L-540"><a href="#L-540"><span class="linenos">540</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="n">GWPredictions</span><span class="p">:</span>
+</span><span id="L-541"><a href="#L-541"><span class="linenos">541</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="L-542"><a href="#L-542"><span class="linenos">542</span></a><span class="sd">        Computes demi-cycles, cycles, and translations.</span>
+</span><span id="L-543"><a href="#L-543"><span class="linenos">543</span></a>
+</span><span id="L-544"><a href="#L-544"><span class="linenos">544</span></a><span class="sd">        Args:</span>
+</span><span id="L-545"><a href="#L-545"><span class="linenos">545</span></a><span class="sd">            latent_domains (`LatentsT`): Groups of domains for the computation.</span>
+</span><span id="L-546"><a href="#L-546"><span class="linenos">546</span></a>
+</span><span id="L-547"><a href="#L-547"><span class="linenos">547</span></a><span class="sd">        Returns:</span>
+</span><span id="L-548"><a href="#L-548"><span class="linenos">548</span></a><span class="sd">            `GWPredictions`: the predictions on the batch.</span>
+</span><span id="L-549"><a href="#L-549"><span class="linenos">549</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="L-550"><a href="#L-550"><span class="linenos">550</span></a>        <span class="k">return</span> <span class="n">GWPredictions</span><span class="p">(</span>
+</span><span id="L-551"><a href="#L-551"><span class="linenos">551</span></a>            <span class="n">demi_cycles</span><span class="o">=</span><span class="n">batch_demi_cycles</span><span class="p">(</span>
+</span><span id="L-552"><a href="#L-552"><span class="linenos">552</span></a>                <span class="bp">self</span><span class="o">.</span><span class="n">gw_mod</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">selection_mod</span><span class="p">,</span> <span class="n">latent_domains</span>
+</span><span id="L-553"><a href="#L-553"><span class="linenos">553</span></a>            <span class="p">),</span>
+</span><span id="L-554"><a href="#L-554"><span class="linenos">554</span></a>            <span class="n">cycles</span><span class="o">=</span><span class="n">batch_cycles</span><span class="p">(</span>
+</span><span id="L-555"><a href="#L-555"><span class="linenos">555</span></a>                <span class="bp">self</span><span class="o">.</span><span class="n">gw_mod</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">selection_mod</span><span class="p">,</span> <span class="n">latent_domains</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">domain_mods</span><span class="o">.</span><span class="n">keys</span><span class="p">()</span>
+</span><span id="L-556"><a href="#L-556"><span class="linenos">556</span></a>            <span class="p">),</span>
+</span><span id="L-557"><a href="#L-557"><span class="linenos">557</span></a>            <span class="n">translations</span><span class="o">=</span><span class="n">batch_translations</span><span class="p">(</span>
+</span><span id="L-558"><a href="#L-558"><span class="linenos">558</span></a>                <span class="bp">self</span><span class="o">.</span><span class="n">gw_mod</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">selection_mod</span><span class="p">,</span> <span class="n">latent_domains</span>
+</span><span id="L-559"><a href="#L-559"><span class="linenos">559</span></a>            <span class="p">),</span>
+</span><span id="L-560"><a href="#L-560"><span class="linenos">560</span></a>            <span class="o">**</span><span class="nb">super</span><span class="p">()</span><span class="o">.</span><span class="n">forward</span><span class="p">(</span><span class="n">latent_domains</span><span class="p">),</span>
+</span><span id="L-561"><a href="#L-561"><span class="linenos">561</span></a>        <span class="p">)</span>
+</span><span id="L-562"><a href="#L-562"><span class="linenos">562</span></a>
+</span><span id="L-563"><a href="#L-563"><span class="linenos">563</span></a>
+</span><span id="L-564"><a href="#L-564"><span class="linenos">564</span></a><span class="k">class</span> <span class="nc">GlobalWorkspace</span><span class="p">(</span><span class="n">GlobalWorkspaceBase</span><span class="p">[</span><span class="n">GWModule</span><span class="p">,</span> <span class="n">RandomSelection</span><span class="p">,</span> <span class="n">GWLosses</span><span class="p">]):</span>
+</span><span id="L-565"><a href="#L-565"><span class="linenos">565</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;The 2-domain fusion (with broadcast loss) flavor of GlobalWorkspaceBase.</span>
+</span><span id="L-566"><a href="#L-566"><span class="linenos">566</span></a>
+</span><span id="L-567"><a href="#L-567"><span class="linenos">567</span></a><span class="sd">    This is used to simplify a Global Workspace instanciation and only overrides the</span>
+</span><span id="L-568"><a href="#L-568"><span class="linenos">568</span></a><span class="sd">    `__init__` method.</span>
+</span><span id="L-569"><a href="#L-569"><span class="linenos">569</span></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="L-570"><a href="#L-570"><span class="linenos">570</span></a>
+</span><span id="L-571"><a href="#L-571"><span class="linenos">571</span></a>    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span>
+</span><span id="L-572"><a href="#L-572"><span class="linenos">572</span></a>        <span class="bp">self</span><span class="p">,</span>
+</span><span id="L-573"><a href="#L-573"><span class="linenos">573</span></a>        <span class="n">domain_mods</span><span class="p">:</span> <span class="n">Mapping</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">DomainModule</span><span class="p">],</span>
+</span><span id="L-574"><a href="#L-574"><span class="linenos">574</span></a>        <span class="n">gw_encoders</span><span class="p">:</span> <span class="n">Mapping</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">Module</span><span class="p">],</span>
+</span><span id="L-575"><a href="#L-575"><span class="linenos">575</span></a>        <span class="n">gw_decoders</span><span class="p">:</span> <span class="n">Mapping</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">Module</span><span class="p">],</span>
+</span><span id="L-576"><a href="#L-576"><span class="linenos">576</span></a>        <span class="n">workspace_dim</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span>
+</span><span id="L-577"><a href="#L-577"><span class="linenos">577</span></a>        <span class="n">loss_coefs</span><span class="p">:</span> <span class="n">BroadcastLossCoefs</span><span class="p">,</span>
+</span><span id="L-578"><a href="#L-578"><span class="linenos">578</span></a>        <span class="n">selection_temperature</span><span class="p">:</span> <span class="nb">float</span> <span class="o">=</span> <span class="mf">0.2</span><span class="p">,</span>
+</span><span id="L-579"><a href="#L-579"><span class="linenos">579</span></a>        <span class="n">optim_lr</span><span class="p">:</span> <span class="nb">float</span> <span class="o">=</span> <span class="mf">1e-3</span><span class="p">,</span>
+</span><span id="L-580"><a href="#L-580"><span class="linenos">580</span></a>        <span class="n">optim_weight_decay</span><span class="p">:</span> <span class="nb">float</span> <span class="o">=</span> <span class="mf">0.0</span><span class="p">,</span>
+</span><span id="L-581"><a href="#L-581"><span class="linenos">581</span></a>        <span class="n">scheduler_args</span><span class="p">:</span> <span class="n">SchedulerArgs</span> <span class="o">|</span> <span class="kc">None</span> <span class="o">=</span> <span class="kc">None</span><span class="p">,</span>
+</span><span id="L-582"><a href="#L-582"><span class="linenos">582</span></a>        <span class="n">learn_logit_scale</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">False</span><span class="p">,</span>
+</span><span id="L-583"><a href="#L-583"><span class="linenos">583</span></a>        <span class="n">contrastive_loss</span><span class="p">:</span> <span class="n">ContrastiveLossType</span> <span class="o">|</span> <span class="kc">None</span> <span class="o">=</span> <span class="kc">None</span><span class="p">,</span>
+</span><span id="L-584"><a href="#L-584"><span class="linenos">584</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="L-585"><a href="#L-585"><span class="linenos">585</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="L-586"><a href="#L-586"><span class="linenos">586</span></a><span class="sd">        Initializes a Global Workspace</span>
+</span><span id="L-587"><a href="#L-587"><span class="linenos">587</span></a>
+</span><span id="L-588"><a href="#L-588"><span class="linenos">588</span></a><span class="sd">        Args:</span>
+</span><span id="L-589"><a href="#L-589"><span class="linenos">589</span></a><span class="sd">            domain_mods (`Mapping[str, DomainModule]`): mapping of the domains</span>
+</span><span id="L-590"><a href="#L-590"><span class="linenos">590</span></a><span class="sd">                connected to the GW. Keys are domain names, values are the</span>
+</span><span id="L-591"><a href="#L-591"><span class="linenos">591</span></a><span class="sd">                `DomainModule`.</span>
+</span><span id="L-592"><a href="#L-592"><span class="linenos">592</span></a><span class="sd">            gw_encoders (`Mapping[str, torch.nn.Module]`): mapping for each domain</span>
+</span><span id="L-593"><a href="#L-593"><span class="linenos">593</span></a><span class="sd">                name to a `torch.nn.Module` class which role is to encode a</span>
+</span><span id="L-594"><a href="#L-594"><span class="linenos">594</span></a><span class="sd">                unimodal latent representations into a GW representation (pre fusion).</span>
+</span><span id="L-595"><a href="#L-595"><span class="linenos">595</span></a><span class="sd">            gw_decoders (`Mapping[str, torch.nn.Module]`): mapping for each domain</span>
+</span><span id="L-596"><a href="#L-596"><span class="linenos">596</span></a><span class="sd">                name to a `torch.nn.Module` class which role is to decode a</span>
+</span><span id="L-597"><a href="#L-597"><span class="linenos">597</span></a><span class="sd">                GW representation into a unimodal latent representations.</span>
+</span><span id="L-598"><a href="#L-598"><span class="linenos">598</span></a><span class="sd">            workspace_dim (`int`): dimension of the GW.</span>
+</span><span id="L-599"><a href="#L-599"><span class="linenos">599</span></a><span class="sd">            loss_coefs (`BroadcastLossCoefs`): loss coefs for the losses.</span>
+</span><span id="L-600"><a href="#L-600"><span class="linenos">600</span></a><span class="sd">            selection_temperature (`float`): temperature value for the RandomSelection</span>
+</span><span id="L-601"><a href="#L-601"><span class="linenos">601</span></a><span class="sd">                module.</span>
+</span><span id="L-602"><a href="#L-602"><span class="linenos">602</span></a><span class="sd">            optim_lr (`float`): learning rate</span>
+</span><span id="L-603"><a href="#L-603"><span class="linenos">603</span></a><span class="sd">            optim_weight_decay (`float`): weight decay</span>
+</span><span id="L-604"><a href="#L-604"><span class="linenos">604</span></a><span class="sd">            scheduler_args (`SchedulerArgs | None`): optimization scheduler&#39;s arguments</span>
+</span><span id="L-605"><a href="#L-605"><span class="linenos">605</span></a><span class="sd">            learn_logit_scale (`bool`): whether to learn the contrastive learning</span>
+</span><span id="L-606"><a href="#L-606"><span class="linenos">606</span></a><span class="sd">                contrastive loss when using the default contrastive loss.</span>
+</span><span id="L-607"><a href="#L-607"><span class="linenos">607</span></a><span class="sd">            contrastive_loss (`ContrastiveLossType | None`): a contrastive loss</span>
+</span><span id="L-608"><a href="#L-608"><span class="linenos">608</span></a><span class="sd">                function used for alignment. `learn_logit_scale` will not affect custom</span>
+</span><span id="L-609"><a href="#L-609"><span class="linenos">609</span></a><span class="sd">                contrastive losses.</span>
+</span><span id="L-610"><a href="#L-610"><span class="linenos">610</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="L-611"><a href="#L-611"><span class="linenos">611</span></a>        <span class="n">domain_mods</span> <span class="o">=</span> <span class="n">freeze_domain_modules</span><span class="p">(</span><span class="n">domain_mods</span><span class="p">)</span>
+</span><span id="L-612"><a href="#L-612"><span class="linenos">612</span></a>        <span class="n">gw_mod</span> <span class="o">=</span> <span class="n">GWModule</span><span class="p">(</span><span class="n">domain_mods</span><span class="p">,</span> <span class="n">workspace_dim</span><span class="p">,</span> <span class="n">gw_encoders</span><span class="p">,</span> <span class="n">gw_decoders</span><span class="p">)</span>
+</span><span id="L-613"><a href="#L-613"><span class="linenos">613</span></a>
+</span><span id="L-614"><a href="#L-614"><span class="linenos">614</span></a>        <span class="k">if</span> <span class="n">contrastive_loss</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="L-615"><a href="#L-615"><span class="linenos">615</span></a>            <span class="n">contrastive_loss</span> <span class="o">=</span> <span class="n">ContrastiveLoss</span><span class="p">(</span>
+</span><span id="L-616"><a href="#L-616"><span class="linenos">616</span></a>                <span class="n">torch</span><span class="o">.</span><span class="n">tensor</span><span class="p">([</span><span class="mi">1</span> <span class="o">/</span> <span class="mf">0.07</span><span class="p">])</span><span class="o">.</span><span class="n">log</span><span class="p">(),</span> <span class="s2">&quot;mean&quot;</span><span class="p">,</span> <span class="n">learn_logit_scale</span>
+</span><span id="L-617"><a href="#L-617"><span class="linenos">617</span></a>            <span class="p">)</span>
+</span><span id="L-618"><a href="#L-618"><span class="linenos">618</span></a>
+</span><span id="L-619"><a href="#L-619"><span class="linenos">619</span></a>        <span class="n">selection_mod</span> <span class="o">=</span> <span class="n">RandomSelection</span><span class="p">(</span><span class="n">selection_temperature</span><span class="p">)</span>
+</span><span id="L-620"><a href="#L-620"><span class="linenos">620</span></a>        <span class="n">loss_mod</span> <span class="o">=</span> <span class="n">GWLosses</span><span class="p">(</span>
+</span><span id="L-621"><a href="#L-621"><span class="linenos">621</span></a>            <span class="n">gw_mod</span><span class="p">,</span> <span class="n">selection_mod</span><span class="p">,</span> <span class="n">domain_mods</span><span class="p">,</span> <span class="n">loss_coefs</span><span class="p">,</span> <span class="n">contrastive_loss</span>
+</span><span id="L-622"><a href="#L-622"><span class="linenos">622</span></a>        <span class="p">)</span>
+</span><span id="L-623"><a href="#L-623"><span class="linenos">623</span></a>
+</span><span id="L-624"><a href="#L-624"><span class="linenos">624</span></a>        <span class="nb">super</span><span class="p">()</span><span class="o">.</span><span class="fm">__init__</span><span class="p">(</span>
+</span><span id="L-625"><a href="#L-625"><span class="linenos">625</span></a>            <span class="n">gw_mod</span><span class="p">,</span>
+</span><span id="L-626"><a href="#L-626"><span class="linenos">626</span></a>            <span class="n">selection_mod</span><span class="p">,</span>
+</span><span id="L-627"><a href="#L-627"><span class="linenos">627</span></a>            <span class="n">loss_mod</span><span class="p">,</span>
+</span><span id="L-628"><a href="#L-628"><span class="linenos">628</span></a>            <span class="n">optim_lr</span><span class="p">,</span>
+</span><span id="L-629"><a href="#L-629"><span class="linenos">629</span></a>            <span class="n">optim_weight_decay</span><span class="p">,</span>
+</span><span id="L-630"><a href="#L-630"><span class="linenos">630</span></a>            <span class="n">scheduler_args</span><span class="p">,</span>
+</span><span id="L-631"><a href="#L-631"><span class="linenos">631</span></a>        <span class="p">)</span>
+</span><span id="L-632"><a href="#L-632"><span class="linenos">632</span></a>
+</span><span id="L-633"><a href="#L-633"><span class="linenos">633</span></a>    <span class="k">def</span> <span class="nf">forward</span><span class="p">(</span>  <span class="c1"># type: ignore</span>
+</span><span id="L-634"><a href="#L-634"><span class="linenos">634</span></a>        <span class="bp">self</span><span class="p">,</span>
+</span><span id="L-635"><a href="#L-635"><span class="linenos">635</span></a>        <span class="n">latent_domains</span><span class="p">:</span> <span class="n">LatentsDomainGroupsT</span><span class="p">,</span>
+</span><span id="L-636"><a href="#L-636"><span class="linenos">636</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="n">GWPredictions</span><span class="p">:</span>
+</span><span id="L-637"><a href="#L-637"><span class="linenos">637</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="L-638"><a href="#L-638"><span class="linenos">638</span></a><span class="sd">        Computes demi-cycles, cycles, and translations.</span>
+</span><span id="L-639"><a href="#L-639"><span class="linenos">639</span></a>
+</span><span id="L-640"><a href="#L-640"><span class="linenos">640</span></a><span class="sd">        Args:</span>
+</span><span id="L-641"><a href="#L-641"><span class="linenos">641</span></a><span class="sd">            latent_domains (`LatentsT`): Groups of domains for the computation.</span>
+</span><span id="L-642"><a href="#L-642"><span class="linenos">642</span></a>
+</span><span id="L-643"><a href="#L-643"><span class="linenos">643</span></a><span class="sd">        Returns:</span>
+</span><span id="L-644"><a href="#L-644"><span class="linenos">644</span></a><span class="sd">            `GWPredictions`: the predictions on the batch.</span>
+</span><span id="L-645"><a href="#L-645"><span class="linenos">645</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="L-646"><a href="#L-646"><span class="linenos">646</span></a>        <span class="k">return</span> <span class="n">GWPredictions</span><span class="p">(</span>
+</span><span id="L-647"><a href="#L-647"><span class="linenos">647</span></a>            <span class="n">demi_cycles</span><span class="o">=</span><span class="n">batch_demi_cycles</span><span class="p">(</span>
+</span><span id="L-648"><a href="#L-648"><span class="linenos">648</span></a>                <span class="bp">self</span><span class="o">.</span><span class="n">gw_mod</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">selection_mod</span><span class="p">,</span> <span class="n">latent_domains</span>
+</span><span id="L-649"><a href="#L-649"><span class="linenos">649</span></a>            <span class="p">),</span>
+</span><span id="L-650"><a href="#L-650"><span class="linenos">650</span></a>            <span class="n">cycles</span><span class="o">=</span><span class="n">batch_cycles</span><span class="p">(</span>
+</span><span id="L-651"><a href="#L-651"><span class="linenos">651</span></a>                <span class="bp">self</span><span class="o">.</span><span class="n">gw_mod</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">selection_mod</span><span class="p">,</span> <span class="n">latent_domains</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">domain_mods</span><span class="o">.</span><span class="n">keys</span><span class="p">()</span>
+</span><span id="L-652"><a href="#L-652"><span class="linenos">652</span></a>            <span class="p">),</span>
+</span><span id="L-653"><a href="#L-653"><span class="linenos">653</span></a>            <span class="n">translations</span><span class="o">=</span><span class="n">batch_translations</span><span class="p">(</span>
+</span><span id="L-654"><a href="#L-654"><span class="linenos">654</span></a>                <span class="bp">self</span><span class="o">.</span><span class="n">gw_mod</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">selection_mod</span><span class="p">,</span> <span class="n">latent_domains</span>
+</span><span id="L-655"><a href="#L-655"><span class="linenos">655</span></a>            <span class="p">),</span>
+</span><span id="L-656"><a href="#L-656"><span class="linenos">656</span></a>            <span class="c1"># TODO: add other combinations</span>
+</span><span id="L-657"><a href="#L-657"><span class="linenos">657</span></a>            <span class="o">**</span><span class="nb">super</span><span class="p">()</span><span class="o">.</span><span class="n">forward</span><span class="p">(</span><span class="n">latent_domains</span><span class="p">),</span>
+</span><span id="L-658"><a href="#L-658"><span class="linenos">658</span></a>        <span class="p">)</span>
+</span><span id="L-659"><a href="#L-659"><span class="linenos">659</span></a>
+</span><span id="L-660"><a href="#L-660"><span class="linenos">660</span></a>
+</span><span id="L-661"><a href="#L-661"><span class="linenos">661</span></a><span class="k">class</span> <span class="nc">GlobalWorkspaceBayesian</span><span class="p">(</span>
+</span><span id="L-662"><a href="#L-662"><span class="linenos">662</span></a>    <span class="n">GlobalWorkspaceBase</span><span class="p">[</span><span class="n">GWModuleBayesian</span><span class="p">,</span> <span class="n">FixedSharedSelection</span><span class="p">,</span> <span class="n">GWLossesBayesian</span><span class="p">]</span>
+</span><span id="L-663"><a href="#L-663"><span class="linenos">663</span></a><span class="p">):</span>
+</span><span id="L-664"><a href="#L-664"><span class="linenos">664</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="L-665"><a href="#L-665"><span class="linenos">665</span></a><span class="sd">    A simple 2-domains max GlobalWorkspaceBase with a Bayesian base uncertainty</span>
+</span><span id="L-666"><a href="#L-666"><span class="linenos">666</span></a><span class="sd">    prediction.</span>
+</span><span id="L-667"><a href="#L-667"><span class="linenos">667</span></a>
+</span><span id="L-668"><a href="#L-668"><span class="linenos">668</span></a><span class="sd">    This is used to simplify a Global Workspace instanciation and only overrides the</span>
+</span><span id="L-669"><a href="#L-669"><span class="linenos">669</span></a><span class="sd">    `__init__` method.</span>
+</span><span id="L-670"><a href="#L-670"><span class="linenos">670</span></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="L-671"><a href="#L-671"><span class="linenos">671</span></a>
+</span><span id="L-672"><a href="#L-672"><span class="linenos">672</span></a>    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span>
+</span><span id="L-673"><a href="#L-673"><span class="linenos">673</span></a>        <span class="bp">self</span><span class="p">,</span>
+</span><span id="L-674"><a href="#L-674"><span class="linenos">674</span></a>        <span class="n">domain_mods</span><span class="p">:</span> <span class="n">Mapping</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">DomainModule</span><span class="p">],</span>
+</span><span id="L-675"><a href="#L-675"><span class="linenos">675</span></a>        <span class="n">gw_encoders</span><span class="p">:</span> <span class="n">Mapping</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">Module</span><span class="p">],</span>
+</span><span id="L-676"><a href="#L-676"><span class="linenos">676</span></a>        <span class="n">gw_decoders</span><span class="p">:</span> <span class="n">Mapping</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">Module</span><span class="p">],</span>
+</span><span id="L-677"><a href="#L-677"><span class="linenos">677</span></a>        <span class="n">workspace_dim</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span>
+</span><span id="L-678"><a href="#L-678"><span class="linenos">678</span></a>        <span class="n">loss_coefs</span><span class="p">:</span> <span class="n">BroadcastLossCoefs</span><span class="p">,</span>
+</span><span id="L-679"><a href="#L-679"><span class="linenos">679</span></a>        <span class="n">sensitivity_selection</span><span class="p">:</span> <span class="nb">float</span> <span class="o">=</span> <span class="mi">1</span><span class="p">,</span>
+</span><span id="L-680"><a href="#L-680"><span class="linenos">680</span></a>        <span class="n">sensitivity_precision</span><span class="p">:</span> <span class="nb">float</span> <span class="o">=</span> <span class="mi">1</span><span class="p">,</span>
+</span><span id="L-681"><a href="#L-681"><span class="linenos">681</span></a>        <span class="n">optim_lr</span><span class="p">:</span> <span class="nb">float</span> <span class="o">=</span> <span class="mf">1e-3</span><span class="p">,</span>
+</span><span id="L-682"><a href="#L-682"><span class="linenos">682</span></a>        <span class="n">optim_weight_decay</span><span class="p">:</span> <span class="nb">float</span> <span class="o">=</span> <span class="mf">0.0</span><span class="p">,</span>
+</span><span id="L-683"><a href="#L-683"><span class="linenos">683</span></a>        <span class="n">scheduler_args</span><span class="p">:</span> <span class="n">SchedulerArgs</span> <span class="o">|</span> <span class="kc">None</span> <span class="o">=</span> <span class="kc">None</span><span class="p">,</span>
+</span><span id="L-684"><a href="#L-684"><span class="linenos">684</span></a>        <span class="n">learn_logit_scale</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">False</span><span class="p">,</span>
+</span><span id="L-685"><a href="#L-685"><span class="linenos">685</span></a>        <span class="n">use_normalized_constrastive</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">True</span><span class="p">,</span>
+</span><span id="L-686"><a href="#L-686"><span class="linenos">686</span></a>        <span class="n">contrastive_loss</span><span class="p">:</span> <span class="n">ContrastiveLossType</span> <span class="o">|</span> <span class="kc">None</span> <span class="o">=</span> <span class="kc">None</span><span class="p">,</span>
+</span><span id="L-687"><a href="#L-687"><span class="linenos">687</span></a>        <span class="n">precision_softmax_temp</span><span class="p">:</span> <span class="nb">float</span> <span class="o">=</span> <span class="mf">0.01</span><span class="p">,</span>
+</span><span id="L-688"><a href="#L-688"><span class="linenos">688</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="L-689"><a href="#L-689"><span class="linenos">689</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="L-690"><a href="#L-690"><span class="linenos">690</span></a><span class="sd">        Initializes a Global Workspace</span>
+</span><span id="L-691"><a href="#L-691"><span class="linenos">691</span></a>
+</span><span id="L-692"><a href="#L-692"><span class="linenos">692</span></a><span class="sd">        Args:</span>
+</span><span id="L-693"><a href="#L-693"><span class="linenos">693</span></a><span class="sd">            domain_mods (`Mapping[str, DomainModule]`): mapping of the domains</span>
+</span><span id="L-694"><a href="#L-694"><span class="linenos">694</span></a><span class="sd">                connected to the GW. Keys are domain names, values are the</span>
+</span><span id="L-695"><a href="#L-695"><span class="linenos">695</span></a><span class="sd">                `DomainModule`.</span>
+</span><span id="L-696"><a href="#L-696"><span class="linenos">696</span></a><span class="sd">            gw_encoders (`Mapping[str, torch.nn.Module]`): mapping for each domain</span>
+</span><span id="L-697"><a href="#L-697"><span class="linenos">697</span></a><span class="sd">                name to a `torch.nn.Module` class which role is to encode a</span>
+</span><span id="L-698"><a href="#L-698"><span class="linenos">698</span></a><span class="sd">                unimodal latent representations into a GW representation (pre fusion).</span>
+</span><span id="L-699"><a href="#L-699"><span class="linenos">699</span></a><span class="sd">            gw_decoders (`Mapping[str, torch.nn.Module]`): mapping for each domain</span>
+</span><span id="L-700"><a href="#L-700"><span class="linenos">700</span></a><span class="sd">                name to a `torch.nn.Module` class which role is to decode a</span>
+</span><span id="L-701"><a href="#L-701"><span class="linenos">701</span></a><span class="sd">                GW representation into a unimodal latent representations.</span>
+</span><span id="L-702"><a href="#L-702"><span class="linenos">702</span></a><span class="sd">            workspace_dim (`int`): dimension of the GW.</span>
+</span><span id="L-703"><a href="#L-703"><span class="linenos">703</span></a><span class="sd">            loss_coefs (`LossCoefs`): loss coefficients</span>
+</span><span id="L-704"><a href="#L-704"><span class="linenos">704</span></a><span class="sd">            sensitivity_selection (`float`): sensivity coef $c&#39;_1$</span>
+</span><span id="L-705"><a href="#L-705"><span class="linenos">705</span></a><span class="sd">            sensitivity_precision (`float`): sensitivity coef $c&#39;_2$</span>
+</span><span id="L-706"><a href="#L-706"><span class="linenos">706</span></a><span class="sd">            optim_lr (`float`): learning rate</span>
+</span><span id="L-707"><a href="#L-707"><span class="linenos">707</span></a><span class="sd">            optim_weight_decay (`float`): weight decay</span>
+</span><span id="L-708"><a href="#L-708"><span class="linenos">708</span></a><span class="sd">            scheduler_args (`SchedulerArgs | None`): optimization scheduler&#39;s arguments</span>
+</span><span id="L-709"><a href="#L-709"><span class="linenos">709</span></a><span class="sd">            learn_logit_scale (`bool`): whether to learn the contrastive learning</span>
+</span><span id="L-710"><a href="#L-710"><span class="linenos">710</span></a><span class="sd">                contrastive loss when using the default contrastive loss.</span>
+</span><span id="L-711"><a href="#L-711"><span class="linenos">711</span></a><span class="sd">            use_normalized_constrastive (`bool`): whether to use the normalized cont</span>
+</span><span id="L-712"><a href="#L-712"><span class="linenos">712</span></a><span class="sd">                loss by the precision coefs</span>
+</span><span id="L-713"><a href="#L-713"><span class="linenos">713</span></a><span class="sd">            contrastive_loss (`ContrastiveLossType | None`): a contrastive loss</span>
+</span><span id="L-714"><a href="#L-714"><span class="linenos">714</span></a><span class="sd">                function used for alignment. `learn_logit_scale` will not affect custom</span>
+</span><span id="L-715"><a href="#L-715"><span class="linenos">715</span></a><span class="sd">                contrastive losses.</span>
+</span><span id="L-716"><a href="#L-716"><span class="linenos">716</span></a><span class="sd">            precision_softmax_temp (`float`): temperature to use in softmax of</span>
+</span><span id="L-717"><a href="#L-717"><span class="linenos">717</span></a><span class="sd">                precision</span>
+</span><span id="L-718"><a href="#L-718"><span class="linenos">718</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="L-719"><a href="#L-719"><span class="linenos">719</span></a>        <span class="n">domain_mods</span> <span class="o">=</span> <span class="n">freeze_domain_modules</span><span class="p">(</span><span class="n">domain_mods</span><span class="p">)</span>
+</span><span id="L-720"><a href="#L-720"><span class="linenos">720</span></a>
+</span><span id="L-721"><a href="#L-721"><span class="linenos">721</span></a>        <span class="n">gw_mod</span> <span class="o">=</span> <span class="n">GWModuleBayesian</span><span class="p">(</span>
+</span><span id="L-722"><a href="#L-722"><span class="linenos">722</span></a>            <span class="n">domain_mods</span><span class="p">,</span>
+</span><span id="L-723"><a href="#L-723"><span class="linenos">723</span></a>            <span class="n">workspace_dim</span><span class="p">,</span>
+</span><span id="L-724"><a href="#L-724"><span class="linenos">724</span></a>            <span class="n">gw_encoders</span><span class="p">,</span>
+</span><span id="L-725"><a href="#L-725"><span class="linenos">725</span></a>            <span class="n">gw_decoders</span><span class="p">,</span>
+</span><span id="L-726"><a href="#L-726"><span class="linenos">726</span></a>            <span class="n">sensitivity_selection</span><span class="p">,</span>
+</span><span id="L-727"><a href="#L-727"><span class="linenos">727</span></a>            <span class="n">sensitivity_precision</span><span class="p">,</span>
+</span><span id="L-728"><a href="#L-728"><span class="linenos">728</span></a>            <span class="n">precision_softmax_temp</span><span class="p">,</span>
+</span><span id="L-729"><a href="#L-729"><span class="linenos">729</span></a>        <span class="p">)</span>
+</span><span id="L-730"><a href="#L-730"><span class="linenos">730</span></a>
+</span><span id="L-731"><a href="#L-731"><span class="linenos">731</span></a>        <span class="n">selection_mod</span> <span class="o">=</span> <span class="n">FixedSharedSelection</span><span class="p">()</span>
+</span><span id="L-732"><a href="#L-732"><span class="linenos">732</span></a>
+</span><span id="L-733"><a href="#L-733"><span class="linenos">733</span></a>        <span class="n">contrastive_loss</span> <span class="o">=</span> <span class="n">ContrastiveLoss</span><span class="p">(</span>
+</span><span id="L-734"><a href="#L-734"><span class="linenos">734</span></a>            <span class="n">torch</span><span class="o">.</span><span class="n">tensor</span><span class="p">([</span><span class="mi">1</span><span class="p">])</span><span class="o">.</span><span class="n">log</span><span class="p">(),</span> <span class="s2">&quot;mean&quot;</span><span class="p">,</span> <span class="n">learn_logit_scale</span>
+</span><span id="L-735"><a href="#L-735"><span class="linenos">735</span></a>        <span class="p">)</span>
+</span><span id="L-736"><a href="#L-736"><span class="linenos">736</span></a>
+</span><span id="L-737"><a href="#L-737"><span class="linenos">737</span></a>        <span class="n">loss_mod</span> <span class="o">=</span> <span class="n">GWLossesBayesian</span><span class="p">(</span>
+</span><span id="L-738"><a href="#L-738"><span class="linenos">738</span></a>            <span class="n">gw_mod</span><span class="p">,</span>
+</span><span id="L-739"><a href="#L-739"><span class="linenos">739</span></a>            <span class="n">selection_mod</span><span class="p">,</span>
+</span><span id="L-740"><a href="#L-740"><span class="linenos">740</span></a>            <span class="n">domain_mods</span><span class="p">,</span>
+</span><span id="L-741"><a href="#L-741"><span class="linenos">741</span></a>            <span class="n">loss_coefs</span><span class="p">,</span>
+</span><span id="L-742"><a href="#L-742"><span class="linenos">742</span></a>            <span class="n">contrastive_loss</span><span class="p">,</span>
+</span><span id="L-743"><a href="#L-743"><span class="linenos">743</span></a>            <span class="n">use_normalized_constrastive</span><span class="p">,</span>
+</span><span id="L-744"><a href="#L-744"><span class="linenos">744</span></a>        <span class="p">)</span>
+</span><span id="L-745"><a href="#L-745"><span class="linenos">745</span></a>
+</span><span id="L-746"><a href="#L-746"><span class="linenos">746</span></a>        <span class="nb">super</span><span class="p">()</span><span class="o">.</span><span class="fm">__init__</span><span class="p">(</span>
+</span><span id="L-747"><a href="#L-747"><span class="linenos">747</span></a>            <span class="n">gw_mod</span><span class="p">,</span>
+</span><span id="L-748"><a href="#L-748"><span class="linenos">748</span></a>            <span class="n">selection_mod</span><span class="p">,</span>
+</span><span id="L-749"><a href="#L-749"><span class="linenos">749</span></a>            <span class="n">loss_mod</span><span class="p">,</span>
+</span><span id="L-750"><a href="#L-750"><span class="linenos">750</span></a>            <span class="n">optim_lr</span><span class="p">,</span>
+</span><span id="L-751"><a href="#L-751"><span class="linenos">751</span></a>            <span class="n">optim_weight_decay</span><span class="p">,</span>
+</span><span id="L-752"><a href="#L-752"><span class="linenos">752</span></a>            <span class="n">scheduler_args</span><span class="p">,</span>
+</span><span id="L-753"><a href="#L-753"><span class="linenos">753</span></a>        <span class="p">)</span>
+</span><span id="L-754"><a href="#L-754"><span class="linenos">754</span></a>
+</span><span id="L-755"><a href="#L-755"><span class="linenos">755</span></a>    <span class="k">def</span> <span class="nf">forward</span><span class="p">(</span>  <span class="c1"># type: ignore</span>
+</span><span id="L-756"><a href="#L-756"><span class="linenos">756</span></a>        <span class="bp">self</span><span class="p">,</span>
+</span><span id="L-757"><a href="#L-757"><span class="linenos">757</span></a>        <span class="n">latent_domains</span><span class="p">:</span> <span class="n">LatentsDomainGroupsT</span><span class="p">,</span>
+</span><span id="L-758"><a href="#L-758"><span class="linenos">758</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="n">GWPredictions</span><span class="p">:</span>
+</span><span id="L-759"><a href="#L-759"><span class="linenos">759</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="L-760"><a href="#L-760"><span class="linenos">760</span></a><span class="sd">        Computes demi-cycles, cycles, and translations.</span>
+</span><span id="L-761"><a href="#L-761"><span class="linenos">761</span></a>
+</span><span id="L-762"><a href="#L-762"><span class="linenos">762</span></a><span class="sd">        Args:</span>
+</span><span id="L-763"><a href="#L-763"><span class="linenos">763</span></a><span class="sd">            latent_domains (`LatentsT`): Groups of domains for the computation.</span>
+</span><span id="L-764"><a href="#L-764"><span class="linenos">764</span></a>
+</span><span id="L-765"><a href="#L-765"><span class="linenos">765</span></a><span class="sd">        Returns:</span>
+</span><span id="L-766"><a href="#L-766"><span class="linenos">766</span></a><span class="sd">            `GWPredictions`: the predictions on the batch.</span>
+</span><span id="L-767"><a href="#L-767"><span class="linenos">767</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="L-768"><a href="#L-768"><span class="linenos">768</span></a>        <span class="k">return</span> <span class="n">GWPredictions</span><span class="p">(</span>
+</span><span id="L-769"><a href="#L-769"><span class="linenos">769</span></a>            <span class="n">demi_cycles</span><span class="o">=</span><span class="n">batch_demi_cycles</span><span class="p">(</span>
+</span><span id="L-770"><a href="#L-770"><span class="linenos">770</span></a>                <span class="bp">self</span><span class="o">.</span><span class="n">gw_mod</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">selection_mod</span><span class="p">,</span> <span class="n">latent_domains</span>
+</span><span id="L-771"><a href="#L-771"><span class="linenos">771</span></a>            <span class="p">),</span>
+</span><span id="L-772"><a href="#L-772"><span class="linenos">772</span></a>            <span class="n">cycles</span><span class="o">=</span><span class="n">batch_cycles</span><span class="p">(</span>
+</span><span id="L-773"><a href="#L-773"><span class="linenos">773</span></a>                <span class="bp">self</span><span class="o">.</span><span class="n">gw_mod</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">selection_mod</span><span class="p">,</span> <span class="n">latent_domains</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">domain_mods</span><span class="o">.</span><span class="n">keys</span><span class="p">()</span>
+</span><span id="L-774"><a href="#L-774"><span class="linenos">774</span></a>            <span class="p">),</span>
+</span><span id="L-775"><a href="#L-775"><span class="linenos">775</span></a>            <span class="n">translations</span><span class="o">=</span><span class="n">batch_translations</span><span class="p">(</span>
+</span><span id="L-776"><a href="#L-776"><span class="linenos">776</span></a>                <span class="bp">self</span><span class="o">.</span><span class="n">gw_mod</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">selection_mod</span><span class="p">,</span> <span class="n">latent_domains</span>
+</span><span id="L-777"><a href="#L-777"><span class="linenos">777</span></a>            <span class="p">),</span>
+</span><span id="L-778"><a href="#L-778"><span class="linenos">778</span></a>            <span class="o">**</span><span class="nb">super</span><span class="p">()</span><span class="o">.</span><span class="n">forward</span><span class="p">(</span><span class="n">latent_domains</span><span class="p">),</span>
+</span><span id="L-779"><a href="#L-779"><span class="linenos">779</span></a>        <span class="p">)</span>
+</span><span id="L-780"><a href="#L-780"><span class="linenos">780</span></a>
+</span><span id="L-781"><a href="#L-781"><span class="linenos">781</span></a>
+</span><span id="L-782"><a href="#L-782"><span class="linenos">782</span></a><span class="k">def</span> <span class="nf">pretrained_global_workspace</span><span class="p">(</span>
+</span><span id="L-783"><a href="#L-783"><span class="linenos">783</span></a>    <span class="n">checkpoint_path</span><span class="p">:</span> <span class="nb">str</span> <span class="o">|</span> <span class="n">Path</span><span class="p">,</span>
+</span><span id="L-784"><a href="#L-784"><span class="linenos">784</span></a>    <span class="n">domain_mods</span><span class="p">:</span> <span class="n">Mapping</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">DomainModule</span><span class="p">],</span>
+</span><span id="L-785"><a href="#L-785"><span class="linenos">785</span></a>    <span class="n">gw_encoders</span><span class="p">:</span> <span class="n">Mapping</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">Module</span><span class="p">],</span>
+</span><span id="L-786"><a href="#L-786"><span class="linenos">786</span></a>    <span class="n">gw_decoders</span><span class="p">:</span> <span class="n">Mapping</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">Module</span><span class="p">],</span>
+</span><span id="L-787"><a href="#L-787"><span class="linenos">787</span></a>    <span class="n">workspace_dim</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span>
+</span><span id="L-788"><a href="#L-788"><span class="linenos">788</span></a>    <span class="n">loss_coefs</span><span class="p">:</span> <span class="n">LossCoefs</span><span class="p">,</span>
+</span><span id="L-789"><a href="#L-789"><span class="linenos">789</span></a>    <span class="n">contrastive_fn</span><span class="p">:</span> <span class="n">ContrastiveLossType</span><span class="p">,</span>
+</span><span id="L-790"><a href="#L-790"><span class="linenos">790</span></a>    <span class="o">**</span><span class="n">kwargs</span><span class="p">,</span>
+</span><span id="L-791"><a href="#L-791"><span class="linenos">791</span></a><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">GlobalWorkspace2Domains</span><span class="p">:</span>
+</span><span id="L-792"><a href="#L-792"><span class="linenos">792</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="L-793"><a href="#L-793"><span class="linenos">793</span></a><span class="sd">    Load a `GlobalWorkspace` flavor of `GlobalWorkspaceBase` from a checkpoint.</span>
+</span><span id="L-794"><a href="#L-794"><span class="linenos">794</span></a>
+</span><span id="L-795"><a href="#L-795"><span class="linenos">795</span></a><span class="sd">    Args:</span>
+</span><span id="L-796"><a href="#L-796"><span class="linenos">796</span></a><span class="sd">        checkpoint_path (`str | Path`): path to checkpoint</span>
+</span><span id="L-797"><a href="#L-797"><span class="linenos">797</span></a><span class="sd">        domain_mods (`Mapping[str, DomainModule]`): mapping of the domains</span>
+</span><span id="L-798"><a href="#L-798"><span class="linenos">798</span></a><span class="sd">            connected to the GW. Keys are domain names, values are the</span>
+</span><span id="L-799"><a href="#L-799"><span class="linenos">799</span></a><span class="sd">            `DomainModule`.</span>
+</span><span id="L-800"><a href="#L-800"><span class="linenos">800</span></a><span class="sd">        gw_encoders (`Mapping[str, torch.nn.Module]`): mapping for each domain</span>
+</span><span id="L-801"><a href="#L-801"><span class="linenos">801</span></a><span class="sd">            name to a `torch.nn.Module` class which role is to encode a</span>
+</span><span id="L-802"><a href="#L-802"><span class="linenos">802</span></a><span class="sd">            unimodal latent representations into a GW representation (pre fusion).</span>
+</span><span id="L-803"><a href="#L-803"><span class="linenos">803</span></a><span class="sd">        gw_decoders (`Mapping[str, torch.nn.Module]`): mapping for each domain</span>
+</span><span id="L-804"><a href="#L-804"><span class="linenos">804</span></a><span class="sd">            name to a `torch.nn.Module` class which role is to decode a</span>
+</span><span id="L-805"><a href="#L-805"><span class="linenos">805</span></a><span class="sd">            GW representation into a unimodal latent representations.</span>
+</span><span id="L-806"><a href="#L-806"><span class="linenos">806</span></a><span class="sd">        workspace_dim (`int`): dimension of the GW.</span>
+</span><span id="L-807"><a href="#L-807"><span class="linenos">807</span></a><span class="sd">        loss_coefs (`LossCoefs`): loss coefficients</span>
+</span><span id="L-808"><a href="#L-808"><span class="linenos">808</span></a><span class="sd">        contrastive_loss (`ContrastiveLossType`): a contrastive loss</span>
+</span><span id="L-809"><a href="#L-809"><span class="linenos">809</span></a><span class="sd">            function used for alignment. `learn_logit_scale` will not affect custom</span>
+</span><span id="L-810"><a href="#L-810"><span class="linenos">810</span></a><span class="sd">            contrastive losses.</span>
+</span><span id="L-811"><a href="#L-811"><span class="linenos">811</span></a><span class="sd">        **kwargs: additional arguments to pass to</span>
+</span><span id="L-812"><a href="#L-812"><span class="linenos">812</span></a><span class="sd">            `GlobalWorkspace.load_from_checkpoint`.</span>
+</span><span id="L-813"><a href="#L-813"><span class="linenos">813</span></a>
+</span><span id="L-814"><a href="#L-814"><span class="linenos">814</span></a><span class="sd">    Returns:</span>
+</span><span id="L-815"><a href="#L-815"><span class="linenos">815</span></a><span class="sd">        `GlobalWorkspace`: the pretrained `GlobalWorkspace`.</span>
+</span><span id="L-816"><a href="#L-816"><span class="linenos">816</span></a>
+</span><span id="L-817"><a href="#L-817"><span class="linenos">817</span></a><span class="sd">    Raises:</span>
+</span><span id="L-818"><a href="#L-818"><span class="linenos">818</span></a><span class="sd">        `TypeError`: if loaded type is not `GlobalWorkspace`.</span>
+</span><span id="L-819"><a href="#L-819"><span class="linenos">819</span></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="L-820"><a href="#L-820"><span class="linenos">820</span></a>    <span class="n">domain_mods</span> <span class="o">=</span> <span class="n">freeze_domain_modules</span><span class="p">(</span><span class="n">domain_mods</span><span class="p">)</span>
+</span><span id="L-821"><a href="#L-821"><span class="linenos">821</span></a>    <span class="n">gw_mod</span> <span class="o">=</span> <span class="n">GWModule</span><span class="p">(</span><span class="n">domain_mods</span><span class="p">,</span> <span class="n">workspace_dim</span><span class="p">,</span> <span class="n">gw_encoders</span><span class="p">,</span> <span class="n">gw_decoders</span><span class="p">)</span>
+</span><span id="L-822"><a href="#L-822"><span class="linenos">822</span></a>    <span class="n">selection_mod</span> <span class="o">=</span> <span class="n">SingleDomainSelection</span><span class="p">()</span>
+</span><span id="L-823"><a href="#L-823"><span class="linenos">823</span></a>    <span class="n">loss_mod</span> <span class="o">=</span> <span class="n">GWLosses2Domains</span><span class="p">(</span>
+</span><span id="L-824"><a href="#L-824"><span class="linenos">824</span></a>        <span class="n">gw_mod</span><span class="p">,</span> <span class="n">selection_mod</span><span class="p">,</span> <span class="n">domain_mods</span><span class="p">,</span> <span class="n">loss_coefs</span><span class="p">,</span> <span class="n">contrastive_fn</span>
+</span><span id="L-825"><a href="#L-825"><span class="linenos">825</span></a>    <span class="p">)</span>
+</span><span id="L-826"><a href="#L-826"><span class="linenos">826</span></a>
+</span><span id="L-827"><a href="#L-827"><span class="linenos">827</span></a>    <span class="n">gw</span> <span class="o">=</span> <span class="n">GlobalWorkspace2Domains</span><span class="o">.</span><span class="n">load_from_checkpoint</span><span class="p">(</span>
+</span><span id="L-828"><a href="#L-828"><span class="linenos">828</span></a>        <span class="n">checkpoint_path</span><span class="p">,</span>
+</span><span id="L-829"><a href="#L-829"><span class="linenos">829</span></a>        <span class="n">gw_mod</span><span class="o">=</span><span class="n">gw_mod</span><span class="p">,</span>
+</span><span id="L-830"><a href="#L-830"><span class="linenos">830</span></a>        <span class="n">selection_mid</span><span class="o">=</span><span class="n">selection_mod</span><span class="p">,</span>
+</span><span id="L-831"><a href="#L-831"><span class="linenos">831</span></a>        <span class="n">loss_coefs</span><span class="o">=</span><span class="n">loss_coefs</span><span class="p">,</span>
+</span><span id="L-832"><a href="#L-832"><span class="linenos">832</span></a>        <span class="n">loss_mod</span><span class="o">=</span><span class="n">loss_mod</span><span class="p">,</span>
+</span><span id="L-833"><a href="#L-833"><span class="linenos">833</span></a>        <span class="o">**</span><span class="n">kwargs</span><span class="p">,</span>
+</span><span id="L-834"><a href="#L-834"><span class="linenos">834</span></a>    <span class="p">)</span>
+</span><span id="L-835"><a href="#L-835"><span class="linenos">835</span></a>    <span class="k">if</span> <span class="ow">not</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">gw</span><span class="p">,</span> <span class="n">GlobalWorkspace2Domains</span><span class="p">):</span>
+</span><span id="L-836"><a href="#L-836"><span class="linenos">836</span></a>        <span class="k">raise</span> <span class="ne">TypeError</span><span class="p">(</span><span class="s2">&quot;model should be of type GlobalWorkspace&quot;</span><span class="p">)</span>
+</span><span id="L-837"><a href="#L-837"><span class="linenos">837</span></a>    <span class="k">return</span> <span class="n">gw</span>
+</span></pre></div>
+
+
+            </section>
+                <section id="SchedulerArgs">
+                            <input id="SchedulerArgs-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
+<div class="attr class">
+            
+    <span class="def">class</span>
+    <span class="name">SchedulerArgs</span><wbr>(<span class="base">typing.TypedDict</span>):
+
+                <label class="view-source-button" for="SchedulerArgs-view-source"><span>View Source</span></label>
+
+    </div>
+    <a class="headerlink" href="#SchedulerArgs"></a>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="SchedulerArgs-45"><a href="#SchedulerArgs-45"><span class="linenos">45</span></a><span class="k">class</span> <span class="nc">SchedulerArgs</span><span class="p">(</span><span class="n">TypedDict</span><span class="p">,</span> <span class="n">total</span><span class="o">=</span><span class="kc">False</span><span class="p">):</span>
+</span><span id="SchedulerArgs-46"><a href="#SchedulerArgs-46"><span class="linenos">46</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;TypedDict of arguments passed to the OneCycle scheduler&quot;&quot;&quot;</span>
+</span><span id="SchedulerArgs-47"><a href="#SchedulerArgs-47"><span class="linenos">47</span></a>
+</span><span id="SchedulerArgs-48"><a href="#SchedulerArgs-48"><span class="linenos">48</span></a>    <span class="n">max_lr</span><span class="p">:</span> <span class="nb">float</span>
+</span><span id="SchedulerArgs-49"><a href="#SchedulerArgs-49"><span class="linenos">49</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Maximum learning rate&quot;&quot;&quot;</span>
+</span><span id="SchedulerArgs-50"><a href="#SchedulerArgs-50"><span class="linenos">50</span></a>
+</span><span id="SchedulerArgs-51"><a href="#SchedulerArgs-51"><span class="linenos">51</span></a>    <span class="n">total_steps</span><span class="p">:</span> <span class="nb">int</span>
+</span><span id="SchedulerArgs-52"><a href="#SchedulerArgs-52"><span class="linenos">52</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Total number of steps&quot;&quot;&quot;</span>
+</span></pre></div>
+
+
+            <div class="docstring"><p>TypedDict of arguments passed to the OneCycle scheduler</p>
+</div>
+
+
+                            <div id="SchedulerArgs.max_lr" class="classattr">
+                                <div class="attr variable">
+            <span class="name">max_lr</span><span class="annotation">: float</span>
+
+        
+    </div>
+    <a class="headerlink" href="#SchedulerArgs.max_lr"></a>
+    
+            <div class="docstring"><p>Maximum learning rate</p>
+</div>
+
+
+                            </div>
+                            <div id="SchedulerArgs.total_steps" class="classattr">
+                                <div class="attr variable">
+            <span class="name">total_steps</span><span class="annotation">: int</span>
+
+        
+    </div>
+    <a class="headerlink" href="#SchedulerArgs.total_steps"></a>
+    
+            <div class="docstring"><p>Total number of steps</p>
+</div>
+
+
+                            </div>
+                </section>
+                <section id="GWPredictionsBase">
+                            <input id="GWPredictionsBase-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
+<div class="attr class">
+            
+    <span class="def">class</span>
+    <span class="name">GWPredictionsBase</span><wbr>(<span class="base">typing.TypedDict</span>):
+
+                <label class="view-source-button" for="GWPredictionsBase-view-source"><span>View Source</span></label>
+
+    </div>
+    <a class="headerlink" href="#GWPredictionsBase"></a>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="GWPredictionsBase-55"><a href="#GWPredictionsBase-55"><span class="linenos">55</span></a><span class="k">class</span> <span class="nc">GWPredictionsBase</span><span class="p">(</span><span class="n">TypedDict</span><span class="p">):</span>
+</span><span id="GWPredictionsBase-56"><a href="#GWPredictionsBase-56"><span class="linenos">56</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;TypedDict of the output given when calling `GlobalWorkspaceBase.predict`&quot;&quot;&quot;</span>
+</span><span id="GWPredictionsBase-57"><a href="#GWPredictionsBase-57"><span class="linenos">57</span></a>
+</span><span id="GWPredictionsBase-58"><a href="#GWPredictionsBase-58"><span class="linenos">58</span></a>    <span class="n">states</span><span class="p">:</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]</span>
+</span><span id="GWPredictionsBase-59"><a href="#GWPredictionsBase-59"><span class="linenos">59</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="GWPredictionsBase-60"><a href="#GWPredictionsBase-60"><span class="linenos">60</span></a><span class="sd">    GW state representation from domain groups with only one domain.</span>
+</span><span id="GWPredictionsBase-61"><a href="#GWPredictionsBase-61"><span class="linenos">61</span></a><span class="sd">    The key represent the domain&#39;s name.</span>
+</span><span id="GWPredictionsBase-62"><a href="#GWPredictionsBase-62"><span class="linenos">62</span></a><span class="sd">    &quot;&quot;&quot;</span>
+</span></pre></div>
+
+
+            <div class="docstring"><p>TypedDict of the output given when calling <code>GlobalWorkspaceBase.predict</code></p>
+</div>
+
+
+                            <div id="GWPredictionsBase.states" class="classattr">
+                                <div class="attr variable">
+            <span class="name">states</span><span class="annotation">: dict[str, torch.Tensor]</span>
+
+        
+    </div>
+    <a class="headerlink" href="#GWPredictionsBase.states"></a>
+    
+            <div class="docstring"><p>GW state representation from domain groups with only one domain.
+The key represent the domain's name.</p>
+</div>
+
+
+                            </div>
+                </section>
+                <section id="GlobalWorkspaceBase">
+                            <input id="GlobalWorkspaceBase-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
+<div class="attr class">
+            
+    <span class="def">class</span>
+    <span class="name">GlobalWorkspaceBase</span><wbr>(<span class="base">typing.Generic[~_T_gw_mod, ~_T_selection_mod, ~_T_loss_mod]</span>, <span class="base">lightning.pytorch.core.module.LightningModule</span>):
+
+                <label class="view-source-button" for="GlobalWorkspaceBase-view-source"><span>View Source</span></label>
+
+    </div>
+    <a class="headerlink" href="#GlobalWorkspaceBase"></a>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="GlobalWorkspaceBase-70"><a href="#GlobalWorkspaceBase-70"><span class="linenos"> 70</span></a><span class="k">class</span> <span class="nc">GlobalWorkspaceBase</span><span class="p">(</span>
+</span><span id="GlobalWorkspaceBase-71"><a href="#GlobalWorkspaceBase-71"><span class="linenos"> 71</span></a>    <span class="n">Generic</span><span class="p">[</span><span class="n">_T_gw_mod</span><span class="p">,</span> <span class="n">_T_selection_mod</span><span class="p">,</span> <span class="n">_T_loss_mod</span><span class="p">],</span> <span class="n">LightningModule</span>
+</span><span id="GlobalWorkspaceBase-72"><a href="#GlobalWorkspaceBase-72"><span class="linenos"> 72</span></a><span class="p">):</span>
+</span><span id="GlobalWorkspaceBase-73"><a href="#GlobalWorkspaceBase-73"><span class="linenos"> 73</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="GlobalWorkspaceBase-74"><a href="#GlobalWorkspaceBase-74"><span class="linenos"> 74</span></a><span class="sd">    Global Workspace Lightning Module.</span>
+</span><span id="GlobalWorkspaceBase-75"><a href="#GlobalWorkspaceBase-75"><span class="linenos"> 75</span></a>
+</span><span id="GlobalWorkspaceBase-76"><a href="#GlobalWorkspaceBase-76"><span class="linenos"> 76</span></a><span class="sd">    This is the base class to build the Global Workspace.</span>
+</span><span id="GlobalWorkspaceBase-77"><a href="#GlobalWorkspaceBase-77"><span class="linenos"> 77</span></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="GlobalWorkspaceBase-78"><a href="#GlobalWorkspaceBase-78"><span class="linenos"> 78</span></a>
+</span><span id="GlobalWorkspaceBase-79"><a href="#GlobalWorkspaceBase-79"><span class="linenos"> 79</span></a>    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span>
+</span><span id="GlobalWorkspaceBase-80"><a href="#GlobalWorkspaceBase-80"><span class="linenos"> 80</span></a>        <span class="bp">self</span><span class="p">,</span>
+</span><span id="GlobalWorkspaceBase-81"><a href="#GlobalWorkspaceBase-81"><span class="linenos"> 81</span></a>        <span class="n">gw_mod</span><span class="p">:</span> <span class="n">_T_gw_mod</span><span class="p">,</span>
+</span><span id="GlobalWorkspaceBase-82"><a href="#GlobalWorkspaceBase-82"><span class="linenos"> 82</span></a>        <span class="n">selection_mod</span><span class="p">:</span> <span class="n">_T_selection_mod</span><span class="p">,</span>
+</span><span id="GlobalWorkspaceBase-83"><a href="#GlobalWorkspaceBase-83"><span class="linenos"> 83</span></a>        <span class="n">loss_mod</span><span class="p">:</span> <span class="n">_T_loss_mod</span><span class="p">,</span>
+</span><span id="GlobalWorkspaceBase-84"><a href="#GlobalWorkspaceBase-84"><span class="linenos"> 84</span></a>        <span class="n">optim_lr</span><span class="p">:</span> <span class="nb">float</span> <span class="o">=</span> <span class="mf">1e-3</span><span class="p">,</span>
+</span><span id="GlobalWorkspaceBase-85"><a href="#GlobalWorkspaceBase-85"><span class="linenos"> 85</span></a>        <span class="n">optim_weight_decay</span><span class="p">:</span> <span class="nb">float</span> <span class="o">=</span> <span class="mf">0.0</span><span class="p">,</span>
+</span><span id="GlobalWorkspaceBase-86"><a href="#GlobalWorkspaceBase-86"><span class="linenos"> 86</span></a>        <span class="n">scheduler_args</span><span class="p">:</span> <span class="n">SchedulerArgs</span> <span class="o">|</span> <span class="kc">None</span> <span class="o">=</span> <span class="kc">None</span><span class="p">,</span>
+</span><span id="GlobalWorkspaceBase-87"><a href="#GlobalWorkspaceBase-87"><span class="linenos"> 87</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="GlobalWorkspaceBase-88"><a href="#GlobalWorkspaceBase-88"><span class="linenos"> 88</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="GlobalWorkspaceBase-89"><a href="#GlobalWorkspaceBase-89"><span class="linenos"> 89</span></a><span class="sd">        Initializes a GW</span>
+</span><span id="GlobalWorkspaceBase-90"><a href="#GlobalWorkspaceBase-90"><span class="linenos"> 90</span></a>
+</span><span id="GlobalWorkspaceBase-91"><a href="#GlobalWorkspaceBase-91"><span class="linenos"> 91</span></a><span class="sd">        Args:</span>
+</span><span id="GlobalWorkspaceBase-92"><a href="#GlobalWorkspaceBase-92"><span class="linenos"> 92</span></a><span class="sd">            gw_mod (`GWModuleBase`): the GWModule</span>
+</span><span id="GlobalWorkspaceBase-93"><a href="#GlobalWorkspaceBase-93"><span class="linenos"> 93</span></a><span class="sd">            selection_mod (`SelectionBase`): selection module</span>
+</span><span id="GlobalWorkspaceBase-94"><a href="#GlobalWorkspaceBase-94"><span class="linenos"> 94</span></a><span class="sd">            loss_mod (`GWLossesBase`): module to compute the GW losses.</span>
+</span><span id="GlobalWorkspaceBase-95"><a href="#GlobalWorkspaceBase-95"><span class="linenos"> 95</span></a><span class="sd">            optim_lr (`float`): learning rate</span>
+</span><span id="GlobalWorkspaceBase-96"><a href="#GlobalWorkspaceBase-96"><span class="linenos"> 96</span></a><span class="sd">            optim_weight_decay (`float`): weight decay</span>
+</span><span id="GlobalWorkspaceBase-97"><a href="#GlobalWorkspaceBase-97"><span class="linenos"> 97</span></a><span class="sd">            scheduler_args (`SchedulerArgs`): `SchedulerArgs` instance to define</span>
+</span><span id="GlobalWorkspaceBase-98"><a href="#GlobalWorkspaceBase-98"><span class="linenos"> 98</span></a><span class="sd">                scheduler parameters.</span>
+</span><span id="GlobalWorkspaceBase-99"><a href="#GlobalWorkspaceBase-99"><span class="linenos"> 99</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="GlobalWorkspaceBase-100"><a href="#GlobalWorkspaceBase-100"><span class="linenos">100</span></a>        <span class="nb">super</span><span class="p">()</span><span class="o">.</span><span class="fm">__init__</span><span class="p">()</span>
+</span><span id="GlobalWorkspaceBase-101"><a href="#GlobalWorkspaceBase-101"><span class="linenos">101</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">save_hyperparameters</span><span class="p">(</span>
+</span><span id="GlobalWorkspaceBase-102"><a href="#GlobalWorkspaceBase-102"><span class="linenos">102</span></a>            <span class="n">ignore</span><span class="o">=</span><span class="p">[</span>
+</span><span id="GlobalWorkspaceBase-103"><a href="#GlobalWorkspaceBase-103"><span class="linenos">103</span></a>                <span class="s2">&quot;gw_mod&quot;</span><span class="p">,</span>
+</span><span id="GlobalWorkspaceBase-104"><a href="#GlobalWorkspaceBase-104"><span class="linenos">104</span></a>                <span class="s2">&quot;selection_mod&quot;</span><span class="p">,</span>
+</span><span id="GlobalWorkspaceBase-105"><a href="#GlobalWorkspaceBase-105"><span class="linenos">105</span></a>                <span class="s2">&quot;domain_mods&quot;</span><span class="p">,</span>
+</span><span id="GlobalWorkspaceBase-106"><a href="#GlobalWorkspaceBase-106"><span class="linenos">106</span></a>                <span class="s2">&quot;loss_mod&quot;</span><span class="p">,</span>
+</span><span id="GlobalWorkspaceBase-107"><a href="#GlobalWorkspaceBase-107"><span class="linenos">107</span></a>                <span class="s2">&quot;domain_descriptions&quot;</span><span class="p">,</span>
+</span><span id="GlobalWorkspaceBase-108"><a href="#GlobalWorkspaceBase-108"><span class="linenos">108</span></a>                <span class="s2">&quot;contrastive_loss&quot;</span><span class="p">,</span>
+</span><span id="GlobalWorkspaceBase-109"><a href="#GlobalWorkspaceBase-109"><span class="linenos">109</span></a>                <span class="s2">&quot;cont_loss_bayesian&quot;</span><span class="p">,</span>
+</span><span id="GlobalWorkspaceBase-110"><a href="#GlobalWorkspaceBase-110"><span class="linenos">110</span></a>                <span class="s2">&quot;gw_encoders&quot;</span><span class="p">,</span>
+</span><span id="GlobalWorkspaceBase-111"><a href="#GlobalWorkspaceBase-111"><span class="linenos">111</span></a>                <span class="s2">&quot;gw_decoders&quot;</span><span class="p">,</span>
+</span><span id="GlobalWorkspaceBase-112"><a href="#GlobalWorkspaceBase-112"><span class="linenos">112</span></a>            <span class="p">]</span>
+</span><span id="GlobalWorkspaceBase-113"><a href="#GlobalWorkspaceBase-113"><span class="linenos">113</span></a>        <span class="p">)</span>
+</span><span id="GlobalWorkspaceBase-114"><a href="#GlobalWorkspaceBase-114"><span class="linenos">114</span></a>
+</span><span id="GlobalWorkspaceBase-115"><a href="#GlobalWorkspaceBase-115"><span class="linenos">115</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">gw_mod</span> <span class="o">=</span> <span class="n">gw_mod</span>
+</span><span id="GlobalWorkspaceBase-116"><a href="#GlobalWorkspaceBase-116"><span class="linenos">116</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot; a `GWModuleBase` implementation.&quot;&quot;&quot;</span>
+</span><span id="GlobalWorkspaceBase-117"><a href="#GlobalWorkspaceBase-117"><span class="linenos">117</span></a>
+</span><span id="GlobalWorkspaceBase-118"><a href="#GlobalWorkspaceBase-118"><span class="linenos">118</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">selection_mod</span> <span class="o">=</span> <span class="n">selection_mod</span>
+</span><span id="GlobalWorkspaceBase-119"><a href="#GlobalWorkspaceBase-119"><span class="linenos">119</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;A `SelectionBase` implementation.&quot;&quot;&quot;</span>
+</span><span id="GlobalWorkspaceBase-120"><a href="#GlobalWorkspaceBase-120"><span class="linenos">120</span></a>
+</span><span id="GlobalWorkspaceBase-121"><a href="#GlobalWorkspaceBase-121"><span class="linenos">121</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">loss_mod</span> <span class="o">=</span> <span class="n">loss_mod</span>
+</span><span id="GlobalWorkspaceBase-122"><a href="#GlobalWorkspaceBase-122"><span class="linenos">122</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;The module that computes losses of the GW&quot;&quot;&quot;</span>
+</span><span id="GlobalWorkspaceBase-123"><a href="#GlobalWorkspaceBase-123"><span class="linenos">123</span></a>
+</span><span id="GlobalWorkspaceBase-124"><a href="#GlobalWorkspaceBase-124"><span class="linenos">124</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">optim_lr</span> <span class="o">=</span> <span class="n">optim_lr</span>
+</span><span id="GlobalWorkspaceBase-125"><a href="#GlobalWorkspaceBase-125"><span class="linenos">125</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">optim_weight_decay</span> <span class="o">=</span> <span class="n">optim_weight_decay</span>
+</span><span id="GlobalWorkspaceBase-126"><a href="#GlobalWorkspaceBase-126"><span class="linenos">126</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">scheduler_args</span> <span class="o">=</span> <span class="n">SchedulerArgs</span><span class="p">(</span><span class="n">max_lr</span><span class="o">=</span><span class="n">optim_lr</span><span class="p">,</span> <span class="n">total_steps</span><span class="o">=</span><span class="mi">1</span><span class="p">)</span>
+</span><span id="GlobalWorkspaceBase-127"><a href="#GlobalWorkspaceBase-127"><span class="linenos">127</span></a>        <span class="k">if</span> <span class="n">scheduler_args</span> <span class="ow">is</span> <span class="ow">not</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="GlobalWorkspaceBase-128"><a href="#GlobalWorkspaceBase-128"><span class="linenos">128</span></a>            <span class="bp">self</span><span class="o">.</span><span class="n">scheduler_args</span><span class="o">.</span><span class="n">update</span><span class="p">(</span><span class="n">scheduler_args</span><span class="p">)</span>
+</span><span id="GlobalWorkspaceBase-129"><a href="#GlobalWorkspaceBase-129"><span class="linenos">129</span></a>
+</span><span id="GlobalWorkspaceBase-130"><a href="#GlobalWorkspaceBase-130"><span class="linenos">130</span></a>    <span class="nd">@property</span>
+</span><span id="GlobalWorkspaceBase-131"><a href="#GlobalWorkspaceBase-131"><span class="linenos">131</span></a>    <span class="k">def</span> <span class="nf">domain_mods</span><span class="p">(</span><span class="bp">self</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">Mapping</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">DomainModule</span><span class="p">]:</span>
+</span><span id="GlobalWorkspaceBase-132"><a href="#GlobalWorkspaceBase-132"><span class="linenos">132</span></a>        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">gw_mod</span><span class="o">.</span><span class="n">domain_mods</span>
+</span><span id="GlobalWorkspaceBase-133"><a href="#GlobalWorkspaceBase-133"><span class="linenos">133</span></a>
+</span><span id="GlobalWorkspaceBase-134"><a href="#GlobalWorkspaceBase-134"><span class="linenos">134</span></a>    <span class="nd">@property</span>
+</span><span id="GlobalWorkspaceBase-135"><a href="#GlobalWorkspaceBase-135"><span class="linenos">135</span></a>    <span class="k">def</span> <span class="nf">workspace_dim</span><span class="p">(</span><span class="bp">self</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">int</span><span class="p">:</span>
+</span><span id="GlobalWorkspaceBase-136"><a href="#GlobalWorkspaceBase-136"><span class="linenos">136</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;Dimension of the GW.&quot;&quot;&quot;</span>
+</span><span id="GlobalWorkspaceBase-137"><a href="#GlobalWorkspaceBase-137"><span class="linenos">137</span></a>        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">gw_mod</span><span class="o">.</span><span class="n">workspace_dim</span>
+</span><span id="GlobalWorkspaceBase-138"><a href="#GlobalWorkspaceBase-138"><span class="linenos">138</span></a>
+</span><span id="GlobalWorkspaceBase-139"><a href="#GlobalWorkspaceBase-139"><span class="linenos">139</span></a>    <span class="k">def</span> <span class="nf">encode_and_fuse</span><span class="p">(</span>
+</span><span id="GlobalWorkspaceBase-140"><a href="#GlobalWorkspaceBase-140"><span class="linenos">140</span></a>        <span class="bp">self</span><span class="p">,</span> <span class="n">x</span><span class="p">:</span> <span class="n">LatentsDomainGroupsT</span><span class="p">,</span> <span class="n">selection_module</span><span class="p">:</span> <span class="n">SelectionBase</span>
+</span><span id="GlobalWorkspaceBase-141"><a href="#GlobalWorkspaceBase-141"><span class="linenos">141</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">frozenset</span><span class="p">[</span><span class="nb">str</span><span class="p">],</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]:</span>
+</span><span id="GlobalWorkspaceBase-142"><a href="#GlobalWorkspaceBase-142"><span class="linenos">142</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="GlobalWorkspaceBase-143"><a href="#GlobalWorkspaceBase-143"><span class="linenos">143</span></a><span class="sd">        Encode a group of latent representations into the GW representation.</span>
+</span><span id="GlobalWorkspaceBase-144"><a href="#GlobalWorkspaceBase-144"><span class="linenos">144</span></a>
+</span><span id="GlobalWorkspaceBase-145"><a href="#GlobalWorkspaceBase-145"><span class="linenos">145</span></a><span class="sd">        Args:</span>
+</span><span id="GlobalWorkspaceBase-146"><a href="#GlobalWorkspaceBase-146"><span class="linenos">146</span></a><span class="sd">            x (`LatentsDomainGroupsT`): the input domain representations.</span>
+</span><span id="GlobalWorkspaceBase-147"><a href="#GlobalWorkspaceBase-147"><span class="linenos">147</span></a><span class="sd">            selection_scores (`Mapping[str, torch.Tensor]`):</span>
+</span><span id="GlobalWorkspaceBase-148"><a href="#GlobalWorkspaceBase-148"><span class="linenos">148</span></a>
+</span><span id="GlobalWorkspaceBase-149"><a href="#GlobalWorkspaceBase-149"><span class="linenos">149</span></a><span class="sd">        Returns:</span>
+</span><span id="GlobalWorkspaceBase-150"><a href="#GlobalWorkspaceBase-150"><span class="linenos">150</span></a><span class="sd">            `dict[frozenset[str], torch.Tensor]`: the GW representations.</span>
+</span><span id="GlobalWorkspaceBase-151"><a href="#GlobalWorkspaceBase-151"><span class="linenos">151</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="GlobalWorkspaceBase-152"><a href="#GlobalWorkspaceBase-152"><span class="linenos">152</span></a>        <span class="k">return</span> <span class="p">{</span>
+</span><span id="GlobalWorkspaceBase-153"><a href="#GlobalWorkspaceBase-153"><span class="linenos">153</span></a>            <span class="n">domains</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">gw_mod</span><span class="o">.</span><span class="n">encode_and_fuse</span><span class="p">(</span><span class="n">latents</span><span class="p">,</span> <span class="n">selection_module</span><span class="p">)</span>
+</span><span id="GlobalWorkspaceBase-154"><a href="#GlobalWorkspaceBase-154"><span class="linenos">154</span></a>            <span class="k">for</span> <span class="n">domains</span><span class="p">,</span> <span class="n">latents</span> <span class="ow">in</span> <span class="n">x</span><span class="o">.</span><span class="n">items</span><span class="p">()</span>
+</span><span id="GlobalWorkspaceBase-155"><a href="#GlobalWorkspaceBase-155"><span class="linenos">155</span></a>        <span class="p">}</span>
+</span><span id="GlobalWorkspaceBase-156"><a href="#GlobalWorkspaceBase-156"><span class="linenos">156</span></a>
+</span><span id="GlobalWorkspaceBase-157"><a href="#GlobalWorkspaceBase-157"><span class="linenos">157</span></a>    <span class="k">def</span> <span class="nf">encode</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">x</span><span class="p">:</span> <span class="n">LatentsDomainGroupsT</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">LatentsDomainGroupsDT</span><span class="p">:</span>
+</span><span id="GlobalWorkspaceBase-158"><a href="#GlobalWorkspaceBase-158"><span class="linenos">158</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="GlobalWorkspaceBase-159"><a href="#GlobalWorkspaceBase-159"><span class="linenos">159</span></a><span class="sd">        Encode a group of latent representations into the pre-fusion GW representation.</span>
+</span><span id="GlobalWorkspaceBase-160"><a href="#GlobalWorkspaceBase-160"><span class="linenos">160</span></a>
+</span><span id="GlobalWorkspaceBase-161"><a href="#GlobalWorkspaceBase-161"><span class="linenos">161</span></a><span class="sd">        Args:</span>
+</span><span id="GlobalWorkspaceBase-162"><a href="#GlobalWorkspaceBase-162"><span class="linenos">162</span></a><span class="sd">            x (`LatentsDomainGroupsT`): the input domain representations.</span>
+</span><span id="GlobalWorkspaceBase-163"><a href="#GlobalWorkspaceBase-163"><span class="linenos">163</span></a>
+</span><span id="GlobalWorkspaceBase-164"><a href="#GlobalWorkspaceBase-164"><span class="linenos">164</span></a><span class="sd">        Returns:</span>
+</span><span id="GlobalWorkspaceBase-165"><a href="#GlobalWorkspaceBase-165"><span class="linenos">165</span></a><span class="sd">            `LatensDomainGroupsDT`: the GW representations.</span>
+</span><span id="GlobalWorkspaceBase-166"><a href="#GlobalWorkspaceBase-166"><span class="linenos">166</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="GlobalWorkspaceBase-167"><a href="#GlobalWorkspaceBase-167"><span class="linenos">167</span></a>        <span class="k">return</span> <span class="p">{</span><span class="n">domains</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">gw_mod</span><span class="o">.</span><span class="n">encode</span><span class="p">(</span><span class="n">latents</span><span class="p">)</span> <span class="k">for</span> <span class="n">domains</span><span class="p">,</span> <span class="n">latents</span> <span class="ow">in</span> <span class="n">x</span><span class="o">.</span><span class="n">items</span><span class="p">()}</span>
+</span><span id="GlobalWorkspaceBase-168"><a href="#GlobalWorkspaceBase-168"><span class="linenos">168</span></a>
+</span><span id="GlobalWorkspaceBase-169"><a href="#GlobalWorkspaceBase-169"><span class="linenos">169</span></a>    <span class="k">def</span> <span class="nf">fuse</span><span class="p">(</span>
+</span><span id="GlobalWorkspaceBase-170"><a href="#GlobalWorkspaceBase-170"><span class="linenos">170</span></a>        <span class="bp">self</span><span class="p">,</span>
+</span><span id="GlobalWorkspaceBase-171"><a href="#GlobalWorkspaceBase-171"><span class="linenos">171</span></a>        <span class="n">x</span><span class="p">:</span> <span class="n">LatentsDomainGroupsT</span><span class="p">,</span>
+</span><span id="GlobalWorkspaceBase-172"><a href="#GlobalWorkspaceBase-172"><span class="linenos">172</span></a>        <span class="n">selection_scores</span><span class="p">:</span> <span class="n">Mapping</span><span class="p">[</span><span class="nb">frozenset</span><span class="p">[</span><span class="nb">str</span><span class="p">],</span> <span class="n">Mapping</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]],</span>
+</span><span id="GlobalWorkspaceBase-173"><a href="#GlobalWorkspaceBase-173"><span class="linenos">173</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">frozenset</span><span class="p">[</span><span class="nb">str</span><span class="p">],</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]:</span>
+</span><span id="GlobalWorkspaceBase-174"><a href="#GlobalWorkspaceBase-174"><span class="linenos">174</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="GlobalWorkspaceBase-175"><a href="#GlobalWorkspaceBase-175"><span class="linenos">175</span></a><span class="sd">        Fuses a group of latent representations into the GW representation.</span>
+</span><span id="GlobalWorkspaceBase-176"><a href="#GlobalWorkspaceBase-176"><span class="linenos">176</span></a>
+</span><span id="GlobalWorkspaceBase-177"><a href="#GlobalWorkspaceBase-177"><span class="linenos">177</span></a><span class="sd">        Args:</span>
+</span><span id="GlobalWorkspaceBase-178"><a href="#GlobalWorkspaceBase-178"><span class="linenos">178</span></a><span class="sd">            x (`LatentsDomainGroupsT`): the pre-fusion latent representations</span>
+</span><span id="GlobalWorkspaceBase-179"><a href="#GlobalWorkspaceBase-179"><span class="linenos">179</span></a><span class="sd">            selection_scores (`Mapping[frozenset[str], Mapping[str, torch.Tensor]]`):</span>
+</span><span id="GlobalWorkspaceBase-180"><a href="#GlobalWorkspaceBase-180"><span class="linenos">180</span></a><span class="sd">                selection scores for each group</span>
+</span><span id="GlobalWorkspaceBase-181"><a href="#GlobalWorkspaceBase-181"><span class="linenos">181</span></a>
+</span><span id="GlobalWorkspaceBase-182"><a href="#GlobalWorkspaceBase-182"><span class="linenos">182</span></a><span class="sd">        Returns:</span>
+</span><span id="GlobalWorkspaceBase-183"><a href="#GlobalWorkspaceBase-183"><span class="linenos">183</span></a><span class="sd">            `dict[frozenset[str], torch.Tensor]`: GW representation of each group</span>
+</span><span id="GlobalWorkspaceBase-184"><a href="#GlobalWorkspaceBase-184"><span class="linenos">184</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="GlobalWorkspaceBase-185"><a href="#GlobalWorkspaceBase-185"><span class="linenos">185</span></a>        <span class="k">return</span> <span class="p">{</span>
+</span><span id="GlobalWorkspaceBase-186"><a href="#GlobalWorkspaceBase-186"><span class="linenos">186</span></a>            <span class="n">domains</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">gw_mod</span><span class="o">.</span><span class="n">fuse</span><span class="p">(</span><span class="n">latents</span><span class="p">,</span> <span class="n">selection_scores</span><span class="p">[</span><span class="n">domains</span><span class="p">])</span>
+</span><span id="GlobalWorkspaceBase-187"><a href="#GlobalWorkspaceBase-187"><span class="linenos">187</span></a>            <span class="k">for</span> <span class="n">domains</span><span class="p">,</span> <span class="n">latents</span> <span class="ow">in</span> <span class="n">x</span><span class="o">.</span><span class="n">items</span><span class="p">()</span>
+</span><span id="GlobalWorkspaceBase-188"><a href="#GlobalWorkspaceBase-188"><span class="linenos">188</span></a>        <span class="p">}</span>
+</span><span id="GlobalWorkspaceBase-189"><a href="#GlobalWorkspaceBase-189"><span class="linenos">189</span></a>
+</span><span id="GlobalWorkspaceBase-190"><a href="#GlobalWorkspaceBase-190"><span class="linenos">190</span></a>    <span class="k">def</span> <span class="nf">decode</span><span class="p">(</span>
+</span><span id="GlobalWorkspaceBase-191"><a href="#GlobalWorkspaceBase-191"><span class="linenos">191</span></a>        <span class="bp">self</span><span class="p">,</span>
+</span><span id="GlobalWorkspaceBase-192"><a href="#GlobalWorkspaceBase-192"><span class="linenos">192</span></a>        <span class="n">z</span><span class="p">:</span> <span class="n">Mapping</span><span class="p">[</span><span class="nb">frozenset</span><span class="p">[</span><span class="nb">str</span><span class="p">],</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">],</span>
+</span><span id="GlobalWorkspaceBase-193"><a href="#GlobalWorkspaceBase-193"><span class="linenos">193</span></a>        <span class="n">domains</span><span class="p">:</span> <span class="n">Iterable</span><span class="p">[</span><span class="nb">str</span><span class="p">]</span> <span class="o">|</span> <span class="kc">None</span> <span class="o">=</span> <span class="kc">None</span><span class="p">,</span>
+</span><span id="GlobalWorkspaceBase-194"><a href="#GlobalWorkspaceBase-194"><span class="linenos">194</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="n">LatentsDomainGroupsDT</span><span class="p">:</span>
+</span><span id="GlobalWorkspaceBase-195"><a href="#GlobalWorkspaceBase-195"><span class="linenos">195</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="GlobalWorkspaceBase-196"><a href="#GlobalWorkspaceBase-196"><span class="linenos">196</span></a><span class="sd">        Decode the group GW representation into given `domains`.</span>
+</span><span id="GlobalWorkspaceBase-197"><a href="#GlobalWorkspaceBase-197"><span class="linenos">197</span></a>
+</span><span id="GlobalWorkspaceBase-198"><a href="#GlobalWorkspaceBase-198"><span class="linenos">198</span></a><span class="sd">        Args:</span>
+</span><span id="GlobalWorkspaceBase-199"><a href="#GlobalWorkspaceBase-199"><span class="linenos">199</span></a><span class="sd">            z (`torch.Tensor`): the GW representation.</span>
+</span><span id="GlobalWorkspaceBase-200"><a href="#GlobalWorkspaceBase-200"><span class="linenos">200</span></a><span class="sd">            domains (`Iterable[str]`): iterable of domains to decode.</span>
+</span><span id="GlobalWorkspaceBase-201"><a href="#GlobalWorkspaceBase-201"><span class="linenos">201</span></a>
+</span><span id="GlobalWorkspaceBase-202"><a href="#GlobalWorkspaceBase-202"><span class="linenos">202</span></a><span class="sd">        Returns:</span>
+</span><span id="GlobalWorkspaceBase-203"><a href="#GlobalWorkspaceBase-203"><span class="linenos">203</span></a><span class="sd">            `dict[str, torch.Tensor]`: the decoded unimodal representations.</span>
+</span><span id="GlobalWorkspaceBase-204"><a href="#GlobalWorkspaceBase-204"><span class="linenos">204</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="GlobalWorkspaceBase-205"><a href="#GlobalWorkspaceBase-205"><span class="linenos">205</span></a>        <span class="k">return</span> <span class="p">{</span>
+</span><span id="GlobalWorkspaceBase-206"><a href="#GlobalWorkspaceBase-206"><span class="linenos">206</span></a>            <span class="n">domain_names</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">gw_mod</span><span class="o">.</span><span class="n">decode</span><span class="p">(</span><span class="n">gw_rep</span><span class="p">,</span> <span class="n">domains</span><span class="p">)</span>
+</span><span id="GlobalWorkspaceBase-207"><a href="#GlobalWorkspaceBase-207"><span class="linenos">207</span></a>            <span class="k">for</span> <span class="n">domain_names</span><span class="p">,</span> <span class="n">gw_rep</span> <span class="ow">in</span> <span class="n">z</span><span class="o">.</span><span class="n">items</span><span class="p">()</span>
+</span><span id="GlobalWorkspaceBase-208"><a href="#GlobalWorkspaceBase-208"><span class="linenos">208</span></a>        <span class="p">}</span>
+</span><span id="GlobalWorkspaceBase-209"><a href="#GlobalWorkspaceBase-209"><span class="linenos">209</span></a>
+</span><span id="GlobalWorkspaceBase-210"><a href="#GlobalWorkspaceBase-210"><span class="linenos">210</span></a>    <span class="k">def</span> <span class="nf">forward</span><span class="p">(</span>  <span class="c1"># type: ignore</span>
+</span><span id="GlobalWorkspaceBase-211"><a href="#GlobalWorkspaceBase-211"><span class="linenos">211</span></a>        <span class="bp">self</span><span class="p">,</span>
+</span><span id="GlobalWorkspaceBase-212"><a href="#GlobalWorkspaceBase-212"><span class="linenos">212</span></a>        <span class="n">latent_domains</span><span class="p">:</span> <span class="n">LatentsDomainGroupsT</span><span class="p">,</span>
+</span><span id="GlobalWorkspaceBase-213"><a href="#GlobalWorkspaceBase-213"><span class="linenos">213</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="n">GWPredictionsBase</span><span class="p">:</span>
+</span><span id="GlobalWorkspaceBase-214"><a href="#GlobalWorkspaceBase-214"><span class="linenos">214</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="GlobalWorkspaceBase-215"><a href="#GlobalWorkspaceBase-215"><span class="linenos">215</span></a><span class="sd">        Computes demi-cycles, cycles, and translations.</span>
+</span><span id="GlobalWorkspaceBase-216"><a href="#GlobalWorkspaceBase-216"><span class="linenos">216</span></a>
+</span><span id="GlobalWorkspaceBase-217"><a href="#GlobalWorkspaceBase-217"><span class="linenos">217</span></a><span class="sd">        Args:</span>
+</span><span id="GlobalWorkspaceBase-218"><a href="#GlobalWorkspaceBase-218"><span class="linenos">218</span></a><span class="sd">            latent_domains (`LatentsT`): Groups of domains for the computation.</span>
+</span><span id="GlobalWorkspaceBase-219"><a href="#GlobalWorkspaceBase-219"><span class="linenos">219</span></a>
+</span><span id="GlobalWorkspaceBase-220"><a href="#GlobalWorkspaceBase-220"><span class="linenos">220</span></a><span class="sd">        Returns:</span>
+</span><span id="GlobalWorkspaceBase-221"><a href="#GlobalWorkspaceBase-221"><span class="linenos">221</span></a><span class="sd">            `GWPredictionsBase`: the predictions on the batch.</span>
+</span><span id="GlobalWorkspaceBase-222"><a href="#GlobalWorkspaceBase-222"><span class="linenos">222</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="GlobalWorkspaceBase-223"><a href="#GlobalWorkspaceBase-223"><span class="linenos">223</span></a>
+</span><span id="GlobalWorkspaceBase-224"><a href="#GlobalWorkspaceBase-224"><span class="linenos">224</span></a>        <span class="k">return</span> <span class="n">GWPredictionsBase</span><span class="p">(</span><span class="n">states</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">batch_gw_states</span><span class="p">(</span><span class="n">latent_domains</span><span class="p">))</span>
+</span><span id="GlobalWorkspaceBase-225"><a href="#GlobalWorkspaceBase-225"><span class="linenos">225</span></a>
+</span><span id="GlobalWorkspaceBase-226"><a href="#GlobalWorkspaceBase-226"><span class="linenos">226</span></a>    <span class="k">def</span> <span class="nf">batch_gw_states</span><span class="p">(</span>
+</span><span id="GlobalWorkspaceBase-227"><a href="#GlobalWorkspaceBase-227"><span class="linenos">227</span></a>        <span class="bp">self</span><span class="p">,</span> <span class="n">latent_domains</span><span class="p">:</span> <span class="n">LatentsDomainGroupsT</span>
+</span><span id="GlobalWorkspaceBase-228"><a href="#GlobalWorkspaceBase-228"><span class="linenos">228</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]:</span>
+</span><span id="GlobalWorkspaceBase-229"><a href="#GlobalWorkspaceBase-229"><span class="linenos">229</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="GlobalWorkspaceBase-230"><a href="#GlobalWorkspaceBase-230"><span class="linenos">230</span></a><span class="sd">        Comptues GW states of a batch of groups of domains.</span>
+</span><span id="GlobalWorkspaceBase-231"><a href="#GlobalWorkspaceBase-231"><span class="linenos">231</span></a>
+</span><span id="GlobalWorkspaceBase-232"><a href="#GlobalWorkspaceBase-232"><span class="linenos">232</span></a><span class="sd">        Args:</span>
+</span><span id="GlobalWorkspaceBase-233"><a href="#GlobalWorkspaceBase-233"><span class="linenos">233</span></a><span class="sd">            latent_domains (`LatentsT`): the batch of groups of domains</span>
+</span><span id="GlobalWorkspaceBase-234"><a href="#GlobalWorkspaceBase-234"><span class="linenos">234</span></a>
+</span><span id="GlobalWorkspaceBase-235"><a href="#GlobalWorkspaceBase-235"><span class="linenos">235</span></a><span class="sd">        Returns:</span>
+</span><span id="GlobalWorkspaceBase-236"><a href="#GlobalWorkspaceBase-236"><span class="linenos">236</span></a><span class="sd">            `dict[str, torch.Tensor]`: states for each domain.</span>
+</span><span id="GlobalWorkspaceBase-237"><a href="#GlobalWorkspaceBase-237"><span class="linenos">237</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="GlobalWorkspaceBase-238"><a href="#GlobalWorkspaceBase-238"><span class="linenos">238</span></a>        <span class="n">predictions</span><span class="p">:</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]</span> <span class="o">=</span> <span class="p">{}</span>
+</span><span id="GlobalWorkspaceBase-239"><a href="#GlobalWorkspaceBase-239"><span class="linenos">239</span></a>        <span class="k">for</span> <span class="n">domains</span><span class="p">,</span> <span class="n">latents</span> <span class="ow">in</span> <span class="n">latent_domains</span><span class="o">.</span><span class="n">items</span><span class="p">():</span>
+</span><span id="GlobalWorkspaceBase-240"><a href="#GlobalWorkspaceBase-240"><span class="linenos">240</span></a>            <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">domains</span><span class="p">)</span> <span class="o">&gt;</span> <span class="mi">1</span><span class="p">:</span>
+</span><span id="GlobalWorkspaceBase-241"><a href="#GlobalWorkspaceBase-241"><span class="linenos">241</span></a>                <span class="k">continue</span>
+</span><span id="GlobalWorkspaceBase-242"><a href="#GlobalWorkspaceBase-242"><span class="linenos">242</span></a>            <span class="n">domain_name</span> <span class="o">=</span> <span class="nb">list</span><span class="p">(</span><span class="n">domains</span><span class="p">)[</span><span class="mi">0</span><span class="p">]</span>
+</span><span id="GlobalWorkspaceBase-243"><a href="#GlobalWorkspaceBase-243"><span class="linenos">243</span></a>            <span class="n">z</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">gw_mod</span><span class="o">.</span><span class="n">encode_and_fuse</span><span class="p">(</span>
+</span><span id="GlobalWorkspaceBase-244"><a href="#GlobalWorkspaceBase-244"><span class="linenos">244</span></a>                <span class="n">latents</span><span class="p">,</span> <span class="n">selection_module</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">selection_mod</span>
+</span><span id="GlobalWorkspaceBase-245"><a href="#GlobalWorkspaceBase-245"><span class="linenos">245</span></a>            <span class="p">)</span>
+</span><span id="GlobalWorkspaceBase-246"><a href="#GlobalWorkspaceBase-246"><span class="linenos">246</span></a>            <span class="n">predictions</span><span class="p">[</span><span class="n">domain_name</span><span class="p">]</span> <span class="o">=</span> <span class="n">z</span>
+</span><span id="GlobalWorkspaceBase-247"><a href="#GlobalWorkspaceBase-247"><span class="linenos">247</span></a>        <span class="k">return</span> <span class="n">predictions</span>
+</span><span id="GlobalWorkspaceBase-248"><a href="#GlobalWorkspaceBase-248"><span class="linenos">248</span></a>
+</span><span id="GlobalWorkspaceBase-249"><a href="#GlobalWorkspaceBase-249"><span class="linenos">249</span></a>    <span class="k">def</span> <span class="nf">encode_domain</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">domain</span><span class="p">:</span> <span class="n">Any</span><span class="p">,</span> <span class="n">name</span><span class="p">:</span> <span class="nb">str</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">:</span>
+</span><span id="GlobalWorkspaceBase-250"><a href="#GlobalWorkspaceBase-250"><span class="linenos">250</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="GlobalWorkspaceBase-251"><a href="#GlobalWorkspaceBase-251"><span class="linenos">251</span></a><span class="sd">        Encodes a domain from the domain data into the unimodal representation.</span>
+</span><span id="GlobalWorkspaceBase-252"><a href="#GlobalWorkspaceBase-252"><span class="linenos">252</span></a>
+</span><span id="GlobalWorkspaceBase-253"><a href="#GlobalWorkspaceBase-253"><span class="linenos">253</span></a><span class="sd">        This is a convenient proxy for the `DomainModule.encode` method and is</span>
+</span><span id="GlobalWorkspaceBase-254"><a href="#GlobalWorkspaceBase-254"><span class="linenos">254</span></a><span class="sd">        equivalent to:</span>
+</span><span id="GlobalWorkspaceBase-255"><a href="#GlobalWorkspaceBase-255"><span class="linenos">255</span></a><span class="sd">        ```python</span>
+</span><span id="GlobalWorkspaceBase-256"><a href="#GlobalWorkspaceBase-256"><span class="linenos">256</span></a><span class="sd">        self.domain_mods[name].encode(domain)</span>
+</span><span id="GlobalWorkspaceBase-257"><a href="#GlobalWorkspaceBase-257"><span class="linenos">257</span></a><span class="sd">        ```</span>
+</span><span id="GlobalWorkspaceBase-258"><a href="#GlobalWorkspaceBase-258"><span class="linenos">258</span></a>
+</span><span id="GlobalWorkspaceBase-259"><a href="#GlobalWorkspaceBase-259"><span class="linenos">259</span></a><span class="sd">        Args:</span>
+</span><span id="GlobalWorkspaceBase-260"><a href="#GlobalWorkspaceBase-260"><span class="linenos">260</span></a><span class="sd">            domain (`Any`): the domain data</span>
+</span><span id="GlobalWorkspaceBase-261"><a href="#GlobalWorkspaceBase-261"><span class="linenos">261</span></a><span class="sd">            name (`str`): domain name to encode</span>
+</span><span id="GlobalWorkspaceBase-262"><a href="#GlobalWorkspaceBase-262"><span class="linenos">262</span></a>
+</span><span id="GlobalWorkspaceBase-263"><a href="#GlobalWorkspaceBase-263"><span class="linenos">263</span></a><span class="sd">        Returns:</span>
+</span><span id="GlobalWorkspaceBase-264"><a href="#GlobalWorkspaceBase-264"><span class="linenos">264</span></a><span class="sd">            `torch.Tensor`: the domain&#39;s unimodal representation.</span>
+</span><span id="GlobalWorkspaceBase-265"><a href="#GlobalWorkspaceBase-265"><span class="linenos">265</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="GlobalWorkspaceBase-266"><a href="#GlobalWorkspaceBase-266"><span class="linenos">266</span></a>        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">domain_mods</span><span class="p">[</span><span class="n">name</span><span class="p">]</span><span class="o">.</span><span class="n">encode</span><span class="p">(</span><span class="n">domain</span><span class="p">)</span>
+</span><span id="GlobalWorkspaceBase-267"><a href="#GlobalWorkspaceBase-267"><span class="linenos">267</span></a>
+</span><span id="GlobalWorkspaceBase-268"><a href="#GlobalWorkspaceBase-268"><span class="linenos">268</span></a>    <span class="k">def</span> <span class="nf">encode_domains</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">batch</span><span class="p">:</span> <span class="n">RawDomainGroupsT</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">LatentsDomainGroupsDT</span><span class="p">:</span>
+</span><span id="GlobalWorkspaceBase-269"><a href="#GlobalWorkspaceBase-269"><span class="linenos">269</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="GlobalWorkspaceBase-270"><a href="#GlobalWorkspaceBase-270"><span class="linenos">270</span></a><span class="sd">        Encode all domains in the batch.</span>
+</span><span id="GlobalWorkspaceBase-271"><a href="#GlobalWorkspaceBase-271"><span class="linenos">271</span></a>
+</span><span id="GlobalWorkspaceBase-272"><a href="#GlobalWorkspaceBase-272"><span class="linenos">272</span></a><span class="sd">        Args:</span>
+</span><span id="GlobalWorkspaceBase-273"><a href="#GlobalWorkspaceBase-273"><span class="linenos">273</span></a><span class="sd">            batch (`RawDomainGroupsT`): the batch of</span>
+</span><span id="GlobalWorkspaceBase-274"><a href="#GlobalWorkspaceBase-274"><span class="linenos">274</span></a><span class="sd">                domain groups with raw unimodal data to encode into groups of latent</span>
+</span><span id="GlobalWorkspaceBase-275"><a href="#GlobalWorkspaceBase-275"><span class="linenos">275</span></a><span class="sd">                representations.</span>
+</span><span id="GlobalWorkspaceBase-276"><a href="#GlobalWorkspaceBase-276"><span class="linenos">276</span></a>
+</span><span id="GlobalWorkspaceBase-277"><a href="#GlobalWorkspaceBase-277"><span class="linenos">277</span></a><span class="sd">        Returns:</span>
+</span><span id="GlobalWorkspaceBase-278"><a href="#GlobalWorkspaceBase-278"><span class="linenos">278</span></a><span class="sd">            `LatentsDomainGroupsDT`: the domains&#39; unimodal representations.</span>
+</span><span id="GlobalWorkspaceBase-279"><a href="#GlobalWorkspaceBase-279"><span class="linenos">279</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="GlobalWorkspaceBase-280"><a href="#GlobalWorkspaceBase-280"><span class="linenos">280</span></a>        <span class="k">return</span> <span class="p">{</span>
+</span><span id="GlobalWorkspaceBase-281"><a href="#GlobalWorkspaceBase-281"><span class="linenos">281</span></a>            <span class="n">domains</span><span class="p">:</span> <span class="p">{</span>
+</span><span id="GlobalWorkspaceBase-282"><a href="#GlobalWorkspaceBase-282"><span class="linenos">282</span></a>                <span class="n">name</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">domain_mods</span><span class="p">[</span><span class="n">name</span><span class="p">]</span><span class="o">.</span><span class="n">encode</span><span class="p">(</span><span class="n">domain</span><span class="p">)</span>
+</span><span id="GlobalWorkspaceBase-283"><a href="#GlobalWorkspaceBase-283"><span class="linenos">283</span></a>                <span class="k">for</span> <span class="n">name</span><span class="p">,</span> <span class="n">domain</span> <span class="ow">in</span> <span class="n">data</span><span class="o">.</span><span class="n">items</span><span class="p">()</span>
+</span><span id="GlobalWorkspaceBase-284"><a href="#GlobalWorkspaceBase-284"><span class="linenos">284</span></a>            <span class="p">}</span>
+</span><span id="GlobalWorkspaceBase-285"><a href="#GlobalWorkspaceBase-285"><span class="linenos">285</span></a>            <span class="k">for</span> <span class="n">domains</span><span class="p">,</span> <span class="n">data</span> <span class="ow">in</span> <span class="n">batch</span><span class="o">.</span><span class="n">items</span><span class="p">()</span>
+</span><span id="GlobalWorkspaceBase-286"><a href="#GlobalWorkspaceBase-286"><span class="linenos">286</span></a>        <span class="p">}</span>
+</span><span id="GlobalWorkspaceBase-287"><a href="#GlobalWorkspaceBase-287"><span class="linenos">287</span></a>
+</span><span id="GlobalWorkspaceBase-288"><a href="#GlobalWorkspaceBase-288"><span class="linenos">288</span></a>    <span class="k">def</span> <span class="nf">decode_domain</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">domain</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">,</span> <span class="n">name</span><span class="p">:</span> <span class="nb">str</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">Any</span><span class="p">:</span>
+</span><span id="GlobalWorkspaceBase-289"><a href="#GlobalWorkspaceBase-289"><span class="linenos">289</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="GlobalWorkspaceBase-290"><a href="#GlobalWorkspaceBase-290"><span class="linenos">290</span></a><span class="sd">        Decodes a domain from the unimodal representation into the domain data.</span>
+</span><span id="GlobalWorkspaceBase-291"><a href="#GlobalWorkspaceBase-291"><span class="linenos">291</span></a>
+</span><span id="GlobalWorkspaceBase-292"><a href="#GlobalWorkspaceBase-292"><span class="linenos">292</span></a><span class="sd">        This is a convenient proxy for the `DomainModule.encode` method and is</span>
+</span><span id="GlobalWorkspaceBase-293"><a href="#GlobalWorkspaceBase-293"><span class="linenos">293</span></a><span class="sd">        equivalent to:</span>
+</span><span id="GlobalWorkspaceBase-294"><a href="#GlobalWorkspaceBase-294"><span class="linenos">294</span></a><span class="sd">        ```python</span>
+</span><span id="GlobalWorkspaceBase-295"><a href="#GlobalWorkspaceBase-295"><span class="linenos">295</span></a><span class="sd">        self.domain_mods[name].decode(domain)</span>
+</span><span id="GlobalWorkspaceBase-296"><a href="#GlobalWorkspaceBase-296"><span class="linenos">296</span></a><span class="sd">        ```</span>
+</span><span id="GlobalWorkspaceBase-297"><a href="#GlobalWorkspaceBase-297"><span class="linenos">297</span></a>
+</span><span id="GlobalWorkspaceBase-298"><a href="#GlobalWorkspaceBase-298"><span class="linenos">298</span></a><span class="sd">        Args:</span>
+</span><span id="GlobalWorkspaceBase-299"><a href="#GlobalWorkspaceBase-299"><span class="linenos">299</span></a><span class="sd">            domain (`torch.Tensor`): the domain data</span>
+</span><span id="GlobalWorkspaceBase-300"><a href="#GlobalWorkspaceBase-300"><span class="linenos">300</span></a><span class="sd">            name (`str`): domain name to encode</span>
+</span><span id="GlobalWorkspaceBase-301"><a href="#GlobalWorkspaceBase-301"><span class="linenos">301</span></a>
+</span><span id="GlobalWorkspaceBase-302"><a href="#GlobalWorkspaceBase-302"><span class="linenos">302</span></a><span class="sd">        Returns:</span>
+</span><span id="GlobalWorkspaceBase-303"><a href="#GlobalWorkspaceBase-303"><span class="linenos">303</span></a><span class="sd">            `Any`: the domain&#39;s raw data.</span>
+</span><span id="GlobalWorkspaceBase-304"><a href="#GlobalWorkspaceBase-304"><span class="linenos">304</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="GlobalWorkspaceBase-305"><a href="#GlobalWorkspaceBase-305"><span class="linenos">305</span></a>        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">domain_mods</span><span class="p">[</span><span class="n">name</span><span class="p">]</span><span class="o">.</span><span class="n">decode</span><span class="p">(</span><span class="n">domain</span><span class="p">)</span>
+</span><span id="GlobalWorkspaceBase-306"><a href="#GlobalWorkspaceBase-306"><span class="linenos">306</span></a>
+</span><span id="GlobalWorkspaceBase-307"><a href="#GlobalWorkspaceBase-307"><span class="linenos">307</span></a>    <span class="k">def</span> <span class="nf">decode_domains</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">latents_domain</span><span class="p">:</span> <span class="n">LatentsDomainGroupsT</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">RawDomainGroupsDT</span><span class="p">:</span>
+</span><span id="GlobalWorkspaceBase-308"><a href="#GlobalWorkspaceBase-308"><span class="linenos">308</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="GlobalWorkspaceBase-309"><a href="#GlobalWorkspaceBase-309"><span class="linenos">309</span></a><span class="sd">        Decodes all domains in the batch.</span>
+</span><span id="GlobalWorkspaceBase-310"><a href="#GlobalWorkspaceBase-310"><span class="linenos">310</span></a>
+</span><span id="GlobalWorkspaceBase-311"><a href="#GlobalWorkspaceBase-311"><span class="linenos">311</span></a><span class="sd">        Args:</span>
+</span><span id="GlobalWorkspaceBase-312"><a href="#GlobalWorkspaceBase-312"><span class="linenos">312</span></a><span class="sd">            batch (`LatentsDomainGroupsT`): the batch of</span>
+</span><span id="GlobalWorkspaceBase-313"><a href="#GlobalWorkspaceBase-313"><span class="linenos">313</span></a><span class="sd">                domain groups with unimodal latent representation to decode into</span>
+</span><span id="GlobalWorkspaceBase-314"><a href="#GlobalWorkspaceBase-314"><span class="linenos">314</span></a><span class="sd">                groups of raw data.</span>
+</span><span id="GlobalWorkspaceBase-315"><a href="#GlobalWorkspaceBase-315"><span class="linenos">315</span></a>
+</span><span id="GlobalWorkspaceBase-316"><a href="#GlobalWorkspaceBase-316"><span class="linenos">316</span></a><span class="sd">        Returns:</span>
+</span><span id="GlobalWorkspaceBase-317"><a href="#GlobalWorkspaceBase-317"><span class="linenos">317</span></a><span class="sd">            `LatentsDomainGroupsDT`: the domains&#39; raw data.</span>
+</span><span id="GlobalWorkspaceBase-318"><a href="#GlobalWorkspaceBase-318"><span class="linenos">318</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="GlobalWorkspaceBase-319"><a href="#GlobalWorkspaceBase-319"><span class="linenos">319</span></a>        <span class="k">return</span> <span class="p">{</span>
+</span><span id="GlobalWorkspaceBase-320"><a href="#GlobalWorkspaceBase-320"><span class="linenos">320</span></a>            <span class="n">domains</span><span class="p">:</span> <span class="p">{</span>
+</span><span id="GlobalWorkspaceBase-321"><a href="#GlobalWorkspaceBase-321"><span class="linenos">321</span></a>                <span class="n">name</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">domain_mods</span><span class="p">[</span><span class="n">name</span><span class="p">]</span><span class="o">.</span><span class="n">decode</span><span class="p">(</span><span class="n">domain</span><span class="p">)</span>
+</span><span id="GlobalWorkspaceBase-322"><a href="#GlobalWorkspaceBase-322"><span class="linenos">322</span></a>                <span class="k">for</span> <span class="n">name</span><span class="p">,</span> <span class="n">domain</span> <span class="ow">in</span> <span class="n">latents</span><span class="o">.</span><span class="n">items</span><span class="p">()</span>
+</span><span id="GlobalWorkspaceBase-323"><a href="#GlobalWorkspaceBase-323"><span class="linenos">323</span></a>            <span class="p">}</span>
+</span><span id="GlobalWorkspaceBase-324"><a href="#GlobalWorkspaceBase-324"><span class="linenos">324</span></a>            <span class="k">for</span> <span class="n">domains</span><span class="p">,</span> <span class="n">latents</span> <span class="ow">in</span> <span class="n">latents_domain</span><span class="o">.</span><span class="n">items</span><span class="p">()</span>
+</span><span id="GlobalWorkspaceBase-325"><a href="#GlobalWorkspaceBase-325"><span class="linenos">325</span></a>        <span class="p">}</span>
+</span><span id="GlobalWorkspaceBase-326"><a href="#GlobalWorkspaceBase-326"><span class="linenos">326</span></a>
+</span><span id="GlobalWorkspaceBase-327"><a href="#GlobalWorkspaceBase-327"><span class="linenos">327</span></a>    <span class="k">def</span> <span class="nf">generic_step</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">batch</span><span class="p">:</span> <span class="n">RawDomainGroupsT</span><span class="p">,</span> <span class="n">mode</span><span class="p">:</span> <span class="n">ModelModeT</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">:</span>
+</span><span id="GlobalWorkspaceBase-328"><a href="#GlobalWorkspaceBase-328"><span class="linenos">328</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="GlobalWorkspaceBase-329"><a href="#GlobalWorkspaceBase-329"><span class="linenos">329</span></a><span class="sd">        The generic step used in `training_step`, `validation_step` and</span>
+</span><span id="GlobalWorkspaceBase-330"><a href="#GlobalWorkspaceBase-330"><span class="linenos">330</span></a><span class="sd">        `test_step`.</span>
+</span><span id="GlobalWorkspaceBase-331"><a href="#GlobalWorkspaceBase-331"><span class="linenos">331</span></a>
+</span><span id="GlobalWorkspaceBase-332"><a href="#GlobalWorkspaceBase-332"><span class="linenos">332</span></a><span class="sd">        Args:</span>
+</span><span id="GlobalWorkspaceBase-333"><a href="#GlobalWorkspaceBase-333"><span class="linenos">333</span></a><span class="sd">            batch (`RawDomainGroupsT`): the batch of groups of raw unimodal data.</span>
+</span><span id="GlobalWorkspaceBase-334"><a href="#GlobalWorkspaceBase-334"><span class="linenos">334</span></a><span class="sd">            mode (`ModelModeT`):</span>
+</span><span id="GlobalWorkspaceBase-335"><a href="#GlobalWorkspaceBase-335"><span class="linenos">335</span></a>
+</span><span id="GlobalWorkspaceBase-336"><a href="#GlobalWorkspaceBase-336"><span class="linenos">336</span></a><span class="sd">        Returns:</span>
+</span><span id="GlobalWorkspaceBase-337"><a href="#GlobalWorkspaceBase-337"><span class="linenos">337</span></a><span class="sd">            `torch.Tensor`: the loss to train on.</span>
+</span><span id="GlobalWorkspaceBase-338"><a href="#GlobalWorkspaceBase-338"><span class="linenos">338</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="GlobalWorkspaceBase-339"><a href="#GlobalWorkspaceBase-339"><span class="linenos">339</span></a>        <span class="n">domain_latents</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">encode_domains</span><span class="p">(</span><span class="n">batch</span><span class="p">)</span>
+</span><span id="GlobalWorkspaceBase-340"><a href="#GlobalWorkspaceBase-340"><span class="linenos">340</span></a>        <span class="n">batch_size</span> <span class="o">=</span> <span class="n">groups_batch_size</span><span class="p">(</span><span class="n">domain_latents</span><span class="p">)</span>
+</span><span id="GlobalWorkspaceBase-341"><a href="#GlobalWorkspaceBase-341"><span class="linenos">341</span></a>
+</span><span id="GlobalWorkspaceBase-342"><a href="#GlobalWorkspaceBase-342"><span class="linenos">342</span></a>        <span class="n">loss_output</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">loss_mod</span><span class="o">.</span><span class="n">step</span><span class="p">(</span><span class="n">domain_latents</span><span class="p">,</span> <span class="n">mode</span><span class="p">)</span>
+</span><span id="GlobalWorkspaceBase-343"><a href="#GlobalWorkspaceBase-343"><span class="linenos">343</span></a>
+</span><span id="GlobalWorkspaceBase-344"><a href="#GlobalWorkspaceBase-344"><span class="linenos">344</span></a>        <span class="k">for</span> <span class="n">name</span><span class="p">,</span> <span class="n">metric</span> <span class="ow">in</span> <span class="n">loss_output</span><span class="o">.</span><span class="n">all</span><span class="o">.</span><span class="n">items</span><span class="p">():</span>
+</span><span id="GlobalWorkspaceBase-345"><a href="#GlobalWorkspaceBase-345"><span class="linenos">345</span></a>            <span class="bp">self</span><span class="o">.</span><span class="n">log</span><span class="p">(</span>
+</span><span id="GlobalWorkspaceBase-346"><a href="#GlobalWorkspaceBase-346"><span class="linenos">346</span></a>                <span class="sa">f</span><span class="s2">&quot;</span><span class="si">{</span><span class="n">mode</span><span class="si">}</span><span class="s2">/</span><span class="si">{</span><span class="n">name</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">,</span>
+</span><span id="GlobalWorkspaceBase-347"><a href="#GlobalWorkspaceBase-347"><span class="linenos">347</span></a>                <span class="n">metric</span><span class="p">,</span>
+</span><span id="GlobalWorkspaceBase-348"><a href="#GlobalWorkspaceBase-348"><span class="linenos">348</span></a>                <span class="n">batch_size</span><span class="o">=</span><span class="n">batch_size</span><span class="p">,</span>
+</span><span id="GlobalWorkspaceBase-349"><a href="#GlobalWorkspaceBase-349"><span class="linenos">349</span></a>                <span class="n">add_dataloader_idx</span><span class="o">=</span><span class="kc">False</span><span class="p">,</span>
+</span><span id="GlobalWorkspaceBase-350"><a href="#GlobalWorkspaceBase-350"><span class="linenos">350</span></a>            <span class="p">)</span>
+</span><span id="GlobalWorkspaceBase-351"><a href="#GlobalWorkspaceBase-351"><span class="linenos">351</span></a>
+</span><span id="GlobalWorkspaceBase-352"><a href="#GlobalWorkspaceBase-352"><span class="linenos">352</span></a>        <span class="k">return</span> <span class="n">loss_output</span><span class="o">.</span><span class="n">loss</span>
+</span><span id="GlobalWorkspaceBase-353"><a href="#GlobalWorkspaceBase-353"><span class="linenos">353</span></a>
+</span><span id="GlobalWorkspaceBase-354"><a href="#GlobalWorkspaceBase-354"><span class="linenos">354</span></a>    <span class="k">def</span> <span class="nf">validation_step</span><span class="p">(</span>  <span class="c1"># type: ignore</span>
+</span><span id="GlobalWorkspaceBase-355"><a href="#GlobalWorkspaceBase-355"><span class="linenos">355</span></a>        <span class="bp">self</span><span class="p">,</span> <span class="n">data</span><span class="p">:</span> <span class="n">RawDomainGroupT</span><span class="p">,</span> <span class="n">batch_idx</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span> <span class="n">dataloader_idx</span><span class="p">:</span> <span class="nb">int</span> <span class="o">=</span> <span class="mi">0</span>
+</span><span id="GlobalWorkspaceBase-356"><a href="#GlobalWorkspaceBase-356"><span class="linenos">356</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">:</span>
+</span><span id="GlobalWorkspaceBase-357"><a href="#GlobalWorkspaceBase-357"><span class="linenos">357</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;Validation step used by lightning&quot;&quot;&quot;</span>
+</span><span id="GlobalWorkspaceBase-358"><a href="#GlobalWorkspaceBase-358"><span class="linenos">358</span></a>
+</span><span id="GlobalWorkspaceBase-359"><a href="#GlobalWorkspaceBase-359"><span class="linenos">359</span></a>        <span class="n">batch</span> <span class="o">=</span> <span class="p">{</span><span class="nb">frozenset</span><span class="p">(</span><span class="n">data</span><span class="o">.</span><span class="n">keys</span><span class="p">()):</span> <span class="n">data</span><span class="p">}</span>
+</span><span id="GlobalWorkspaceBase-360"><a href="#GlobalWorkspaceBase-360"><span class="linenos">360</span></a>        <span class="k">for</span> <span class="n">domain</span> <span class="ow">in</span> <span class="n">data</span><span class="p">:</span>
+</span><span id="GlobalWorkspaceBase-361"><a href="#GlobalWorkspaceBase-361"><span class="linenos">361</span></a>            <span class="n">batch</span><span class="p">[</span><span class="nb">frozenset</span><span class="p">([</span><span class="n">domain</span><span class="p">])]</span> <span class="o">=</span> <span class="p">{</span><span class="n">domain</span><span class="p">:</span> <span class="n">data</span><span class="p">[</span><span class="n">domain</span><span class="p">]}</span>
+</span><span id="GlobalWorkspaceBase-362"><a href="#GlobalWorkspaceBase-362"><span class="linenos">362</span></a>        <span class="k">if</span> <span class="n">dataloader_idx</span> <span class="o">==</span> <span class="mi">0</span><span class="p">:</span>
+</span><span id="GlobalWorkspaceBase-363"><a href="#GlobalWorkspaceBase-363"><span class="linenos">363</span></a>            <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">generic_step</span><span class="p">(</span><span class="n">batch</span><span class="p">,</span> <span class="n">mode</span><span class="o">=</span><span class="s2">&quot;val&quot;</span><span class="p">)</span>
+</span><span id="GlobalWorkspaceBase-364"><a href="#GlobalWorkspaceBase-364"><span class="linenos">364</span></a>        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">generic_step</span><span class="p">(</span><span class="n">batch</span><span class="p">,</span> <span class="n">mode</span><span class="o">=</span><span class="s2">&quot;val/ood&quot;</span><span class="p">)</span>
+</span><span id="GlobalWorkspaceBase-365"><a href="#GlobalWorkspaceBase-365"><span class="linenos">365</span></a>
+</span><span id="GlobalWorkspaceBase-366"><a href="#GlobalWorkspaceBase-366"><span class="linenos">366</span></a>    <span class="k">def</span> <span class="nf">test_step</span><span class="p">(</span>  <span class="c1"># type: ignore</span>
+</span><span id="GlobalWorkspaceBase-367"><a href="#GlobalWorkspaceBase-367"><span class="linenos">367</span></a>        <span class="bp">self</span><span class="p">,</span> <span class="n">data</span><span class="p">:</span> <span class="n">Mapping</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">Any</span><span class="p">],</span> <span class="n">batch_idx</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span> <span class="n">dataloader_idx</span><span class="p">:</span> <span class="nb">int</span> <span class="o">=</span> <span class="mi">0</span>
+</span><span id="GlobalWorkspaceBase-368"><a href="#GlobalWorkspaceBase-368"><span class="linenos">368</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">:</span>
+</span><span id="GlobalWorkspaceBase-369"><a href="#GlobalWorkspaceBase-369"><span class="linenos">369</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;Test step used by lightning&quot;&quot;&quot;</span>
+</span><span id="GlobalWorkspaceBase-370"><a href="#GlobalWorkspaceBase-370"><span class="linenos">370</span></a>
+</span><span id="GlobalWorkspaceBase-371"><a href="#GlobalWorkspaceBase-371"><span class="linenos">371</span></a>        <span class="n">batch</span> <span class="o">=</span> <span class="p">{</span><span class="nb">frozenset</span><span class="p">(</span><span class="n">data</span><span class="o">.</span><span class="n">keys</span><span class="p">()):</span> <span class="n">data</span><span class="p">}</span>
+</span><span id="GlobalWorkspaceBase-372"><a href="#GlobalWorkspaceBase-372"><span class="linenos">372</span></a>        <span class="k">for</span> <span class="n">domain</span> <span class="ow">in</span> <span class="n">data</span><span class="p">:</span>
+</span><span id="GlobalWorkspaceBase-373"><a href="#GlobalWorkspaceBase-373"><span class="linenos">373</span></a>            <span class="n">batch</span><span class="p">[</span><span class="nb">frozenset</span><span class="p">([</span><span class="n">domain</span><span class="p">])]</span> <span class="o">=</span> <span class="p">{</span><span class="n">domain</span><span class="p">:</span> <span class="n">data</span><span class="p">[</span><span class="n">domain</span><span class="p">]}</span>
+</span><span id="GlobalWorkspaceBase-374"><a href="#GlobalWorkspaceBase-374"><span class="linenos">374</span></a>        <span class="k">if</span> <span class="n">dataloader_idx</span> <span class="o">==</span> <span class="mi">0</span><span class="p">:</span>
+</span><span id="GlobalWorkspaceBase-375"><a href="#GlobalWorkspaceBase-375"><span class="linenos">375</span></a>            <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">generic_step</span><span class="p">(</span><span class="n">batch</span><span class="p">,</span> <span class="n">mode</span><span class="o">=</span><span class="s2">&quot;test&quot;</span><span class="p">)</span>
+</span><span id="GlobalWorkspaceBase-376"><a href="#GlobalWorkspaceBase-376"><span class="linenos">376</span></a>        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">generic_step</span><span class="p">(</span><span class="n">batch</span><span class="p">,</span> <span class="n">mode</span><span class="o">=</span><span class="s2">&quot;test/ood&quot;</span><span class="p">)</span>
+</span><span id="GlobalWorkspaceBase-377"><a href="#GlobalWorkspaceBase-377"><span class="linenos">377</span></a>
+</span><span id="GlobalWorkspaceBase-378"><a href="#GlobalWorkspaceBase-378"><span class="linenos">378</span></a>    <span class="k">def</span> <span class="nf">training_step</span><span class="p">(</span>  <span class="c1"># type: ignore</span>
+</span><span id="GlobalWorkspaceBase-379"><a href="#GlobalWorkspaceBase-379"><span class="linenos">379</span></a>        <span class="bp">self</span><span class="p">,</span> <span class="n">batch</span><span class="p">:</span> <span class="n">Mapping</span><span class="p">[</span><span class="nb">frozenset</span><span class="p">[</span><span class="nb">str</span><span class="p">],</span> <span class="n">Mapping</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">Any</span><span class="p">]],</span> <span class="n">batch_idx</span><span class="p">:</span> <span class="nb">int</span>
+</span><span id="GlobalWorkspaceBase-380"><a href="#GlobalWorkspaceBase-380"><span class="linenos">380</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">:</span>
+</span><span id="GlobalWorkspaceBase-381"><a href="#GlobalWorkspaceBase-381"><span class="linenos">381</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;Training step used by lightning&quot;&quot;&quot;</span>
+</span><span id="GlobalWorkspaceBase-382"><a href="#GlobalWorkspaceBase-382"><span class="linenos">382</span></a>
+</span><span id="GlobalWorkspaceBase-383"><a href="#GlobalWorkspaceBase-383"><span class="linenos">383</span></a>        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">generic_step</span><span class="p">(</span><span class="n">batch</span><span class="p">,</span> <span class="n">mode</span><span class="o">=</span><span class="s2">&quot;train&quot;</span><span class="p">)</span>
+</span><span id="GlobalWorkspaceBase-384"><a href="#GlobalWorkspaceBase-384"><span class="linenos">384</span></a>
+</span><span id="GlobalWorkspaceBase-385"><a href="#GlobalWorkspaceBase-385"><span class="linenos">385</span></a>    <span class="k">def</span> <span class="nf">predict_step</span><span class="p">(</span>  <span class="c1"># type: ignore</span>
+</span><span id="GlobalWorkspaceBase-386"><a href="#GlobalWorkspaceBase-386"><span class="linenos">386</span></a>        <span class="bp">self</span><span class="p">,</span> <span class="n">data</span><span class="p">:</span> <span class="n">Mapping</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">Any</span><span class="p">],</span> <span class="n">batch_idx</span><span class="p">:</span> <span class="nb">int</span>
+</span><span id="GlobalWorkspaceBase-387"><a href="#GlobalWorkspaceBase-387"><span class="linenos">387</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="n">GWPredictionsBase</span><span class="p">:</span>
+</span><span id="GlobalWorkspaceBase-388"><a href="#GlobalWorkspaceBase-388"><span class="linenos">388</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;Predict step used by lightning&quot;&quot;&quot;</span>
+</span><span id="GlobalWorkspaceBase-389"><a href="#GlobalWorkspaceBase-389"><span class="linenos">389</span></a>
+</span><span id="GlobalWorkspaceBase-390"><a href="#GlobalWorkspaceBase-390"><span class="linenos">390</span></a>        <span class="n">batch</span> <span class="o">=</span> <span class="p">{</span><span class="nb">frozenset</span><span class="p">(</span><span class="n">data</span><span class="o">.</span><span class="n">keys</span><span class="p">()):</span> <span class="n">data</span><span class="p">}</span>
+</span><span id="GlobalWorkspaceBase-391"><a href="#GlobalWorkspaceBase-391"><span class="linenos">391</span></a>        <span class="k">for</span> <span class="n">domain</span> <span class="ow">in</span> <span class="n">data</span><span class="p">:</span>
+</span><span id="GlobalWorkspaceBase-392"><a href="#GlobalWorkspaceBase-392"><span class="linenos">392</span></a>            <span class="n">batch</span><span class="p">[</span><span class="nb">frozenset</span><span class="p">([</span><span class="n">domain</span><span class="p">])]</span> <span class="o">=</span> <span class="p">{</span><span class="n">domain</span><span class="p">:</span> <span class="n">data</span><span class="p">[</span><span class="n">domain</span><span class="p">]}</span>
+</span><span id="GlobalWorkspaceBase-393"><a href="#GlobalWorkspaceBase-393"><span class="linenos">393</span></a>
+</span><span id="GlobalWorkspaceBase-394"><a href="#GlobalWorkspaceBase-394"><span class="linenos">394</span></a>        <span class="n">domain_latents</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">encode_domains</span><span class="p">(</span><span class="n">batch</span><span class="p">)</span>
+</span><span id="GlobalWorkspaceBase-395"><a href="#GlobalWorkspaceBase-395"><span class="linenos">395</span></a>        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">forward</span><span class="p">(</span><span class="n">domain_latents</span><span class="p">)</span>
+</span><span id="GlobalWorkspaceBase-396"><a href="#GlobalWorkspaceBase-396"><span class="linenos">396</span></a>
+</span><span id="GlobalWorkspaceBase-397"><a href="#GlobalWorkspaceBase-397"><span class="linenos">397</span></a>    <span class="k">def</span> <span class="nf">configure_optimizers</span><span class="p">(</span><span class="bp">self</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">OptimizerLRSchedulerConfig</span><span class="p">:</span>
+</span><span id="GlobalWorkspaceBase-398"><a href="#GlobalWorkspaceBase-398"><span class="linenos">398</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="GlobalWorkspaceBase-399"><a href="#GlobalWorkspaceBase-399"><span class="linenos">399</span></a><span class="sd">        Configure models optimizers.</span>
+</span><span id="GlobalWorkspaceBase-400"><a href="#GlobalWorkspaceBase-400"><span class="linenos">400</span></a>
+</span><span id="GlobalWorkspaceBase-401"><a href="#GlobalWorkspaceBase-401"><span class="linenos">401</span></a><span class="sd">        Here we use `AdamW` for the optimizer and `OneCycleLR` for the learning-rate</span>
+</span><span id="GlobalWorkspaceBase-402"><a href="#GlobalWorkspaceBase-402"><span class="linenos">402</span></a><span class="sd">        scheduler.</span>
+</span><span id="GlobalWorkspaceBase-403"><a href="#GlobalWorkspaceBase-403"><span class="linenos">403</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="GlobalWorkspaceBase-404"><a href="#GlobalWorkspaceBase-404"><span class="linenos">404</span></a>
+</span><span id="GlobalWorkspaceBase-405"><a href="#GlobalWorkspaceBase-405"><span class="linenos">405</span></a>        <span class="n">optimizer</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">optim</span><span class="o">.</span><span class="n">AdamW</span><span class="p">(</span>
+</span><span id="GlobalWorkspaceBase-406"><a href="#GlobalWorkspaceBase-406"><span class="linenos">406</span></a>            <span class="bp">self</span><span class="o">.</span><span class="n">parameters</span><span class="p">(),</span>
+</span><span id="GlobalWorkspaceBase-407"><a href="#GlobalWorkspaceBase-407"><span class="linenos">407</span></a>            <span class="n">lr</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">optim_lr</span><span class="p">,</span>
+</span><span id="GlobalWorkspaceBase-408"><a href="#GlobalWorkspaceBase-408"><span class="linenos">408</span></a>            <span class="n">weight_decay</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">optim_weight_decay</span><span class="p">,</span>
+</span><span id="GlobalWorkspaceBase-409"><a href="#GlobalWorkspaceBase-409"><span class="linenos">409</span></a>        <span class="p">)</span>
+</span><span id="GlobalWorkspaceBase-410"><a href="#GlobalWorkspaceBase-410"><span class="linenos">410</span></a>
+</span><span id="GlobalWorkspaceBase-411"><a href="#GlobalWorkspaceBase-411"><span class="linenos">411</span></a>        <span class="n">lr_scheduler</span> <span class="o">=</span> <span class="n">OneCycleLR</span><span class="p">(</span><span class="n">optimizer</span><span class="p">,</span> <span class="o">**</span><span class="bp">self</span><span class="o">.</span><span class="n">scheduler_args</span><span class="p">)</span>
+</span><span id="GlobalWorkspaceBase-412"><a href="#GlobalWorkspaceBase-412"><span class="linenos">412</span></a>
+</span><span id="GlobalWorkspaceBase-413"><a href="#GlobalWorkspaceBase-413"><span class="linenos">413</span></a>        <span class="k">return</span> <span class="p">{</span>
+</span><span id="GlobalWorkspaceBase-414"><a href="#GlobalWorkspaceBase-414"><span class="linenos">414</span></a>            <span class="s2">&quot;optimizer&quot;</span><span class="p">:</span> <span class="n">optimizer</span><span class="p">,</span>
+</span><span id="GlobalWorkspaceBase-415"><a href="#GlobalWorkspaceBase-415"><span class="linenos">415</span></a>            <span class="s2">&quot;lr_scheduler&quot;</span><span class="p">:</span> <span class="p">{</span>
+</span><span id="GlobalWorkspaceBase-416"><a href="#GlobalWorkspaceBase-416"><span class="linenos">416</span></a>                <span class="s2">&quot;scheduler&quot;</span><span class="p">:</span> <span class="n">lr_scheduler</span><span class="p">,</span>
+</span><span id="GlobalWorkspaceBase-417"><a href="#GlobalWorkspaceBase-417"><span class="linenos">417</span></a>                <span class="s2">&quot;interval&quot;</span><span class="p">:</span> <span class="s2">&quot;step&quot;</span><span class="p">,</span>
+</span><span id="GlobalWorkspaceBase-418"><a href="#GlobalWorkspaceBase-418"><span class="linenos">418</span></a>            <span class="p">},</span>
+</span><span id="GlobalWorkspaceBase-419"><a href="#GlobalWorkspaceBase-419"><span class="linenos">419</span></a>        <span class="p">}</span>
+</span></pre></div>
+
+
+            <div class="docstring"><p>Global Workspace Lightning Module.</p>
+
+<p>This is the base class to build the Global Workspace.</p>
+</div>
+
+
+                            <div id="GlobalWorkspaceBase.gw_mod" class="classattr">
+                                <div class="attr variable">
+            <span class="name">gw_mod</span>
+
+        
+    </div>
+    <a class="headerlink" href="#GlobalWorkspaceBase.gw_mod"></a>
+    
+            <div class="docstring"><p>a <code>GWModuleBase</code> implementation.</p>
+</div>
+
+
+                            </div>
+                            <div id="GlobalWorkspaceBase.selection_mod" class="classattr">
+                                <div class="attr variable">
+            <span class="name">selection_mod</span>
+
+        
+    </div>
+    <a class="headerlink" href="#GlobalWorkspaceBase.selection_mod"></a>
+    
+            <div class="docstring"><p>A <code>SelectionBase</code> implementation.</p>
+</div>
+
+
+                            </div>
+                            <div id="GlobalWorkspaceBase.loss_mod" class="classattr">
+                                <div class="attr variable">
+            <span class="name">loss_mod</span>
+
+        
+    </div>
+    <a class="headerlink" href="#GlobalWorkspaceBase.loss_mod"></a>
+    
+            <div class="docstring"><p>The module that computes losses of the GW</p>
+</div>
+
+
+                            </div>
+                            <div id="GlobalWorkspaceBase.optim_lr" class="classattr">
+                                <div class="attr variable">
+            <span class="name">optim_lr</span>
+
+        
+    </div>
+    <a class="headerlink" href="#GlobalWorkspaceBase.optim_lr"></a>
+    
+    
+
+                            </div>
+                            <div id="GlobalWorkspaceBase.optim_weight_decay" class="classattr">
+                                <div class="attr variable">
+            <span class="name">optim_weight_decay</span>
+
+        
+    </div>
+    <a class="headerlink" href="#GlobalWorkspaceBase.optim_weight_decay"></a>
+    
+    
+
+                            </div>
+                            <div id="GlobalWorkspaceBase.scheduler_args" class="classattr">
+                                <div class="attr variable">
+            <span class="name">scheduler_args</span>
+
+        
+    </div>
+    <a class="headerlink" href="#GlobalWorkspaceBase.scheduler_args"></a>
+    
+    
+
+                            </div>
+                            <div id="GlobalWorkspaceBase.domain_mods" class="classattr">
+                                        <input id="GlobalWorkspaceBase.domain_mods-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
+<div class="attr variable">
+            <span class="name">domain_mods</span><span class="annotation">: collections.abc.Mapping[str, <a href="domain.html#DomainModule">shimmer.modules.domain.DomainModule</a>]</span>
+
+                <label class="view-source-button" for="GlobalWorkspaceBase.domain_mods-view-source"><span>View Source</span></label>
+
+    </div>
+    <a class="headerlink" href="#GlobalWorkspaceBase.domain_mods"></a>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="GlobalWorkspaceBase.domain_mods-130"><a href="#GlobalWorkspaceBase.domain_mods-130"><span class="linenos">130</span></a>    <span class="nd">@property</span>
+</span><span id="GlobalWorkspaceBase.domain_mods-131"><a href="#GlobalWorkspaceBase.domain_mods-131"><span class="linenos">131</span></a>    <span class="k">def</span> <span class="nf">domain_mods</span><span class="p">(</span><span class="bp">self</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">Mapping</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">DomainModule</span><span class="p">]:</span>
+</span><span id="GlobalWorkspaceBase.domain_mods-132"><a href="#GlobalWorkspaceBase.domain_mods-132"><span class="linenos">132</span></a>        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">gw_mod</span><span class="o">.</span><span class="n">domain_mods</span>
+</span></pre></div>
+
+
+    
+
+                            </div>
+                            <div id="GlobalWorkspaceBase.workspace_dim" class="classattr">
+                                        <input id="GlobalWorkspaceBase.workspace_dim-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
+<div class="attr variable">
+            <span class="name">workspace_dim</span><span class="annotation">: int</span>
+
+                <label class="view-source-button" for="GlobalWorkspaceBase.workspace_dim-view-source"><span>View Source</span></label>
+
+    </div>
+    <a class="headerlink" href="#GlobalWorkspaceBase.workspace_dim"></a>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="GlobalWorkspaceBase.workspace_dim-134"><a href="#GlobalWorkspaceBase.workspace_dim-134"><span class="linenos">134</span></a>    <span class="nd">@property</span>
+</span><span id="GlobalWorkspaceBase.workspace_dim-135"><a href="#GlobalWorkspaceBase.workspace_dim-135"><span class="linenos">135</span></a>    <span class="k">def</span> <span class="nf">workspace_dim</span><span class="p">(</span><span class="bp">self</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">int</span><span class="p">:</span>
+</span><span id="GlobalWorkspaceBase.workspace_dim-136"><a href="#GlobalWorkspaceBase.workspace_dim-136"><span class="linenos">136</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;Dimension of the GW.&quot;&quot;&quot;</span>
+</span><span id="GlobalWorkspaceBase.workspace_dim-137"><a href="#GlobalWorkspaceBase.workspace_dim-137"><span class="linenos">137</span></a>        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">gw_mod</span><span class="o">.</span><span class="n">workspace_dim</span>
+</span></pre></div>
+
+
+            <div class="docstring"><p>Dimension of the GW.</p>
+</div>
+
+
+                            </div>
+                            <div id="GlobalWorkspaceBase.encode_and_fuse" class="classattr">
+                                        <input id="GlobalWorkspaceBase.encode_and_fuse-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
+<div class="attr function">
+            
+        <span class="def">def</span>
+        <span class="name">encode_and_fuse</span><span class="signature pdoc-code multiline">(<span class="param">	<span class="bp">self</span>,</span><span class="param">	<span class="n">x</span><span class="p">:</span> <span class="n">collections</span><span class="o">.</span><span class="n">abc</span><span class="o">.</span><span class="n">Mapping</span><span class="p">[</span><span class="nb">frozenset</span><span class="p">[</span><span class="nb">str</span><span class="p">],</span> <span class="n">collections</span><span class="o">.</span><span class="n">abc</span><span class="o">.</span><span class="n">Mapping</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]]</span>,</span><span class="param">	<span class="n">selection_module</span><span class="p">:</span> <span class="n"><a href="selection.html#SelectionBase">shimmer.modules.selection.SelectionBase</a></span></span><span class="return-annotation">) -> <span class="nb">dict</span><span class="p">[</span><span class="nb">frozenset</span><span class="p">[</span><span class="nb">str</span><span class="p">],</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]</span>:</span></span>
+
+                <label class="view-source-button" for="GlobalWorkspaceBase.encode_and_fuse-view-source"><span>View Source</span></label>
+
+    </div>
+    <a class="headerlink" href="#GlobalWorkspaceBase.encode_and_fuse"></a>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="GlobalWorkspaceBase.encode_and_fuse-139"><a href="#GlobalWorkspaceBase.encode_and_fuse-139"><span class="linenos">139</span></a>    <span class="k">def</span> <span class="nf">encode_and_fuse</span><span class="p">(</span>
+</span><span id="GlobalWorkspaceBase.encode_and_fuse-140"><a href="#GlobalWorkspaceBase.encode_and_fuse-140"><span class="linenos">140</span></a>        <span class="bp">self</span><span class="p">,</span> <span class="n">x</span><span class="p">:</span> <span class="n">LatentsDomainGroupsT</span><span class="p">,</span> <span class="n">selection_module</span><span class="p">:</span> <span class="n">SelectionBase</span>
+</span><span id="GlobalWorkspaceBase.encode_and_fuse-141"><a href="#GlobalWorkspaceBase.encode_and_fuse-141"><span class="linenos">141</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">frozenset</span><span class="p">[</span><span class="nb">str</span><span class="p">],</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]:</span>
+</span><span id="GlobalWorkspaceBase.encode_and_fuse-142"><a href="#GlobalWorkspaceBase.encode_and_fuse-142"><span class="linenos">142</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="GlobalWorkspaceBase.encode_and_fuse-143"><a href="#GlobalWorkspaceBase.encode_and_fuse-143"><span class="linenos">143</span></a><span class="sd">        Encode a group of latent representations into the GW representation.</span>
+</span><span id="GlobalWorkspaceBase.encode_and_fuse-144"><a href="#GlobalWorkspaceBase.encode_and_fuse-144"><span class="linenos">144</span></a>
+</span><span id="GlobalWorkspaceBase.encode_and_fuse-145"><a href="#GlobalWorkspaceBase.encode_and_fuse-145"><span class="linenos">145</span></a><span class="sd">        Args:</span>
+</span><span id="GlobalWorkspaceBase.encode_and_fuse-146"><a href="#GlobalWorkspaceBase.encode_and_fuse-146"><span class="linenos">146</span></a><span class="sd">            x (`LatentsDomainGroupsT`): the input domain representations.</span>
+</span><span id="GlobalWorkspaceBase.encode_and_fuse-147"><a href="#GlobalWorkspaceBase.encode_and_fuse-147"><span class="linenos">147</span></a><span class="sd">            selection_scores (`Mapping[str, torch.Tensor]`):</span>
+</span><span id="GlobalWorkspaceBase.encode_and_fuse-148"><a href="#GlobalWorkspaceBase.encode_and_fuse-148"><span class="linenos">148</span></a>
+</span><span id="GlobalWorkspaceBase.encode_and_fuse-149"><a href="#GlobalWorkspaceBase.encode_and_fuse-149"><span class="linenos">149</span></a><span class="sd">        Returns:</span>
+</span><span id="GlobalWorkspaceBase.encode_and_fuse-150"><a href="#GlobalWorkspaceBase.encode_and_fuse-150"><span class="linenos">150</span></a><span class="sd">            `dict[frozenset[str], torch.Tensor]`: the GW representations.</span>
+</span><span id="GlobalWorkspaceBase.encode_and_fuse-151"><a href="#GlobalWorkspaceBase.encode_and_fuse-151"><span class="linenos">151</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="GlobalWorkspaceBase.encode_and_fuse-152"><a href="#GlobalWorkspaceBase.encode_and_fuse-152"><span class="linenos">152</span></a>        <span class="k">return</span> <span class="p">{</span>
+</span><span id="GlobalWorkspaceBase.encode_and_fuse-153"><a href="#GlobalWorkspaceBase.encode_and_fuse-153"><span class="linenos">153</span></a>            <span class="n">domains</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">gw_mod</span><span class="o">.</span><span class="n">encode_and_fuse</span><span class="p">(</span><span class="n">latents</span><span class="p">,</span> <span class="n">selection_module</span><span class="p">)</span>
+</span><span id="GlobalWorkspaceBase.encode_and_fuse-154"><a href="#GlobalWorkspaceBase.encode_and_fuse-154"><span class="linenos">154</span></a>            <span class="k">for</span> <span class="n">domains</span><span class="p">,</span> <span class="n">latents</span> <span class="ow">in</span> <span class="n">x</span><span class="o">.</span><span class="n">items</span><span class="p">()</span>
+</span><span id="GlobalWorkspaceBase.encode_and_fuse-155"><a href="#GlobalWorkspaceBase.encode_and_fuse-155"><span class="linenos">155</span></a>        <span class="p">}</span>
+</span></pre></div>
+
+
+            <div class="docstring"><p>Encode a group of latent representations into the GW representation.</p>
+
+<h6 id="arguments">Arguments:</h6>
+
+<ul>
+<li><strong>x (<code>LatentsDomainGroupsT</code>):</strong>  the input domain representations.</li>
+<li><strong>selection_scores (<code>Mapping[str, torch.Tensor]</code>):</strong> </li>
+</ul>
+
+<h6 id="returns">Returns:</h6>
+
+<blockquote>
+  <p><code>dict[frozenset[str], torch.Tensor]</code>: the GW representations.</p>
+</blockquote>
+</div>
+
+
+                            </div>
+                            <div id="GlobalWorkspaceBase.encode" class="classattr">
+                                        <input id="GlobalWorkspaceBase.encode-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
+<div class="attr function">
+            
+        <span class="def">def</span>
+        <span class="name">encode</span><span class="signature pdoc-code multiline">(<span class="param">	<span class="bp">self</span>,</span><span class="param">	<span class="n">x</span><span class="p">:</span> <span class="n">collections</span><span class="o">.</span><span class="n">abc</span><span class="o">.</span><span class="n">Mapping</span><span class="p">[</span><span class="nb">frozenset</span><span class="p">[</span><span class="nb">str</span><span class="p">],</span> <span class="n">collections</span><span class="o">.</span><span class="n">abc</span><span class="o">.</span><span class="n">Mapping</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]]</span></span><span class="return-annotation">) -> <span class="nb">dict</span><span class="p">[</span><span class="nb">frozenset</span><span class="p">[</span><span class="nb">str</span><span class="p">],</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]]</span>:</span></span>
+
+                <label class="view-source-button" for="GlobalWorkspaceBase.encode-view-source"><span>View Source</span></label>
+
+    </div>
+    <a class="headerlink" href="#GlobalWorkspaceBase.encode"></a>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="GlobalWorkspaceBase.encode-157"><a href="#GlobalWorkspaceBase.encode-157"><span class="linenos">157</span></a>    <span class="k">def</span> <span class="nf">encode</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">x</span><span class="p">:</span> <span class="n">LatentsDomainGroupsT</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">LatentsDomainGroupsDT</span><span class="p">:</span>
+</span><span id="GlobalWorkspaceBase.encode-158"><a href="#GlobalWorkspaceBase.encode-158"><span class="linenos">158</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="GlobalWorkspaceBase.encode-159"><a href="#GlobalWorkspaceBase.encode-159"><span class="linenos">159</span></a><span class="sd">        Encode a group of latent representations into the pre-fusion GW representation.</span>
+</span><span id="GlobalWorkspaceBase.encode-160"><a href="#GlobalWorkspaceBase.encode-160"><span class="linenos">160</span></a>
+</span><span id="GlobalWorkspaceBase.encode-161"><a href="#GlobalWorkspaceBase.encode-161"><span class="linenos">161</span></a><span class="sd">        Args:</span>
+</span><span id="GlobalWorkspaceBase.encode-162"><a href="#GlobalWorkspaceBase.encode-162"><span class="linenos">162</span></a><span class="sd">            x (`LatentsDomainGroupsT`): the input domain representations.</span>
+</span><span id="GlobalWorkspaceBase.encode-163"><a href="#GlobalWorkspaceBase.encode-163"><span class="linenos">163</span></a>
+</span><span id="GlobalWorkspaceBase.encode-164"><a href="#GlobalWorkspaceBase.encode-164"><span class="linenos">164</span></a><span class="sd">        Returns:</span>
+</span><span id="GlobalWorkspaceBase.encode-165"><a href="#GlobalWorkspaceBase.encode-165"><span class="linenos">165</span></a><span class="sd">            `LatensDomainGroupsDT`: the GW representations.</span>
+</span><span id="GlobalWorkspaceBase.encode-166"><a href="#GlobalWorkspaceBase.encode-166"><span class="linenos">166</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="GlobalWorkspaceBase.encode-167"><a href="#GlobalWorkspaceBase.encode-167"><span class="linenos">167</span></a>        <span class="k">return</span> <span class="p">{</span><span class="n">domains</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">gw_mod</span><span class="o">.</span><span class="n">encode</span><span class="p">(</span><span class="n">latents</span><span class="p">)</span> <span class="k">for</span> <span class="n">domains</span><span class="p">,</span> <span class="n">latents</span> <span class="ow">in</span> <span class="n">x</span><span class="o">.</span><span class="n">items</span><span class="p">()}</span>
+</span></pre></div>
+
+
+            <div class="docstring"><p>Encode a group of latent representations into the pre-fusion GW representation.</p>
+
+<h6 id="arguments">Arguments:</h6>
+
+<ul>
+<li><strong>x (<code>LatentsDomainGroupsT</code>):</strong>  the input domain representations.</li>
+</ul>
+
+<h6 id="returns">Returns:</h6>
+
+<blockquote>
+  <p><code>LatensDomainGroupsDT</code>: the GW representations.</p>
+</blockquote>
+</div>
+
+
+                            </div>
+                            <div id="GlobalWorkspaceBase.fuse" class="classattr">
+                                        <input id="GlobalWorkspaceBase.fuse-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
+<div class="attr function">
+            
+        <span class="def">def</span>
+        <span class="name">fuse</span><span class="signature pdoc-code multiline">(<span class="param">	<span class="bp">self</span>,</span><span class="param">	<span class="n">x</span><span class="p">:</span> <span class="n">collections</span><span class="o">.</span><span class="n">abc</span><span class="o">.</span><span class="n">Mapping</span><span class="p">[</span><span class="nb">frozenset</span><span class="p">[</span><span class="nb">str</span><span class="p">],</span> <span class="n">collections</span><span class="o">.</span><span class="n">abc</span><span class="o">.</span><span class="n">Mapping</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]]</span>,</span><span class="param">	<span class="n">selection_scores</span><span class="p">:</span> <span class="n">collections</span><span class="o">.</span><span class="n">abc</span><span class="o">.</span><span class="n">Mapping</span><span class="p">[</span><span class="nb">frozenset</span><span class="p">[</span><span class="nb">str</span><span class="p">],</span> <span class="n">collections</span><span class="o">.</span><span class="n">abc</span><span class="o">.</span><span class="n">Mapping</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]]</span></span><span class="return-annotation">) -> <span class="nb">dict</span><span class="p">[</span><span class="nb">frozenset</span><span class="p">[</span><span class="nb">str</span><span class="p">],</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]</span>:</span></span>
+
+                <label class="view-source-button" for="GlobalWorkspaceBase.fuse-view-source"><span>View Source</span></label>
+
+    </div>
+    <a class="headerlink" href="#GlobalWorkspaceBase.fuse"></a>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="GlobalWorkspaceBase.fuse-169"><a href="#GlobalWorkspaceBase.fuse-169"><span class="linenos">169</span></a>    <span class="k">def</span> <span class="nf">fuse</span><span class="p">(</span>
+</span><span id="GlobalWorkspaceBase.fuse-170"><a href="#GlobalWorkspaceBase.fuse-170"><span class="linenos">170</span></a>        <span class="bp">self</span><span class="p">,</span>
+</span><span id="GlobalWorkspaceBase.fuse-171"><a href="#GlobalWorkspaceBase.fuse-171"><span class="linenos">171</span></a>        <span class="n">x</span><span class="p">:</span> <span class="n">LatentsDomainGroupsT</span><span class="p">,</span>
+</span><span id="GlobalWorkspaceBase.fuse-172"><a href="#GlobalWorkspaceBase.fuse-172"><span class="linenos">172</span></a>        <span class="n">selection_scores</span><span class="p">:</span> <span class="n">Mapping</span><span class="p">[</span><span class="nb">frozenset</span><span class="p">[</span><span class="nb">str</span><span class="p">],</span> <span class="n">Mapping</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]],</span>
+</span><span id="GlobalWorkspaceBase.fuse-173"><a href="#GlobalWorkspaceBase.fuse-173"><span class="linenos">173</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">frozenset</span><span class="p">[</span><span class="nb">str</span><span class="p">],</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]:</span>
+</span><span id="GlobalWorkspaceBase.fuse-174"><a href="#GlobalWorkspaceBase.fuse-174"><span class="linenos">174</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="GlobalWorkspaceBase.fuse-175"><a href="#GlobalWorkspaceBase.fuse-175"><span class="linenos">175</span></a><span class="sd">        Fuses a group of latent representations into the GW representation.</span>
+</span><span id="GlobalWorkspaceBase.fuse-176"><a href="#GlobalWorkspaceBase.fuse-176"><span class="linenos">176</span></a>
+</span><span id="GlobalWorkspaceBase.fuse-177"><a href="#GlobalWorkspaceBase.fuse-177"><span class="linenos">177</span></a><span class="sd">        Args:</span>
+</span><span id="GlobalWorkspaceBase.fuse-178"><a href="#GlobalWorkspaceBase.fuse-178"><span class="linenos">178</span></a><span class="sd">            x (`LatentsDomainGroupsT`): the pre-fusion latent representations</span>
+</span><span id="GlobalWorkspaceBase.fuse-179"><a href="#GlobalWorkspaceBase.fuse-179"><span class="linenos">179</span></a><span class="sd">            selection_scores (`Mapping[frozenset[str], Mapping[str, torch.Tensor]]`):</span>
+</span><span id="GlobalWorkspaceBase.fuse-180"><a href="#GlobalWorkspaceBase.fuse-180"><span class="linenos">180</span></a><span class="sd">                selection scores for each group</span>
+</span><span id="GlobalWorkspaceBase.fuse-181"><a href="#GlobalWorkspaceBase.fuse-181"><span class="linenos">181</span></a>
+</span><span id="GlobalWorkspaceBase.fuse-182"><a href="#GlobalWorkspaceBase.fuse-182"><span class="linenos">182</span></a><span class="sd">        Returns:</span>
+</span><span id="GlobalWorkspaceBase.fuse-183"><a href="#GlobalWorkspaceBase.fuse-183"><span class="linenos">183</span></a><span class="sd">            `dict[frozenset[str], torch.Tensor]`: GW representation of each group</span>
+</span><span id="GlobalWorkspaceBase.fuse-184"><a href="#GlobalWorkspaceBase.fuse-184"><span class="linenos">184</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="GlobalWorkspaceBase.fuse-185"><a href="#GlobalWorkspaceBase.fuse-185"><span class="linenos">185</span></a>        <span class="k">return</span> <span class="p">{</span>
+</span><span id="GlobalWorkspaceBase.fuse-186"><a href="#GlobalWorkspaceBase.fuse-186"><span class="linenos">186</span></a>            <span class="n">domains</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">gw_mod</span><span class="o">.</span><span class="n">fuse</span><span class="p">(</span><span class="n">latents</span><span class="p">,</span> <span class="n">selection_scores</span><span class="p">[</span><span class="n">domains</span><span class="p">])</span>
+</span><span id="GlobalWorkspaceBase.fuse-187"><a href="#GlobalWorkspaceBase.fuse-187"><span class="linenos">187</span></a>            <span class="k">for</span> <span class="n">domains</span><span class="p">,</span> <span class="n">latents</span> <span class="ow">in</span> <span class="n">x</span><span class="o">.</span><span class="n">items</span><span class="p">()</span>
+</span><span id="GlobalWorkspaceBase.fuse-188"><a href="#GlobalWorkspaceBase.fuse-188"><span class="linenos">188</span></a>        <span class="p">}</span>
+</span></pre></div>
+
+
+            <div class="docstring"><p>Fuses a group of latent representations into the GW representation.</p>
+
+<h6 id="arguments">Arguments:</h6>
+
+<ul>
+<li><strong>x (<code>LatentsDomainGroupsT</code>):</strong>  the pre-fusion latent representations</li>
+<li><strong>selection_scores (<code>Mapping[frozenset[str], Mapping[str, torch.Tensor]]</code>):</strong>  selection scores for each group</li>
+</ul>
+
+<h6 id="returns">Returns:</h6>
+
+<blockquote>
+  <p><code>dict[frozenset[str], torch.Tensor]</code>: GW representation of each group</p>
+</blockquote>
+</div>
+
+
+                            </div>
+                            <div id="GlobalWorkspaceBase.decode" class="classattr">
+                                        <input id="GlobalWorkspaceBase.decode-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
+<div class="attr function">
+            
+        <span class="def">def</span>
+        <span class="name">decode</span><span class="signature pdoc-code multiline">(<span class="param">	<span class="bp">self</span>,</span><span class="param">	<span class="n">z</span><span class="p">:</span> <span class="n">collections</span><span class="o">.</span><span class="n">abc</span><span class="o">.</span><span class="n">Mapping</span><span class="p">[</span><span class="nb">frozenset</span><span class="p">[</span><span class="nb">str</span><span class="p">],</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]</span>,</span><span class="param">	<span class="n">domains</span><span class="p">:</span> <span class="n">collections</span><span class="o">.</span><span class="n">abc</span><span class="o">.</span><span class="n">Iterable</span><span class="p">[</span><span class="nb">str</span><span class="p">]</span> <span class="o">|</span> <span class="kc">None</span> <span class="o">=</span> <span class="kc">None</span></span><span class="return-annotation">) -> <span class="nb">dict</span><span class="p">[</span><span class="nb">frozenset</span><span class="p">[</span><span class="nb">str</span><span class="p">],</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]]</span>:</span></span>
+
+                <label class="view-source-button" for="GlobalWorkspaceBase.decode-view-source"><span>View Source</span></label>
+
+    </div>
+    <a class="headerlink" href="#GlobalWorkspaceBase.decode"></a>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="GlobalWorkspaceBase.decode-190"><a href="#GlobalWorkspaceBase.decode-190"><span class="linenos">190</span></a>    <span class="k">def</span> <span class="nf">decode</span><span class="p">(</span>
+</span><span id="GlobalWorkspaceBase.decode-191"><a href="#GlobalWorkspaceBase.decode-191"><span class="linenos">191</span></a>        <span class="bp">self</span><span class="p">,</span>
+</span><span id="GlobalWorkspaceBase.decode-192"><a href="#GlobalWorkspaceBase.decode-192"><span class="linenos">192</span></a>        <span class="n">z</span><span class="p">:</span> <span class="n">Mapping</span><span class="p">[</span><span class="nb">frozenset</span><span class="p">[</span><span class="nb">str</span><span class="p">],</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">],</span>
+</span><span id="GlobalWorkspaceBase.decode-193"><a href="#GlobalWorkspaceBase.decode-193"><span class="linenos">193</span></a>        <span class="n">domains</span><span class="p">:</span> <span class="n">Iterable</span><span class="p">[</span><span class="nb">str</span><span class="p">]</span> <span class="o">|</span> <span class="kc">None</span> <span class="o">=</span> <span class="kc">None</span><span class="p">,</span>
+</span><span id="GlobalWorkspaceBase.decode-194"><a href="#GlobalWorkspaceBase.decode-194"><span class="linenos">194</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="n">LatentsDomainGroupsDT</span><span class="p">:</span>
+</span><span id="GlobalWorkspaceBase.decode-195"><a href="#GlobalWorkspaceBase.decode-195"><span class="linenos">195</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="GlobalWorkspaceBase.decode-196"><a href="#GlobalWorkspaceBase.decode-196"><span class="linenos">196</span></a><span class="sd">        Decode the group GW representation into given `domains`.</span>
+</span><span id="GlobalWorkspaceBase.decode-197"><a href="#GlobalWorkspaceBase.decode-197"><span class="linenos">197</span></a>
+</span><span id="GlobalWorkspaceBase.decode-198"><a href="#GlobalWorkspaceBase.decode-198"><span class="linenos">198</span></a><span class="sd">        Args:</span>
+</span><span id="GlobalWorkspaceBase.decode-199"><a href="#GlobalWorkspaceBase.decode-199"><span class="linenos">199</span></a><span class="sd">            z (`torch.Tensor`): the GW representation.</span>
+</span><span id="GlobalWorkspaceBase.decode-200"><a href="#GlobalWorkspaceBase.decode-200"><span class="linenos">200</span></a><span class="sd">            domains (`Iterable[str]`): iterable of domains to decode.</span>
+</span><span id="GlobalWorkspaceBase.decode-201"><a href="#GlobalWorkspaceBase.decode-201"><span class="linenos">201</span></a>
+</span><span id="GlobalWorkspaceBase.decode-202"><a href="#GlobalWorkspaceBase.decode-202"><span class="linenos">202</span></a><span class="sd">        Returns:</span>
+</span><span id="GlobalWorkspaceBase.decode-203"><a href="#GlobalWorkspaceBase.decode-203"><span class="linenos">203</span></a><span class="sd">            `dict[str, torch.Tensor]`: the decoded unimodal representations.</span>
+</span><span id="GlobalWorkspaceBase.decode-204"><a href="#GlobalWorkspaceBase.decode-204"><span class="linenos">204</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="GlobalWorkspaceBase.decode-205"><a href="#GlobalWorkspaceBase.decode-205"><span class="linenos">205</span></a>        <span class="k">return</span> <span class="p">{</span>
+</span><span id="GlobalWorkspaceBase.decode-206"><a href="#GlobalWorkspaceBase.decode-206"><span class="linenos">206</span></a>            <span class="n">domain_names</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">gw_mod</span><span class="o">.</span><span class="n">decode</span><span class="p">(</span><span class="n">gw_rep</span><span class="p">,</span> <span class="n">domains</span><span class="p">)</span>
+</span><span id="GlobalWorkspaceBase.decode-207"><a href="#GlobalWorkspaceBase.decode-207"><span class="linenos">207</span></a>            <span class="k">for</span> <span class="n">domain_names</span><span class="p">,</span> <span class="n">gw_rep</span> <span class="ow">in</span> <span class="n">z</span><span class="o">.</span><span class="n">items</span><span class="p">()</span>
+</span><span id="GlobalWorkspaceBase.decode-208"><a href="#GlobalWorkspaceBase.decode-208"><span class="linenos">208</span></a>        <span class="p">}</span>
+</span></pre></div>
+
+
+            <div class="docstring"><p>Decode the group GW representation into given <code>domains</code>.</p>
+
+<h6 id="arguments">Arguments:</h6>
+
+<ul>
+<li><strong>z (<code>torch.Tensor</code>):</strong>  the GW representation.</li>
+<li><strong>domains (<code>Iterable[str]</code>):</strong>  iterable of domains to decode.</li>
+</ul>
+
+<h6 id="returns">Returns:</h6>
+
+<blockquote>
+  <p><code>dict[str, torch.Tensor]</code>: the decoded unimodal representations.</p>
+</blockquote>
+</div>
+
+
+                            </div>
+                            <div id="GlobalWorkspaceBase.batch_gw_states" class="classattr">
+                                        <input id="GlobalWorkspaceBase.batch_gw_states-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
+<div class="attr function">
+            
+        <span class="def">def</span>
+        <span class="name">batch_gw_states</span><span class="signature pdoc-code multiline">(<span class="param">	<span class="bp">self</span>,</span><span class="param">	<span class="n">latent_domains</span><span class="p">:</span> <span class="n">collections</span><span class="o">.</span><span class="n">abc</span><span class="o">.</span><span class="n">Mapping</span><span class="p">[</span><span class="nb">frozenset</span><span class="p">[</span><span class="nb">str</span><span class="p">],</span> <span class="n">collections</span><span class="o">.</span><span class="n">abc</span><span class="o">.</span><span class="n">Mapping</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]]</span></span><span class="return-annotation">) -> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]</span>:</span></span>
+
+                <label class="view-source-button" for="GlobalWorkspaceBase.batch_gw_states-view-source"><span>View Source</span></label>
+
+    </div>
+    <a class="headerlink" href="#GlobalWorkspaceBase.batch_gw_states"></a>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="GlobalWorkspaceBase.batch_gw_states-226"><a href="#GlobalWorkspaceBase.batch_gw_states-226"><span class="linenos">226</span></a>    <span class="k">def</span> <span class="nf">batch_gw_states</span><span class="p">(</span>
+</span><span id="GlobalWorkspaceBase.batch_gw_states-227"><a href="#GlobalWorkspaceBase.batch_gw_states-227"><span class="linenos">227</span></a>        <span class="bp">self</span><span class="p">,</span> <span class="n">latent_domains</span><span class="p">:</span> <span class="n">LatentsDomainGroupsT</span>
+</span><span id="GlobalWorkspaceBase.batch_gw_states-228"><a href="#GlobalWorkspaceBase.batch_gw_states-228"><span class="linenos">228</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]:</span>
+</span><span id="GlobalWorkspaceBase.batch_gw_states-229"><a href="#GlobalWorkspaceBase.batch_gw_states-229"><span class="linenos">229</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="GlobalWorkspaceBase.batch_gw_states-230"><a href="#GlobalWorkspaceBase.batch_gw_states-230"><span class="linenos">230</span></a><span class="sd">        Comptues GW states of a batch of groups of domains.</span>
+</span><span id="GlobalWorkspaceBase.batch_gw_states-231"><a href="#GlobalWorkspaceBase.batch_gw_states-231"><span class="linenos">231</span></a>
+</span><span id="GlobalWorkspaceBase.batch_gw_states-232"><a href="#GlobalWorkspaceBase.batch_gw_states-232"><span class="linenos">232</span></a><span class="sd">        Args:</span>
+</span><span id="GlobalWorkspaceBase.batch_gw_states-233"><a href="#GlobalWorkspaceBase.batch_gw_states-233"><span class="linenos">233</span></a><span class="sd">            latent_domains (`LatentsT`): the batch of groups of domains</span>
+</span><span id="GlobalWorkspaceBase.batch_gw_states-234"><a href="#GlobalWorkspaceBase.batch_gw_states-234"><span class="linenos">234</span></a>
+</span><span id="GlobalWorkspaceBase.batch_gw_states-235"><a href="#GlobalWorkspaceBase.batch_gw_states-235"><span class="linenos">235</span></a><span class="sd">        Returns:</span>
+</span><span id="GlobalWorkspaceBase.batch_gw_states-236"><a href="#GlobalWorkspaceBase.batch_gw_states-236"><span class="linenos">236</span></a><span class="sd">            `dict[str, torch.Tensor]`: states for each domain.</span>
+</span><span id="GlobalWorkspaceBase.batch_gw_states-237"><a href="#GlobalWorkspaceBase.batch_gw_states-237"><span class="linenos">237</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="GlobalWorkspaceBase.batch_gw_states-238"><a href="#GlobalWorkspaceBase.batch_gw_states-238"><span class="linenos">238</span></a>        <span class="n">predictions</span><span class="p">:</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]</span> <span class="o">=</span> <span class="p">{}</span>
+</span><span id="GlobalWorkspaceBase.batch_gw_states-239"><a href="#GlobalWorkspaceBase.batch_gw_states-239"><span class="linenos">239</span></a>        <span class="k">for</span> <span class="n">domains</span><span class="p">,</span> <span class="n">latents</span> <span class="ow">in</span> <span class="n">latent_domains</span><span class="o">.</span><span class="n">items</span><span class="p">():</span>
+</span><span id="GlobalWorkspaceBase.batch_gw_states-240"><a href="#GlobalWorkspaceBase.batch_gw_states-240"><span class="linenos">240</span></a>            <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">domains</span><span class="p">)</span> <span class="o">&gt;</span> <span class="mi">1</span><span class="p">:</span>
+</span><span id="GlobalWorkspaceBase.batch_gw_states-241"><a href="#GlobalWorkspaceBase.batch_gw_states-241"><span class="linenos">241</span></a>                <span class="k">continue</span>
+</span><span id="GlobalWorkspaceBase.batch_gw_states-242"><a href="#GlobalWorkspaceBase.batch_gw_states-242"><span class="linenos">242</span></a>            <span class="n">domain_name</span> <span class="o">=</span> <span class="nb">list</span><span class="p">(</span><span class="n">domains</span><span class="p">)[</span><span class="mi">0</span><span class="p">]</span>
+</span><span id="GlobalWorkspaceBase.batch_gw_states-243"><a href="#GlobalWorkspaceBase.batch_gw_states-243"><span class="linenos">243</span></a>            <span class="n">z</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">gw_mod</span><span class="o">.</span><span class="n">encode_and_fuse</span><span class="p">(</span>
+</span><span id="GlobalWorkspaceBase.batch_gw_states-244"><a href="#GlobalWorkspaceBase.batch_gw_states-244"><span class="linenos">244</span></a>                <span class="n">latents</span><span class="p">,</span> <span class="n">selection_module</span><span class="o">=</span><span class="bp">self</span><span class="o">.</span><span class="n">selection_mod</span>
+</span><span id="GlobalWorkspaceBase.batch_gw_states-245"><a href="#GlobalWorkspaceBase.batch_gw_states-245"><span class="linenos">245</span></a>            <span class="p">)</span>
+</span><span id="GlobalWorkspaceBase.batch_gw_states-246"><a href="#GlobalWorkspaceBase.batch_gw_states-246"><span class="linenos">246</span></a>            <span class="n">predictions</span><span class="p">[</span><span class="n">domain_name</span><span class="p">]</span> <span class="o">=</span> <span class="n">z</span>
+</span><span id="GlobalWorkspaceBase.batch_gw_states-247"><a href="#GlobalWorkspaceBase.batch_gw_states-247"><span class="linenos">247</span></a>        <span class="k">return</span> <span class="n">predictions</span>
+</span></pre></div>
+
+
+            <div class="docstring"><p>Comptues GW states of a batch of groups of domains.</p>
+
+<h6 id="arguments">Arguments:</h6>
+
+<ul>
+<li><strong>latent_domains (<code>LatentsT</code>):</strong>  the batch of groups of domains</li>
+</ul>
+
+<h6 id="returns">Returns:</h6>
+
+<blockquote>
+  <p><code>dict[str, torch.Tensor]</code>: states for each domain.</p>
+</blockquote>
+</div>
+
+
+                            </div>
+                            <div id="GlobalWorkspaceBase.encode_domain" class="classattr">
+                                        <input id="GlobalWorkspaceBase.encode_domain-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
+<div class="attr function">
+            
+        <span class="def">def</span>
+        <span class="name">encode_domain</span><span class="signature pdoc-code condensed">(<span class="param"><span class="bp">self</span>, </span><span class="param"><span class="n">domain</span><span class="p">:</span> <span class="n">Any</span>, </span><span class="param"><span class="n">name</span><span class="p">:</span> <span class="nb">str</span></span><span class="return-annotation">) -> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span>:</span></span>
+
+                <label class="view-source-button" for="GlobalWorkspaceBase.encode_domain-view-source"><span>View Source</span></label>
+
+    </div>
+    <a class="headerlink" href="#GlobalWorkspaceBase.encode_domain"></a>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="GlobalWorkspaceBase.encode_domain-249"><a href="#GlobalWorkspaceBase.encode_domain-249"><span class="linenos">249</span></a>    <span class="k">def</span> <span class="nf">encode_domain</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">domain</span><span class="p">:</span> <span class="n">Any</span><span class="p">,</span> <span class="n">name</span><span class="p">:</span> <span class="nb">str</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">:</span>
+</span><span id="GlobalWorkspaceBase.encode_domain-250"><a href="#GlobalWorkspaceBase.encode_domain-250"><span class="linenos">250</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="GlobalWorkspaceBase.encode_domain-251"><a href="#GlobalWorkspaceBase.encode_domain-251"><span class="linenos">251</span></a><span class="sd">        Encodes a domain from the domain data into the unimodal representation.</span>
+</span><span id="GlobalWorkspaceBase.encode_domain-252"><a href="#GlobalWorkspaceBase.encode_domain-252"><span class="linenos">252</span></a>
+</span><span id="GlobalWorkspaceBase.encode_domain-253"><a href="#GlobalWorkspaceBase.encode_domain-253"><span class="linenos">253</span></a><span class="sd">        This is a convenient proxy for the `DomainModule.encode` method and is</span>
+</span><span id="GlobalWorkspaceBase.encode_domain-254"><a href="#GlobalWorkspaceBase.encode_domain-254"><span class="linenos">254</span></a><span class="sd">        equivalent to:</span>
+</span><span id="GlobalWorkspaceBase.encode_domain-255"><a href="#GlobalWorkspaceBase.encode_domain-255"><span class="linenos">255</span></a><span class="sd">        ```python</span>
+</span><span id="GlobalWorkspaceBase.encode_domain-256"><a href="#GlobalWorkspaceBase.encode_domain-256"><span class="linenos">256</span></a><span class="sd">        self.domain_mods[name].encode(domain)</span>
+</span><span id="GlobalWorkspaceBase.encode_domain-257"><a href="#GlobalWorkspaceBase.encode_domain-257"><span class="linenos">257</span></a><span class="sd">        ```</span>
+</span><span id="GlobalWorkspaceBase.encode_domain-258"><a href="#GlobalWorkspaceBase.encode_domain-258"><span class="linenos">258</span></a>
+</span><span id="GlobalWorkspaceBase.encode_domain-259"><a href="#GlobalWorkspaceBase.encode_domain-259"><span class="linenos">259</span></a><span class="sd">        Args:</span>
+</span><span id="GlobalWorkspaceBase.encode_domain-260"><a href="#GlobalWorkspaceBase.encode_domain-260"><span class="linenos">260</span></a><span class="sd">            domain (`Any`): the domain data</span>
+</span><span id="GlobalWorkspaceBase.encode_domain-261"><a href="#GlobalWorkspaceBase.encode_domain-261"><span class="linenos">261</span></a><span class="sd">            name (`str`): domain name to encode</span>
+</span><span id="GlobalWorkspaceBase.encode_domain-262"><a href="#GlobalWorkspaceBase.encode_domain-262"><span class="linenos">262</span></a>
+</span><span id="GlobalWorkspaceBase.encode_domain-263"><a href="#GlobalWorkspaceBase.encode_domain-263"><span class="linenos">263</span></a><span class="sd">        Returns:</span>
+</span><span id="GlobalWorkspaceBase.encode_domain-264"><a href="#GlobalWorkspaceBase.encode_domain-264"><span class="linenos">264</span></a><span class="sd">            `torch.Tensor`: the domain&#39;s unimodal representation.</span>
+</span><span id="GlobalWorkspaceBase.encode_domain-265"><a href="#GlobalWorkspaceBase.encode_domain-265"><span class="linenos">265</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="GlobalWorkspaceBase.encode_domain-266"><a href="#GlobalWorkspaceBase.encode_domain-266"><span class="linenos">266</span></a>        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">domain_mods</span><span class="p">[</span><span class="n">name</span><span class="p">]</span><span class="o">.</span><span class="n">encode</span><span class="p">(</span><span class="n">domain</span><span class="p">)</span>
+</span></pre></div>
+
+
+            <div class="docstring"><p>Encodes a domain from the domain data into the unimodal representation.</p>
+
+<p>This is a convenient proxy for the <code>DomainModule.encode</code> method and is
+equivalent to:</p>
+
+<div class="pdoc-code codehilite">
+<pre><span></span><code><span class="bp">self</span><span class="o">.</span><span class="n">domain_mods</span><span class="p">[</span><span class="n">name</span><span class="p">]</span><span class="o">.</span><span class="n">encode</span><span class="p">(</span><span class="n">domain</span><span class="p">)</span>
+</code></pre>
+</div>
+
+<h6 id="arguments">Arguments:</h6>
+
+<ul>
+<li><strong>domain (<code>Any</code>):</strong>  the domain data</li>
+<li><strong>name (<code>str</code>):</strong>  domain name to encode</li>
+</ul>
+
+<h6 id="returns">Returns:</h6>
+
+<blockquote>
+  <p><code>torch.Tensor</code>: the domain's unimodal representation.</p>
+</blockquote>
+</div>
+
+
+                            </div>
+                            <div id="GlobalWorkspaceBase.encode_domains" class="classattr">
+                                        <input id="GlobalWorkspaceBase.encode_domains-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
+<div class="attr function">
+            
+        <span class="def">def</span>
+        <span class="name">encode_domains</span><span class="signature pdoc-code multiline">(<span class="param">	<span class="bp">self</span>,</span><span class="param">	<span class="n">batch</span><span class="p">:</span> <span class="n">collections</span><span class="o">.</span><span class="n">abc</span><span class="o">.</span><span class="n">Mapping</span><span class="p">[</span><span class="nb">frozenset</span><span class="p">[</span><span class="nb">str</span><span class="p">],</span> <span class="n">collections</span><span class="o">.</span><span class="n">abc</span><span class="o">.</span><span class="n">Mapping</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">typing</span><span class="o">.</span><span class="n">Any</span><span class="p">]]</span></span><span class="return-annotation">) -> <span class="nb">dict</span><span class="p">[</span><span class="nb">frozenset</span><span class="p">[</span><span class="nb">str</span><span class="p">],</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]]</span>:</span></span>
+
+                <label class="view-source-button" for="GlobalWorkspaceBase.encode_domains-view-source"><span>View Source</span></label>
+
+    </div>
+    <a class="headerlink" href="#GlobalWorkspaceBase.encode_domains"></a>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="GlobalWorkspaceBase.encode_domains-268"><a href="#GlobalWorkspaceBase.encode_domains-268"><span class="linenos">268</span></a>    <span class="k">def</span> <span class="nf">encode_domains</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">batch</span><span class="p">:</span> <span class="n">RawDomainGroupsT</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">LatentsDomainGroupsDT</span><span class="p">:</span>
+</span><span id="GlobalWorkspaceBase.encode_domains-269"><a href="#GlobalWorkspaceBase.encode_domains-269"><span class="linenos">269</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="GlobalWorkspaceBase.encode_domains-270"><a href="#GlobalWorkspaceBase.encode_domains-270"><span class="linenos">270</span></a><span class="sd">        Encode all domains in the batch.</span>
+</span><span id="GlobalWorkspaceBase.encode_domains-271"><a href="#GlobalWorkspaceBase.encode_domains-271"><span class="linenos">271</span></a>
+</span><span id="GlobalWorkspaceBase.encode_domains-272"><a href="#GlobalWorkspaceBase.encode_domains-272"><span class="linenos">272</span></a><span class="sd">        Args:</span>
+</span><span id="GlobalWorkspaceBase.encode_domains-273"><a href="#GlobalWorkspaceBase.encode_domains-273"><span class="linenos">273</span></a><span class="sd">            batch (`RawDomainGroupsT`): the batch of</span>
+</span><span id="GlobalWorkspaceBase.encode_domains-274"><a href="#GlobalWorkspaceBase.encode_domains-274"><span class="linenos">274</span></a><span class="sd">                domain groups with raw unimodal data to encode into groups of latent</span>
+</span><span id="GlobalWorkspaceBase.encode_domains-275"><a href="#GlobalWorkspaceBase.encode_domains-275"><span class="linenos">275</span></a><span class="sd">                representations.</span>
+</span><span id="GlobalWorkspaceBase.encode_domains-276"><a href="#GlobalWorkspaceBase.encode_domains-276"><span class="linenos">276</span></a>
+</span><span id="GlobalWorkspaceBase.encode_domains-277"><a href="#GlobalWorkspaceBase.encode_domains-277"><span class="linenos">277</span></a><span class="sd">        Returns:</span>
+</span><span id="GlobalWorkspaceBase.encode_domains-278"><a href="#GlobalWorkspaceBase.encode_domains-278"><span class="linenos">278</span></a><span class="sd">            `LatentsDomainGroupsDT`: the domains&#39; unimodal representations.</span>
+</span><span id="GlobalWorkspaceBase.encode_domains-279"><a href="#GlobalWorkspaceBase.encode_domains-279"><span class="linenos">279</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="GlobalWorkspaceBase.encode_domains-280"><a href="#GlobalWorkspaceBase.encode_domains-280"><span class="linenos">280</span></a>        <span class="k">return</span> <span class="p">{</span>
+</span><span id="GlobalWorkspaceBase.encode_domains-281"><a href="#GlobalWorkspaceBase.encode_domains-281"><span class="linenos">281</span></a>            <span class="n">domains</span><span class="p">:</span> <span class="p">{</span>
+</span><span id="GlobalWorkspaceBase.encode_domains-282"><a href="#GlobalWorkspaceBase.encode_domains-282"><span class="linenos">282</span></a>                <span class="n">name</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">domain_mods</span><span class="p">[</span><span class="n">name</span><span class="p">]</span><span class="o">.</span><span class="n">encode</span><span class="p">(</span><span class="n">domain</span><span class="p">)</span>
+</span><span id="GlobalWorkspaceBase.encode_domains-283"><a href="#GlobalWorkspaceBase.encode_domains-283"><span class="linenos">283</span></a>                <span class="k">for</span> <span class="n">name</span><span class="p">,</span> <span class="n">domain</span> <span class="ow">in</span> <span class="n">data</span><span class="o">.</span><span class="n">items</span><span class="p">()</span>
+</span><span id="GlobalWorkspaceBase.encode_domains-284"><a href="#GlobalWorkspaceBase.encode_domains-284"><span class="linenos">284</span></a>            <span class="p">}</span>
+</span><span id="GlobalWorkspaceBase.encode_domains-285"><a href="#GlobalWorkspaceBase.encode_domains-285"><span class="linenos">285</span></a>            <span class="k">for</span> <span class="n">domains</span><span class="p">,</span> <span class="n">data</span> <span class="ow">in</span> <span class="n">batch</span><span class="o">.</span><span class="n">items</span><span class="p">()</span>
+</span><span id="GlobalWorkspaceBase.encode_domains-286"><a href="#GlobalWorkspaceBase.encode_domains-286"><span class="linenos">286</span></a>        <span class="p">}</span>
+</span></pre></div>
+
+
+            <div class="docstring"><p>Encode all domains in the batch.</p>
+
+<h6 id="arguments">Arguments:</h6>
+
+<ul>
+<li><strong>batch (<code>RawDomainGroupsT</code>):</strong>  the batch of
+domain groups with raw unimodal data to encode into groups of latent
+representations.</li>
+</ul>
+
+<h6 id="returns">Returns:</h6>
+
+<blockquote>
+  <p><code>LatentsDomainGroupsDT</code>: the domains' unimodal representations.</p>
+</blockquote>
+</div>
+
+
+                            </div>
+                            <div id="GlobalWorkspaceBase.decode_domain" class="classattr">
+                                        <input id="GlobalWorkspaceBase.decode_domain-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
+<div class="attr function">
+            
+        <span class="def">def</span>
+        <span class="name">decode_domain</span><span class="signature pdoc-code condensed">(<span class="param"><span class="bp">self</span>, </span><span class="param"><span class="n">domain</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span>, </span><span class="param"><span class="n">name</span><span class="p">:</span> <span class="nb">str</span></span><span class="return-annotation">) -> <span class="n">Any</span>:</span></span>
+
+                <label class="view-source-button" for="GlobalWorkspaceBase.decode_domain-view-source"><span>View Source</span></label>
+
+    </div>
+    <a class="headerlink" href="#GlobalWorkspaceBase.decode_domain"></a>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="GlobalWorkspaceBase.decode_domain-288"><a href="#GlobalWorkspaceBase.decode_domain-288"><span class="linenos">288</span></a>    <span class="k">def</span> <span class="nf">decode_domain</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">domain</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">,</span> <span class="n">name</span><span class="p">:</span> <span class="nb">str</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">Any</span><span class="p">:</span>
+</span><span id="GlobalWorkspaceBase.decode_domain-289"><a href="#GlobalWorkspaceBase.decode_domain-289"><span class="linenos">289</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="GlobalWorkspaceBase.decode_domain-290"><a href="#GlobalWorkspaceBase.decode_domain-290"><span class="linenos">290</span></a><span class="sd">        Decodes a domain from the unimodal representation into the domain data.</span>
+</span><span id="GlobalWorkspaceBase.decode_domain-291"><a href="#GlobalWorkspaceBase.decode_domain-291"><span class="linenos">291</span></a>
+</span><span id="GlobalWorkspaceBase.decode_domain-292"><a href="#GlobalWorkspaceBase.decode_domain-292"><span class="linenos">292</span></a><span class="sd">        This is a convenient proxy for the `DomainModule.encode` method and is</span>
+</span><span id="GlobalWorkspaceBase.decode_domain-293"><a href="#GlobalWorkspaceBase.decode_domain-293"><span class="linenos">293</span></a><span class="sd">        equivalent to:</span>
+</span><span id="GlobalWorkspaceBase.decode_domain-294"><a href="#GlobalWorkspaceBase.decode_domain-294"><span class="linenos">294</span></a><span class="sd">        ```python</span>
+</span><span id="GlobalWorkspaceBase.decode_domain-295"><a href="#GlobalWorkspaceBase.decode_domain-295"><span class="linenos">295</span></a><span class="sd">        self.domain_mods[name].decode(domain)</span>
+</span><span id="GlobalWorkspaceBase.decode_domain-296"><a href="#GlobalWorkspaceBase.decode_domain-296"><span class="linenos">296</span></a><span class="sd">        ```</span>
+</span><span id="GlobalWorkspaceBase.decode_domain-297"><a href="#GlobalWorkspaceBase.decode_domain-297"><span class="linenos">297</span></a>
+</span><span id="GlobalWorkspaceBase.decode_domain-298"><a href="#GlobalWorkspaceBase.decode_domain-298"><span class="linenos">298</span></a><span class="sd">        Args:</span>
+</span><span id="GlobalWorkspaceBase.decode_domain-299"><a href="#GlobalWorkspaceBase.decode_domain-299"><span class="linenos">299</span></a><span class="sd">            domain (`torch.Tensor`): the domain data</span>
+</span><span id="GlobalWorkspaceBase.decode_domain-300"><a href="#GlobalWorkspaceBase.decode_domain-300"><span class="linenos">300</span></a><span class="sd">            name (`str`): domain name to encode</span>
+</span><span id="GlobalWorkspaceBase.decode_domain-301"><a href="#GlobalWorkspaceBase.decode_domain-301"><span class="linenos">301</span></a>
+</span><span id="GlobalWorkspaceBase.decode_domain-302"><a href="#GlobalWorkspaceBase.decode_domain-302"><span class="linenos">302</span></a><span class="sd">        Returns:</span>
+</span><span id="GlobalWorkspaceBase.decode_domain-303"><a href="#GlobalWorkspaceBase.decode_domain-303"><span class="linenos">303</span></a><span class="sd">            `Any`: the domain&#39;s raw data.</span>
+</span><span id="GlobalWorkspaceBase.decode_domain-304"><a href="#GlobalWorkspaceBase.decode_domain-304"><span class="linenos">304</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="GlobalWorkspaceBase.decode_domain-305"><a href="#GlobalWorkspaceBase.decode_domain-305"><span class="linenos">305</span></a>        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">domain_mods</span><span class="p">[</span><span class="n">name</span><span class="p">]</span><span class="o">.</span><span class="n">decode</span><span class="p">(</span><span class="n">domain</span><span class="p">)</span>
+</span></pre></div>
+
+
+            <div class="docstring"><p>Decodes a domain from the unimodal representation into the domain data.</p>
+
+<p>This is a convenient proxy for the <code>DomainModule.encode</code> method and is
+equivalent to:</p>
+
+<div class="pdoc-code codehilite">
+<pre><span></span><code><span class="bp">self</span><span class="o">.</span><span class="n">domain_mods</span><span class="p">[</span><span class="n">name</span><span class="p">]</span><span class="o">.</span><span class="n">decode</span><span class="p">(</span><span class="n">domain</span><span class="p">)</span>
+</code></pre>
+</div>
+
+<h6 id="arguments">Arguments:</h6>
+
+<ul>
+<li><strong>domain (<code>torch.Tensor</code>):</strong>  the domain data</li>
+<li><strong>name (<code>str</code>):</strong>  domain name to encode</li>
+</ul>
+
+<h6 id="returns">Returns:</h6>
+
+<blockquote>
+  <p><code>Any</code>: the domain's raw data.</p>
+</blockquote>
+</div>
+
+
+                            </div>
+                            <div id="GlobalWorkspaceBase.decode_domains" class="classattr">
+                                        <input id="GlobalWorkspaceBase.decode_domains-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
+<div class="attr function">
+            
+        <span class="def">def</span>
+        <span class="name">decode_domains</span><span class="signature pdoc-code multiline">(<span class="param">	<span class="bp">self</span>,</span><span class="param">	<span class="n">latents_domain</span><span class="p">:</span> <span class="n">collections</span><span class="o">.</span><span class="n">abc</span><span class="o">.</span><span class="n">Mapping</span><span class="p">[</span><span class="nb">frozenset</span><span class="p">[</span><span class="nb">str</span><span class="p">],</span> <span class="n">collections</span><span class="o">.</span><span class="n">abc</span><span class="o">.</span><span class="n">Mapping</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]]</span></span><span class="return-annotation">) -> <span class="nb">dict</span><span class="p">[</span><span class="nb">frozenset</span><span class="p">[</span><span class="nb">str</span><span class="p">],</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">typing</span><span class="o">.</span><span class="n">Any</span><span class="p">]]</span>:</span></span>
+
+                <label class="view-source-button" for="GlobalWorkspaceBase.decode_domains-view-source"><span>View Source</span></label>
+
+    </div>
+    <a class="headerlink" href="#GlobalWorkspaceBase.decode_domains"></a>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="GlobalWorkspaceBase.decode_domains-307"><a href="#GlobalWorkspaceBase.decode_domains-307"><span class="linenos">307</span></a>    <span class="k">def</span> <span class="nf">decode_domains</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">latents_domain</span><span class="p">:</span> <span class="n">LatentsDomainGroupsT</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">RawDomainGroupsDT</span><span class="p">:</span>
+</span><span id="GlobalWorkspaceBase.decode_domains-308"><a href="#GlobalWorkspaceBase.decode_domains-308"><span class="linenos">308</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="GlobalWorkspaceBase.decode_domains-309"><a href="#GlobalWorkspaceBase.decode_domains-309"><span class="linenos">309</span></a><span class="sd">        Decodes all domains in the batch.</span>
+</span><span id="GlobalWorkspaceBase.decode_domains-310"><a href="#GlobalWorkspaceBase.decode_domains-310"><span class="linenos">310</span></a>
+</span><span id="GlobalWorkspaceBase.decode_domains-311"><a href="#GlobalWorkspaceBase.decode_domains-311"><span class="linenos">311</span></a><span class="sd">        Args:</span>
+</span><span id="GlobalWorkspaceBase.decode_domains-312"><a href="#GlobalWorkspaceBase.decode_domains-312"><span class="linenos">312</span></a><span class="sd">            batch (`LatentsDomainGroupsT`): the batch of</span>
+</span><span id="GlobalWorkspaceBase.decode_domains-313"><a href="#GlobalWorkspaceBase.decode_domains-313"><span class="linenos">313</span></a><span class="sd">                domain groups with unimodal latent representation to decode into</span>
+</span><span id="GlobalWorkspaceBase.decode_domains-314"><a href="#GlobalWorkspaceBase.decode_domains-314"><span class="linenos">314</span></a><span class="sd">                groups of raw data.</span>
+</span><span id="GlobalWorkspaceBase.decode_domains-315"><a href="#GlobalWorkspaceBase.decode_domains-315"><span class="linenos">315</span></a>
+</span><span id="GlobalWorkspaceBase.decode_domains-316"><a href="#GlobalWorkspaceBase.decode_domains-316"><span class="linenos">316</span></a><span class="sd">        Returns:</span>
+</span><span id="GlobalWorkspaceBase.decode_domains-317"><a href="#GlobalWorkspaceBase.decode_domains-317"><span class="linenos">317</span></a><span class="sd">            `LatentsDomainGroupsDT`: the domains&#39; raw data.</span>
+</span><span id="GlobalWorkspaceBase.decode_domains-318"><a href="#GlobalWorkspaceBase.decode_domains-318"><span class="linenos">318</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="GlobalWorkspaceBase.decode_domains-319"><a href="#GlobalWorkspaceBase.decode_domains-319"><span class="linenos">319</span></a>        <span class="k">return</span> <span class="p">{</span>
+</span><span id="GlobalWorkspaceBase.decode_domains-320"><a href="#GlobalWorkspaceBase.decode_domains-320"><span class="linenos">320</span></a>            <span class="n">domains</span><span class="p">:</span> <span class="p">{</span>
+</span><span id="GlobalWorkspaceBase.decode_domains-321"><a href="#GlobalWorkspaceBase.decode_domains-321"><span class="linenos">321</span></a>                <span class="n">name</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">domain_mods</span><span class="p">[</span><span class="n">name</span><span class="p">]</span><span class="o">.</span><span class="n">decode</span><span class="p">(</span><span class="n">domain</span><span class="p">)</span>
+</span><span id="GlobalWorkspaceBase.decode_domains-322"><a href="#GlobalWorkspaceBase.decode_domains-322"><span class="linenos">322</span></a>                <span class="k">for</span> <span class="n">name</span><span class="p">,</span> <span class="n">domain</span> <span class="ow">in</span> <span class="n">latents</span><span class="o">.</span><span class="n">items</span><span class="p">()</span>
+</span><span id="GlobalWorkspaceBase.decode_domains-323"><a href="#GlobalWorkspaceBase.decode_domains-323"><span class="linenos">323</span></a>            <span class="p">}</span>
+</span><span id="GlobalWorkspaceBase.decode_domains-324"><a href="#GlobalWorkspaceBase.decode_domains-324"><span class="linenos">324</span></a>            <span class="k">for</span> <span class="n">domains</span><span class="p">,</span> <span class="n">latents</span> <span class="ow">in</span> <span class="n">latents_domain</span><span class="o">.</span><span class="n">items</span><span class="p">()</span>
+</span><span id="GlobalWorkspaceBase.decode_domains-325"><a href="#GlobalWorkspaceBase.decode_domains-325"><span class="linenos">325</span></a>        <span class="p">}</span>
+</span></pre></div>
+
+
+            <div class="docstring"><p>Decodes all domains in the batch.</p>
+
+<h6 id="arguments">Arguments:</h6>
+
+<ul>
+<li><strong>batch (<code>LatentsDomainGroupsT</code>):</strong>  the batch of
+domain groups with unimodal latent representation to decode into
+groups of raw data.</li>
+</ul>
+
+<h6 id="returns">Returns:</h6>
+
+<blockquote>
+  <p><code>LatentsDomainGroupsDT</code>: the domains' raw data.</p>
+</blockquote>
+</div>
+
+
+                            </div>
+                            <div id="GlobalWorkspaceBase.generic_step" class="classattr">
+                                        <input id="GlobalWorkspaceBase.generic_step-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
+<div class="attr function">
+            
+        <span class="def">def</span>
+        <span class="name">generic_step</span><span class="signature pdoc-code multiline">(<span class="param">	<span class="bp">self</span>,</span><span class="param">	<span class="n">batch</span><span class="p">:</span> <span class="n">collections</span><span class="o">.</span><span class="n">abc</span><span class="o">.</span><span class="n">Mapping</span><span class="p">[</span><span class="nb">frozenset</span><span class="p">[</span><span class="nb">str</span><span class="p">],</span> <span class="n">collections</span><span class="o">.</span><span class="n">abc</span><span class="o">.</span><span class="n">Mapping</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">typing</span><span class="o">.</span><span class="n">Any</span><span class="p">]]</span>,</span><span class="param">	<span class="n">mode</span><span class="p">:</span> <span class="n">Literal</span><span class="p">[</span><span class="s1">&#39;train&#39;</span><span class="p">,</span> <span class="s1">&#39;val&#39;</span><span class="p">,</span> <span class="s1">&#39;test&#39;</span><span class="p">,</span> <span class="s1">&#39;val/ood&#39;</span><span class="p">,</span> <span class="s1">&#39;test/ood&#39;</span><span class="p">]</span></span><span class="return-annotation">) -> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span>:</span></span>
+
+                <label class="view-source-button" for="GlobalWorkspaceBase.generic_step-view-source"><span>View Source</span></label>
+
+    </div>
+    <a class="headerlink" href="#GlobalWorkspaceBase.generic_step"></a>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="GlobalWorkspaceBase.generic_step-327"><a href="#GlobalWorkspaceBase.generic_step-327"><span class="linenos">327</span></a>    <span class="k">def</span> <span class="nf">generic_step</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">batch</span><span class="p">:</span> <span class="n">RawDomainGroupsT</span><span class="p">,</span> <span class="n">mode</span><span class="p">:</span> <span class="n">ModelModeT</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">:</span>
+</span><span id="GlobalWorkspaceBase.generic_step-328"><a href="#GlobalWorkspaceBase.generic_step-328"><span class="linenos">328</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="GlobalWorkspaceBase.generic_step-329"><a href="#GlobalWorkspaceBase.generic_step-329"><span class="linenos">329</span></a><span class="sd">        The generic step used in `training_step`, `validation_step` and</span>
+</span><span id="GlobalWorkspaceBase.generic_step-330"><a href="#GlobalWorkspaceBase.generic_step-330"><span class="linenos">330</span></a><span class="sd">        `test_step`.</span>
+</span><span id="GlobalWorkspaceBase.generic_step-331"><a href="#GlobalWorkspaceBase.generic_step-331"><span class="linenos">331</span></a>
+</span><span id="GlobalWorkspaceBase.generic_step-332"><a href="#GlobalWorkspaceBase.generic_step-332"><span class="linenos">332</span></a><span class="sd">        Args:</span>
+</span><span id="GlobalWorkspaceBase.generic_step-333"><a href="#GlobalWorkspaceBase.generic_step-333"><span class="linenos">333</span></a><span class="sd">            batch (`RawDomainGroupsT`): the batch of groups of raw unimodal data.</span>
+</span><span id="GlobalWorkspaceBase.generic_step-334"><a href="#GlobalWorkspaceBase.generic_step-334"><span class="linenos">334</span></a><span class="sd">            mode (`ModelModeT`):</span>
+</span><span id="GlobalWorkspaceBase.generic_step-335"><a href="#GlobalWorkspaceBase.generic_step-335"><span class="linenos">335</span></a>
+</span><span id="GlobalWorkspaceBase.generic_step-336"><a href="#GlobalWorkspaceBase.generic_step-336"><span class="linenos">336</span></a><span class="sd">        Returns:</span>
+</span><span id="GlobalWorkspaceBase.generic_step-337"><a href="#GlobalWorkspaceBase.generic_step-337"><span class="linenos">337</span></a><span class="sd">            `torch.Tensor`: the loss to train on.</span>
+</span><span id="GlobalWorkspaceBase.generic_step-338"><a href="#GlobalWorkspaceBase.generic_step-338"><span class="linenos">338</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="GlobalWorkspaceBase.generic_step-339"><a href="#GlobalWorkspaceBase.generic_step-339"><span class="linenos">339</span></a>        <span class="n">domain_latents</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">encode_domains</span><span class="p">(</span><span class="n">batch</span><span class="p">)</span>
+</span><span id="GlobalWorkspaceBase.generic_step-340"><a href="#GlobalWorkspaceBase.generic_step-340"><span class="linenos">340</span></a>        <span class="n">batch_size</span> <span class="o">=</span> <span class="n">groups_batch_size</span><span class="p">(</span><span class="n">domain_latents</span><span class="p">)</span>
+</span><span id="GlobalWorkspaceBase.generic_step-341"><a href="#GlobalWorkspaceBase.generic_step-341"><span class="linenos">341</span></a>
+</span><span id="GlobalWorkspaceBase.generic_step-342"><a href="#GlobalWorkspaceBase.generic_step-342"><span class="linenos">342</span></a>        <span class="n">loss_output</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">loss_mod</span><span class="o">.</span><span class="n">step</span><span class="p">(</span><span class="n">domain_latents</span><span class="p">,</span> <span class="n">mode</span><span class="p">)</span>
+</span><span id="GlobalWorkspaceBase.generic_step-343"><a href="#GlobalWorkspaceBase.generic_step-343"><span class="linenos">343</span></a>
+</span><span id="GlobalWorkspaceBase.generic_step-344"><a href="#GlobalWorkspaceBase.generic_step-344"><span class="linenos">344</span></a>        <span class="k">for</span> <span class="n">name</span><span class="p">,</span> <span class="n">metric</span> <span class="ow">in</span> <span class="n">loss_output</span><span class="o">.</span><span class="n">all</span><span class="o">.</span><span class="n">items</span><span class="p">():</span>
+</span><span id="GlobalWorkspaceBase.generic_step-345"><a href="#GlobalWorkspaceBase.generic_step-345"><span class="linenos">345</span></a>            <span class="bp">self</span><span class="o">.</span><span class="n">log</span><span class="p">(</span>
+</span><span id="GlobalWorkspaceBase.generic_step-346"><a href="#GlobalWorkspaceBase.generic_step-346"><span class="linenos">346</span></a>                <span class="sa">f</span><span class="s2">&quot;</span><span class="si">{</span><span class="n">mode</span><span class="si">}</span><span class="s2">/</span><span class="si">{</span><span class="n">name</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">,</span>
+</span><span id="GlobalWorkspaceBase.generic_step-347"><a href="#GlobalWorkspaceBase.generic_step-347"><span class="linenos">347</span></a>                <span class="n">metric</span><span class="p">,</span>
+</span><span id="GlobalWorkspaceBase.generic_step-348"><a href="#GlobalWorkspaceBase.generic_step-348"><span class="linenos">348</span></a>                <span class="n">batch_size</span><span class="o">=</span><span class="n">batch_size</span><span class="p">,</span>
+</span><span id="GlobalWorkspaceBase.generic_step-349"><a href="#GlobalWorkspaceBase.generic_step-349"><span class="linenos">349</span></a>                <span class="n">add_dataloader_idx</span><span class="o">=</span><span class="kc">False</span><span class="p">,</span>
+</span><span id="GlobalWorkspaceBase.generic_step-350"><a href="#GlobalWorkspaceBase.generic_step-350"><span class="linenos">350</span></a>            <span class="p">)</span>
+</span><span id="GlobalWorkspaceBase.generic_step-351"><a href="#GlobalWorkspaceBase.generic_step-351"><span class="linenos">351</span></a>
+</span><span id="GlobalWorkspaceBase.generic_step-352"><a href="#GlobalWorkspaceBase.generic_step-352"><span class="linenos">352</span></a>        <span class="k">return</span> <span class="n">loss_output</span><span class="o">.</span><span class="n">loss</span>
+</span></pre></div>
+
+
+            <div class="docstring"><p>The generic step used in <code><a href="#GlobalWorkspaceBase.training_step">training_step</a></code>, <code><a href="#GlobalWorkspaceBase.validation_step">validation_step</a></code> and
+<code><a href="#GlobalWorkspaceBase.test_step">test_step</a></code>.</p>
+
+<h6 id="arguments">Arguments:</h6>
+
+<ul>
+<li><strong>batch (<code>RawDomainGroupsT</code>):</strong>  the batch of groups of raw unimodal data.</li>
+<li><strong>mode (<code>ModelModeT</code>):</strong> </li>
+</ul>
+
+<h6 id="returns">Returns:</h6>
+
+<blockquote>
+  <p><code>torch.Tensor</code>: the loss to train on.</p>
+</blockquote>
+</div>
+
+
+                            </div>
+                            <div class="inherited">
+                                <h5>Inherited Members</h5>
+                                <dl>
+                                    <div><dt>lightning.pytorch.core.module.LightningModule</dt>
+                                <dd id="GlobalWorkspaceBase.__init__" class="function">LightningModule</dd>
+                <dd id="GlobalWorkspaceBase.CHECKPOINT_HYPER_PARAMS_KEY" class="variable">CHECKPOINT_HYPER_PARAMS_KEY</dd>
+                <dd id="GlobalWorkspaceBase.CHECKPOINT_HYPER_PARAMS_NAME" class="variable">CHECKPOINT_HYPER_PARAMS_NAME</dd>
+                <dd id="GlobalWorkspaceBase.CHECKPOINT_HYPER_PARAMS_TYPE" class="variable">CHECKPOINT_HYPER_PARAMS_TYPE</dd>
+                <dd id="GlobalWorkspaceBase.optimizers" class="function">optimizers</dd>
+                <dd id="GlobalWorkspaceBase.lr_schedulers" class="function">lr_schedulers</dd>
+                <dd id="GlobalWorkspaceBase.trainer" class="variable">trainer</dd>
+                <dd id="GlobalWorkspaceBase.fabric" class="variable">fabric</dd>
+                <dd id="GlobalWorkspaceBase.example_input_array" class="variable">example_input_array</dd>
+                <dd id="GlobalWorkspaceBase.current_epoch" class="variable">current_epoch</dd>
+                <dd id="GlobalWorkspaceBase.global_step" class="variable">global_step</dd>
+                <dd id="GlobalWorkspaceBase.global_rank" class="variable">global_rank</dd>
+                <dd id="GlobalWorkspaceBase.local_rank" class="variable">local_rank</dd>
+                <dd id="GlobalWorkspaceBase.on_gpu" class="variable">on_gpu</dd>
+                <dd id="GlobalWorkspaceBase.automatic_optimization" class="variable">automatic_optimization</dd>
+                <dd id="GlobalWorkspaceBase.strict_loading" class="variable">strict_loading</dd>
+                <dd id="GlobalWorkspaceBase.logger" class="variable">logger</dd>
+                <dd id="GlobalWorkspaceBase.loggers" class="variable">loggers</dd>
+                <dd id="GlobalWorkspaceBase.print" class="function">print</dd>
+                <dd id="GlobalWorkspaceBase.log" class="function">log</dd>
+                <dd id="GlobalWorkspaceBase.log_dict" class="function">log_dict</dd>
+                <dd id="GlobalWorkspaceBase.all_gather" class="function">all_gather</dd>
+                <dd id="GlobalWorkspaceBase.forward" class="function">forward</dd>
+                <dd id="GlobalWorkspaceBase.training_step" class="function">training_step</dd>
+                <dd id="GlobalWorkspaceBase.validation_step" class="function">validation_step</dd>
+                <dd id="GlobalWorkspaceBase.test_step" class="function">test_step</dd>
+                <dd id="GlobalWorkspaceBase.predict_step" class="function">predict_step</dd>
+                <dd id="GlobalWorkspaceBase.configure_callbacks" class="function">configure_callbacks</dd>
+                <dd id="GlobalWorkspaceBase.configure_optimizers" class="function">configure_optimizers</dd>
+                <dd id="GlobalWorkspaceBase.manual_backward" class="function">manual_backward</dd>
+                <dd id="GlobalWorkspaceBase.backward" class="function">backward</dd>
+                <dd id="GlobalWorkspaceBase.toggle_optimizer" class="function">toggle_optimizer</dd>
+                <dd id="GlobalWorkspaceBase.untoggle_optimizer" class="function">untoggle_optimizer</dd>
+                <dd id="GlobalWorkspaceBase.clip_gradients" class="function">clip_gradients</dd>
+                <dd id="GlobalWorkspaceBase.configure_gradient_clipping" class="function">configure_gradient_clipping</dd>
+                <dd id="GlobalWorkspaceBase.lr_scheduler_step" class="function">lr_scheduler_step</dd>
+                <dd id="GlobalWorkspaceBase.optimizer_step" class="function">optimizer_step</dd>
+                <dd id="GlobalWorkspaceBase.optimizer_zero_grad" class="function">optimizer_zero_grad</dd>
+                <dd id="GlobalWorkspaceBase.freeze" class="function">freeze</dd>
+                <dd id="GlobalWorkspaceBase.unfreeze" class="function">unfreeze</dd>
+                <dd id="GlobalWorkspaceBase.to_onnx" class="function">to_onnx</dd>
+                <dd id="GlobalWorkspaceBase.to_torchscript" class="function">to_torchscript</dd>
+                <dd id="GlobalWorkspaceBase.load_from_checkpoint" class="function">load_from_checkpoint</dd>
+
+            </div>
+            <div><dt>lightning.fabric.utilities.device_dtype_mixin._DeviceDtypeModuleMixin</dt>
+                                <dd id="GlobalWorkspaceBase.dtype" class="variable">dtype</dd>
+                <dd id="GlobalWorkspaceBase.device" class="variable">device</dd>
+                <dd id="GlobalWorkspaceBase.to" class="function">to</dd>
+                <dd id="GlobalWorkspaceBase.cuda" class="function">cuda</dd>
+                <dd id="GlobalWorkspaceBase.cpu" class="function">cpu</dd>
+                <dd id="GlobalWorkspaceBase.type" class="function">type</dd>
+                <dd id="GlobalWorkspaceBase.float" class="function">float</dd>
+                <dd id="GlobalWorkspaceBase.double" class="function">double</dd>
+                <dd id="GlobalWorkspaceBase.half" class="function">half</dd>
+
+            </div>
+            <div><dt>lightning.pytorch.core.mixins.hparams_mixin.HyperparametersMixin</dt>
+                                <dd id="GlobalWorkspaceBase.save_hyperparameters" class="function">save_hyperparameters</dd>
+                <dd id="GlobalWorkspaceBase.hparams" class="variable">hparams</dd>
+                <dd id="GlobalWorkspaceBase.hparams_initial" class="variable">hparams_initial</dd>
+
+            </div>
+            <div><dt>lightning.pytorch.core.hooks.ModelHooks</dt>
+                                <dd id="GlobalWorkspaceBase.on_fit_start" class="function">on_fit_start</dd>
+                <dd id="GlobalWorkspaceBase.on_fit_end" class="function">on_fit_end</dd>
+                <dd id="GlobalWorkspaceBase.on_train_start" class="function">on_train_start</dd>
+                <dd id="GlobalWorkspaceBase.on_train_end" class="function">on_train_end</dd>
+                <dd id="GlobalWorkspaceBase.on_validation_start" class="function">on_validation_start</dd>
+                <dd id="GlobalWorkspaceBase.on_validation_end" class="function">on_validation_end</dd>
+                <dd id="GlobalWorkspaceBase.on_test_start" class="function">on_test_start</dd>
+                <dd id="GlobalWorkspaceBase.on_test_end" class="function">on_test_end</dd>
+                <dd id="GlobalWorkspaceBase.on_predict_start" class="function">on_predict_start</dd>
+                <dd id="GlobalWorkspaceBase.on_predict_end" class="function">on_predict_end</dd>
+                <dd id="GlobalWorkspaceBase.on_train_batch_start" class="function">on_train_batch_start</dd>
+                <dd id="GlobalWorkspaceBase.on_train_batch_end" class="function">on_train_batch_end</dd>
+                <dd id="GlobalWorkspaceBase.on_validation_batch_start" class="function">on_validation_batch_start</dd>
+                <dd id="GlobalWorkspaceBase.on_validation_batch_end" class="function">on_validation_batch_end</dd>
+                <dd id="GlobalWorkspaceBase.on_test_batch_start" class="function">on_test_batch_start</dd>
+                <dd id="GlobalWorkspaceBase.on_test_batch_end" class="function">on_test_batch_end</dd>
+                <dd id="GlobalWorkspaceBase.on_predict_batch_start" class="function">on_predict_batch_start</dd>
+                <dd id="GlobalWorkspaceBase.on_predict_batch_end" class="function">on_predict_batch_end</dd>
+                <dd id="GlobalWorkspaceBase.on_validation_model_zero_grad" class="function">on_validation_model_zero_grad</dd>
+                <dd id="GlobalWorkspaceBase.on_validation_model_eval" class="function">on_validation_model_eval</dd>
+                <dd id="GlobalWorkspaceBase.on_validation_model_train" class="function">on_validation_model_train</dd>
+                <dd id="GlobalWorkspaceBase.on_test_model_eval" class="function">on_test_model_eval</dd>
+                <dd id="GlobalWorkspaceBase.on_test_model_train" class="function">on_test_model_train</dd>
+                <dd id="GlobalWorkspaceBase.on_predict_model_eval" class="function">on_predict_model_eval</dd>
+                <dd id="GlobalWorkspaceBase.on_train_epoch_start" class="function">on_train_epoch_start</dd>
+                <dd id="GlobalWorkspaceBase.on_train_epoch_end" class="function">on_train_epoch_end</dd>
+                <dd id="GlobalWorkspaceBase.on_validation_epoch_start" class="function">on_validation_epoch_start</dd>
+                <dd id="GlobalWorkspaceBase.on_validation_epoch_end" class="function">on_validation_epoch_end</dd>
+                <dd id="GlobalWorkspaceBase.on_test_epoch_start" class="function">on_test_epoch_start</dd>
+                <dd id="GlobalWorkspaceBase.on_test_epoch_end" class="function">on_test_epoch_end</dd>
+                <dd id="GlobalWorkspaceBase.on_predict_epoch_start" class="function">on_predict_epoch_start</dd>
+                <dd id="GlobalWorkspaceBase.on_predict_epoch_end" class="function">on_predict_epoch_end</dd>
+                <dd id="GlobalWorkspaceBase.on_before_zero_grad" class="function">on_before_zero_grad</dd>
+                <dd id="GlobalWorkspaceBase.on_before_backward" class="function">on_before_backward</dd>
+                <dd id="GlobalWorkspaceBase.on_after_backward" class="function">on_after_backward</dd>
+                <dd id="GlobalWorkspaceBase.on_before_optimizer_step" class="function">on_before_optimizer_step</dd>
+                <dd id="GlobalWorkspaceBase.configure_sharded_model" class="function">configure_sharded_model</dd>
+                <dd id="GlobalWorkspaceBase.configure_model" class="function">configure_model</dd>
+
+            </div>
+            <div><dt>lightning.pytorch.core.hooks.DataHooks</dt>
+                                <dd id="GlobalWorkspaceBase.prepare_data_per_node" class="variable">prepare_data_per_node</dd>
+                <dd id="GlobalWorkspaceBase.allow_zero_length_dataloader_with_multiple_devices" class="variable">allow_zero_length_dataloader_with_multiple_devices</dd>
+                <dd id="GlobalWorkspaceBase.prepare_data" class="function">prepare_data</dd>
+                <dd id="GlobalWorkspaceBase.setup" class="function">setup</dd>
+                <dd id="GlobalWorkspaceBase.teardown" class="function">teardown</dd>
+                <dd id="GlobalWorkspaceBase.train_dataloader" class="function">train_dataloader</dd>
+                <dd id="GlobalWorkspaceBase.test_dataloader" class="function">test_dataloader</dd>
+                <dd id="GlobalWorkspaceBase.val_dataloader" class="function">val_dataloader</dd>
+                <dd id="GlobalWorkspaceBase.predict_dataloader" class="function">predict_dataloader</dd>
+                <dd id="GlobalWorkspaceBase.transfer_batch_to_device" class="function">transfer_batch_to_device</dd>
+                <dd id="GlobalWorkspaceBase.on_before_batch_transfer" class="function">on_before_batch_transfer</dd>
+                <dd id="GlobalWorkspaceBase.on_after_batch_transfer" class="function">on_after_batch_transfer</dd>
+
+            </div>
+            <div><dt>lightning.pytorch.core.hooks.CheckpointHooks</dt>
+                                <dd id="GlobalWorkspaceBase.on_load_checkpoint" class="function">on_load_checkpoint</dd>
+                <dd id="GlobalWorkspaceBase.on_save_checkpoint" class="function">on_save_checkpoint</dd>
+
+            </div>
+            <div><dt>torch.nn.modules.module.Module</dt>
+                                <dd id="GlobalWorkspaceBase.dump_patches" class="variable">dump_patches</dd>
+                <dd id="GlobalWorkspaceBase.training" class="variable">training</dd>
+                <dd id="GlobalWorkspaceBase.call_super_init" class="variable">call_super_init</dd>
+                <dd id="GlobalWorkspaceBase.register_buffer" class="function">register_buffer</dd>
+                <dd id="GlobalWorkspaceBase.register_parameter" class="function">register_parameter</dd>
+                <dd id="GlobalWorkspaceBase.add_module" class="function">add_module</dd>
+                <dd id="GlobalWorkspaceBase.register_module" class="function">register_module</dd>
+                <dd id="GlobalWorkspaceBase.get_submodule" class="function">get_submodule</dd>
+                <dd id="GlobalWorkspaceBase.get_parameter" class="function">get_parameter</dd>
+                <dd id="GlobalWorkspaceBase.get_buffer" class="function">get_buffer</dd>
+                <dd id="GlobalWorkspaceBase.get_extra_state" class="function">get_extra_state</dd>
+                <dd id="GlobalWorkspaceBase.set_extra_state" class="function">set_extra_state</dd>
+                <dd id="GlobalWorkspaceBase.apply" class="function">apply</dd>
+                <dd id="GlobalWorkspaceBase.ipu" class="function">ipu</dd>
+                <dd id="GlobalWorkspaceBase.xpu" class="function">xpu</dd>
+                <dd id="GlobalWorkspaceBase.bfloat16" class="function">bfloat16</dd>
+                <dd id="GlobalWorkspaceBase.to_empty" class="function">to_empty</dd>
+                <dd id="GlobalWorkspaceBase.register_full_backward_pre_hook" class="function">register_full_backward_pre_hook</dd>
+                <dd id="GlobalWorkspaceBase.register_backward_hook" class="function">register_backward_hook</dd>
+                <dd id="GlobalWorkspaceBase.register_full_backward_hook" class="function">register_full_backward_hook</dd>
+                <dd id="GlobalWorkspaceBase.register_forward_pre_hook" class="function">register_forward_pre_hook</dd>
+                <dd id="GlobalWorkspaceBase.register_forward_hook" class="function">register_forward_hook</dd>
+                <dd id="GlobalWorkspaceBase.register_state_dict_pre_hook" class="function">register_state_dict_pre_hook</dd>
+                <dd id="GlobalWorkspaceBase.state_dict" class="function">state_dict</dd>
+                <dd id="GlobalWorkspaceBase.register_load_state_dict_post_hook" class="function">register_load_state_dict_post_hook</dd>
+                <dd id="GlobalWorkspaceBase.load_state_dict" class="function">load_state_dict</dd>
+                <dd id="GlobalWorkspaceBase.parameters" class="function">parameters</dd>
+                <dd id="GlobalWorkspaceBase.named_parameters" class="function">named_parameters</dd>
+                <dd id="GlobalWorkspaceBase.buffers" class="function">buffers</dd>
+                <dd id="GlobalWorkspaceBase.named_buffers" class="function">named_buffers</dd>
+                <dd id="GlobalWorkspaceBase.children" class="function">children</dd>
+                <dd id="GlobalWorkspaceBase.named_children" class="function">named_children</dd>
+                <dd id="GlobalWorkspaceBase.modules" class="function">modules</dd>
+                <dd id="GlobalWorkspaceBase.named_modules" class="function">named_modules</dd>
+                <dd id="GlobalWorkspaceBase.train" class="function">train</dd>
+                <dd id="GlobalWorkspaceBase.eval" class="function">eval</dd>
+                <dd id="GlobalWorkspaceBase.requires_grad_" class="function">requires_grad_</dd>
+                <dd id="GlobalWorkspaceBase.zero_grad" class="function">zero_grad</dd>
+                <dd id="GlobalWorkspaceBase.share_memory" class="function">share_memory</dd>
+                <dd id="GlobalWorkspaceBase.extra_repr" class="function">extra_repr</dd>
+                <dd id="GlobalWorkspaceBase.compile" class="function">compile</dd>
+
+            </div>
+                                </dl>
+                            </div>
+                </section>
+                <section id="freeze_domain_modules">
+                            <input id="freeze_domain_modules-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
+<div class="attr function">
+            
+        <span class="def">def</span>
+        <span class="name">freeze_domain_modules</span><span class="signature pdoc-code multiline">(<span class="param">	<span class="n">domain_mods</span><span class="p">:</span> <span class="n">collections</span><span class="o">.</span><span class="n">abc</span><span class="o">.</span><span class="n">Mapping</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n"><a href="domain.html#DomainModule">shimmer.modules.domain.DomainModule</a></span><span class="p">]</span></span><span class="return-annotation">) -> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n"><a href="domain.html#DomainModule">shimmer.modules.domain.DomainModule</a></span><span class="p">]</span>:</span></span>
+
+                <label class="view-source-button" for="freeze_domain_modules-view-source"><span>View Source</span></label>
+
+    </div>
+    <a class="headerlink" href="#freeze_domain_modules"></a>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="freeze_domain_modules-422"><a href="#freeze_domain_modules-422"><span class="linenos">422</span></a><span class="k">def</span> <span class="nf">freeze_domain_modules</span><span class="p">(</span>
+</span><span id="freeze_domain_modules-423"><a href="#freeze_domain_modules-423"><span class="linenos">423</span></a>    <span class="n">domain_mods</span><span class="p">:</span> <span class="n">Mapping</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">DomainModule</span><span class="p">],</span>
+</span><span id="freeze_domain_modules-424"><a href="#freeze_domain_modules-424"><span class="linenos">424</span></a><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">DomainModule</span><span class="p">]:</span>
+</span><span id="freeze_domain_modules-425"><a href="#freeze_domain_modules-425"><span class="linenos">425</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="freeze_domain_modules-426"><a href="#freeze_domain_modules-426"><span class="linenos">426</span></a><span class="sd">    Freezes weights and set to eval mode the domain modules.</span>
+</span><span id="freeze_domain_modules-427"><a href="#freeze_domain_modules-427"><span class="linenos">427</span></a>
+</span><span id="freeze_domain_modules-428"><a href="#freeze_domain_modules-428"><span class="linenos">428</span></a><span class="sd">    .. note::</span>
+</span><span id="freeze_domain_modules-429"><a href="#freeze_domain_modules-429"><span class="linenos">429</span></a><span class="sd">        The output is casted as `dict[str, DomainModule]` type for better</span>
+</span><span id="freeze_domain_modules-430"><a href="#freeze_domain_modules-430"><span class="linenos">430</span></a><span class="sd">        auto-completion, but is actually a torch `ModuleDict`.</span>
+</span><span id="freeze_domain_modules-431"><a href="#freeze_domain_modules-431"><span class="linenos">431</span></a>
+</span><span id="freeze_domain_modules-432"><a href="#freeze_domain_modules-432"><span class="linenos">432</span></a><span class="sd">    Args:</span>
+</span><span id="freeze_domain_modules-433"><a href="#freeze_domain_modules-433"><span class="linenos">433</span></a><span class="sd">        domain_mods (`Mapping[str, DomainModule]`): mapping of domain modules to freeze</span>
+</span><span id="freeze_domain_modules-434"><a href="#freeze_domain_modules-434"><span class="linenos">434</span></a>
+</span><span id="freeze_domain_modules-435"><a href="#freeze_domain_modules-435"><span class="linenos">435</span></a><span class="sd">    Returns:</span>
+</span><span id="freeze_domain_modules-436"><a href="#freeze_domain_modules-436"><span class="linenos">436</span></a><span class="sd">        `ModuleDict`: frozen modules.</span>
+</span><span id="freeze_domain_modules-437"><a href="#freeze_domain_modules-437"><span class="linenos">437</span></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="freeze_domain_modules-438"><a href="#freeze_domain_modules-438"><span class="linenos">438</span></a>
+</span><span id="freeze_domain_modules-439"><a href="#freeze_domain_modules-439"><span class="linenos">439</span></a>    <span class="k">for</span> <span class="n">mod</span> <span class="ow">in</span> <span class="n">domain_mods</span><span class="o">.</span><span class="n">values</span><span class="p">():</span>
+</span><span id="freeze_domain_modules-440"><a href="#freeze_domain_modules-440"><span class="linenos">440</span></a>        <span class="n">mod</span><span class="o">.</span><span class="n">freeze</span><span class="p">()</span>
+</span><span id="freeze_domain_modules-441"><a href="#freeze_domain_modules-441"><span class="linenos">441</span></a>    <span class="c1"># Cast for better auto-completion at the expense of ModuleDict</span>
+</span><span id="freeze_domain_modules-442"><a href="#freeze_domain_modules-442"><span class="linenos">442</span></a>    <span class="k">return</span> <span class="n">cast</span><span class="p">(</span><span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">DomainModule</span><span class="p">],</span> <span class="n">ModuleDict</span><span class="p">(</span><span class="n">domain_mods</span><span class="p">))</span>
+</span></pre></div>
+
+
+            <div class="docstring"><p>Freezes weights and set to eval mode the domain modules.</p>
+
+<div class="pdoc-alert pdoc-alert-note">
+
+<p>The output is casted as <code>dict[str, DomainModule]</code> type for better
+auto-completion, but is actually a torch <code>ModuleDict</code>.</p>
+
+</div>
+
+<h6 id="arguments">Arguments:</h6>
+
+<ul>
+<li><strong>domain_mods (<code>Mapping[str, DomainModule]</code>):</strong>  mapping of domain modules to freeze</li>
+</ul>
+
+<h6 id="returns">Returns:</h6>
+
+<blockquote>
+  <p><code>ModuleDict</code>: frozen modules.</p>
+</blockquote>
+</div>
+
+
+                </section>
+                <section id="GWPredictions">
+                            <input id="GWPredictions-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
+<div class="attr class">
+            
+    <span class="def">class</span>
+    <span class="name">GWPredictions</span><wbr>(<span class="base">builtins.dict</span>):
+
+                <label class="view-source-button" for="GWPredictions-view-source"><span>View Source</span></label>
+
+    </div>
+    <a class="headerlink" href="#GWPredictions"></a>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="GWPredictions-445"><a href="#GWPredictions-445"><span class="linenos">445</span></a><span class="k">class</span> <span class="nc">GWPredictions</span><span class="p">(</span><span class="n">GWPredictionsBase</span><span class="p">):</span>
+</span><span id="GWPredictions-446"><a href="#GWPredictions-446"><span class="linenos">446</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;TypedDict of the output given when calling `GlobalWorkspaceBase.predict`&quot;&quot;&quot;</span>
+</span><span id="GWPredictions-447"><a href="#GWPredictions-447"><span class="linenos">447</span></a>
+</span><span id="GWPredictions-448"><a href="#GWPredictions-448"><span class="linenos">448</span></a>    <span class="n">demi_cycles</span><span class="p">:</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]</span>
+</span><span id="GWPredictions-449"><a href="#GWPredictions-449"><span class="linenos">449</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="GWPredictions-450"><a href="#GWPredictions-450"><span class="linenos">450</span></a><span class="sd">    Demi-cycle predictions of the model for each domain. Only computed on domain</span>
+</span><span id="GWPredictions-451"><a href="#GWPredictions-451"><span class="linenos">451</span></a><span class="sd">    groups with only one domain.</span>
+</span><span id="GWPredictions-452"><a href="#GWPredictions-452"><span class="linenos">452</span></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="GWPredictions-453"><a href="#GWPredictions-453"><span class="linenos">453</span></a>
+</span><span id="GWPredictions-454"><a href="#GWPredictions-454"><span class="linenos">454</span></a>    <span class="n">cycles</span><span class="p">:</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">tuple</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="nb">str</span><span class="p">],</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]</span>
+</span><span id="GWPredictions-455"><a href="#GWPredictions-455"><span class="linenos">455</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="GWPredictions-456"><a href="#GWPredictions-456"><span class="linenos">456</span></a><span class="sd">    Cycle predictions of the model from one domain through another one.</span>
+</span><span id="GWPredictions-457"><a href="#GWPredictions-457"><span class="linenos">457</span></a><span class="sd">    Only computed on domain groups with more than one domain.</span>
+</span><span id="GWPredictions-458"><a href="#GWPredictions-458"><span class="linenos">458</span></a><span class="sd">    The keys are tuple with start domain and intermediary domain.</span>
+</span><span id="GWPredictions-459"><a href="#GWPredictions-459"><span class="linenos">459</span></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="GWPredictions-460"><a href="#GWPredictions-460"><span class="linenos">460</span></a>
+</span><span id="GWPredictions-461"><a href="#GWPredictions-461"><span class="linenos">461</span></a>    <span class="n">translations</span><span class="p">:</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">tuple</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="nb">str</span><span class="p">],</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]</span>
+</span><span id="GWPredictions-462"><a href="#GWPredictions-462"><span class="linenos">462</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="GWPredictions-463"><a href="#GWPredictions-463"><span class="linenos">463</span></a><span class="sd">    Translation predictions of the model from one domain through another one.</span>
+</span><span id="GWPredictions-464"><a href="#GWPredictions-464"><span class="linenos">464</span></a>
+</span><span id="GWPredictions-465"><a href="#GWPredictions-465"><span class="linenos">465</span></a><span class="sd">    Only computed on domain groups with more than one domain.</span>
+</span><span id="GWPredictions-466"><a href="#GWPredictions-466"><span class="linenos">466</span></a><span class="sd">    The keys are tuples with start domain and target domain.</span>
+</span><span id="GWPredictions-467"><a href="#GWPredictions-467"><span class="linenos">467</span></a><span class="sd">    &quot;&quot;&quot;</span>
+</span></pre></div>
+
+
+            <div class="docstring"><p>TypedDict of the output given when calling <code>GlobalWorkspaceBase.predict</code></p>
+</div>
+
+
+                            <div id="GWPredictions.demi_cycles" class="classattr">
+                                <div class="attr variable">
+            <span class="name">demi_cycles</span><span class="annotation">: dict[str, torch.Tensor]</span>
+
+        
+    </div>
+    <a class="headerlink" href="#GWPredictions.demi_cycles"></a>
+    
+            <div class="docstring"><p>Demi-cycle predictions of the model for each domain. Only computed on domain
+groups with only one domain.</p>
+</div>
+
+
+                            </div>
+                            <div id="GWPredictions.cycles" class="classattr">
+                                <div class="attr variable">
+            <span class="name">cycles</span><span class="annotation">: dict[tuple[str, str], torch.Tensor]</span>
+
+        
+    </div>
+    <a class="headerlink" href="#GWPredictions.cycles"></a>
+    
+            <div class="docstring"><p>Cycle predictions of the model from one domain through another one.
+Only computed on domain groups with more than one domain.
+The keys are tuple with start domain and intermediary domain.</p>
+</div>
+
+
+                            </div>
+                            <div id="GWPredictions.translations" class="classattr">
+                                <div class="attr variable">
+            <span class="name">translations</span><span class="annotation">: dict[tuple[str, str], torch.Tensor]</span>
+
+        
+    </div>
+    <a class="headerlink" href="#GWPredictions.translations"></a>
+    
+            <div class="docstring"><p>Translation predictions of the model from one domain through another one.</p>
+
+<p>Only computed on domain groups with more than one domain.
+The keys are tuples with start domain and target domain.</p>
+</div>
+
+
+                            </div>
+                            <div id="GWPredictions.states" class="classattr">
+                                <div class="attr variable">
+            <span class="name">states</span><span class="annotation">: dict[str, torch.Tensor]</span>
+
+        
+    </div>
+    <a class="headerlink" href="#GWPredictions.states"></a>
+    
+    
+
+                            </div>
+                            <div class="inherited">
+                                <h5>Inherited Members</h5>
+                                <dl>
+                                    <div><dt>builtins.dict</dt>
+                                <dd id="GWPredictions.get" class="function">get</dd>
+                <dd id="GWPredictions.setdefault" class="function">setdefault</dd>
+                <dd id="GWPredictions.pop" class="function">pop</dd>
+                <dd id="GWPredictions.popitem" class="function">popitem</dd>
+                <dd id="GWPredictions.keys" class="function">keys</dd>
+                <dd id="GWPredictions.items" class="function">items</dd>
+                <dd id="GWPredictions.values" class="function">values</dd>
+                <dd id="GWPredictions.update" class="function">update</dd>
+                <dd id="GWPredictions.fromkeys" class="function">fromkeys</dd>
+                <dd id="GWPredictions.clear" class="function">clear</dd>
+                <dd id="GWPredictions.copy" class="function">copy</dd>
+
+            </div>
+                                </dl>
+                            </div>
+                </section>
+                <section id="GlobalWorkspace2Domains">
+                            <input id="GlobalWorkspace2Domains-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
+<div class="attr class">
+            
+    <span class="def">class</span>
+    <span class="name">GlobalWorkspace2Domains</span><wbr>(<span class="base"><a href="#GlobalWorkspaceBase">shimmer.modules.global_workspace.GlobalWorkspaceBase[shimmer.modules.gw_module.GWModule, shimmer.modules.selection.SingleDomainSelection, shimmer.modules.losses.GWLosses2Domains]</a></span>):
+
+                <label class="view-source-button" for="GlobalWorkspace2Domains-view-source"><span>View Source</span></label>
+
+    </div>
+    <a class="headerlink" href="#GlobalWorkspace2Domains"></a>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="GlobalWorkspace2Domains-470"><a href="#GlobalWorkspace2Domains-470"><span class="linenos">470</span></a><span class="k">class</span> <span class="nc">GlobalWorkspace2Domains</span><span class="p">(</span>
+</span><span id="GlobalWorkspace2Domains-471"><a href="#GlobalWorkspace2Domains-471"><span class="linenos">471</span></a>    <span class="n">GlobalWorkspaceBase</span><span class="p">[</span><span class="n">GWModule</span><span class="p">,</span> <span class="n">SingleDomainSelection</span><span class="p">,</span> <span class="n">GWLosses2Domains</span><span class="p">]</span>
+</span><span id="GlobalWorkspace2Domains-472"><a href="#GlobalWorkspace2Domains-472"><span class="linenos">472</span></a><span class="p">):</span>
+</span><span id="GlobalWorkspace2Domains-473"><a href="#GlobalWorkspace2Domains-473"><span class="linenos">473</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="GlobalWorkspace2Domains-474"><a href="#GlobalWorkspace2Domains-474"><span class="linenos">474</span></a><span class="sd">    A simple 2-domains max flavor of GlobalWorkspaceBase.</span>
+</span><span id="GlobalWorkspace2Domains-475"><a href="#GlobalWorkspace2Domains-475"><span class="linenos">475</span></a>
+</span><span id="GlobalWorkspace2Domains-476"><a href="#GlobalWorkspace2Domains-476"><span class="linenos">476</span></a><span class="sd">    This is used to simplify a Global Workspace instanciation and only overrides the</span>
+</span><span id="GlobalWorkspace2Domains-477"><a href="#GlobalWorkspace2Domains-477"><span class="linenos">477</span></a><span class="sd">    `__init__` method.</span>
+</span><span id="GlobalWorkspace2Domains-478"><a href="#GlobalWorkspace2Domains-478"><span class="linenos">478</span></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="GlobalWorkspace2Domains-479"><a href="#GlobalWorkspace2Domains-479"><span class="linenos">479</span></a>
+</span><span id="GlobalWorkspace2Domains-480"><a href="#GlobalWorkspace2Domains-480"><span class="linenos">480</span></a>    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span>
+</span><span id="GlobalWorkspace2Domains-481"><a href="#GlobalWorkspace2Domains-481"><span class="linenos">481</span></a>        <span class="bp">self</span><span class="p">,</span>
+</span><span id="GlobalWorkspace2Domains-482"><a href="#GlobalWorkspace2Domains-482"><span class="linenos">482</span></a>        <span class="n">domain_mods</span><span class="p">:</span> <span class="n">Mapping</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">DomainModule</span><span class="p">],</span>
+</span><span id="GlobalWorkspace2Domains-483"><a href="#GlobalWorkspace2Domains-483"><span class="linenos">483</span></a>        <span class="n">gw_encoders</span><span class="p">:</span> <span class="n">Mapping</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">Module</span><span class="p">],</span>
+</span><span id="GlobalWorkspace2Domains-484"><a href="#GlobalWorkspace2Domains-484"><span class="linenos">484</span></a>        <span class="n">gw_decoders</span><span class="p">:</span> <span class="n">Mapping</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">Module</span><span class="p">],</span>
+</span><span id="GlobalWorkspace2Domains-485"><a href="#GlobalWorkspace2Domains-485"><span class="linenos">485</span></a>        <span class="n">workspace_dim</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span>
+</span><span id="GlobalWorkspace2Domains-486"><a href="#GlobalWorkspace2Domains-486"><span class="linenos">486</span></a>        <span class="n">loss_coefs</span><span class="p">:</span> <span class="n">LossCoefs</span><span class="p">,</span>
+</span><span id="GlobalWorkspace2Domains-487"><a href="#GlobalWorkspace2Domains-487"><span class="linenos">487</span></a>        <span class="n">optim_lr</span><span class="p">:</span> <span class="nb">float</span> <span class="o">=</span> <span class="mf">1e-3</span><span class="p">,</span>
+</span><span id="GlobalWorkspace2Domains-488"><a href="#GlobalWorkspace2Domains-488"><span class="linenos">488</span></a>        <span class="n">optim_weight_decay</span><span class="p">:</span> <span class="nb">float</span> <span class="o">=</span> <span class="mf">0.0</span><span class="p">,</span>
+</span><span id="GlobalWorkspace2Domains-489"><a href="#GlobalWorkspace2Domains-489"><span class="linenos">489</span></a>        <span class="n">scheduler_args</span><span class="p">:</span> <span class="n">SchedulerArgs</span> <span class="o">|</span> <span class="kc">None</span> <span class="o">=</span> <span class="kc">None</span><span class="p">,</span>
+</span><span id="GlobalWorkspace2Domains-490"><a href="#GlobalWorkspace2Domains-490"><span class="linenos">490</span></a>        <span class="n">learn_logit_scale</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">False</span><span class="p">,</span>
+</span><span id="GlobalWorkspace2Domains-491"><a href="#GlobalWorkspace2Domains-491"><span class="linenos">491</span></a>        <span class="n">contrastive_loss</span><span class="p">:</span> <span class="n">ContrastiveLossType</span> <span class="o">|</span> <span class="kc">None</span> <span class="o">=</span> <span class="kc">None</span><span class="p">,</span>
+</span><span id="GlobalWorkspace2Domains-492"><a href="#GlobalWorkspace2Domains-492"><span class="linenos">492</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="GlobalWorkspace2Domains-493"><a href="#GlobalWorkspace2Domains-493"><span class="linenos">493</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="GlobalWorkspace2Domains-494"><a href="#GlobalWorkspace2Domains-494"><span class="linenos">494</span></a><span class="sd">        Initializes a Global Workspace</span>
+</span><span id="GlobalWorkspace2Domains-495"><a href="#GlobalWorkspace2Domains-495"><span class="linenos">495</span></a>
+</span><span id="GlobalWorkspace2Domains-496"><a href="#GlobalWorkspace2Domains-496"><span class="linenos">496</span></a><span class="sd">        Args:</span>
+</span><span id="GlobalWorkspace2Domains-497"><a href="#GlobalWorkspace2Domains-497"><span class="linenos">497</span></a><span class="sd">            domain_mods (`Mapping[str, DomainModule]`): mapping of the domains</span>
+</span><span id="GlobalWorkspace2Domains-498"><a href="#GlobalWorkspace2Domains-498"><span class="linenos">498</span></a><span class="sd">                connected to the GW. Keys are domain names, values are the</span>
+</span><span id="GlobalWorkspace2Domains-499"><a href="#GlobalWorkspace2Domains-499"><span class="linenos">499</span></a><span class="sd">                `DomainModule`.</span>
+</span><span id="GlobalWorkspace2Domains-500"><a href="#GlobalWorkspace2Domains-500"><span class="linenos">500</span></a><span class="sd">            gw_encoders (`Mapping[str, torch.nn.Module]`): mapping for each domain</span>
+</span><span id="GlobalWorkspace2Domains-501"><a href="#GlobalWorkspace2Domains-501"><span class="linenos">501</span></a><span class="sd">                name to a `torch.nn.Module` class which role is to encode a</span>
+</span><span id="GlobalWorkspace2Domains-502"><a href="#GlobalWorkspace2Domains-502"><span class="linenos">502</span></a><span class="sd">                unimodal latent representations into a GW representation (pre fusion).</span>
+</span><span id="GlobalWorkspace2Domains-503"><a href="#GlobalWorkspace2Domains-503"><span class="linenos">503</span></a><span class="sd">            gw_decoders (`Mapping[str, torch.nn.Module]`): mapping for each domain</span>
+</span><span id="GlobalWorkspace2Domains-504"><a href="#GlobalWorkspace2Domains-504"><span class="linenos">504</span></a><span class="sd">                name to a `torch.nn.Module` class which role is to decode a</span>
+</span><span id="GlobalWorkspace2Domains-505"><a href="#GlobalWorkspace2Domains-505"><span class="linenos">505</span></a><span class="sd">                GW representation into a unimodal latent representations.</span>
+</span><span id="GlobalWorkspace2Domains-506"><a href="#GlobalWorkspace2Domains-506"><span class="linenos">506</span></a><span class="sd">            workspace_dim (`int`): dimension of the GW.</span>
+</span><span id="GlobalWorkspace2Domains-507"><a href="#GlobalWorkspace2Domains-507"><span class="linenos">507</span></a><span class="sd">            loss_coefs (`LossCoefs`): loss coefficients</span>
+</span><span id="GlobalWorkspace2Domains-508"><a href="#GlobalWorkspace2Domains-508"><span class="linenos">508</span></a><span class="sd">            optim_lr (`float`): learning rate</span>
+</span><span id="GlobalWorkspace2Domains-509"><a href="#GlobalWorkspace2Domains-509"><span class="linenos">509</span></a><span class="sd">            optim_weight_decay (`float`): weight decay</span>
+</span><span id="GlobalWorkspace2Domains-510"><a href="#GlobalWorkspace2Domains-510"><span class="linenos">510</span></a><span class="sd">            scheduler_args (`SchedulerArgs | None`): optimization scheduler&#39;s arguments</span>
+</span><span id="GlobalWorkspace2Domains-511"><a href="#GlobalWorkspace2Domains-511"><span class="linenos">511</span></a><span class="sd">            learn_logit_scale (`bool`): whether to learn the contrastive learning</span>
+</span><span id="GlobalWorkspace2Domains-512"><a href="#GlobalWorkspace2Domains-512"><span class="linenos">512</span></a><span class="sd">                contrastive loss when using the default contrastive loss.</span>
+</span><span id="GlobalWorkspace2Domains-513"><a href="#GlobalWorkspace2Domains-513"><span class="linenos">513</span></a><span class="sd">            contrastive_loss (`ContrastiveLossType | None`): a contrastive loss</span>
+</span><span id="GlobalWorkspace2Domains-514"><a href="#GlobalWorkspace2Domains-514"><span class="linenos">514</span></a><span class="sd">                function used for alignment. `learn_logit_scale` will not affect custom</span>
+</span><span id="GlobalWorkspace2Domains-515"><a href="#GlobalWorkspace2Domains-515"><span class="linenos">515</span></a><span class="sd">                contrastive losses.</span>
+</span><span id="GlobalWorkspace2Domains-516"><a href="#GlobalWorkspace2Domains-516"><span class="linenos">516</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="GlobalWorkspace2Domains-517"><a href="#GlobalWorkspace2Domains-517"><span class="linenos">517</span></a>        <span class="n">domain_mods</span> <span class="o">=</span> <span class="n">freeze_domain_modules</span><span class="p">(</span><span class="n">domain_mods</span><span class="p">)</span>
+</span><span id="GlobalWorkspace2Domains-518"><a href="#GlobalWorkspace2Domains-518"><span class="linenos">518</span></a>
+</span><span id="GlobalWorkspace2Domains-519"><a href="#GlobalWorkspace2Domains-519"><span class="linenos">519</span></a>        <span class="n">gw_mod</span> <span class="o">=</span> <span class="n">GWModule</span><span class="p">(</span><span class="n">domain_mods</span><span class="p">,</span> <span class="n">workspace_dim</span><span class="p">,</span> <span class="n">gw_encoders</span><span class="p">,</span> <span class="n">gw_decoders</span><span class="p">)</span>
+</span><span id="GlobalWorkspace2Domains-520"><a href="#GlobalWorkspace2Domains-520"><span class="linenos">520</span></a>        <span class="k">if</span> <span class="n">contrastive_loss</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="GlobalWorkspace2Domains-521"><a href="#GlobalWorkspace2Domains-521"><span class="linenos">521</span></a>            <span class="n">contrastive_loss</span> <span class="o">=</span> <span class="n">ContrastiveLoss</span><span class="p">(</span>
+</span><span id="GlobalWorkspace2Domains-522"><a href="#GlobalWorkspace2Domains-522"><span class="linenos">522</span></a>                <span class="n">torch</span><span class="o">.</span><span class="n">tensor</span><span class="p">([</span><span class="mi">1</span> <span class="o">/</span> <span class="mf">0.07</span><span class="p">])</span><span class="o">.</span><span class="n">log</span><span class="p">(),</span> <span class="s2">&quot;mean&quot;</span><span class="p">,</span> <span class="n">learn_logit_scale</span>
+</span><span id="GlobalWorkspace2Domains-523"><a href="#GlobalWorkspace2Domains-523"><span class="linenos">523</span></a>            <span class="p">)</span>
+</span><span id="GlobalWorkspace2Domains-524"><a href="#GlobalWorkspace2Domains-524"><span class="linenos">524</span></a>        <span class="n">selection_mod</span> <span class="o">=</span> <span class="n">SingleDomainSelection</span><span class="p">()</span>
+</span><span id="GlobalWorkspace2Domains-525"><a href="#GlobalWorkspace2Domains-525"><span class="linenos">525</span></a>        <span class="n">loss_mod</span> <span class="o">=</span> <span class="n">GWLosses2Domains</span><span class="p">(</span>
+</span><span id="GlobalWorkspace2Domains-526"><a href="#GlobalWorkspace2Domains-526"><span class="linenos">526</span></a>            <span class="n">gw_mod</span><span class="p">,</span> <span class="n">selection_mod</span><span class="p">,</span> <span class="n">domain_mods</span><span class="p">,</span> <span class="n">loss_coefs</span><span class="p">,</span> <span class="n">contrastive_loss</span>
+</span><span id="GlobalWorkspace2Domains-527"><a href="#GlobalWorkspace2Domains-527"><span class="linenos">527</span></a>        <span class="p">)</span>
+</span><span id="GlobalWorkspace2Domains-528"><a href="#GlobalWorkspace2Domains-528"><span class="linenos">528</span></a>
+</span><span id="GlobalWorkspace2Domains-529"><a href="#GlobalWorkspace2Domains-529"><span class="linenos">529</span></a>        <span class="nb">super</span><span class="p">()</span><span class="o">.</span><span class="fm">__init__</span><span class="p">(</span>
+</span><span id="GlobalWorkspace2Domains-530"><a href="#GlobalWorkspace2Domains-530"><span class="linenos">530</span></a>            <span class="n">gw_mod</span><span class="p">,</span>
+</span><span id="GlobalWorkspace2Domains-531"><a href="#GlobalWorkspace2Domains-531"><span class="linenos">531</span></a>            <span class="n">selection_mod</span><span class="p">,</span>
+</span><span id="GlobalWorkspace2Domains-532"><a href="#GlobalWorkspace2Domains-532"><span class="linenos">532</span></a>            <span class="n">loss_mod</span><span class="p">,</span>
+</span><span id="GlobalWorkspace2Domains-533"><a href="#GlobalWorkspace2Domains-533"><span class="linenos">533</span></a>            <span class="n">optim_lr</span><span class="p">,</span>
+</span><span id="GlobalWorkspace2Domains-534"><a href="#GlobalWorkspace2Domains-534"><span class="linenos">534</span></a>            <span class="n">optim_weight_decay</span><span class="p">,</span>
+</span><span id="GlobalWorkspace2Domains-535"><a href="#GlobalWorkspace2Domains-535"><span class="linenos">535</span></a>            <span class="n">scheduler_args</span><span class="p">,</span>
+</span><span id="GlobalWorkspace2Domains-536"><a href="#GlobalWorkspace2Domains-536"><span class="linenos">536</span></a>        <span class="p">)</span>
+</span><span id="GlobalWorkspace2Domains-537"><a href="#GlobalWorkspace2Domains-537"><span class="linenos">537</span></a>
+</span><span id="GlobalWorkspace2Domains-538"><a href="#GlobalWorkspace2Domains-538"><span class="linenos">538</span></a>    <span class="k">def</span> <span class="nf">forward</span><span class="p">(</span>  <span class="c1"># type: ignore</span>
+</span><span id="GlobalWorkspace2Domains-539"><a href="#GlobalWorkspace2Domains-539"><span class="linenos">539</span></a>        <span class="bp">self</span><span class="p">,</span>
+</span><span id="GlobalWorkspace2Domains-540"><a href="#GlobalWorkspace2Domains-540"><span class="linenos">540</span></a>        <span class="n">latent_domains</span><span class="p">:</span> <span class="n">LatentsDomainGroupsT</span><span class="p">,</span>
+</span><span id="GlobalWorkspace2Domains-541"><a href="#GlobalWorkspace2Domains-541"><span class="linenos">541</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="n">GWPredictions</span><span class="p">:</span>
+</span><span id="GlobalWorkspace2Domains-542"><a href="#GlobalWorkspace2Domains-542"><span class="linenos">542</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="GlobalWorkspace2Domains-543"><a href="#GlobalWorkspace2Domains-543"><span class="linenos">543</span></a><span class="sd">        Computes demi-cycles, cycles, and translations.</span>
+</span><span id="GlobalWorkspace2Domains-544"><a href="#GlobalWorkspace2Domains-544"><span class="linenos">544</span></a>
+</span><span id="GlobalWorkspace2Domains-545"><a href="#GlobalWorkspace2Domains-545"><span class="linenos">545</span></a><span class="sd">        Args:</span>
+</span><span id="GlobalWorkspace2Domains-546"><a href="#GlobalWorkspace2Domains-546"><span class="linenos">546</span></a><span class="sd">            latent_domains (`LatentsT`): Groups of domains for the computation.</span>
+</span><span id="GlobalWorkspace2Domains-547"><a href="#GlobalWorkspace2Domains-547"><span class="linenos">547</span></a>
+</span><span id="GlobalWorkspace2Domains-548"><a href="#GlobalWorkspace2Domains-548"><span class="linenos">548</span></a><span class="sd">        Returns:</span>
+</span><span id="GlobalWorkspace2Domains-549"><a href="#GlobalWorkspace2Domains-549"><span class="linenos">549</span></a><span class="sd">            `GWPredictions`: the predictions on the batch.</span>
+</span><span id="GlobalWorkspace2Domains-550"><a href="#GlobalWorkspace2Domains-550"><span class="linenos">550</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="GlobalWorkspace2Domains-551"><a href="#GlobalWorkspace2Domains-551"><span class="linenos">551</span></a>        <span class="k">return</span> <span class="n">GWPredictions</span><span class="p">(</span>
+</span><span id="GlobalWorkspace2Domains-552"><a href="#GlobalWorkspace2Domains-552"><span class="linenos">552</span></a>            <span class="n">demi_cycles</span><span class="o">=</span><span class="n">batch_demi_cycles</span><span class="p">(</span>
+</span><span id="GlobalWorkspace2Domains-553"><a href="#GlobalWorkspace2Domains-553"><span class="linenos">553</span></a>                <span class="bp">self</span><span class="o">.</span><span class="n">gw_mod</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">selection_mod</span><span class="p">,</span> <span class="n">latent_domains</span>
+</span><span id="GlobalWorkspace2Domains-554"><a href="#GlobalWorkspace2Domains-554"><span class="linenos">554</span></a>            <span class="p">),</span>
+</span><span id="GlobalWorkspace2Domains-555"><a href="#GlobalWorkspace2Domains-555"><span class="linenos">555</span></a>            <span class="n">cycles</span><span class="o">=</span><span class="n">batch_cycles</span><span class="p">(</span>
+</span><span id="GlobalWorkspace2Domains-556"><a href="#GlobalWorkspace2Domains-556"><span class="linenos">556</span></a>                <span class="bp">self</span><span class="o">.</span><span class="n">gw_mod</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">selection_mod</span><span class="p">,</span> <span class="n">latent_domains</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">domain_mods</span><span class="o">.</span><span class="n">keys</span><span class="p">()</span>
+</span><span id="GlobalWorkspace2Domains-557"><a href="#GlobalWorkspace2Domains-557"><span class="linenos">557</span></a>            <span class="p">),</span>
+</span><span id="GlobalWorkspace2Domains-558"><a href="#GlobalWorkspace2Domains-558"><span class="linenos">558</span></a>            <span class="n">translations</span><span class="o">=</span><span class="n">batch_translations</span><span class="p">(</span>
+</span><span id="GlobalWorkspace2Domains-559"><a href="#GlobalWorkspace2Domains-559"><span class="linenos">559</span></a>                <span class="bp">self</span><span class="o">.</span><span class="n">gw_mod</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">selection_mod</span><span class="p">,</span> <span class="n">latent_domains</span>
+</span><span id="GlobalWorkspace2Domains-560"><a href="#GlobalWorkspace2Domains-560"><span class="linenos">560</span></a>            <span class="p">),</span>
+</span><span id="GlobalWorkspace2Domains-561"><a href="#GlobalWorkspace2Domains-561"><span class="linenos">561</span></a>            <span class="o">**</span><span class="nb">super</span><span class="p">()</span><span class="o">.</span><span class="n">forward</span><span class="p">(</span><span class="n">latent_domains</span><span class="p">),</span>
+</span><span id="GlobalWorkspace2Domains-562"><a href="#GlobalWorkspace2Domains-562"><span class="linenos">562</span></a>        <span class="p">)</span>
+</span></pre></div>
+
+
+            <div class="docstring"><p>A simple 2-domains max flavor of GlobalWorkspaceBase.</p>
+
+<p>This is used to simplify a Global Workspace instanciation and only overrides the
+<code><a href="#GlobalWorkspace2Domains.__init__">__init__</a></code> method.</p>
+</div>
+
+
+                            <div id="GlobalWorkspace2Domains.__init__" class="classattr">
+                                        <input id="GlobalWorkspace2Domains.__init__-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
+<div class="attr function">
+            
+        <span class="name">GlobalWorkspace2Domains</span><span class="signature pdoc-code multiline">(<span class="param">	<span class="n">domain_mods</span><span class="p">:</span> <span class="n">collections</span><span class="o">.</span><span class="n">abc</span><span class="o">.</span><span class="n">Mapping</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n"><a href="domain.html#DomainModule">shimmer.modules.domain.DomainModule</a></span><span class="p">]</span>,</span><span class="param">	<span class="n">gw_encoders</span><span class="p">:</span> <span class="n">collections</span><span class="o">.</span><span class="n">abc</span><span class="o">.</span><span class="n">Mapping</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">nn</span><span class="o">.</span><span class="n">modules</span><span class="o">.</span><span class="n">module</span><span class="o">.</span><span class="n">Module</span><span class="p">]</span>,</span><span class="param">	<span class="n">gw_decoders</span><span class="p">:</span> <span class="n">collections</span><span class="o">.</span><span class="n">abc</span><span class="o">.</span><span class="n">Mapping</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">nn</span><span class="o">.</span><span class="n">modules</span><span class="o">.</span><span class="n">module</span><span class="o">.</span><span class="n">Module</span><span class="p">]</span>,</span><span class="param">	<span class="n">workspace_dim</span><span class="p">:</span> <span class="nb">int</span>,</span><span class="param">	<span class="n">loss_coefs</span><span class="p">:</span> <span class="n"><a href="losses.html#LossCoefs">shimmer.modules.losses.LossCoefs</a></span>,</span><span class="param">	<span class="n">optim_lr</span><span class="p">:</span> <span class="nb">float</span> <span class="o">=</span> <span class="mf">0.001</span>,</span><span class="param">	<span class="n">optim_weight_decay</span><span class="p">:</span> <span class="nb">float</span> <span class="o">=</span> <span class="mf">0.0</span>,</span><span class="param">	<span class="n">scheduler_args</span><span class="p">:</span> <span class="n"><a href="#SchedulerArgs">SchedulerArgs</a></span> <span class="o">|</span> <span class="kc">None</span> <span class="o">=</span> <span class="kc">None</span>,</span><span class="param">	<span class="n">learn_logit_scale</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">False</span>,</span><span class="param">	<span class="n">contrastive_loss</span><span class="p">:</span> <span class="n">collections</span><span class="o">.</span><span class="n">abc</span><span class="o">.</span><span class="n">Callable</span><span class="p">[[</span><span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">],</span> <span class="n"><a href="domain.html#LossOutput">shimmer.modules.domain.LossOutput</a></span><span class="p">]</span> <span class="o">|</span> <span class="kc">None</span> <span class="o">=</span> <span class="kc">None</span></span>)</span>
+
+                <label class="view-source-button" for="GlobalWorkspace2Domains.__init__-view-source"><span>View Source</span></label>
+
+    </div>
+    <a class="headerlink" href="#GlobalWorkspace2Domains.__init__"></a>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="GlobalWorkspace2Domains.__init__-480"><a href="#GlobalWorkspace2Domains.__init__-480"><span class="linenos">480</span></a>    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span>
+</span><span id="GlobalWorkspace2Domains.__init__-481"><a href="#GlobalWorkspace2Domains.__init__-481"><span class="linenos">481</span></a>        <span class="bp">self</span><span class="p">,</span>
+</span><span id="GlobalWorkspace2Domains.__init__-482"><a href="#GlobalWorkspace2Domains.__init__-482"><span class="linenos">482</span></a>        <span class="n">domain_mods</span><span class="p">:</span> <span class="n">Mapping</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">DomainModule</span><span class="p">],</span>
+</span><span id="GlobalWorkspace2Domains.__init__-483"><a href="#GlobalWorkspace2Domains.__init__-483"><span class="linenos">483</span></a>        <span class="n">gw_encoders</span><span class="p">:</span> <span class="n">Mapping</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">Module</span><span class="p">],</span>
+</span><span id="GlobalWorkspace2Domains.__init__-484"><a href="#GlobalWorkspace2Domains.__init__-484"><span class="linenos">484</span></a>        <span class="n">gw_decoders</span><span class="p">:</span> <span class="n">Mapping</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">Module</span><span class="p">],</span>
+</span><span id="GlobalWorkspace2Domains.__init__-485"><a href="#GlobalWorkspace2Domains.__init__-485"><span class="linenos">485</span></a>        <span class="n">workspace_dim</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span>
+</span><span id="GlobalWorkspace2Domains.__init__-486"><a href="#GlobalWorkspace2Domains.__init__-486"><span class="linenos">486</span></a>        <span class="n">loss_coefs</span><span class="p">:</span> <span class="n">LossCoefs</span><span class="p">,</span>
+</span><span id="GlobalWorkspace2Domains.__init__-487"><a href="#GlobalWorkspace2Domains.__init__-487"><span class="linenos">487</span></a>        <span class="n">optim_lr</span><span class="p">:</span> <span class="nb">float</span> <span class="o">=</span> <span class="mf">1e-3</span><span class="p">,</span>
+</span><span id="GlobalWorkspace2Domains.__init__-488"><a href="#GlobalWorkspace2Domains.__init__-488"><span class="linenos">488</span></a>        <span class="n">optim_weight_decay</span><span class="p">:</span> <span class="nb">float</span> <span class="o">=</span> <span class="mf">0.0</span><span class="p">,</span>
+</span><span id="GlobalWorkspace2Domains.__init__-489"><a href="#GlobalWorkspace2Domains.__init__-489"><span class="linenos">489</span></a>        <span class="n">scheduler_args</span><span class="p">:</span> <span class="n">SchedulerArgs</span> <span class="o">|</span> <span class="kc">None</span> <span class="o">=</span> <span class="kc">None</span><span class="p">,</span>
+</span><span id="GlobalWorkspace2Domains.__init__-490"><a href="#GlobalWorkspace2Domains.__init__-490"><span class="linenos">490</span></a>        <span class="n">learn_logit_scale</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">False</span><span class="p">,</span>
+</span><span id="GlobalWorkspace2Domains.__init__-491"><a href="#GlobalWorkspace2Domains.__init__-491"><span class="linenos">491</span></a>        <span class="n">contrastive_loss</span><span class="p">:</span> <span class="n">ContrastiveLossType</span> <span class="o">|</span> <span class="kc">None</span> <span class="o">=</span> <span class="kc">None</span><span class="p">,</span>
+</span><span id="GlobalWorkspace2Domains.__init__-492"><a href="#GlobalWorkspace2Domains.__init__-492"><span class="linenos">492</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="GlobalWorkspace2Domains.__init__-493"><a href="#GlobalWorkspace2Domains.__init__-493"><span class="linenos">493</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="GlobalWorkspace2Domains.__init__-494"><a href="#GlobalWorkspace2Domains.__init__-494"><span class="linenos">494</span></a><span class="sd">        Initializes a Global Workspace</span>
+</span><span id="GlobalWorkspace2Domains.__init__-495"><a href="#GlobalWorkspace2Domains.__init__-495"><span class="linenos">495</span></a>
+</span><span id="GlobalWorkspace2Domains.__init__-496"><a href="#GlobalWorkspace2Domains.__init__-496"><span class="linenos">496</span></a><span class="sd">        Args:</span>
+</span><span id="GlobalWorkspace2Domains.__init__-497"><a href="#GlobalWorkspace2Domains.__init__-497"><span class="linenos">497</span></a><span class="sd">            domain_mods (`Mapping[str, DomainModule]`): mapping of the domains</span>
+</span><span id="GlobalWorkspace2Domains.__init__-498"><a href="#GlobalWorkspace2Domains.__init__-498"><span class="linenos">498</span></a><span class="sd">                connected to the GW. Keys are domain names, values are the</span>
+</span><span id="GlobalWorkspace2Domains.__init__-499"><a href="#GlobalWorkspace2Domains.__init__-499"><span class="linenos">499</span></a><span class="sd">                `DomainModule`.</span>
+</span><span id="GlobalWorkspace2Domains.__init__-500"><a href="#GlobalWorkspace2Domains.__init__-500"><span class="linenos">500</span></a><span class="sd">            gw_encoders (`Mapping[str, torch.nn.Module]`): mapping for each domain</span>
+</span><span id="GlobalWorkspace2Domains.__init__-501"><a href="#GlobalWorkspace2Domains.__init__-501"><span class="linenos">501</span></a><span class="sd">                name to a `torch.nn.Module` class which role is to encode a</span>
+</span><span id="GlobalWorkspace2Domains.__init__-502"><a href="#GlobalWorkspace2Domains.__init__-502"><span class="linenos">502</span></a><span class="sd">                unimodal latent representations into a GW representation (pre fusion).</span>
+</span><span id="GlobalWorkspace2Domains.__init__-503"><a href="#GlobalWorkspace2Domains.__init__-503"><span class="linenos">503</span></a><span class="sd">            gw_decoders (`Mapping[str, torch.nn.Module]`): mapping for each domain</span>
+</span><span id="GlobalWorkspace2Domains.__init__-504"><a href="#GlobalWorkspace2Domains.__init__-504"><span class="linenos">504</span></a><span class="sd">                name to a `torch.nn.Module` class which role is to decode a</span>
+</span><span id="GlobalWorkspace2Domains.__init__-505"><a href="#GlobalWorkspace2Domains.__init__-505"><span class="linenos">505</span></a><span class="sd">                GW representation into a unimodal latent representations.</span>
+</span><span id="GlobalWorkspace2Domains.__init__-506"><a href="#GlobalWorkspace2Domains.__init__-506"><span class="linenos">506</span></a><span class="sd">            workspace_dim (`int`): dimension of the GW.</span>
+</span><span id="GlobalWorkspace2Domains.__init__-507"><a href="#GlobalWorkspace2Domains.__init__-507"><span class="linenos">507</span></a><span class="sd">            loss_coefs (`LossCoefs`): loss coefficients</span>
+</span><span id="GlobalWorkspace2Domains.__init__-508"><a href="#GlobalWorkspace2Domains.__init__-508"><span class="linenos">508</span></a><span class="sd">            optim_lr (`float`): learning rate</span>
+</span><span id="GlobalWorkspace2Domains.__init__-509"><a href="#GlobalWorkspace2Domains.__init__-509"><span class="linenos">509</span></a><span class="sd">            optim_weight_decay (`float`): weight decay</span>
+</span><span id="GlobalWorkspace2Domains.__init__-510"><a href="#GlobalWorkspace2Domains.__init__-510"><span class="linenos">510</span></a><span class="sd">            scheduler_args (`SchedulerArgs | None`): optimization scheduler&#39;s arguments</span>
+</span><span id="GlobalWorkspace2Domains.__init__-511"><a href="#GlobalWorkspace2Domains.__init__-511"><span class="linenos">511</span></a><span class="sd">            learn_logit_scale (`bool`): whether to learn the contrastive learning</span>
+</span><span id="GlobalWorkspace2Domains.__init__-512"><a href="#GlobalWorkspace2Domains.__init__-512"><span class="linenos">512</span></a><span class="sd">                contrastive loss when using the default contrastive loss.</span>
+</span><span id="GlobalWorkspace2Domains.__init__-513"><a href="#GlobalWorkspace2Domains.__init__-513"><span class="linenos">513</span></a><span class="sd">            contrastive_loss (`ContrastiveLossType | None`): a contrastive loss</span>
+</span><span id="GlobalWorkspace2Domains.__init__-514"><a href="#GlobalWorkspace2Domains.__init__-514"><span class="linenos">514</span></a><span class="sd">                function used for alignment. `learn_logit_scale` will not affect custom</span>
+</span><span id="GlobalWorkspace2Domains.__init__-515"><a href="#GlobalWorkspace2Domains.__init__-515"><span class="linenos">515</span></a><span class="sd">                contrastive losses.</span>
+</span><span id="GlobalWorkspace2Domains.__init__-516"><a href="#GlobalWorkspace2Domains.__init__-516"><span class="linenos">516</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="GlobalWorkspace2Domains.__init__-517"><a href="#GlobalWorkspace2Domains.__init__-517"><span class="linenos">517</span></a>        <span class="n">domain_mods</span> <span class="o">=</span> <span class="n">freeze_domain_modules</span><span class="p">(</span><span class="n">domain_mods</span><span class="p">)</span>
+</span><span id="GlobalWorkspace2Domains.__init__-518"><a href="#GlobalWorkspace2Domains.__init__-518"><span class="linenos">518</span></a>
+</span><span id="GlobalWorkspace2Domains.__init__-519"><a href="#GlobalWorkspace2Domains.__init__-519"><span class="linenos">519</span></a>        <span class="n">gw_mod</span> <span class="o">=</span> <span class="n">GWModule</span><span class="p">(</span><span class="n">domain_mods</span><span class="p">,</span> <span class="n">workspace_dim</span><span class="p">,</span> <span class="n">gw_encoders</span><span class="p">,</span> <span class="n">gw_decoders</span><span class="p">)</span>
+</span><span id="GlobalWorkspace2Domains.__init__-520"><a href="#GlobalWorkspace2Domains.__init__-520"><span class="linenos">520</span></a>        <span class="k">if</span> <span class="n">contrastive_loss</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="GlobalWorkspace2Domains.__init__-521"><a href="#GlobalWorkspace2Domains.__init__-521"><span class="linenos">521</span></a>            <span class="n">contrastive_loss</span> <span class="o">=</span> <span class="n">ContrastiveLoss</span><span class="p">(</span>
+</span><span id="GlobalWorkspace2Domains.__init__-522"><a href="#GlobalWorkspace2Domains.__init__-522"><span class="linenos">522</span></a>                <span class="n">torch</span><span class="o">.</span><span class="n">tensor</span><span class="p">([</span><span class="mi">1</span> <span class="o">/</span> <span class="mf">0.07</span><span class="p">])</span><span class="o">.</span><span class="n">log</span><span class="p">(),</span> <span class="s2">&quot;mean&quot;</span><span class="p">,</span> <span class="n">learn_logit_scale</span>
+</span><span id="GlobalWorkspace2Domains.__init__-523"><a href="#GlobalWorkspace2Domains.__init__-523"><span class="linenos">523</span></a>            <span class="p">)</span>
+</span><span id="GlobalWorkspace2Domains.__init__-524"><a href="#GlobalWorkspace2Domains.__init__-524"><span class="linenos">524</span></a>        <span class="n">selection_mod</span> <span class="o">=</span> <span class="n">SingleDomainSelection</span><span class="p">()</span>
+</span><span id="GlobalWorkspace2Domains.__init__-525"><a href="#GlobalWorkspace2Domains.__init__-525"><span class="linenos">525</span></a>        <span class="n">loss_mod</span> <span class="o">=</span> <span class="n">GWLosses2Domains</span><span class="p">(</span>
+</span><span id="GlobalWorkspace2Domains.__init__-526"><a href="#GlobalWorkspace2Domains.__init__-526"><span class="linenos">526</span></a>            <span class="n">gw_mod</span><span class="p">,</span> <span class="n">selection_mod</span><span class="p">,</span> <span class="n">domain_mods</span><span class="p">,</span> <span class="n">loss_coefs</span><span class="p">,</span> <span class="n">contrastive_loss</span>
+</span><span id="GlobalWorkspace2Domains.__init__-527"><a href="#GlobalWorkspace2Domains.__init__-527"><span class="linenos">527</span></a>        <span class="p">)</span>
+</span><span id="GlobalWorkspace2Domains.__init__-528"><a href="#GlobalWorkspace2Domains.__init__-528"><span class="linenos">528</span></a>
+</span><span id="GlobalWorkspace2Domains.__init__-529"><a href="#GlobalWorkspace2Domains.__init__-529"><span class="linenos">529</span></a>        <span class="nb">super</span><span class="p">()</span><span class="o">.</span><span class="fm">__init__</span><span class="p">(</span>
+</span><span id="GlobalWorkspace2Domains.__init__-530"><a href="#GlobalWorkspace2Domains.__init__-530"><span class="linenos">530</span></a>            <span class="n">gw_mod</span><span class="p">,</span>
+</span><span id="GlobalWorkspace2Domains.__init__-531"><a href="#GlobalWorkspace2Domains.__init__-531"><span class="linenos">531</span></a>            <span class="n">selection_mod</span><span class="p">,</span>
+</span><span id="GlobalWorkspace2Domains.__init__-532"><a href="#GlobalWorkspace2Domains.__init__-532"><span class="linenos">532</span></a>            <span class="n">loss_mod</span><span class="p">,</span>
+</span><span id="GlobalWorkspace2Domains.__init__-533"><a href="#GlobalWorkspace2Domains.__init__-533"><span class="linenos">533</span></a>            <span class="n">optim_lr</span><span class="p">,</span>
+</span><span id="GlobalWorkspace2Domains.__init__-534"><a href="#GlobalWorkspace2Domains.__init__-534"><span class="linenos">534</span></a>            <span class="n">optim_weight_decay</span><span class="p">,</span>
+</span><span id="GlobalWorkspace2Domains.__init__-535"><a href="#GlobalWorkspace2Domains.__init__-535"><span class="linenos">535</span></a>            <span class="n">scheduler_args</span><span class="p">,</span>
+</span><span id="GlobalWorkspace2Domains.__init__-536"><a href="#GlobalWorkspace2Domains.__init__-536"><span class="linenos">536</span></a>        <span class="p">)</span>
+</span></pre></div>
+
+
+            <div class="docstring"><p>Initializes a Global Workspace</p>
+
+<h6 id="arguments">Arguments:</h6>
+
+<ul>
+<li><strong>domain_mods (<code>Mapping[str, DomainModule]</code>):</strong>  mapping of the domains
+connected to the GW. Keys are domain names, values are the
+<code>DomainModule</code>.</li>
+<li><strong>gw_encoders (<code>Mapping[str, torch.nn.Module]</code>):</strong>  mapping for each domain
+name to a <code>torch.nn.Module</code> class which role is to encode a
+unimodal latent representations into a GW representation (pre fusion).</li>
+<li><strong>gw_decoders (<code>Mapping[str, torch.nn.Module]</code>):</strong>  mapping for each domain
+name to a <code>torch.nn.Module</code> class which role is to decode a
+GW representation into a unimodal latent representations.</li>
+<li><strong>workspace_dim (<code>int</code>):</strong>  dimension of the GW.</li>
+<li><strong>loss_coefs (<code>LossCoefs</code>):</strong>  loss coefficients</li>
+<li><strong>optim_lr (<code><a href="#GlobalWorkspace2Domains.float">float</a></code>):</strong>  learning rate</li>
+<li><strong>optim_weight_decay (<code><a href="#GlobalWorkspace2Domains.float">float</a></code>):</strong>  weight decay</li>
+<li><strong>scheduler_args (<code>SchedulerArgs | None</code>):</strong>  optimization scheduler's arguments</li>
+<li><strong>learn_logit_scale (<code>bool</code>):</strong>  whether to learn the contrastive learning
+contrastive loss when using the default contrastive loss.</li>
+<li><strong>contrastive_loss (<code>ContrastiveLossType | None</code>):</strong>  a contrastive loss
+function used for alignment. <code>learn_logit_scale</code> will not affect custom
+contrastive losses.</li>
+</ul>
+</div>
+
+
+                            </div>
+                            <div id="GlobalWorkspace2Domains.forward" class="classattr">
+                                        <input id="GlobalWorkspace2Domains.forward-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
+<div class="attr function">
+            
+        <span class="def">def</span>
+        <span class="name">forward</span><span class="signature pdoc-code multiline">(<span class="param">	<span class="bp">self</span>,</span><span class="param">	<span class="n">latent_domains</span><span class="p">:</span> <span class="n">collections</span><span class="o">.</span><span class="n">abc</span><span class="o">.</span><span class="n">Mapping</span><span class="p">[</span><span class="nb">frozenset</span><span class="p">[</span><span class="nb">str</span><span class="p">],</span> <span class="n">collections</span><span class="o">.</span><span class="n">abc</span><span class="o">.</span><span class="n">Mapping</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]]</span></span><span class="return-annotation">) -> <span class="n"><a href="#GWPredictions">GWPredictions</a></span>:</span></span>
+
+                <label class="view-source-button" for="GlobalWorkspace2Domains.forward-view-source"><span>View Source</span></label>
+
+    </div>
+    <a class="headerlink" href="#GlobalWorkspace2Domains.forward"></a>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="GlobalWorkspace2Domains.forward-538"><a href="#GlobalWorkspace2Domains.forward-538"><span class="linenos">538</span></a>    <span class="k">def</span> <span class="nf">forward</span><span class="p">(</span>  <span class="c1"># type: ignore</span>
+</span><span id="GlobalWorkspace2Domains.forward-539"><a href="#GlobalWorkspace2Domains.forward-539"><span class="linenos">539</span></a>        <span class="bp">self</span><span class="p">,</span>
+</span><span id="GlobalWorkspace2Domains.forward-540"><a href="#GlobalWorkspace2Domains.forward-540"><span class="linenos">540</span></a>        <span class="n">latent_domains</span><span class="p">:</span> <span class="n">LatentsDomainGroupsT</span><span class="p">,</span>
+</span><span id="GlobalWorkspace2Domains.forward-541"><a href="#GlobalWorkspace2Domains.forward-541"><span class="linenos">541</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="n">GWPredictions</span><span class="p">:</span>
+</span><span id="GlobalWorkspace2Domains.forward-542"><a href="#GlobalWorkspace2Domains.forward-542"><span class="linenos">542</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="GlobalWorkspace2Domains.forward-543"><a href="#GlobalWorkspace2Domains.forward-543"><span class="linenos">543</span></a><span class="sd">        Computes demi-cycles, cycles, and translations.</span>
+</span><span id="GlobalWorkspace2Domains.forward-544"><a href="#GlobalWorkspace2Domains.forward-544"><span class="linenos">544</span></a>
+</span><span id="GlobalWorkspace2Domains.forward-545"><a href="#GlobalWorkspace2Domains.forward-545"><span class="linenos">545</span></a><span class="sd">        Args:</span>
+</span><span id="GlobalWorkspace2Domains.forward-546"><a href="#GlobalWorkspace2Domains.forward-546"><span class="linenos">546</span></a><span class="sd">            latent_domains (`LatentsT`): Groups of domains for the computation.</span>
+</span><span id="GlobalWorkspace2Domains.forward-547"><a href="#GlobalWorkspace2Domains.forward-547"><span class="linenos">547</span></a>
+</span><span id="GlobalWorkspace2Domains.forward-548"><a href="#GlobalWorkspace2Domains.forward-548"><span class="linenos">548</span></a><span class="sd">        Returns:</span>
+</span><span id="GlobalWorkspace2Domains.forward-549"><a href="#GlobalWorkspace2Domains.forward-549"><span class="linenos">549</span></a><span class="sd">            `GWPredictions`: the predictions on the batch.</span>
+</span><span id="GlobalWorkspace2Domains.forward-550"><a href="#GlobalWorkspace2Domains.forward-550"><span class="linenos">550</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="GlobalWorkspace2Domains.forward-551"><a href="#GlobalWorkspace2Domains.forward-551"><span class="linenos">551</span></a>        <span class="k">return</span> <span class="n">GWPredictions</span><span class="p">(</span>
+</span><span id="GlobalWorkspace2Domains.forward-552"><a href="#GlobalWorkspace2Domains.forward-552"><span class="linenos">552</span></a>            <span class="n">demi_cycles</span><span class="o">=</span><span class="n">batch_demi_cycles</span><span class="p">(</span>
+</span><span id="GlobalWorkspace2Domains.forward-553"><a href="#GlobalWorkspace2Domains.forward-553"><span class="linenos">553</span></a>                <span class="bp">self</span><span class="o">.</span><span class="n">gw_mod</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">selection_mod</span><span class="p">,</span> <span class="n">latent_domains</span>
+</span><span id="GlobalWorkspace2Domains.forward-554"><a href="#GlobalWorkspace2Domains.forward-554"><span class="linenos">554</span></a>            <span class="p">),</span>
+</span><span id="GlobalWorkspace2Domains.forward-555"><a href="#GlobalWorkspace2Domains.forward-555"><span class="linenos">555</span></a>            <span class="n">cycles</span><span class="o">=</span><span class="n">batch_cycles</span><span class="p">(</span>
+</span><span id="GlobalWorkspace2Domains.forward-556"><a href="#GlobalWorkspace2Domains.forward-556"><span class="linenos">556</span></a>                <span class="bp">self</span><span class="o">.</span><span class="n">gw_mod</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">selection_mod</span><span class="p">,</span> <span class="n">latent_domains</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">domain_mods</span><span class="o">.</span><span class="n">keys</span><span class="p">()</span>
+</span><span id="GlobalWorkspace2Domains.forward-557"><a href="#GlobalWorkspace2Domains.forward-557"><span class="linenos">557</span></a>            <span class="p">),</span>
+</span><span id="GlobalWorkspace2Domains.forward-558"><a href="#GlobalWorkspace2Domains.forward-558"><span class="linenos">558</span></a>            <span class="n">translations</span><span class="o">=</span><span class="n">batch_translations</span><span class="p">(</span>
+</span><span id="GlobalWorkspace2Domains.forward-559"><a href="#GlobalWorkspace2Domains.forward-559"><span class="linenos">559</span></a>                <span class="bp">self</span><span class="o">.</span><span class="n">gw_mod</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">selection_mod</span><span class="p">,</span> <span class="n">latent_domains</span>
+</span><span id="GlobalWorkspace2Domains.forward-560"><a href="#GlobalWorkspace2Domains.forward-560"><span class="linenos">560</span></a>            <span class="p">),</span>
+</span><span id="GlobalWorkspace2Domains.forward-561"><a href="#GlobalWorkspace2Domains.forward-561"><span class="linenos">561</span></a>            <span class="o">**</span><span class="nb">super</span><span class="p">()</span><span class="o">.</span><span class="n">forward</span><span class="p">(</span><span class="n">latent_domains</span><span class="p">),</span>
+</span><span id="GlobalWorkspace2Domains.forward-562"><a href="#GlobalWorkspace2Domains.forward-562"><span class="linenos">562</span></a>        <span class="p">)</span>
+</span></pre></div>
+
+
+            <div class="docstring"><p>Computes demi-cycles, cycles, and translations.</p>
+
+<h6 id="arguments">Arguments:</h6>
+
+<ul>
+<li><strong>latent_domains (<code>LatentsT</code>):</strong>  Groups of domains for the computation.</li>
+</ul>
+
+<h6 id="returns">Returns:</h6>
+
+<blockquote>
+  <p><code><a href="#GWPredictions">GWPredictions</a></code>: the predictions on the batch.</p>
+</blockquote>
+</div>
+
+
+                            </div>
+                            <div class="inherited">
+                                <h5>Inherited Members</h5>
+                                <dl>
+                                    <div><dt><a href="#GlobalWorkspaceBase">GlobalWorkspaceBase</a></dt>
+                                <dd id="GlobalWorkspace2Domains.gw_mod" class="variable"><a href="#GlobalWorkspaceBase.gw_mod">gw_mod</a></dd>
+                <dd id="GlobalWorkspace2Domains.selection_mod" class="variable"><a href="#GlobalWorkspaceBase.selection_mod">selection_mod</a></dd>
+                <dd id="GlobalWorkspace2Domains.loss_mod" class="variable"><a href="#GlobalWorkspaceBase.loss_mod">loss_mod</a></dd>
+                <dd id="GlobalWorkspace2Domains.optim_lr" class="variable"><a href="#GlobalWorkspaceBase.optim_lr">optim_lr</a></dd>
+                <dd id="GlobalWorkspace2Domains.optim_weight_decay" class="variable"><a href="#GlobalWorkspaceBase.optim_weight_decay">optim_weight_decay</a></dd>
+                <dd id="GlobalWorkspace2Domains.scheduler_args" class="variable"><a href="#GlobalWorkspaceBase.scheduler_args">scheduler_args</a></dd>
+                <dd id="GlobalWorkspace2Domains.domain_mods" class="variable"><a href="#GlobalWorkspaceBase.domain_mods">domain_mods</a></dd>
+                <dd id="GlobalWorkspace2Domains.workspace_dim" class="variable"><a href="#GlobalWorkspaceBase.workspace_dim">workspace_dim</a></dd>
+                <dd id="GlobalWorkspace2Domains.encode_and_fuse" class="function"><a href="#GlobalWorkspaceBase.encode_and_fuse">encode_and_fuse</a></dd>
+                <dd id="GlobalWorkspace2Domains.encode" class="function"><a href="#GlobalWorkspaceBase.encode">encode</a></dd>
+                <dd id="GlobalWorkspace2Domains.fuse" class="function"><a href="#GlobalWorkspaceBase.fuse">fuse</a></dd>
+                <dd id="GlobalWorkspace2Domains.decode" class="function"><a href="#GlobalWorkspaceBase.decode">decode</a></dd>
+                <dd id="GlobalWorkspace2Domains.batch_gw_states" class="function"><a href="#GlobalWorkspaceBase.batch_gw_states">batch_gw_states</a></dd>
+                <dd id="GlobalWorkspace2Domains.encode_domain" class="function"><a href="#GlobalWorkspaceBase.encode_domain">encode_domain</a></dd>
+                <dd id="GlobalWorkspace2Domains.encode_domains" class="function"><a href="#GlobalWorkspaceBase.encode_domains">encode_domains</a></dd>
+                <dd id="GlobalWorkspace2Domains.decode_domain" class="function"><a href="#GlobalWorkspaceBase.decode_domain">decode_domain</a></dd>
+                <dd id="GlobalWorkspace2Domains.decode_domains" class="function"><a href="#GlobalWorkspaceBase.decode_domains">decode_domains</a></dd>
+                <dd id="GlobalWorkspace2Domains.generic_step" class="function"><a href="#GlobalWorkspaceBase.generic_step">generic_step</a></dd>
+                <dd id="GlobalWorkspace2Domains.validation_step" class="function"><a href="#GlobalWorkspaceBase.validation_step">validation_step</a></dd>
+                <dd id="GlobalWorkspace2Domains.test_step" class="function"><a href="#GlobalWorkspaceBase.test_step">test_step</a></dd>
+                <dd id="GlobalWorkspace2Domains.training_step" class="function"><a href="#GlobalWorkspaceBase.training_step">training_step</a></dd>
+                <dd id="GlobalWorkspace2Domains.predict_step" class="function"><a href="#GlobalWorkspaceBase.predict_step">predict_step</a></dd>
+                <dd id="GlobalWorkspace2Domains.configure_optimizers" class="function"><a href="#GlobalWorkspaceBase.configure_optimizers">configure_optimizers</a></dd>
+
+            </div>
+            <div><dt>lightning.pytorch.core.module.LightningModule</dt>
+                                <dd id="GlobalWorkspace2Domains.CHECKPOINT_HYPER_PARAMS_KEY" class="variable">CHECKPOINT_HYPER_PARAMS_KEY</dd>
+                <dd id="GlobalWorkspace2Domains.CHECKPOINT_HYPER_PARAMS_NAME" class="variable">CHECKPOINT_HYPER_PARAMS_NAME</dd>
+                <dd id="GlobalWorkspace2Domains.CHECKPOINT_HYPER_PARAMS_TYPE" class="variable">CHECKPOINT_HYPER_PARAMS_TYPE</dd>
+                <dd id="GlobalWorkspace2Domains.optimizers" class="function">optimizers</dd>
+                <dd id="GlobalWorkspace2Domains.lr_schedulers" class="function">lr_schedulers</dd>
+                <dd id="GlobalWorkspace2Domains.trainer" class="variable">trainer</dd>
+                <dd id="GlobalWorkspace2Domains.fabric" class="variable">fabric</dd>
+                <dd id="GlobalWorkspace2Domains.example_input_array" class="variable">example_input_array</dd>
+                <dd id="GlobalWorkspace2Domains.current_epoch" class="variable">current_epoch</dd>
+                <dd id="GlobalWorkspace2Domains.global_step" class="variable">global_step</dd>
+                <dd id="GlobalWorkspace2Domains.global_rank" class="variable">global_rank</dd>
+                <dd id="GlobalWorkspace2Domains.local_rank" class="variable">local_rank</dd>
+                <dd id="GlobalWorkspace2Domains.on_gpu" class="variable">on_gpu</dd>
+                <dd id="GlobalWorkspace2Domains.automatic_optimization" class="variable">automatic_optimization</dd>
+                <dd id="GlobalWorkspace2Domains.strict_loading" class="variable">strict_loading</dd>
+                <dd id="GlobalWorkspace2Domains.logger" class="variable">logger</dd>
+                <dd id="GlobalWorkspace2Domains.loggers" class="variable">loggers</dd>
+                <dd id="GlobalWorkspace2Domains.print" class="function">print</dd>
+                <dd id="GlobalWorkspace2Domains.log" class="function">log</dd>
+                <dd id="GlobalWorkspace2Domains.log_dict" class="function">log_dict</dd>
+                <dd id="GlobalWorkspace2Domains.all_gather" class="function">all_gather</dd>
+                <dd id="GlobalWorkspace2Domains.configure_callbacks" class="function">configure_callbacks</dd>
+                <dd id="GlobalWorkspace2Domains.manual_backward" class="function">manual_backward</dd>
+                <dd id="GlobalWorkspace2Domains.backward" class="function">backward</dd>
+                <dd id="GlobalWorkspace2Domains.toggle_optimizer" class="function">toggle_optimizer</dd>
+                <dd id="GlobalWorkspace2Domains.untoggle_optimizer" class="function">untoggle_optimizer</dd>
+                <dd id="GlobalWorkspace2Domains.clip_gradients" class="function">clip_gradients</dd>
+                <dd id="GlobalWorkspace2Domains.configure_gradient_clipping" class="function">configure_gradient_clipping</dd>
+                <dd id="GlobalWorkspace2Domains.lr_scheduler_step" class="function">lr_scheduler_step</dd>
+                <dd id="GlobalWorkspace2Domains.optimizer_step" class="function">optimizer_step</dd>
+                <dd id="GlobalWorkspace2Domains.optimizer_zero_grad" class="function">optimizer_zero_grad</dd>
+                <dd id="GlobalWorkspace2Domains.freeze" class="function">freeze</dd>
+                <dd id="GlobalWorkspace2Domains.unfreeze" class="function">unfreeze</dd>
+                <dd id="GlobalWorkspace2Domains.to_onnx" class="function">to_onnx</dd>
+                <dd id="GlobalWorkspace2Domains.to_torchscript" class="function">to_torchscript</dd>
+                <dd id="GlobalWorkspace2Domains.load_from_checkpoint" class="function">load_from_checkpoint</dd>
+
+            </div>
+            <div><dt>lightning.fabric.utilities.device_dtype_mixin._DeviceDtypeModuleMixin</dt>
+                                <dd id="GlobalWorkspace2Domains.dtype" class="variable">dtype</dd>
+                <dd id="GlobalWorkspace2Domains.device" class="variable">device</dd>
+                <dd id="GlobalWorkspace2Domains.to" class="function">to</dd>
+                <dd id="GlobalWorkspace2Domains.cuda" class="function">cuda</dd>
+                <dd id="GlobalWorkspace2Domains.cpu" class="function">cpu</dd>
+                <dd id="GlobalWorkspace2Domains.type" class="function">type</dd>
+                <dd id="GlobalWorkspace2Domains.float" class="function">float</dd>
+                <dd id="GlobalWorkspace2Domains.double" class="function">double</dd>
+                <dd id="GlobalWorkspace2Domains.half" class="function">half</dd>
+
+            </div>
+            <div><dt>lightning.pytorch.core.mixins.hparams_mixin.HyperparametersMixin</dt>
+                                <dd id="GlobalWorkspace2Domains.save_hyperparameters" class="function">save_hyperparameters</dd>
+                <dd id="GlobalWorkspace2Domains.hparams" class="variable">hparams</dd>
+                <dd id="GlobalWorkspace2Domains.hparams_initial" class="variable">hparams_initial</dd>
+
+            </div>
+            <div><dt>lightning.pytorch.core.hooks.ModelHooks</dt>
+                                <dd id="GlobalWorkspace2Domains.on_fit_start" class="function">on_fit_start</dd>
+                <dd id="GlobalWorkspace2Domains.on_fit_end" class="function">on_fit_end</dd>
+                <dd id="GlobalWorkspace2Domains.on_train_start" class="function">on_train_start</dd>
+                <dd id="GlobalWorkspace2Domains.on_train_end" class="function">on_train_end</dd>
+                <dd id="GlobalWorkspace2Domains.on_validation_start" class="function">on_validation_start</dd>
+                <dd id="GlobalWorkspace2Domains.on_validation_end" class="function">on_validation_end</dd>
+                <dd id="GlobalWorkspace2Domains.on_test_start" class="function">on_test_start</dd>
+                <dd id="GlobalWorkspace2Domains.on_test_end" class="function">on_test_end</dd>
+                <dd id="GlobalWorkspace2Domains.on_predict_start" class="function">on_predict_start</dd>
+                <dd id="GlobalWorkspace2Domains.on_predict_end" class="function">on_predict_end</dd>
+                <dd id="GlobalWorkspace2Domains.on_train_batch_start" class="function">on_train_batch_start</dd>
+                <dd id="GlobalWorkspace2Domains.on_train_batch_end" class="function">on_train_batch_end</dd>
+                <dd id="GlobalWorkspace2Domains.on_validation_batch_start" class="function">on_validation_batch_start</dd>
+                <dd id="GlobalWorkspace2Domains.on_validation_batch_end" class="function">on_validation_batch_end</dd>
+                <dd id="GlobalWorkspace2Domains.on_test_batch_start" class="function">on_test_batch_start</dd>
+                <dd id="GlobalWorkspace2Domains.on_test_batch_end" class="function">on_test_batch_end</dd>
+                <dd id="GlobalWorkspace2Domains.on_predict_batch_start" class="function">on_predict_batch_start</dd>
+                <dd id="GlobalWorkspace2Domains.on_predict_batch_end" class="function">on_predict_batch_end</dd>
+                <dd id="GlobalWorkspace2Domains.on_validation_model_zero_grad" class="function">on_validation_model_zero_grad</dd>
+                <dd id="GlobalWorkspace2Domains.on_validation_model_eval" class="function">on_validation_model_eval</dd>
+                <dd id="GlobalWorkspace2Domains.on_validation_model_train" class="function">on_validation_model_train</dd>
+                <dd id="GlobalWorkspace2Domains.on_test_model_eval" class="function">on_test_model_eval</dd>
+                <dd id="GlobalWorkspace2Domains.on_test_model_train" class="function">on_test_model_train</dd>
+                <dd id="GlobalWorkspace2Domains.on_predict_model_eval" class="function">on_predict_model_eval</dd>
+                <dd id="GlobalWorkspace2Domains.on_train_epoch_start" class="function">on_train_epoch_start</dd>
+                <dd id="GlobalWorkspace2Domains.on_train_epoch_end" class="function">on_train_epoch_end</dd>
+                <dd id="GlobalWorkspace2Domains.on_validation_epoch_start" class="function">on_validation_epoch_start</dd>
+                <dd id="GlobalWorkspace2Domains.on_validation_epoch_end" class="function">on_validation_epoch_end</dd>
+                <dd id="GlobalWorkspace2Domains.on_test_epoch_start" class="function">on_test_epoch_start</dd>
+                <dd id="GlobalWorkspace2Domains.on_test_epoch_end" class="function">on_test_epoch_end</dd>
+                <dd id="GlobalWorkspace2Domains.on_predict_epoch_start" class="function">on_predict_epoch_start</dd>
+                <dd id="GlobalWorkspace2Domains.on_predict_epoch_end" class="function">on_predict_epoch_end</dd>
+                <dd id="GlobalWorkspace2Domains.on_before_zero_grad" class="function">on_before_zero_grad</dd>
+                <dd id="GlobalWorkspace2Domains.on_before_backward" class="function">on_before_backward</dd>
+                <dd id="GlobalWorkspace2Domains.on_after_backward" class="function">on_after_backward</dd>
+                <dd id="GlobalWorkspace2Domains.on_before_optimizer_step" class="function">on_before_optimizer_step</dd>
+                <dd id="GlobalWorkspace2Domains.configure_sharded_model" class="function">configure_sharded_model</dd>
+                <dd id="GlobalWorkspace2Domains.configure_model" class="function">configure_model</dd>
+
+            </div>
+            <div><dt>lightning.pytorch.core.hooks.DataHooks</dt>
+                                <dd id="GlobalWorkspace2Domains.prepare_data_per_node" class="variable">prepare_data_per_node</dd>
+                <dd id="GlobalWorkspace2Domains.allow_zero_length_dataloader_with_multiple_devices" class="variable">allow_zero_length_dataloader_with_multiple_devices</dd>
+                <dd id="GlobalWorkspace2Domains.prepare_data" class="function">prepare_data</dd>
+                <dd id="GlobalWorkspace2Domains.setup" class="function">setup</dd>
+                <dd id="GlobalWorkspace2Domains.teardown" class="function">teardown</dd>
+                <dd id="GlobalWorkspace2Domains.train_dataloader" class="function">train_dataloader</dd>
+                <dd id="GlobalWorkspace2Domains.test_dataloader" class="function">test_dataloader</dd>
+                <dd id="GlobalWorkspace2Domains.val_dataloader" class="function">val_dataloader</dd>
+                <dd id="GlobalWorkspace2Domains.predict_dataloader" class="function">predict_dataloader</dd>
+                <dd id="GlobalWorkspace2Domains.transfer_batch_to_device" class="function">transfer_batch_to_device</dd>
+                <dd id="GlobalWorkspace2Domains.on_before_batch_transfer" class="function">on_before_batch_transfer</dd>
+                <dd id="GlobalWorkspace2Domains.on_after_batch_transfer" class="function">on_after_batch_transfer</dd>
+
+            </div>
+            <div><dt>lightning.pytorch.core.hooks.CheckpointHooks</dt>
+                                <dd id="GlobalWorkspace2Domains.on_load_checkpoint" class="function">on_load_checkpoint</dd>
+                <dd id="GlobalWorkspace2Domains.on_save_checkpoint" class="function">on_save_checkpoint</dd>
+
+            </div>
+            <div><dt>torch.nn.modules.module.Module</dt>
+                                <dd id="GlobalWorkspace2Domains.dump_patches" class="variable">dump_patches</dd>
+                <dd id="GlobalWorkspace2Domains.training" class="variable">training</dd>
+                <dd id="GlobalWorkspace2Domains.call_super_init" class="variable">call_super_init</dd>
+                <dd id="GlobalWorkspace2Domains.register_buffer" class="function">register_buffer</dd>
+                <dd id="GlobalWorkspace2Domains.register_parameter" class="function">register_parameter</dd>
+                <dd id="GlobalWorkspace2Domains.add_module" class="function">add_module</dd>
+                <dd id="GlobalWorkspace2Domains.register_module" class="function">register_module</dd>
+                <dd id="GlobalWorkspace2Domains.get_submodule" class="function">get_submodule</dd>
+                <dd id="GlobalWorkspace2Domains.get_parameter" class="function">get_parameter</dd>
+                <dd id="GlobalWorkspace2Domains.get_buffer" class="function">get_buffer</dd>
+                <dd id="GlobalWorkspace2Domains.get_extra_state" class="function">get_extra_state</dd>
+                <dd id="GlobalWorkspace2Domains.set_extra_state" class="function">set_extra_state</dd>
+                <dd id="GlobalWorkspace2Domains.apply" class="function">apply</dd>
+                <dd id="GlobalWorkspace2Domains.ipu" class="function">ipu</dd>
+                <dd id="GlobalWorkspace2Domains.xpu" class="function">xpu</dd>
+                <dd id="GlobalWorkspace2Domains.bfloat16" class="function">bfloat16</dd>
+                <dd id="GlobalWorkspace2Domains.to_empty" class="function">to_empty</dd>
+                <dd id="GlobalWorkspace2Domains.register_full_backward_pre_hook" class="function">register_full_backward_pre_hook</dd>
+                <dd id="GlobalWorkspace2Domains.register_backward_hook" class="function">register_backward_hook</dd>
+                <dd id="GlobalWorkspace2Domains.register_full_backward_hook" class="function">register_full_backward_hook</dd>
+                <dd id="GlobalWorkspace2Domains.register_forward_pre_hook" class="function">register_forward_pre_hook</dd>
+                <dd id="GlobalWorkspace2Domains.register_forward_hook" class="function">register_forward_hook</dd>
+                <dd id="GlobalWorkspace2Domains.register_state_dict_pre_hook" class="function">register_state_dict_pre_hook</dd>
+                <dd id="GlobalWorkspace2Domains.state_dict" class="function">state_dict</dd>
+                <dd id="GlobalWorkspace2Domains.register_load_state_dict_post_hook" class="function">register_load_state_dict_post_hook</dd>
+                <dd id="GlobalWorkspace2Domains.load_state_dict" class="function">load_state_dict</dd>
+                <dd id="GlobalWorkspace2Domains.parameters" class="function">parameters</dd>
+                <dd id="GlobalWorkspace2Domains.named_parameters" class="function">named_parameters</dd>
+                <dd id="GlobalWorkspace2Domains.buffers" class="function">buffers</dd>
+                <dd id="GlobalWorkspace2Domains.named_buffers" class="function">named_buffers</dd>
+                <dd id="GlobalWorkspace2Domains.children" class="function">children</dd>
+                <dd id="GlobalWorkspace2Domains.named_children" class="function">named_children</dd>
+                <dd id="GlobalWorkspace2Domains.modules" class="function">modules</dd>
+                <dd id="GlobalWorkspace2Domains.named_modules" class="function">named_modules</dd>
+                <dd id="GlobalWorkspace2Domains.train" class="function">train</dd>
+                <dd id="GlobalWorkspace2Domains.eval" class="function">eval</dd>
+                <dd id="GlobalWorkspace2Domains.requires_grad_" class="function">requires_grad_</dd>
+                <dd id="GlobalWorkspace2Domains.zero_grad" class="function">zero_grad</dd>
+                <dd id="GlobalWorkspace2Domains.share_memory" class="function">share_memory</dd>
+                <dd id="GlobalWorkspace2Domains.extra_repr" class="function">extra_repr</dd>
+                <dd id="GlobalWorkspace2Domains.compile" class="function">compile</dd>
+
+            </div>
+                                </dl>
+                            </div>
+                </section>
+                <section id="GlobalWorkspace">
+                            <input id="GlobalWorkspace-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
+<div class="attr class">
+            
+    <span class="def">class</span>
+    <span class="name">GlobalWorkspace</span><wbr>(<span class="base"><a href="#GlobalWorkspaceBase">shimmer.modules.global_workspace.GlobalWorkspaceBase[shimmer.modules.gw_module.GWModule, shimmer.modules.selection.RandomSelection, shimmer.modules.losses.GWLosses]</a></span>):
+
+                <label class="view-source-button" for="GlobalWorkspace-view-source"><span>View Source</span></label>
+
+    </div>
+    <a class="headerlink" href="#GlobalWorkspace"></a>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="GlobalWorkspace-565"><a href="#GlobalWorkspace-565"><span class="linenos">565</span></a><span class="k">class</span> <span class="nc">GlobalWorkspace</span><span class="p">(</span><span class="n">GlobalWorkspaceBase</span><span class="p">[</span><span class="n">GWModule</span><span class="p">,</span> <span class="n">RandomSelection</span><span class="p">,</span> <span class="n">GWLosses</span><span class="p">]):</span>
+</span><span id="GlobalWorkspace-566"><a href="#GlobalWorkspace-566"><span class="linenos">566</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;The 2-domain fusion (with broadcast loss) flavor of GlobalWorkspaceBase.</span>
+</span><span id="GlobalWorkspace-567"><a href="#GlobalWorkspace-567"><span class="linenos">567</span></a>
+</span><span id="GlobalWorkspace-568"><a href="#GlobalWorkspace-568"><span class="linenos">568</span></a><span class="sd">    This is used to simplify a Global Workspace instanciation and only overrides the</span>
+</span><span id="GlobalWorkspace-569"><a href="#GlobalWorkspace-569"><span class="linenos">569</span></a><span class="sd">    `__init__` method.</span>
+</span><span id="GlobalWorkspace-570"><a href="#GlobalWorkspace-570"><span class="linenos">570</span></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="GlobalWorkspace-571"><a href="#GlobalWorkspace-571"><span class="linenos">571</span></a>
+</span><span id="GlobalWorkspace-572"><a href="#GlobalWorkspace-572"><span class="linenos">572</span></a>    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span>
+</span><span id="GlobalWorkspace-573"><a href="#GlobalWorkspace-573"><span class="linenos">573</span></a>        <span class="bp">self</span><span class="p">,</span>
+</span><span id="GlobalWorkspace-574"><a href="#GlobalWorkspace-574"><span class="linenos">574</span></a>        <span class="n">domain_mods</span><span class="p">:</span> <span class="n">Mapping</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">DomainModule</span><span class="p">],</span>
+</span><span id="GlobalWorkspace-575"><a href="#GlobalWorkspace-575"><span class="linenos">575</span></a>        <span class="n">gw_encoders</span><span class="p">:</span> <span class="n">Mapping</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">Module</span><span class="p">],</span>
+</span><span id="GlobalWorkspace-576"><a href="#GlobalWorkspace-576"><span class="linenos">576</span></a>        <span class="n">gw_decoders</span><span class="p">:</span> <span class="n">Mapping</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">Module</span><span class="p">],</span>
+</span><span id="GlobalWorkspace-577"><a href="#GlobalWorkspace-577"><span class="linenos">577</span></a>        <span class="n">workspace_dim</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span>
+</span><span id="GlobalWorkspace-578"><a href="#GlobalWorkspace-578"><span class="linenos">578</span></a>        <span class="n">loss_coefs</span><span class="p">:</span> <span class="n">BroadcastLossCoefs</span><span class="p">,</span>
+</span><span id="GlobalWorkspace-579"><a href="#GlobalWorkspace-579"><span class="linenos">579</span></a>        <span class="n">selection_temperature</span><span class="p">:</span> <span class="nb">float</span> <span class="o">=</span> <span class="mf">0.2</span><span class="p">,</span>
+</span><span id="GlobalWorkspace-580"><a href="#GlobalWorkspace-580"><span class="linenos">580</span></a>        <span class="n">optim_lr</span><span class="p">:</span> <span class="nb">float</span> <span class="o">=</span> <span class="mf">1e-3</span><span class="p">,</span>
+</span><span id="GlobalWorkspace-581"><a href="#GlobalWorkspace-581"><span class="linenos">581</span></a>        <span class="n">optim_weight_decay</span><span class="p">:</span> <span class="nb">float</span> <span class="o">=</span> <span class="mf">0.0</span><span class="p">,</span>
+</span><span id="GlobalWorkspace-582"><a href="#GlobalWorkspace-582"><span class="linenos">582</span></a>        <span class="n">scheduler_args</span><span class="p">:</span> <span class="n">SchedulerArgs</span> <span class="o">|</span> <span class="kc">None</span> <span class="o">=</span> <span class="kc">None</span><span class="p">,</span>
+</span><span id="GlobalWorkspace-583"><a href="#GlobalWorkspace-583"><span class="linenos">583</span></a>        <span class="n">learn_logit_scale</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">False</span><span class="p">,</span>
+</span><span id="GlobalWorkspace-584"><a href="#GlobalWorkspace-584"><span class="linenos">584</span></a>        <span class="n">contrastive_loss</span><span class="p">:</span> <span class="n">ContrastiveLossType</span> <span class="o">|</span> <span class="kc">None</span> <span class="o">=</span> <span class="kc">None</span><span class="p">,</span>
+</span><span id="GlobalWorkspace-585"><a href="#GlobalWorkspace-585"><span class="linenos">585</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="GlobalWorkspace-586"><a href="#GlobalWorkspace-586"><span class="linenos">586</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="GlobalWorkspace-587"><a href="#GlobalWorkspace-587"><span class="linenos">587</span></a><span class="sd">        Initializes a Global Workspace</span>
+</span><span id="GlobalWorkspace-588"><a href="#GlobalWorkspace-588"><span class="linenos">588</span></a>
+</span><span id="GlobalWorkspace-589"><a href="#GlobalWorkspace-589"><span class="linenos">589</span></a><span class="sd">        Args:</span>
+</span><span id="GlobalWorkspace-590"><a href="#GlobalWorkspace-590"><span class="linenos">590</span></a><span class="sd">            domain_mods (`Mapping[str, DomainModule]`): mapping of the domains</span>
+</span><span id="GlobalWorkspace-591"><a href="#GlobalWorkspace-591"><span class="linenos">591</span></a><span class="sd">                connected to the GW. Keys are domain names, values are the</span>
+</span><span id="GlobalWorkspace-592"><a href="#GlobalWorkspace-592"><span class="linenos">592</span></a><span class="sd">                `DomainModule`.</span>
+</span><span id="GlobalWorkspace-593"><a href="#GlobalWorkspace-593"><span class="linenos">593</span></a><span class="sd">            gw_encoders (`Mapping[str, torch.nn.Module]`): mapping for each domain</span>
+</span><span id="GlobalWorkspace-594"><a href="#GlobalWorkspace-594"><span class="linenos">594</span></a><span class="sd">                name to a `torch.nn.Module` class which role is to encode a</span>
+</span><span id="GlobalWorkspace-595"><a href="#GlobalWorkspace-595"><span class="linenos">595</span></a><span class="sd">                unimodal latent representations into a GW representation (pre fusion).</span>
+</span><span id="GlobalWorkspace-596"><a href="#GlobalWorkspace-596"><span class="linenos">596</span></a><span class="sd">            gw_decoders (`Mapping[str, torch.nn.Module]`): mapping for each domain</span>
+</span><span id="GlobalWorkspace-597"><a href="#GlobalWorkspace-597"><span class="linenos">597</span></a><span class="sd">                name to a `torch.nn.Module` class which role is to decode a</span>
+</span><span id="GlobalWorkspace-598"><a href="#GlobalWorkspace-598"><span class="linenos">598</span></a><span class="sd">                GW representation into a unimodal latent representations.</span>
+</span><span id="GlobalWorkspace-599"><a href="#GlobalWorkspace-599"><span class="linenos">599</span></a><span class="sd">            workspace_dim (`int`): dimension of the GW.</span>
+</span><span id="GlobalWorkspace-600"><a href="#GlobalWorkspace-600"><span class="linenos">600</span></a><span class="sd">            loss_coefs (`BroadcastLossCoefs`): loss coefs for the losses.</span>
+</span><span id="GlobalWorkspace-601"><a href="#GlobalWorkspace-601"><span class="linenos">601</span></a><span class="sd">            selection_temperature (`float`): temperature value for the RandomSelection</span>
+</span><span id="GlobalWorkspace-602"><a href="#GlobalWorkspace-602"><span class="linenos">602</span></a><span class="sd">                module.</span>
+</span><span id="GlobalWorkspace-603"><a href="#GlobalWorkspace-603"><span class="linenos">603</span></a><span class="sd">            optim_lr (`float`): learning rate</span>
+</span><span id="GlobalWorkspace-604"><a href="#GlobalWorkspace-604"><span class="linenos">604</span></a><span class="sd">            optim_weight_decay (`float`): weight decay</span>
+</span><span id="GlobalWorkspace-605"><a href="#GlobalWorkspace-605"><span class="linenos">605</span></a><span class="sd">            scheduler_args (`SchedulerArgs | None`): optimization scheduler&#39;s arguments</span>
+</span><span id="GlobalWorkspace-606"><a href="#GlobalWorkspace-606"><span class="linenos">606</span></a><span class="sd">            learn_logit_scale (`bool`): whether to learn the contrastive learning</span>
+</span><span id="GlobalWorkspace-607"><a href="#GlobalWorkspace-607"><span class="linenos">607</span></a><span class="sd">                contrastive loss when using the default contrastive loss.</span>
+</span><span id="GlobalWorkspace-608"><a href="#GlobalWorkspace-608"><span class="linenos">608</span></a><span class="sd">            contrastive_loss (`ContrastiveLossType | None`): a contrastive loss</span>
+</span><span id="GlobalWorkspace-609"><a href="#GlobalWorkspace-609"><span class="linenos">609</span></a><span class="sd">                function used for alignment. `learn_logit_scale` will not affect custom</span>
+</span><span id="GlobalWorkspace-610"><a href="#GlobalWorkspace-610"><span class="linenos">610</span></a><span class="sd">                contrastive losses.</span>
+</span><span id="GlobalWorkspace-611"><a href="#GlobalWorkspace-611"><span class="linenos">611</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="GlobalWorkspace-612"><a href="#GlobalWorkspace-612"><span class="linenos">612</span></a>        <span class="n">domain_mods</span> <span class="o">=</span> <span class="n">freeze_domain_modules</span><span class="p">(</span><span class="n">domain_mods</span><span class="p">)</span>
+</span><span id="GlobalWorkspace-613"><a href="#GlobalWorkspace-613"><span class="linenos">613</span></a>        <span class="n">gw_mod</span> <span class="o">=</span> <span class="n">GWModule</span><span class="p">(</span><span class="n">domain_mods</span><span class="p">,</span> <span class="n">workspace_dim</span><span class="p">,</span> <span class="n">gw_encoders</span><span class="p">,</span> <span class="n">gw_decoders</span><span class="p">)</span>
+</span><span id="GlobalWorkspace-614"><a href="#GlobalWorkspace-614"><span class="linenos">614</span></a>
+</span><span id="GlobalWorkspace-615"><a href="#GlobalWorkspace-615"><span class="linenos">615</span></a>        <span class="k">if</span> <span class="n">contrastive_loss</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="GlobalWorkspace-616"><a href="#GlobalWorkspace-616"><span class="linenos">616</span></a>            <span class="n">contrastive_loss</span> <span class="o">=</span> <span class="n">ContrastiveLoss</span><span class="p">(</span>
+</span><span id="GlobalWorkspace-617"><a href="#GlobalWorkspace-617"><span class="linenos">617</span></a>                <span class="n">torch</span><span class="o">.</span><span class="n">tensor</span><span class="p">([</span><span class="mi">1</span> <span class="o">/</span> <span class="mf">0.07</span><span class="p">])</span><span class="o">.</span><span class="n">log</span><span class="p">(),</span> <span class="s2">&quot;mean&quot;</span><span class="p">,</span> <span class="n">learn_logit_scale</span>
+</span><span id="GlobalWorkspace-618"><a href="#GlobalWorkspace-618"><span class="linenos">618</span></a>            <span class="p">)</span>
+</span><span id="GlobalWorkspace-619"><a href="#GlobalWorkspace-619"><span class="linenos">619</span></a>
+</span><span id="GlobalWorkspace-620"><a href="#GlobalWorkspace-620"><span class="linenos">620</span></a>        <span class="n">selection_mod</span> <span class="o">=</span> <span class="n">RandomSelection</span><span class="p">(</span><span class="n">selection_temperature</span><span class="p">)</span>
+</span><span id="GlobalWorkspace-621"><a href="#GlobalWorkspace-621"><span class="linenos">621</span></a>        <span class="n">loss_mod</span> <span class="o">=</span> <span class="n">GWLosses</span><span class="p">(</span>
+</span><span id="GlobalWorkspace-622"><a href="#GlobalWorkspace-622"><span class="linenos">622</span></a>            <span class="n">gw_mod</span><span class="p">,</span> <span class="n">selection_mod</span><span class="p">,</span> <span class="n">domain_mods</span><span class="p">,</span> <span class="n">loss_coefs</span><span class="p">,</span> <span class="n">contrastive_loss</span>
+</span><span id="GlobalWorkspace-623"><a href="#GlobalWorkspace-623"><span class="linenos">623</span></a>        <span class="p">)</span>
+</span><span id="GlobalWorkspace-624"><a href="#GlobalWorkspace-624"><span class="linenos">624</span></a>
+</span><span id="GlobalWorkspace-625"><a href="#GlobalWorkspace-625"><span class="linenos">625</span></a>        <span class="nb">super</span><span class="p">()</span><span class="o">.</span><span class="fm">__init__</span><span class="p">(</span>
+</span><span id="GlobalWorkspace-626"><a href="#GlobalWorkspace-626"><span class="linenos">626</span></a>            <span class="n">gw_mod</span><span class="p">,</span>
+</span><span id="GlobalWorkspace-627"><a href="#GlobalWorkspace-627"><span class="linenos">627</span></a>            <span class="n">selection_mod</span><span class="p">,</span>
+</span><span id="GlobalWorkspace-628"><a href="#GlobalWorkspace-628"><span class="linenos">628</span></a>            <span class="n">loss_mod</span><span class="p">,</span>
+</span><span id="GlobalWorkspace-629"><a href="#GlobalWorkspace-629"><span class="linenos">629</span></a>            <span class="n">optim_lr</span><span class="p">,</span>
+</span><span id="GlobalWorkspace-630"><a href="#GlobalWorkspace-630"><span class="linenos">630</span></a>            <span class="n">optim_weight_decay</span><span class="p">,</span>
+</span><span id="GlobalWorkspace-631"><a href="#GlobalWorkspace-631"><span class="linenos">631</span></a>            <span class="n">scheduler_args</span><span class="p">,</span>
+</span><span id="GlobalWorkspace-632"><a href="#GlobalWorkspace-632"><span class="linenos">632</span></a>        <span class="p">)</span>
+</span><span id="GlobalWorkspace-633"><a href="#GlobalWorkspace-633"><span class="linenos">633</span></a>
+</span><span id="GlobalWorkspace-634"><a href="#GlobalWorkspace-634"><span class="linenos">634</span></a>    <span class="k">def</span> <span class="nf">forward</span><span class="p">(</span>  <span class="c1"># type: ignore</span>
+</span><span id="GlobalWorkspace-635"><a href="#GlobalWorkspace-635"><span class="linenos">635</span></a>        <span class="bp">self</span><span class="p">,</span>
+</span><span id="GlobalWorkspace-636"><a href="#GlobalWorkspace-636"><span class="linenos">636</span></a>        <span class="n">latent_domains</span><span class="p">:</span> <span class="n">LatentsDomainGroupsT</span><span class="p">,</span>
+</span><span id="GlobalWorkspace-637"><a href="#GlobalWorkspace-637"><span class="linenos">637</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="n">GWPredictions</span><span class="p">:</span>
+</span><span id="GlobalWorkspace-638"><a href="#GlobalWorkspace-638"><span class="linenos">638</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="GlobalWorkspace-639"><a href="#GlobalWorkspace-639"><span class="linenos">639</span></a><span class="sd">        Computes demi-cycles, cycles, and translations.</span>
+</span><span id="GlobalWorkspace-640"><a href="#GlobalWorkspace-640"><span class="linenos">640</span></a>
+</span><span id="GlobalWorkspace-641"><a href="#GlobalWorkspace-641"><span class="linenos">641</span></a><span class="sd">        Args:</span>
+</span><span id="GlobalWorkspace-642"><a href="#GlobalWorkspace-642"><span class="linenos">642</span></a><span class="sd">            latent_domains (`LatentsT`): Groups of domains for the computation.</span>
+</span><span id="GlobalWorkspace-643"><a href="#GlobalWorkspace-643"><span class="linenos">643</span></a>
+</span><span id="GlobalWorkspace-644"><a href="#GlobalWorkspace-644"><span class="linenos">644</span></a><span class="sd">        Returns:</span>
+</span><span id="GlobalWorkspace-645"><a href="#GlobalWorkspace-645"><span class="linenos">645</span></a><span class="sd">            `GWPredictions`: the predictions on the batch.</span>
+</span><span id="GlobalWorkspace-646"><a href="#GlobalWorkspace-646"><span class="linenos">646</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="GlobalWorkspace-647"><a href="#GlobalWorkspace-647"><span class="linenos">647</span></a>        <span class="k">return</span> <span class="n">GWPredictions</span><span class="p">(</span>
+</span><span id="GlobalWorkspace-648"><a href="#GlobalWorkspace-648"><span class="linenos">648</span></a>            <span class="n">demi_cycles</span><span class="o">=</span><span class="n">batch_demi_cycles</span><span class="p">(</span>
+</span><span id="GlobalWorkspace-649"><a href="#GlobalWorkspace-649"><span class="linenos">649</span></a>                <span class="bp">self</span><span class="o">.</span><span class="n">gw_mod</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">selection_mod</span><span class="p">,</span> <span class="n">latent_domains</span>
+</span><span id="GlobalWorkspace-650"><a href="#GlobalWorkspace-650"><span class="linenos">650</span></a>            <span class="p">),</span>
+</span><span id="GlobalWorkspace-651"><a href="#GlobalWorkspace-651"><span class="linenos">651</span></a>            <span class="n">cycles</span><span class="o">=</span><span class="n">batch_cycles</span><span class="p">(</span>
+</span><span id="GlobalWorkspace-652"><a href="#GlobalWorkspace-652"><span class="linenos">652</span></a>                <span class="bp">self</span><span class="o">.</span><span class="n">gw_mod</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">selection_mod</span><span class="p">,</span> <span class="n">latent_domains</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">domain_mods</span><span class="o">.</span><span class="n">keys</span><span class="p">()</span>
+</span><span id="GlobalWorkspace-653"><a href="#GlobalWorkspace-653"><span class="linenos">653</span></a>            <span class="p">),</span>
+</span><span id="GlobalWorkspace-654"><a href="#GlobalWorkspace-654"><span class="linenos">654</span></a>            <span class="n">translations</span><span class="o">=</span><span class="n">batch_translations</span><span class="p">(</span>
+</span><span id="GlobalWorkspace-655"><a href="#GlobalWorkspace-655"><span class="linenos">655</span></a>                <span class="bp">self</span><span class="o">.</span><span class="n">gw_mod</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">selection_mod</span><span class="p">,</span> <span class="n">latent_domains</span>
+</span><span id="GlobalWorkspace-656"><a href="#GlobalWorkspace-656"><span class="linenos">656</span></a>            <span class="p">),</span>
+</span><span id="GlobalWorkspace-657"><a href="#GlobalWorkspace-657"><span class="linenos">657</span></a>            <span class="c1"># TODO: add other combinations</span>
+</span><span id="GlobalWorkspace-658"><a href="#GlobalWorkspace-658"><span class="linenos">658</span></a>            <span class="o">**</span><span class="nb">super</span><span class="p">()</span><span class="o">.</span><span class="n">forward</span><span class="p">(</span><span class="n">latent_domains</span><span class="p">),</span>
+</span><span id="GlobalWorkspace-659"><a href="#GlobalWorkspace-659"><span class="linenos">659</span></a>        <span class="p">)</span>
+</span></pre></div>
+
+
+            <div class="docstring"><p>The 2-domain fusion (with broadcast loss) flavor of GlobalWorkspaceBase.</p>
+
+<p>This is used to simplify a Global Workspace instanciation and only overrides the
+<code><a href="#GlobalWorkspace.__init__">__init__</a></code> method.</p>
+</div>
+
+
+                            <div id="GlobalWorkspace.__init__" class="classattr">
+                                        <input id="GlobalWorkspace.__init__-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
+<div class="attr function">
+            
+        <span class="name">GlobalWorkspace</span><span class="signature pdoc-code multiline">(<span class="param">	<span class="n">domain_mods</span><span class="p">:</span> <span class="n">collections</span><span class="o">.</span><span class="n">abc</span><span class="o">.</span><span class="n">Mapping</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n"><a href="domain.html#DomainModule">shimmer.modules.domain.DomainModule</a></span><span class="p">]</span>,</span><span class="param">	<span class="n">gw_encoders</span><span class="p">:</span> <span class="n">collections</span><span class="o">.</span><span class="n">abc</span><span class="o">.</span><span class="n">Mapping</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">nn</span><span class="o">.</span><span class="n">modules</span><span class="o">.</span><span class="n">module</span><span class="o">.</span><span class="n">Module</span><span class="p">]</span>,</span><span class="param">	<span class="n">gw_decoders</span><span class="p">:</span> <span class="n">collections</span><span class="o">.</span><span class="n">abc</span><span class="o">.</span><span class="n">Mapping</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">nn</span><span class="o">.</span><span class="n">modules</span><span class="o">.</span><span class="n">module</span><span class="o">.</span><span class="n">Module</span><span class="p">]</span>,</span><span class="param">	<span class="n">workspace_dim</span><span class="p">:</span> <span class="nb">int</span>,</span><span class="param">	<span class="n">loss_coefs</span><span class="p">:</span> <span class="n"><a href="losses.html#BroadcastLossCoefs">shimmer.modules.losses.BroadcastLossCoefs</a></span>,</span><span class="param">	<span class="n">selection_temperature</span><span class="p">:</span> <span class="nb">float</span> <span class="o">=</span> <span class="mf">0.2</span>,</span><span class="param">	<span class="n">optim_lr</span><span class="p">:</span> <span class="nb">float</span> <span class="o">=</span> <span class="mf">0.001</span>,</span><span class="param">	<span class="n">optim_weight_decay</span><span class="p">:</span> <span class="nb">float</span> <span class="o">=</span> <span class="mf">0.0</span>,</span><span class="param">	<span class="n">scheduler_args</span><span class="p">:</span> <span class="n"><a href="#SchedulerArgs">SchedulerArgs</a></span> <span class="o">|</span> <span class="kc">None</span> <span class="o">=</span> <span class="kc">None</span>,</span><span class="param">	<span class="n">learn_logit_scale</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">False</span>,</span><span class="param">	<span class="n">contrastive_loss</span><span class="p">:</span> <span class="n">collections</span><span class="o">.</span><span class="n">abc</span><span class="o">.</span><span class="n">Callable</span><span class="p">[[</span><span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">],</span> <span class="n"><a href="domain.html#LossOutput">shimmer.modules.domain.LossOutput</a></span><span class="p">]</span> <span class="o">|</span> <span class="kc">None</span> <span class="o">=</span> <span class="kc">None</span></span>)</span>
+
+                <label class="view-source-button" for="GlobalWorkspace.__init__-view-source"><span>View Source</span></label>
+
+    </div>
+    <a class="headerlink" href="#GlobalWorkspace.__init__"></a>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="GlobalWorkspace.__init__-572"><a href="#GlobalWorkspace.__init__-572"><span class="linenos">572</span></a>    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span>
+</span><span id="GlobalWorkspace.__init__-573"><a href="#GlobalWorkspace.__init__-573"><span class="linenos">573</span></a>        <span class="bp">self</span><span class="p">,</span>
+</span><span id="GlobalWorkspace.__init__-574"><a href="#GlobalWorkspace.__init__-574"><span class="linenos">574</span></a>        <span class="n">domain_mods</span><span class="p">:</span> <span class="n">Mapping</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">DomainModule</span><span class="p">],</span>
+</span><span id="GlobalWorkspace.__init__-575"><a href="#GlobalWorkspace.__init__-575"><span class="linenos">575</span></a>        <span class="n">gw_encoders</span><span class="p">:</span> <span class="n">Mapping</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">Module</span><span class="p">],</span>
+</span><span id="GlobalWorkspace.__init__-576"><a href="#GlobalWorkspace.__init__-576"><span class="linenos">576</span></a>        <span class="n">gw_decoders</span><span class="p">:</span> <span class="n">Mapping</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">Module</span><span class="p">],</span>
+</span><span id="GlobalWorkspace.__init__-577"><a href="#GlobalWorkspace.__init__-577"><span class="linenos">577</span></a>        <span class="n">workspace_dim</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span>
+</span><span id="GlobalWorkspace.__init__-578"><a href="#GlobalWorkspace.__init__-578"><span class="linenos">578</span></a>        <span class="n">loss_coefs</span><span class="p">:</span> <span class="n">BroadcastLossCoefs</span><span class="p">,</span>
+</span><span id="GlobalWorkspace.__init__-579"><a href="#GlobalWorkspace.__init__-579"><span class="linenos">579</span></a>        <span class="n">selection_temperature</span><span class="p">:</span> <span class="nb">float</span> <span class="o">=</span> <span class="mf">0.2</span><span class="p">,</span>
+</span><span id="GlobalWorkspace.__init__-580"><a href="#GlobalWorkspace.__init__-580"><span class="linenos">580</span></a>        <span class="n">optim_lr</span><span class="p">:</span> <span class="nb">float</span> <span class="o">=</span> <span class="mf">1e-3</span><span class="p">,</span>
+</span><span id="GlobalWorkspace.__init__-581"><a href="#GlobalWorkspace.__init__-581"><span class="linenos">581</span></a>        <span class="n">optim_weight_decay</span><span class="p">:</span> <span class="nb">float</span> <span class="o">=</span> <span class="mf">0.0</span><span class="p">,</span>
+</span><span id="GlobalWorkspace.__init__-582"><a href="#GlobalWorkspace.__init__-582"><span class="linenos">582</span></a>        <span class="n">scheduler_args</span><span class="p">:</span> <span class="n">SchedulerArgs</span> <span class="o">|</span> <span class="kc">None</span> <span class="o">=</span> <span class="kc">None</span><span class="p">,</span>
+</span><span id="GlobalWorkspace.__init__-583"><a href="#GlobalWorkspace.__init__-583"><span class="linenos">583</span></a>        <span class="n">learn_logit_scale</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">False</span><span class="p">,</span>
+</span><span id="GlobalWorkspace.__init__-584"><a href="#GlobalWorkspace.__init__-584"><span class="linenos">584</span></a>        <span class="n">contrastive_loss</span><span class="p">:</span> <span class="n">ContrastiveLossType</span> <span class="o">|</span> <span class="kc">None</span> <span class="o">=</span> <span class="kc">None</span><span class="p">,</span>
+</span><span id="GlobalWorkspace.__init__-585"><a href="#GlobalWorkspace.__init__-585"><span class="linenos">585</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="GlobalWorkspace.__init__-586"><a href="#GlobalWorkspace.__init__-586"><span class="linenos">586</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="GlobalWorkspace.__init__-587"><a href="#GlobalWorkspace.__init__-587"><span class="linenos">587</span></a><span class="sd">        Initializes a Global Workspace</span>
+</span><span id="GlobalWorkspace.__init__-588"><a href="#GlobalWorkspace.__init__-588"><span class="linenos">588</span></a>
+</span><span id="GlobalWorkspace.__init__-589"><a href="#GlobalWorkspace.__init__-589"><span class="linenos">589</span></a><span class="sd">        Args:</span>
+</span><span id="GlobalWorkspace.__init__-590"><a href="#GlobalWorkspace.__init__-590"><span class="linenos">590</span></a><span class="sd">            domain_mods (`Mapping[str, DomainModule]`): mapping of the domains</span>
+</span><span id="GlobalWorkspace.__init__-591"><a href="#GlobalWorkspace.__init__-591"><span class="linenos">591</span></a><span class="sd">                connected to the GW. Keys are domain names, values are the</span>
+</span><span id="GlobalWorkspace.__init__-592"><a href="#GlobalWorkspace.__init__-592"><span class="linenos">592</span></a><span class="sd">                `DomainModule`.</span>
+</span><span id="GlobalWorkspace.__init__-593"><a href="#GlobalWorkspace.__init__-593"><span class="linenos">593</span></a><span class="sd">            gw_encoders (`Mapping[str, torch.nn.Module]`): mapping for each domain</span>
+</span><span id="GlobalWorkspace.__init__-594"><a href="#GlobalWorkspace.__init__-594"><span class="linenos">594</span></a><span class="sd">                name to a `torch.nn.Module` class which role is to encode a</span>
+</span><span id="GlobalWorkspace.__init__-595"><a href="#GlobalWorkspace.__init__-595"><span class="linenos">595</span></a><span class="sd">                unimodal latent representations into a GW representation (pre fusion).</span>
+</span><span id="GlobalWorkspace.__init__-596"><a href="#GlobalWorkspace.__init__-596"><span class="linenos">596</span></a><span class="sd">            gw_decoders (`Mapping[str, torch.nn.Module]`): mapping for each domain</span>
+</span><span id="GlobalWorkspace.__init__-597"><a href="#GlobalWorkspace.__init__-597"><span class="linenos">597</span></a><span class="sd">                name to a `torch.nn.Module` class which role is to decode a</span>
+</span><span id="GlobalWorkspace.__init__-598"><a href="#GlobalWorkspace.__init__-598"><span class="linenos">598</span></a><span class="sd">                GW representation into a unimodal latent representations.</span>
+</span><span id="GlobalWorkspace.__init__-599"><a href="#GlobalWorkspace.__init__-599"><span class="linenos">599</span></a><span class="sd">            workspace_dim (`int`): dimension of the GW.</span>
+</span><span id="GlobalWorkspace.__init__-600"><a href="#GlobalWorkspace.__init__-600"><span class="linenos">600</span></a><span class="sd">            loss_coefs (`BroadcastLossCoefs`): loss coefs for the losses.</span>
+</span><span id="GlobalWorkspace.__init__-601"><a href="#GlobalWorkspace.__init__-601"><span class="linenos">601</span></a><span class="sd">            selection_temperature (`float`): temperature value for the RandomSelection</span>
+</span><span id="GlobalWorkspace.__init__-602"><a href="#GlobalWorkspace.__init__-602"><span class="linenos">602</span></a><span class="sd">                module.</span>
+</span><span id="GlobalWorkspace.__init__-603"><a href="#GlobalWorkspace.__init__-603"><span class="linenos">603</span></a><span class="sd">            optim_lr (`float`): learning rate</span>
+</span><span id="GlobalWorkspace.__init__-604"><a href="#GlobalWorkspace.__init__-604"><span class="linenos">604</span></a><span class="sd">            optim_weight_decay (`float`): weight decay</span>
+</span><span id="GlobalWorkspace.__init__-605"><a href="#GlobalWorkspace.__init__-605"><span class="linenos">605</span></a><span class="sd">            scheduler_args (`SchedulerArgs | None`): optimization scheduler&#39;s arguments</span>
+</span><span id="GlobalWorkspace.__init__-606"><a href="#GlobalWorkspace.__init__-606"><span class="linenos">606</span></a><span class="sd">            learn_logit_scale (`bool`): whether to learn the contrastive learning</span>
+</span><span id="GlobalWorkspace.__init__-607"><a href="#GlobalWorkspace.__init__-607"><span class="linenos">607</span></a><span class="sd">                contrastive loss when using the default contrastive loss.</span>
+</span><span id="GlobalWorkspace.__init__-608"><a href="#GlobalWorkspace.__init__-608"><span class="linenos">608</span></a><span class="sd">            contrastive_loss (`ContrastiveLossType | None`): a contrastive loss</span>
+</span><span id="GlobalWorkspace.__init__-609"><a href="#GlobalWorkspace.__init__-609"><span class="linenos">609</span></a><span class="sd">                function used for alignment. `learn_logit_scale` will not affect custom</span>
+</span><span id="GlobalWorkspace.__init__-610"><a href="#GlobalWorkspace.__init__-610"><span class="linenos">610</span></a><span class="sd">                contrastive losses.</span>
+</span><span id="GlobalWorkspace.__init__-611"><a href="#GlobalWorkspace.__init__-611"><span class="linenos">611</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="GlobalWorkspace.__init__-612"><a href="#GlobalWorkspace.__init__-612"><span class="linenos">612</span></a>        <span class="n">domain_mods</span> <span class="o">=</span> <span class="n">freeze_domain_modules</span><span class="p">(</span><span class="n">domain_mods</span><span class="p">)</span>
+</span><span id="GlobalWorkspace.__init__-613"><a href="#GlobalWorkspace.__init__-613"><span class="linenos">613</span></a>        <span class="n">gw_mod</span> <span class="o">=</span> <span class="n">GWModule</span><span class="p">(</span><span class="n">domain_mods</span><span class="p">,</span> <span class="n">workspace_dim</span><span class="p">,</span> <span class="n">gw_encoders</span><span class="p">,</span> <span class="n">gw_decoders</span><span class="p">)</span>
+</span><span id="GlobalWorkspace.__init__-614"><a href="#GlobalWorkspace.__init__-614"><span class="linenos">614</span></a>
+</span><span id="GlobalWorkspace.__init__-615"><a href="#GlobalWorkspace.__init__-615"><span class="linenos">615</span></a>        <span class="k">if</span> <span class="n">contrastive_loss</span> <span class="ow">is</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="GlobalWorkspace.__init__-616"><a href="#GlobalWorkspace.__init__-616"><span class="linenos">616</span></a>            <span class="n">contrastive_loss</span> <span class="o">=</span> <span class="n">ContrastiveLoss</span><span class="p">(</span>
+</span><span id="GlobalWorkspace.__init__-617"><a href="#GlobalWorkspace.__init__-617"><span class="linenos">617</span></a>                <span class="n">torch</span><span class="o">.</span><span class="n">tensor</span><span class="p">([</span><span class="mi">1</span> <span class="o">/</span> <span class="mf">0.07</span><span class="p">])</span><span class="o">.</span><span class="n">log</span><span class="p">(),</span> <span class="s2">&quot;mean&quot;</span><span class="p">,</span> <span class="n">learn_logit_scale</span>
+</span><span id="GlobalWorkspace.__init__-618"><a href="#GlobalWorkspace.__init__-618"><span class="linenos">618</span></a>            <span class="p">)</span>
+</span><span id="GlobalWorkspace.__init__-619"><a href="#GlobalWorkspace.__init__-619"><span class="linenos">619</span></a>
+</span><span id="GlobalWorkspace.__init__-620"><a href="#GlobalWorkspace.__init__-620"><span class="linenos">620</span></a>        <span class="n">selection_mod</span> <span class="o">=</span> <span class="n">RandomSelection</span><span class="p">(</span><span class="n">selection_temperature</span><span class="p">)</span>
+</span><span id="GlobalWorkspace.__init__-621"><a href="#GlobalWorkspace.__init__-621"><span class="linenos">621</span></a>        <span class="n">loss_mod</span> <span class="o">=</span> <span class="n">GWLosses</span><span class="p">(</span>
+</span><span id="GlobalWorkspace.__init__-622"><a href="#GlobalWorkspace.__init__-622"><span class="linenos">622</span></a>            <span class="n">gw_mod</span><span class="p">,</span> <span class="n">selection_mod</span><span class="p">,</span> <span class="n">domain_mods</span><span class="p">,</span> <span class="n">loss_coefs</span><span class="p">,</span> <span class="n">contrastive_loss</span>
+</span><span id="GlobalWorkspace.__init__-623"><a href="#GlobalWorkspace.__init__-623"><span class="linenos">623</span></a>        <span class="p">)</span>
+</span><span id="GlobalWorkspace.__init__-624"><a href="#GlobalWorkspace.__init__-624"><span class="linenos">624</span></a>
+</span><span id="GlobalWorkspace.__init__-625"><a href="#GlobalWorkspace.__init__-625"><span class="linenos">625</span></a>        <span class="nb">super</span><span class="p">()</span><span class="o">.</span><span class="fm">__init__</span><span class="p">(</span>
+</span><span id="GlobalWorkspace.__init__-626"><a href="#GlobalWorkspace.__init__-626"><span class="linenos">626</span></a>            <span class="n">gw_mod</span><span class="p">,</span>
+</span><span id="GlobalWorkspace.__init__-627"><a href="#GlobalWorkspace.__init__-627"><span class="linenos">627</span></a>            <span class="n">selection_mod</span><span class="p">,</span>
+</span><span id="GlobalWorkspace.__init__-628"><a href="#GlobalWorkspace.__init__-628"><span class="linenos">628</span></a>            <span class="n">loss_mod</span><span class="p">,</span>
+</span><span id="GlobalWorkspace.__init__-629"><a href="#GlobalWorkspace.__init__-629"><span class="linenos">629</span></a>            <span class="n">optim_lr</span><span class="p">,</span>
+</span><span id="GlobalWorkspace.__init__-630"><a href="#GlobalWorkspace.__init__-630"><span class="linenos">630</span></a>            <span class="n">optim_weight_decay</span><span class="p">,</span>
+</span><span id="GlobalWorkspace.__init__-631"><a href="#GlobalWorkspace.__init__-631"><span class="linenos">631</span></a>            <span class="n">scheduler_args</span><span class="p">,</span>
+</span><span id="GlobalWorkspace.__init__-632"><a href="#GlobalWorkspace.__init__-632"><span class="linenos">632</span></a>        <span class="p">)</span>
+</span></pre></div>
+
+
+            <div class="docstring"><p>Initializes a Global Workspace</p>
+
+<h6 id="arguments">Arguments:</h6>
+
+<ul>
+<li><strong>domain_mods (<code>Mapping[str, DomainModule]</code>):</strong>  mapping of the domains
+connected to the GW. Keys are domain names, values are the
+<code>DomainModule</code>.</li>
+<li><strong>gw_encoders (<code>Mapping[str, torch.nn.Module]</code>):</strong>  mapping for each domain
+name to a <code>torch.nn.Module</code> class which role is to encode a
+unimodal latent representations into a GW representation (pre fusion).</li>
+<li><strong>gw_decoders (<code>Mapping[str, torch.nn.Module]</code>):</strong>  mapping for each domain
+name to a <code>torch.nn.Module</code> class which role is to decode a
+GW representation into a unimodal latent representations.</li>
+<li><strong>workspace_dim (<code>int</code>):</strong>  dimension of the GW.</li>
+<li><strong>loss_coefs (<code>BroadcastLossCoefs</code>):</strong>  loss coefs for the losses.</li>
+<li><strong>selection_temperature (<code><a href="#GlobalWorkspace.float">float</a></code>):</strong>  temperature value for the RandomSelection
+module.</li>
+<li><strong>optim_lr (<code><a href="#GlobalWorkspace.float">float</a></code>):</strong>  learning rate</li>
+<li><strong>optim_weight_decay (<code><a href="#GlobalWorkspace.float">float</a></code>):</strong>  weight decay</li>
+<li><strong>scheduler_args (<code>SchedulerArgs | None</code>):</strong>  optimization scheduler's arguments</li>
+<li><strong>learn_logit_scale (<code>bool</code>):</strong>  whether to learn the contrastive learning
+contrastive loss when using the default contrastive loss.</li>
+<li><strong>contrastive_loss (<code>ContrastiveLossType | None</code>):</strong>  a contrastive loss
+function used for alignment. <code>learn_logit_scale</code> will not affect custom
+contrastive losses.</li>
+</ul>
+</div>
+
+
+                            </div>
+                            <div id="GlobalWorkspace.forward" class="classattr">
+                                        <input id="GlobalWorkspace.forward-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
+<div class="attr function">
+            
+        <span class="def">def</span>
+        <span class="name">forward</span><span class="signature pdoc-code multiline">(<span class="param">	<span class="bp">self</span>,</span><span class="param">	<span class="n">latent_domains</span><span class="p">:</span> <span class="n">collections</span><span class="o">.</span><span class="n">abc</span><span class="o">.</span><span class="n">Mapping</span><span class="p">[</span><span class="nb">frozenset</span><span class="p">[</span><span class="nb">str</span><span class="p">],</span> <span class="n">collections</span><span class="o">.</span><span class="n">abc</span><span class="o">.</span><span class="n">Mapping</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]]</span></span><span class="return-annotation">) -> <span class="n"><a href="#GWPredictions">GWPredictions</a></span>:</span></span>
+
+                <label class="view-source-button" for="GlobalWorkspace.forward-view-source"><span>View Source</span></label>
+
+    </div>
+    <a class="headerlink" href="#GlobalWorkspace.forward"></a>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="GlobalWorkspace.forward-634"><a href="#GlobalWorkspace.forward-634"><span class="linenos">634</span></a>    <span class="k">def</span> <span class="nf">forward</span><span class="p">(</span>  <span class="c1"># type: ignore</span>
+</span><span id="GlobalWorkspace.forward-635"><a href="#GlobalWorkspace.forward-635"><span class="linenos">635</span></a>        <span class="bp">self</span><span class="p">,</span>
+</span><span id="GlobalWorkspace.forward-636"><a href="#GlobalWorkspace.forward-636"><span class="linenos">636</span></a>        <span class="n">latent_domains</span><span class="p">:</span> <span class="n">LatentsDomainGroupsT</span><span class="p">,</span>
+</span><span id="GlobalWorkspace.forward-637"><a href="#GlobalWorkspace.forward-637"><span class="linenos">637</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="n">GWPredictions</span><span class="p">:</span>
+</span><span id="GlobalWorkspace.forward-638"><a href="#GlobalWorkspace.forward-638"><span class="linenos">638</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="GlobalWorkspace.forward-639"><a href="#GlobalWorkspace.forward-639"><span class="linenos">639</span></a><span class="sd">        Computes demi-cycles, cycles, and translations.</span>
+</span><span id="GlobalWorkspace.forward-640"><a href="#GlobalWorkspace.forward-640"><span class="linenos">640</span></a>
+</span><span id="GlobalWorkspace.forward-641"><a href="#GlobalWorkspace.forward-641"><span class="linenos">641</span></a><span class="sd">        Args:</span>
+</span><span id="GlobalWorkspace.forward-642"><a href="#GlobalWorkspace.forward-642"><span class="linenos">642</span></a><span class="sd">            latent_domains (`LatentsT`): Groups of domains for the computation.</span>
+</span><span id="GlobalWorkspace.forward-643"><a href="#GlobalWorkspace.forward-643"><span class="linenos">643</span></a>
+</span><span id="GlobalWorkspace.forward-644"><a href="#GlobalWorkspace.forward-644"><span class="linenos">644</span></a><span class="sd">        Returns:</span>
+</span><span id="GlobalWorkspace.forward-645"><a href="#GlobalWorkspace.forward-645"><span class="linenos">645</span></a><span class="sd">            `GWPredictions`: the predictions on the batch.</span>
+</span><span id="GlobalWorkspace.forward-646"><a href="#GlobalWorkspace.forward-646"><span class="linenos">646</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="GlobalWorkspace.forward-647"><a href="#GlobalWorkspace.forward-647"><span class="linenos">647</span></a>        <span class="k">return</span> <span class="n">GWPredictions</span><span class="p">(</span>
+</span><span id="GlobalWorkspace.forward-648"><a href="#GlobalWorkspace.forward-648"><span class="linenos">648</span></a>            <span class="n">demi_cycles</span><span class="o">=</span><span class="n">batch_demi_cycles</span><span class="p">(</span>
+</span><span id="GlobalWorkspace.forward-649"><a href="#GlobalWorkspace.forward-649"><span class="linenos">649</span></a>                <span class="bp">self</span><span class="o">.</span><span class="n">gw_mod</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">selection_mod</span><span class="p">,</span> <span class="n">latent_domains</span>
+</span><span id="GlobalWorkspace.forward-650"><a href="#GlobalWorkspace.forward-650"><span class="linenos">650</span></a>            <span class="p">),</span>
+</span><span id="GlobalWorkspace.forward-651"><a href="#GlobalWorkspace.forward-651"><span class="linenos">651</span></a>            <span class="n">cycles</span><span class="o">=</span><span class="n">batch_cycles</span><span class="p">(</span>
+</span><span id="GlobalWorkspace.forward-652"><a href="#GlobalWorkspace.forward-652"><span class="linenos">652</span></a>                <span class="bp">self</span><span class="o">.</span><span class="n">gw_mod</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">selection_mod</span><span class="p">,</span> <span class="n">latent_domains</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">domain_mods</span><span class="o">.</span><span class="n">keys</span><span class="p">()</span>
+</span><span id="GlobalWorkspace.forward-653"><a href="#GlobalWorkspace.forward-653"><span class="linenos">653</span></a>            <span class="p">),</span>
+</span><span id="GlobalWorkspace.forward-654"><a href="#GlobalWorkspace.forward-654"><span class="linenos">654</span></a>            <span class="n">translations</span><span class="o">=</span><span class="n">batch_translations</span><span class="p">(</span>
+</span><span id="GlobalWorkspace.forward-655"><a href="#GlobalWorkspace.forward-655"><span class="linenos">655</span></a>                <span class="bp">self</span><span class="o">.</span><span class="n">gw_mod</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">selection_mod</span><span class="p">,</span> <span class="n">latent_domains</span>
+</span><span id="GlobalWorkspace.forward-656"><a href="#GlobalWorkspace.forward-656"><span class="linenos">656</span></a>            <span class="p">),</span>
+</span><span id="GlobalWorkspace.forward-657"><a href="#GlobalWorkspace.forward-657"><span class="linenos">657</span></a>            <span class="c1"># TODO: add other combinations</span>
+</span><span id="GlobalWorkspace.forward-658"><a href="#GlobalWorkspace.forward-658"><span class="linenos">658</span></a>            <span class="o">**</span><span class="nb">super</span><span class="p">()</span><span class="o">.</span><span class="n">forward</span><span class="p">(</span><span class="n">latent_domains</span><span class="p">),</span>
+</span><span id="GlobalWorkspace.forward-659"><a href="#GlobalWorkspace.forward-659"><span class="linenos">659</span></a>        <span class="p">)</span>
+</span></pre></div>
+
+
+            <div class="docstring"><p>Computes demi-cycles, cycles, and translations.</p>
+
+<h6 id="arguments">Arguments:</h6>
+
+<ul>
+<li><strong>latent_domains (<code>LatentsT</code>):</strong>  Groups of domains for the computation.</li>
+</ul>
+
+<h6 id="returns">Returns:</h6>
+
+<blockquote>
+  <p><code><a href="#GWPredictions">GWPredictions</a></code>: the predictions on the batch.</p>
+</blockquote>
+</div>
+
+
+                            </div>
+                            <div class="inherited">
+                                <h5>Inherited Members</h5>
+                                <dl>
+                                    <div><dt><a href="#GlobalWorkspaceBase">GlobalWorkspaceBase</a></dt>
+                                <dd id="GlobalWorkspace.gw_mod" class="variable"><a href="#GlobalWorkspaceBase.gw_mod">gw_mod</a></dd>
+                <dd id="GlobalWorkspace.selection_mod" class="variable"><a href="#GlobalWorkspaceBase.selection_mod">selection_mod</a></dd>
+                <dd id="GlobalWorkspace.loss_mod" class="variable"><a href="#GlobalWorkspaceBase.loss_mod">loss_mod</a></dd>
+                <dd id="GlobalWorkspace.optim_lr" class="variable"><a href="#GlobalWorkspaceBase.optim_lr">optim_lr</a></dd>
+                <dd id="GlobalWorkspace.optim_weight_decay" class="variable"><a href="#GlobalWorkspaceBase.optim_weight_decay">optim_weight_decay</a></dd>
+                <dd id="GlobalWorkspace.scheduler_args" class="variable"><a href="#GlobalWorkspaceBase.scheduler_args">scheduler_args</a></dd>
+                <dd id="GlobalWorkspace.domain_mods" class="variable"><a href="#GlobalWorkspaceBase.domain_mods">domain_mods</a></dd>
+                <dd id="GlobalWorkspace.workspace_dim" class="variable"><a href="#GlobalWorkspaceBase.workspace_dim">workspace_dim</a></dd>
+                <dd id="GlobalWorkspace.encode_and_fuse" class="function"><a href="#GlobalWorkspaceBase.encode_and_fuse">encode_and_fuse</a></dd>
+                <dd id="GlobalWorkspace.encode" class="function"><a href="#GlobalWorkspaceBase.encode">encode</a></dd>
+                <dd id="GlobalWorkspace.fuse" class="function"><a href="#GlobalWorkspaceBase.fuse">fuse</a></dd>
+                <dd id="GlobalWorkspace.decode" class="function"><a href="#GlobalWorkspaceBase.decode">decode</a></dd>
+                <dd id="GlobalWorkspace.batch_gw_states" class="function"><a href="#GlobalWorkspaceBase.batch_gw_states">batch_gw_states</a></dd>
+                <dd id="GlobalWorkspace.encode_domain" class="function"><a href="#GlobalWorkspaceBase.encode_domain">encode_domain</a></dd>
+                <dd id="GlobalWorkspace.encode_domains" class="function"><a href="#GlobalWorkspaceBase.encode_domains">encode_domains</a></dd>
+                <dd id="GlobalWorkspace.decode_domain" class="function"><a href="#GlobalWorkspaceBase.decode_domain">decode_domain</a></dd>
+                <dd id="GlobalWorkspace.decode_domains" class="function"><a href="#GlobalWorkspaceBase.decode_domains">decode_domains</a></dd>
+                <dd id="GlobalWorkspace.generic_step" class="function"><a href="#GlobalWorkspaceBase.generic_step">generic_step</a></dd>
+                <dd id="GlobalWorkspace.validation_step" class="function"><a href="#GlobalWorkspaceBase.validation_step">validation_step</a></dd>
+                <dd id="GlobalWorkspace.test_step" class="function"><a href="#GlobalWorkspaceBase.test_step">test_step</a></dd>
+                <dd id="GlobalWorkspace.training_step" class="function"><a href="#GlobalWorkspaceBase.training_step">training_step</a></dd>
+                <dd id="GlobalWorkspace.predict_step" class="function"><a href="#GlobalWorkspaceBase.predict_step">predict_step</a></dd>
+                <dd id="GlobalWorkspace.configure_optimizers" class="function"><a href="#GlobalWorkspaceBase.configure_optimizers">configure_optimizers</a></dd>
+
+            </div>
+            <div><dt>lightning.pytorch.core.module.LightningModule</dt>
+                                <dd id="GlobalWorkspace.CHECKPOINT_HYPER_PARAMS_KEY" class="variable">CHECKPOINT_HYPER_PARAMS_KEY</dd>
+                <dd id="GlobalWorkspace.CHECKPOINT_HYPER_PARAMS_NAME" class="variable">CHECKPOINT_HYPER_PARAMS_NAME</dd>
+                <dd id="GlobalWorkspace.CHECKPOINT_HYPER_PARAMS_TYPE" class="variable">CHECKPOINT_HYPER_PARAMS_TYPE</dd>
+                <dd id="GlobalWorkspace.optimizers" class="function">optimizers</dd>
+                <dd id="GlobalWorkspace.lr_schedulers" class="function">lr_schedulers</dd>
+                <dd id="GlobalWorkspace.trainer" class="variable">trainer</dd>
+                <dd id="GlobalWorkspace.fabric" class="variable">fabric</dd>
+                <dd id="GlobalWorkspace.example_input_array" class="variable">example_input_array</dd>
+                <dd id="GlobalWorkspace.current_epoch" class="variable">current_epoch</dd>
+                <dd id="GlobalWorkspace.global_step" class="variable">global_step</dd>
+                <dd id="GlobalWorkspace.global_rank" class="variable">global_rank</dd>
+                <dd id="GlobalWorkspace.local_rank" class="variable">local_rank</dd>
+                <dd id="GlobalWorkspace.on_gpu" class="variable">on_gpu</dd>
+                <dd id="GlobalWorkspace.automatic_optimization" class="variable">automatic_optimization</dd>
+                <dd id="GlobalWorkspace.strict_loading" class="variable">strict_loading</dd>
+                <dd id="GlobalWorkspace.logger" class="variable">logger</dd>
+                <dd id="GlobalWorkspace.loggers" class="variable">loggers</dd>
+                <dd id="GlobalWorkspace.print" class="function">print</dd>
+                <dd id="GlobalWorkspace.log" class="function">log</dd>
+                <dd id="GlobalWorkspace.log_dict" class="function">log_dict</dd>
+                <dd id="GlobalWorkspace.all_gather" class="function">all_gather</dd>
+                <dd id="GlobalWorkspace.configure_callbacks" class="function">configure_callbacks</dd>
+                <dd id="GlobalWorkspace.manual_backward" class="function">manual_backward</dd>
+                <dd id="GlobalWorkspace.backward" class="function">backward</dd>
+                <dd id="GlobalWorkspace.toggle_optimizer" class="function">toggle_optimizer</dd>
+                <dd id="GlobalWorkspace.untoggle_optimizer" class="function">untoggle_optimizer</dd>
+                <dd id="GlobalWorkspace.clip_gradients" class="function">clip_gradients</dd>
+                <dd id="GlobalWorkspace.configure_gradient_clipping" class="function">configure_gradient_clipping</dd>
+                <dd id="GlobalWorkspace.lr_scheduler_step" class="function">lr_scheduler_step</dd>
+                <dd id="GlobalWorkspace.optimizer_step" class="function">optimizer_step</dd>
+                <dd id="GlobalWorkspace.optimizer_zero_grad" class="function">optimizer_zero_grad</dd>
+                <dd id="GlobalWorkspace.freeze" class="function">freeze</dd>
+                <dd id="GlobalWorkspace.unfreeze" class="function">unfreeze</dd>
+                <dd id="GlobalWorkspace.to_onnx" class="function">to_onnx</dd>
+                <dd id="GlobalWorkspace.to_torchscript" class="function">to_torchscript</dd>
+                <dd id="GlobalWorkspace.load_from_checkpoint" class="function">load_from_checkpoint</dd>
+
+            </div>
+            <div><dt>lightning.fabric.utilities.device_dtype_mixin._DeviceDtypeModuleMixin</dt>
+                                <dd id="GlobalWorkspace.dtype" class="variable">dtype</dd>
+                <dd id="GlobalWorkspace.device" class="variable">device</dd>
+                <dd id="GlobalWorkspace.to" class="function">to</dd>
+                <dd id="GlobalWorkspace.cuda" class="function">cuda</dd>
+                <dd id="GlobalWorkspace.cpu" class="function">cpu</dd>
+                <dd id="GlobalWorkspace.type" class="function">type</dd>
+                <dd id="GlobalWorkspace.float" class="function">float</dd>
+                <dd id="GlobalWorkspace.double" class="function">double</dd>
+                <dd id="GlobalWorkspace.half" class="function">half</dd>
+
+            </div>
+            <div><dt>lightning.pytorch.core.mixins.hparams_mixin.HyperparametersMixin</dt>
+                                <dd id="GlobalWorkspace.save_hyperparameters" class="function">save_hyperparameters</dd>
+                <dd id="GlobalWorkspace.hparams" class="variable">hparams</dd>
+                <dd id="GlobalWorkspace.hparams_initial" class="variable">hparams_initial</dd>
+
+            </div>
+            <div><dt>lightning.pytorch.core.hooks.ModelHooks</dt>
+                                <dd id="GlobalWorkspace.on_fit_start" class="function">on_fit_start</dd>
+                <dd id="GlobalWorkspace.on_fit_end" class="function">on_fit_end</dd>
+                <dd id="GlobalWorkspace.on_train_start" class="function">on_train_start</dd>
+                <dd id="GlobalWorkspace.on_train_end" class="function">on_train_end</dd>
+                <dd id="GlobalWorkspace.on_validation_start" class="function">on_validation_start</dd>
+                <dd id="GlobalWorkspace.on_validation_end" class="function">on_validation_end</dd>
+                <dd id="GlobalWorkspace.on_test_start" class="function">on_test_start</dd>
+                <dd id="GlobalWorkspace.on_test_end" class="function">on_test_end</dd>
+                <dd id="GlobalWorkspace.on_predict_start" class="function">on_predict_start</dd>
+                <dd id="GlobalWorkspace.on_predict_end" class="function">on_predict_end</dd>
+                <dd id="GlobalWorkspace.on_train_batch_start" class="function">on_train_batch_start</dd>
+                <dd id="GlobalWorkspace.on_train_batch_end" class="function">on_train_batch_end</dd>
+                <dd id="GlobalWorkspace.on_validation_batch_start" class="function">on_validation_batch_start</dd>
+                <dd id="GlobalWorkspace.on_validation_batch_end" class="function">on_validation_batch_end</dd>
+                <dd id="GlobalWorkspace.on_test_batch_start" class="function">on_test_batch_start</dd>
+                <dd id="GlobalWorkspace.on_test_batch_end" class="function">on_test_batch_end</dd>
+                <dd id="GlobalWorkspace.on_predict_batch_start" class="function">on_predict_batch_start</dd>
+                <dd id="GlobalWorkspace.on_predict_batch_end" class="function">on_predict_batch_end</dd>
+                <dd id="GlobalWorkspace.on_validation_model_zero_grad" class="function">on_validation_model_zero_grad</dd>
+                <dd id="GlobalWorkspace.on_validation_model_eval" class="function">on_validation_model_eval</dd>
+                <dd id="GlobalWorkspace.on_validation_model_train" class="function">on_validation_model_train</dd>
+                <dd id="GlobalWorkspace.on_test_model_eval" class="function">on_test_model_eval</dd>
+                <dd id="GlobalWorkspace.on_test_model_train" class="function">on_test_model_train</dd>
+                <dd id="GlobalWorkspace.on_predict_model_eval" class="function">on_predict_model_eval</dd>
+                <dd id="GlobalWorkspace.on_train_epoch_start" class="function">on_train_epoch_start</dd>
+                <dd id="GlobalWorkspace.on_train_epoch_end" class="function">on_train_epoch_end</dd>
+                <dd id="GlobalWorkspace.on_validation_epoch_start" class="function">on_validation_epoch_start</dd>
+                <dd id="GlobalWorkspace.on_validation_epoch_end" class="function">on_validation_epoch_end</dd>
+                <dd id="GlobalWorkspace.on_test_epoch_start" class="function">on_test_epoch_start</dd>
+                <dd id="GlobalWorkspace.on_test_epoch_end" class="function">on_test_epoch_end</dd>
+                <dd id="GlobalWorkspace.on_predict_epoch_start" class="function">on_predict_epoch_start</dd>
+                <dd id="GlobalWorkspace.on_predict_epoch_end" class="function">on_predict_epoch_end</dd>
+                <dd id="GlobalWorkspace.on_before_zero_grad" class="function">on_before_zero_grad</dd>
+                <dd id="GlobalWorkspace.on_before_backward" class="function">on_before_backward</dd>
+                <dd id="GlobalWorkspace.on_after_backward" class="function">on_after_backward</dd>
+                <dd id="GlobalWorkspace.on_before_optimizer_step" class="function">on_before_optimizer_step</dd>
+                <dd id="GlobalWorkspace.configure_sharded_model" class="function">configure_sharded_model</dd>
+                <dd id="GlobalWorkspace.configure_model" class="function">configure_model</dd>
+
+            </div>
+            <div><dt>lightning.pytorch.core.hooks.DataHooks</dt>
+                                <dd id="GlobalWorkspace.prepare_data_per_node" class="variable">prepare_data_per_node</dd>
+                <dd id="GlobalWorkspace.allow_zero_length_dataloader_with_multiple_devices" class="variable">allow_zero_length_dataloader_with_multiple_devices</dd>
+                <dd id="GlobalWorkspace.prepare_data" class="function">prepare_data</dd>
+                <dd id="GlobalWorkspace.setup" class="function">setup</dd>
+                <dd id="GlobalWorkspace.teardown" class="function">teardown</dd>
+                <dd id="GlobalWorkspace.train_dataloader" class="function">train_dataloader</dd>
+                <dd id="GlobalWorkspace.test_dataloader" class="function">test_dataloader</dd>
+                <dd id="GlobalWorkspace.val_dataloader" class="function">val_dataloader</dd>
+                <dd id="GlobalWorkspace.predict_dataloader" class="function">predict_dataloader</dd>
+                <dd id="GlobalWorkspace.transfer_batch_to_device" class="function">transfer_batch_to_device</dd>
+                <dd id="GlobalWorkspace.on_before_batch_transfer" class="function">on_before_batch_transfer</dd>
+                <dd id="GlobalWorkspace.on_after_batch_transfer" class="function">on_after_batch_transfer</dd>
+
+            </div>
+            <div><dt>lightning.pytorch.core.hooks.CheckpointHooks</dt>
+                                <dd id="GlobalWorkspace.on_load_checkpoint" class="function">on_load_checkpoint</dd>
+                <dd id="GlobalWorkspace.on_save_checkpoint" class="function">on_save_checkpoint</dd>
+
+            </div>
+            <div><dt>torch.nn.modules.module.Module</dt>
+                                <dd id="GlobalWorkspace.dump_patches" class="variable">dump_patches</dd>
+                <dd id="GlobalWorkspace.training" class="variable">training</dd>
+                <dd id="GlobalWorkspace.call_super_init" class="variable">call_super_init</dd>
+                <dd id="GlobalWorkspace.register_buffer" class="function">register_buffer</dd>
+                <dd id="GlobalWorkspace.register_parameter" class="function">register_parameter</dd>
+                <dd id="GlobalWorkspace.add_module" class="function">add_module</dd>
+                <dd id="GlobalWorkspace.register_module" class="function">register_module</dd>
+                <dd id="GlobalWorkspace.get_submodule" class="function">get_submodule</dd>
+                <dd id="GlobalWorkspace.get_parameter" class="function">get_parameter</dd>
+                <dd id="GlobalWorkspace.get_buffer" class="function">get_buffer</dd>
+                <dd id="GlobalWorkspace.get_extra_state" class="function">get_extra_state</dd>
+                <dd id="GlobalWorkspace.set_extra_state" class="function">set_extra_state</dd>
+                <dd id="GlobalWorkspace.apply" class="function">apply</dd>
+                <dd id="GlobalWorkspace.ipu" class="function">ipu</dd>
+                <dd id="GlobalWorkspace.xpu" class="function">xpu</dd>
+                <dd id="GlobalWorkspace.bfloat16" class="function">bfloat16</dd>
+                <dd id="GlobalWorkspace.to_empty" class="function">to_empty</dd>
+                <dd id="GlobalWorkspace.register_full_backward_pre_hook" class="function">register_full_backward_pre_hook</dd>
+                <dd id="GlobalWorkspace.register_backward_hook" class="function">register_backward_hook</dd>
+                <dd id="GlobalWorkspace.register_full_backward_hook" class="function">register_full_backward_hook</dd>
+                <dd id="GlobalWorkspace.register_forward_pre_hook" class="function">register_forward_pre_hook</dd>
+                <dd id="GlobalWorkspace.register_forward_hook" class="function">register_forward_hook</dd>
+                <dd id="GlobalWorkspace.register_state_dict_pre_hook" class="function">register_state_dict_pre_hook</dd>
+                <dd id="GlobalWorkspace.state_dict" class="function">state_dict</dd>
+                <dd id="GlobalWorkspace.register_load_state_dict_post_hook" class="function">register_load_state_dict_post_hook</dd>
+                <dd id="GlobalWorkspace.load_state_dict" class="function">load_state_dict</dd>
+                <dd id="GlobalWorkspace.parameters" class="function">parameters</dd>
+                <dd id="GlobalWorkspace.named_parameters" class="function">named_parameters</dd>
+                <dd id="GlobalWorkspace.buffers" class="function">buffers</dd>
+                <dd id="GlobalWorkspace.named_buffers" class="function">named_buffers</dd>
+                <dd id="GlobalWorkspace.children" class="function">children</dd>
+                <dd id="GlobalWorkspace.named_children" class="function">named_children</dd>
+                <dd id="GlobalWorkspace.modules" class="function">modules</dd>
+                <dd id="GlobalWorkspace.named_modules" class="function">named_modules</dd>
+                <dd id="GlobalWorkspace.train" class="function">train</dd>
+                <dd id="GlobalWorkspace.eval" class="function">eval</dd>
+                <dd id="GlobalWorkspace.requires_grad_" class="function">requires_grad_</dd>
+                <dd id="GlobalWorkspace.zero_grad" class="function">zero_grad</dd>
+                <dd id="GlobalWorkspace.share_memory" class="function">share_memory</dd>
+                <dd id="GlobalWorkspace.extra_repr" class="function">extra_repr</dd>
+                <dd id="GlobalWorkspace.compile" class="function">compile</dd>
+
+            </div>
+                                </dl>
+                            </div>
+                </section>
+                <section id="GlobalWorkspaceBayesian">
+                            <input id="GlobalWorkspaceBayesian-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
+<div class="attr class">
+            
+    <span class="def">class</span>
+    <span class="name">GlobalWorkspaceBayesian</span><wbr>(<span class="base"><a href="#GlobalWorkspaceBase">shimmer.modules.global_workspace.GlobalWorkspaceBase[shimmer.modules.gw_module.GWModuleBayesian, shimmer.modules.selection.FixedSharedSelection, shimmer.modules.losses.GWLossesBayesian]</a></span>):
+
+                <label class="view-source-button" for="GlobalWorkspaceBayesian-view-source"><span>View Source</span></label>
+
+    </div>
+    <a class="headerlink" href="#GlobalWorkspaceBayesian"></a>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="GlobalWorkspaceBayesian-662"><a href="#GlobalWorkspaceBayesian-662"><span class="linenos">662</span></a><span class="k">class</span> <span class="nc">GlobalWorkspaceBayesian</span><span class="p">(</span>
+</span><span id="GlobalWorkspaceBayesian-663"><a href="#GlobalWorkspaceBayesian-663"><span class="linenos">663</span></a>    <span class="n">GlobalWorkspaceBase</span><span class="p">[</span><span class="n">GWModuleBayesian</span><span class="p">,</span> <span class="n">FixedSharedSelection</span><span class="p">,</span> <span class="n">GWLossesBayesian</span><span class="p">]</span>
+</span><span id="GlobalWorkspaceBayesian-664"><a href="#GlobalWorkspaceBayesian-664"><span class="linenos">664</span></a><span class="p">):</span>
+</span><span id="GlobalWorkspaceBayesian-665"><a href="#GlobalWorkspaceBayesian-665"><span class="linenos">665</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="GlobalWorkspaceBayesian-666"><a href="#GlobalWorkspaceBayesian-666"><span class="linenos">666</span></a><span class="sd">    A simple 2-domains max GlobalWorkspaceBase with a Bayesian base uncertainty</span>
+</span><span id="GlobalWorkspaceBayesian-667"><a href="#GlobalWorkspaceBayesian-667"><span class="linenos">667</span></a><span class="sd">    prediction.</span>
+</span><span id="GlobalWorkspaceBayesian-668"><a href="#GlobalWorkspaceBayesian-668"><span class="linenos">668</span></a>
+</span><span id="GlobalWorkspaceBayesian-669"><a href="#GlobalWorkspaceBayesian-669"><span class="linenos">669</span></a><span class="sd">    This is used to simplify a Global Workspace instanciation and only overrides the</span>
+</span><span id="GlobalWorkspaceBayesian-670"><a href="#GlobalWorkspaceBayesian-670"><span class="linenos">670</span></a><span class="sd">    `__init__` method.</span>
+</span><span id="GlobalWorkspaceBayesian-671"><a href="#GlobalWorkspaceBayesian-671"><span class="linenos">671</span></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="GlobalWorkspaceBayesian-672"><a href="#GlobalWorkspaceBayesian-672"><span class="linenos">672</span></a>
+</span><span id="GlobalWorkspaceBayesian-673"><a href="#GlobalWorkspaceBayesian-673"><span class="linenos">673</span></a>    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span>
+</span><span id="GlobalWorkspaceBayesian-674"><a href="#GlobalWorkspaceBayesian-674"><span class="linenos">674</span></a>        <span class="bp">self</span><span class="p">,</span>
+</span><span id="GlobalWorkspaceBayesian-675"><a href="#GlobalWorkspaceBayesian-675"><span class="linenos">675</span></a>        <span class="n">domain_mods</span><span class="p">:</span> <span class="n">Mapping</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">DomainModule</span><span class="p">],</span>
+</span><span id="GlobalWorkspaceBayesian-676"><a href="#GlobalWorkspaceBayesian-676"><span class="linenos">676</span></a>        <span class="n">gw_encoders</span><span class="p">:</span> <span class="n">Mapping</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">Module</span><span class="p">],</span>
+</span><span id="GlobalWorkspaceBayesian-677"><a href="#GlobalWorkspaceBayesian-677"><span class="linenos">677</span></a>        <span class="n">gw_decoders</span><span class="p">:</span> <span class="n">Mapping</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">Module</span><span class="p">],</span>
+</span><span id="GlobalWorkspaceBayesian-678"><a href="#GlobalWorkspaceBayesian-678"><span class="linenos">678</span></a>        <span class="n">workspace_dim</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span>
+</span><span id="GlobalWorkspaceBayesian-679"><a href="#GlobalWorkspaceBayesian-679"><span class="linenos">679</span></a>        <span class="n">loss_coefs</span><span class="p">:</span> <span class="n">BroadcastLossCoefs</span><span class="p">,</span>
+</span><span id="GlobalWorkspaceBayesian-680"><a href="#GlobalWorkspaceBayesian-680"><span class="linenos">680</span></a>        <span class="n">sensitivity_selection</span><span class="p">:</span> <span class="nb">float</span> <span class="o">=</span> <span class="mi">1</span><span class="p">,</span>
+</span><span id="GlobalWorkspaceBayesian-681"><a href="#GlobalWorkspaceBayesian-681"><span class="linenos">681</span></a>        <span class="n">sensitivity_precision</span><span class="p">:</span> <span class="nb">float</span> <span class="o">=</span> <span class="mi">1</span><span class="p">,</span>
+</span><span id="GlobalWorkspaceBayesian-682"><a href="#GlobalWorkspaceBayesian-682"><span class="linenos">682</span></a>        <span class="n">optim_lr</span><span class="p">:</span> <span class="nb">float</span> <span class="o">=</span> <span class="mf">1e-3</span><span class="p">,</span>
+</span><span id="GlobalWorkspaceBayesian-683"><a href="#GlobalWorkspaceBayesian-683"><span class="linenos">683</span></a>        <span class="n">optim_weight_decay</span><span class="p">:</span> <span class="nb">float</span> <span class="o">=</span> <span class="mf">0.0</span><span class="p">,</span>
+</span><span id="GlobalWorkspaceBayesian-684"><a href="#GlobalWorkspaceBayesian-684"><span class="linenos">684</span></a>        <span class="n">scheduler_args</span><span class="p">:</span> <span class="n">SchedulerArgs</span> <span class="o">|</span> <span class="kc">None</span> <span class="o">=</span> <span class="kc">None</span><span class="p">,</span>
+</span><span id="GlobalWorkspaceBayesian-685"><a href="#GlobalWorkspaceBayesian-685"><span class="linenos">685</span></a>        <span class="n">learn_logit_scale</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">False</span><span class="p">,</span>
+</span><span id="GlobalWorkspaceBayesian-686"><a href="#GlobalWorkspaceBayesian-686"><span class="linenos">686</span></a>        <span class="n">use_normalized_constrastive</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">True</span><span class="p">,</span>
+</span><span id="GlobalWorkspaceBayesian-687"><a href="#GlobalWorkspaceBayesian-687"><span class="linenos">687</span></a>        <span class="n">contrastive_loss</span><span class="p">:</span> <span class="n">ContrastiveLossType</span> <span class="o">|</span> <span class="kc">None</span> <span class="o">=</span> <span class="kc">None</span><span class="p">,</span>
+</span><span id="GlobalWorkspaceBayesian-688"><a href="#GlobalWorkspaceBayesian-688"><span class="linenos">688</span></a>        <span class="n">precision_softmax_temp</span><span class="p">:</span> <span class="nb">float</span> <span class="o">=</span> <span class="mf">0.01</span><span class="p">,</span>
+</span><span id="GlobalWorkspaceBayesian-689"><a href="#GlobalWorkspaceBayesian-689"><span class="linenos">689</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="GlobalWorkspaceBayesian-690"><a href="#GlobalWorkspaceBayesian-690"><span class="linenos">690</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="GlobalWorkspaceBayesian-691"><a href="#GlobalWorkspaceBayesian-691"><span class="linenos">691</span></a><span class="sd">        Initializes a Global Workspace</span>
+</span><span id="GlobalWorkspaceBayesian-692"><a href="#GlobalWorkspaceBayesian-692"><span class="linenos">692</span></a>
+</span><span id="GlobalWorkspaceBayesian-693"><a href="#GlobalWorkspaceBayesian-693"><span class="linenos">693</span></a><span class="sd">        Args:</span>
+</span><span id="GlobalWorkspaceBayesian-694"><a href="#GlobalWorkspaceBayesian-694"><span class="linenos">694</span></a><span class="sd">            domain_mods (`Mapping[str, DomainModule]`): mapping of the domains</span>
+</span><span id="GlobalWorkspaceBayesian-695"><a href="#GlobalWorkspaceBayesian-695"><span class="linenos">695</span></a><span class="sd">                connected to the GW. Keys are domain names, values are the</span>
+</span><span id="GlobalWorkspaceBayesian-696"><a href="#GlobalWorkspaceBayesian-696"><span class="linenos">696</span></a><span class="sd">                `DomainModule`.</span>
+</span><span id="GlobalWorkspaceBayesian-697"><a href="#GlobalWorkspaceBayesian-697"><span class="linenos">697</span></a><span class="sd">            gw_encoders (`Mapping[str, torch.nn.Module]`): mapping for each domain</span>
+</span><span id="GlobalWorkspaceBayesian-698"><a href="#GlobalWorkspaceBayesian-698"><span class="linenos">698</span></a><span class="sd">                name to a `torch.nn.Module` class which role is to encode a</span>
+</span><span id="GlobalWorkspaceBayesian-699"><a href="#GlobalWorkspaceBayesian-699"><span class="linenos">699</span></a><span class="sd">                unimodal latent representations into a GW representation (pre fusion).</span>
+</span><span id="GlobalWorkspaceBayesian-700"><a href="#GlobalWorkspaceBayesian-700"><span class="linenos">700</span></a><span class="sd">            gw_decoders (`Mapping[str, torch.nn.Module]`): mapping for each domain</span>
+</span><span id="GlobalWorkspaceBayesian-701"><a href="#GlobalWorkspaceBayesian-701"><span class="linenos">701</span></a><span class="sd">                name to a `torch.nn.Module` class which role is to decode a</span>
+</span><span id="GlobalWorkspaceBayesian-702"><a href="#GlobalWorkspaceBayesian-702"><span class="linenos">702</span></a><span class="sd">                GW representation into a unimodal latent representations.</span>
+</span><span id="GlobalWorkspaceBayesian-703"><a href="#GlobalWorkspaceBayesian-703"><span class="linenos">703</span></a><span class="sd">            workspace_dim (`int`): dimension of the GW.</span>
+</span><span id="GlobalWorkspaceBayesian-704"><a href="#GlobalWorkspaceBayesian-704"><span class="linenos">704</span></a><span class="sd">            loss_coefs (`LossCoefs`): loss coefficients</span>
+</span><span id="GlobalWorkspaceBayesian-705"><a href="#GlobalWorkspaceBayesian-705"><span class="linenos">705</span></a><span class="sd">            sensitivity_selection (`float`): sensivity coef $c&#39;_1$</span>
+</span><span id="GlobalWorkspaceBayesian-706"><a href="#GlobalWorkspaceBayesian-706"><span class="linenos">706</span></a><span class="sd">            sensitivity_precision (`float`): sensitivity coef $c&#39;_2$</span>
+</span><span id="GlobalWorkspaceBayesian-707"><a href="#GlobalWorkspaceBayesian-707"><span class="linenos">707</span></a><span class="sd">            optim_lr (`float`): learning rate</span>
+</span><span id="GlobalWorkspaceBayesian-708"><a href="#GlobalWorkspaceBayesian-708"><span class="linenos">708</span></a><span class="sd">            optim_weight_decay (`float`): weight decay</span>
+</span><span id="GlobalWorkspaceBayesian-709"><a href="#GlobalWorkspaceBayesian-709"><span class="linenos">709</span></a><span class="sd">            scheduler_args (`SchedulerArgs | None`): optimization scheduler&#39;s arguments</span>
+</span><span id="GlobalWorkspaceBayesian-710"><a href="#GlobalWorkspaceBayesian-710"><span class="linenos">710</span></a><span class="sd">            learn_logit_scale (`bool`): whether to learn the contrastive learning</span>
+</span><span id="GlobalWorkspaceBayesian-711"><a href="#GlobalWorkspaceBayesian-711"><span class="linenos">711</span></a><span class="sd">                contrastive loss when using the default contrastive loss.</span>
+</span><span id="GlobalWorkspaceBayesian-712"><a href="#GlobalWorkspaceBayesian-712"><span class="linenos">712</span></a><span class="sd">            use_normalized_constrastive (`bool`): whether to use the normalized cont</span>
+</span><span id="GlobalWorkspaceBayesian-713"><a href="#GlobalWorkspaceBayesian-713"><span class="linenos">713</span></a><span class="sd">                loss by the precision coefs</span>
+</span><span id="GlobalWorkspaceBayesian-714"><a href="#GlobalWorkspaceBayesian-714"><span class="linenos">714</span></a><span class="sd">            contrastive_loss (`ContrastiveLossType | None`): a contrastive loss</span>
+</span><span id="GlobalWorkspaceBayesian-715"><a href="#GlobalWorkspaceBayesian-715"><span class="linenos">715</span></a><span class="sd">                function used for alignment. `learn_logit_scale` will not affect custom</span>
+</span><span id="GlobalWorkspaceBayesian-716"><a href="#GlobalWorkspaceBayesian-716"><span class="linenos">716</span></a><span class="sd">                contrastive losses.</span>
+</span><span id="GlobalWorkspaceBayesian-717"><a href="#GlobalWorkspaceBayesian-717"><span class="linenos">717</span></a><span class="sd">            precision_softmax_temp (`float`): temperature to use in softmax of</span>
+</span><span id="GlobalWorkspaceBayesian-718"><a href="#GlobalWorkspaceBayesian-718"><span class="linenos">718</span></a><span class="sd">                precision</span>
+</span><span id="GlobalWorkspaceBayesian-719"><a href="#GlobalWorkspaceBayesian-719"><span class="linenos">719</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="GlobalWorkspaceBayesian-720"><a href="#GlobalWorkspaceBayesian-720"><span class="linenos">720</span></a>        <span class="n">domain_mods</span> <span class="o">=</span> <span class="n">freeze_domain_modules</span><span class="p">(</span><span class="n">domain_mods</span><span class="p">)</span>
+</span><span id="GlobalWorkspaceBayesian-721"><a href="#GlobalWorkspaceBayesian-721"><span class="linenos">721</span></a>
+</span><span id="GlobalWorkspaceBayesian-722"><a href="#GlobalWorkspaceBayesian-722"><span class="linenos">722</span></a>        <span class="n">gw_mod</span> <span class="o">=</span> <span class="n">GWModuleBayesian</span><span class="p">(</span>
+</span><span id="GlobalWorkspaceBayesian-723"><a href="#GlobalWorkspaceBayesian-723"><span class="linenos">723</span></a>            <span class="n">domain_mods</span><span class="p">,</span>
+</span><span id="GlobalWorkspaceBayesian-724"><a href="#GlobalWorkspaceBayesian-724"><span class="linenos">724</span></a>            <span class="n">workspace_dim</span><span class="p">,</span>
+</span><span id="GlobalWorkspaceBayesian-725"><a href="#GlobalWorkspaceBayesian-725"><span class="linenos">725</span></a>            <span class="n">gw_encoders</span><span class="p">,</span>
+</span><span id="GlobalWorkspaceBayesian-726"><a href="#GlobalWorkspaceBayesian-726"><span class="linenos">726</span></a>            <span class="n">gw_decoders</span><span class="p">,</span>
+</span><span id="GlobalWorkspaceBayesian-727"><a href="#GlobalWorkspaceBayesian-727"><span class="linenos">727</span></a>            <span class="n">sensitivity_selection</span><span class="p">,</span>
+</span><span id="GlobalWorkspaceBayesian-728"><a href="#GlobalWorkspaceBayesian-728"><span class="linenos">728</span></a>            <span class="n">sensitivity_precision</span><span class="p">,</span>
+</span><span id="GlobalWorkspaceBayesian-729"><a href="#GlobalWorkspaceBayesian-729"><span class="linenos">729</span></a>            <span class="n">precision_softmax_temp</span><span class="p">,</span>
+</span><span id="GlobalWorkspaceBayesian-730"><a href="#GlobalWorkspaceBayesian-730"><span class="linenos">730</span></a>        <span class="p">)</span>
+</span><span id="GlobalWorkspaceBayesian-731"><a href="#GlobalWorkspaceBayesian-731"><span class="linenos">731</span></a>
+</span><span id="GlobalWorkspaceBayesian-732"><a href="#GlobalWorkspaceBayesian-732"><span class="linenos">732</span></a>        <span class="n">selection_mod</span> <span class="o">=</span> <span class="n">FixedSharedSelection</span><span class="p">()</span>
+</span><span id="GlobalWorkspaceBayesian-733"><a href="#GlobalWorkspaceBayesian-733"><span class="linenos">733</span></a>
+</span><span id="GlobalWorkspaceBayesian-734"><a href="#GlobalWorkspaceBayesian-734"><span class="linenos">734</span></a>        <span class="n">contrastive_loss</span> <span class="o">=</span> <span class="n">ContrastiveLoss</span><span class="p">(</span>
+</span><span id="GlobalWorkspaceBayesian-735"><a href="#GlobalWorkspaceBayesian-735"><span class="linenos">735</span></a>            <span class="n">torch</span><span class="o">.</span><span class="n">tensor</span><span class="p">([</span><span class="mi">1</span><span class="p">])</span><span class="o">.</span><span class="n">log</span><span class="p">(),</span> <span class="s2">&quot;mean&quot;</span><span class="p">,</span> <span class="n">learn_logit_scale</span>
+</span><span id="GlobalWorkspaceBayesian-736"><a href="#GlobalWorkspaceBayesian-736"><span class="linenos">736</span></a>        <span class="p">)</span>
+</span><span id="GlobalWorkspaceBayesian-737"><a href="#GlobalWorkspaceBayesian-737"><span class="linenos">737</span></a>
+</span><span id="GlobalWorkspaceBayesian-738"><a href="#GlobalWorkspaceBayesian-738"><span class="linenos">738</span></a>        <span class="n">loss_mod</span> <span class="o">=</span> <span class="n">GWLossesBayesian</span><span class="p">(</span>
+</span><span id="GlobalWorkspaceBayesian-739"><a href="#GlobalWorkspaceBayesian-739"><span class="linenos">739</span></a>            <span class="n">gw_mod</span><span class="p">,</span>
+</span><span id="GlobalWorkspaceBayesian-740"><a href="#GlobalWorkspaceBayesian-740"><span class="linenos">740</span></a>            <span class="n">selection_mod</span><span class="p">,</span>
+</span><span id="GlobalWorkspaceBayesian-741"><a href="#GlobalWorkspaceBayesian-741"><span class="linenos">741</span></a>            <span class="n">domain_mods</span><span class="p">,</span>
+</span><span id="GlobalWorkspaceBayesian-742"><a href="#GlobalWorkspaceBayesian-742"><span class="linenos">742</span></a>            <span class="n">loss_coefs</span><span class="p">,</span>
+</span><span id="GlobalWorkspaceBayesian-743"><a href="#GlobalWorkspaceBayesian-743"><span class="linenos">743</span></a>            <span class="n">contrastive_loss</span><span class="p">,</span>
+</span><span id="GlobalWorkspaceBayesian-744"><a href="#GlobalWorkspaceBayesian-744"><span class="linenos">744</span></a>            <span class="n">use_normalized_constrastive</span><span class="p">,</span>
+</span><span id="GlobalWorkspaceBayesian-745"><a href="#GlobalWorkspaceBayesian-745"><span class="linenos">745</span></a>        <span class="p">)</span>
+</span><span id="GlobalWorkspaceBayesian-746"><a href="#GlobalWorkspaceBayesian-746"><span class="linenos">746</span></a>
+</span><span id="GlobalWorkspaceBayesian-747"><a href="#GlobalWorkspaceBayesian-747"><span class="linenos">747</span></a>        <span class="nb">super</span><span class="p">()</span><span class="o">.</span><span class="fm">__init__</span><span class="p">(</span>
+</span><span id="GlobalWorkspaceBayesian-748"><a href="#GlobalWorkspaceBayesian-748"><span class="linenos">748</span></a>            <span class="n">gw_mod</span><span class="p">,</span>
+</span><span id="GlobalWorkspaceBayesian-749"><a href="#GlobalWorkspaceBayesian-749"><span class="linenos">749</span></a>            <span class="n">selection_mod</span><span class="p">,</span>
+</span><span id="GlobalWorkspaceBayesian-750"><a href="#GlobalWorkspaceBayesian-750"><span class="linenos">750</span></a>            <span class="n">loss_mod</span><span class="p">,</span>
+</span><span id="GlobalWorkspaceBayesian-751"><a href="#GlobalWorkspaceBayesian-751"><span class="linenos">751</span></a>            <span class="n">optim_lr</span><span class="p">,</span>
+</span><span id="GlobalWorkspaceBayesian-752"><a href="#GlobalWorkspaceBayesian-752"><span class="linenos">752</span></a>            <span class="n">optim_weight_decay</span><span class="p">,</span>
+</span><span id="GlobalWorkspaceBayesian-753"><a href="#GlobalWorkspaceBayesian-753"><span class="linenos">753</span></a>            <span class="n">scheduler_args</span><span class="p">,</span>
+</span><span id="GlobalWorkspaceBayesian-754"><a href="#GlobalWorkspaceBayesian-754"><span class="linenos">754</span></a>        <span class="p">)</span>
+</span><span id="GlobalWorkspaceBayesian-755"><a href="#GlobalWorkspaceBayesian-755"><span class="linenos">755</span></a>
+</span><span id="GlobalWorkspaceBayesian-756"><a href="#GlobalWorkspaceBayesian-756"><span class="linenos">756</span></a>    <span class="k">def</span> <span class="nf">forward</span><span class="p">(</span>  <span class="c1"># type: ignore</span>
+</span><span id="GlobalWorkspaceBayesian-757"><a href="#GlobalWorkspaceBayesian-757"><span class="linenos">757</span></a>        <span class="bp">self</span><span class="p">,</span>
+</span><span id="GlobalWorkspaceBayesian-758"><a href="#GlobalWorkspaceBayesian-758"><span class="linenos">758</span></a>        <span class="n">latent_domains</span><span class="p">:</span> <span class="n">LatentsDomainGroupsT</span><span class="p">,</span>
+</span><span id="GlobalWorkspaceBayesian-759"><a href="#GlobalWorkspaceBayesian-759"><span class="linenos">759</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="n">GWPredictions</span><span class="p">:</span>
+</span><span id="GlobalWorkspaceBayesian-760"><a href="#GlobalWorkspaceBayesian-760"><span class="linenos">760</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="GlobalWorkspaceBayesian-761"><a href="#GlobalWorkspaceBayesian-761"><span class="linenos">761</span></a><span class="sd">        Computes demi-cycles, cycles, and translations.</span>
+</span><span id="GlobalWorkspaceBayesian-762"><a href="#GlobalWorkspaceBayesian-762"><span class="linenos">762</span></a>
+</span><span id="GlobalWorkspaceBayesian-763"><a href="#GlobalWorkspaceBayesian-763"><span class="linenos">763</span></a><span class="sd">        Args:</span>
+</span><span id="GlobalWorkspaceBayesian-764"><a href="#GlobalWorkspaceBayesian-764"><span class="linenos">764</span></a><span class="sd">            latent_domains (`LatentsT`): Groups of domains for the computation.</span>
+</span><span id="GlobalWorkspaceBayesian-765"><a href="#GlobalWorkspaceBayesian-765"><span class="linenos">765</span></a>
+</span><span id="GlobalWorkspaceBayesian-766"><a href="#GlobalWorkspaceBayesian-766"><span class="linenos">766</span></a><span class="sd">        Returns:</span>
+</span><span id="GlobalWorkspaceBayesian-767"><a href="#GlobalWorkspaceBayesian-767"><span class="linenos">767</span></a><span class="sd">            `GWPredictions`: the predictions on the batch.</span>
+</span><span id="GlobalWorkspaceBayesian-768"><a href="#GlobalWorkspaceBayesian-768"><span class="linenos">768</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="GlobalWorkspaceBayesian-769"><a href="#GlobalWorkspaceBayesian-769"><span class="linenos">769</span></a>        <span class="k">return</span> <span class="n">GWPredictions</span><span class="p">(</span>
+</span><span id="GlobalWorkspaceBayesian-770"><a href="#GlobalWorkspaceBayesian-770"><span class="linenos">770</span></a>            <span class="n">demi_cycles</span><span class="o">=</span><span class="n">batch_demi_cycles</span><span class="p">(</span>
+</span><span id="GlobalWorkspaceBayesian-771"><a href="#GlobalWorkspaceBayesian-771"><span class="linenos">771</span></a>                <span class="bp">self</span><span class="o">.</span><span class="n">gw_mod</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">selection_mod</span><span class="p">,</span> <span class="n">latent_domains</span>
+</span><span id="GlobalWorkspaceBayesian-772"><a href="#GlobalWorkspaceBayesian-772"><span class="linenos">772</span></a>            <span class="p">),</span>
+</span><span id="GlobalWorkspaceBayesian-773"><a href="#GlobalWorkspaceBayesian-773"><span class="linenos">773</span></a>            <span class="n">cycles</span><span class="o">=</span><span class="n">batch_cycles</span><span class="p">(</span>
+</span><span id="GlobalWorkspaceBayesian-774"><a href="#GlobalWorkspaceBayesian-774"><span class="linenos">774</span></a>                <span class="bp">self</span><span class="o">.</span><span class="n">gw_mod</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">selection_mod</span><span class="p">,</span> <span class="n">latent_domains</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">domain_mods</span><span class="o">.</span><span class="n">keys</span><span class="p">()</span>
+</span><span id="GlobalWorkspaceBayesian-775"><a href="#GlobalWorkspaceBayesian-775"><span class="linenos">775</span></a>            <span class="p">),</span>
+</span><span id="GlobalWorkspaceBayesian-776"><a href="#GlobalWorkspaceBayesian-776"><span class="linenos">776</span></a>            <span class="n">translations</span><span class="o">=</span><span class="n">batch_translations</span><span class="p">(</span>
+</span><span id="GlobalWorkspaceBayesian-777"><a href="#GlobalWorkspaceBayesian-777"><span class="linenos">777</span></a>                <span class="bp">self</span><span class="o">.</span><span class="n">gw_mod</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">selection_mod</span><span class="p">,</span> <span class="n">latent_domains</span>
+</span><span id="GlobalWorkspaceBayesian-778"><a href="#GlobalWorkspaceBayesian-778"><span class="linenos">778</span></a>            <span class="p">),</span>
+</span><span id="GlobalWorkspaceBayesian-779"><a href="#GlobalWorkspaceBayesian-779"><span class="linenos">779</span></a>            <span class="o">**</span><span class="nb">super</span><span class="p">()</span><span class="o">.</span><span class="n">forward</span><span class="p">(</span><span class="n">latent_domains</span><span class="p">),</span>
+</span><span id="GlobalWorkspaceBayesian-780"><a href="#GlobalWorkspaceBayesian-780"><span class="linenos">780</span></a>        <span class="p">)</span>
+</span></pre></div>
+
+
+            <div class="docstring"><p>A simple 2-domains max GlobalWorkspaceBase with a Bayesian base uncertainty
+prediction.</p>
+
+<p>This is used to simplify a Global Workspace instanciation and only overrides the
+<code><a href="#GlobalWorkspaceBayesian.__init__">__init__</a></code> method.</p>
+</div>
+
+
+                            <div id="GlobalWorkspaceBayesian.__init__" class="classattr">
+                                        <input id="GlobalWorkspaceBayesian.__init__-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
+<div class="attr function">
+            
+        <span class="name">GlobalWorkspaceBayesian</span><span class="signature pdoc-code multiline">(<span class="param">	<span class="n">domain_mods</span><span class="p">:</span> <span class="n">collections</span><span class="o">.</span><span class="n">abc</span><span class="o">.</span><span class="n">Mapping</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n"><a href="domain.html#DomainModule">shimmer.modules.domain.DomainModule</a></span><span class="p">]</span>,</span><span class="param">	<span class="n">gw_encoders</span><span class="p">:</span> <span class="n">collections</span><span class="o">.</span><span class="n">abc</span><span class="o">.</span><span class="n">Mapping</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">nn</span><span class="o">.</span><span class="n">modules</span><span class="o">.</span><span class="n">module</span><span class="o">.</span><span class="n">Module</span><span class="p">]</span>,</span><span class="param">	<span class="n">gw_decoders</span><span class="p">:</span> <span class="n">collections</span><span class="o">.</span><span class="n">abc</span><span class="o">.</span><span class="n">Mapping</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">nn</span><span class="o">.</span><span class="n">modules</span><span class="o">.</span><span class="n">module</span><span class="o">.</span><span class="n">Module</span><span class="p">]</span>,</span><span class="param">	<span class="n">workspace_dim</span><span class="p">:</span> <span class="nb">int</span>,</span><span class="param">	<span class="n">loss_coefs</span><span class="p">:</span> <span class="n"><a href="losses.html#BroadcastLossCoefs">shimmer.modules.losses.BroadcastLossCoefs</a></span>,</span><span class="param">	<span class="n">sensitivity_selection</span><span class="p">:</span> <span class="nb">float</span> <span class="o">=</span> <span class="mi">1</span>,</span><span class="param">	<span class="n">sensitivity_precision</span><span class="p">:</span> <span class="nb">float</span> <span class="o">=</span> <span class="mi">1</span>,</span><span class="param">	<span class="n">optim_lr</span><span class="p">:</span> <span class="nb">float</span> <span class="o">=</span> <span class="mf">0.001</span>,</span><span class="param">	<span class="n">optim_weight_decay</span><span class="p">:</span> <span class="nb">float</span> <span class="o">=</span> <span class="mf">0.0</span>,</span><span class="param">	<span class="n">scheduler_args</span><span class="p">:</span> <span class="n"><a href="#SchedulerArgs">SchedulerArgs</a></span> <span class="o">|</span> <span class="kc">None</span> <span class="o">=</span> <span class="kc">None</span>,</span><span class="param">	<span class="n">learn_logit_scale</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">False</span>,</span><span class="param">	<span class="n">use_normalized_constrastive</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">True</span>,</span><span class="param">	<span class="n">contrastive_loss</span><span class="p">:</span> <span class="n">collections</span><span class="o">.</span><span class="n">abc</span><span class="o">.</span><span class="n">Callable</span><span class="p">[[</span><span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">],</span> <span class="n"><a href="domain.html#LossOutput">shimmer.modules.domain.LossOutput</a></span><span class="p">]</span> <span class="o">|</span> <span class="kc">None</span> <span class="o">=</span> <span class="kc">None</span>,</span><span class="param">	<span class="n">precision_softmax_temp</span><span class="p">:</span> <span class="nb">float</span> <span class="o">=</span> <span class="mf">0.01</span></span>)</span>
+
+                <label class="view-source-button" for="GlobalWorkspaceBayesian.__init__-view-source"><span>View Source</span></label>
+
+    </div>
+    <a class="headerlink" href="#GlobalWorkspaceBayesian.__init__"></a>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="GlobalWorkspaceBayesian.__init__-673"><a href="#GlobalWorkspaceBayesian.__init__-673"><span class="linenos">673</span></a>    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span>
+</span><span id="GlobalWorkspaceBayesian.__init__-674"><a href="#GlobalWorkspaceBayesian.__init__-674"><span class="linenos">674</span></a>        <span class="bp">self</span><span class="p">,</span>
+</span><span id="GlobalWorkspaceBayesian.__init__-675"><a href="#GlobalWorkspaceBayesian.__init__-675"><span class="linenos">675</span></a>        <span class="n">domain_mods</span><span class="p">:</span> <span class="n">Mapping</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">DomainModule</span><span class="p">],</span>
+</span><span id="GlobalWorkspaceBayesian.__init__-676"><a href="#GlobalWorkspaceBayesian.__init__-676"><span class="linenos">676</span></a>        <span class="n">gw_encoders</span><span class="p">:</span> <span class="n">Mapping</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">Module</span><span class="p">],</span>
+</span><span id="GlobalWorkspaceBayesian.__init__-677"><a href="#GlobalWorkspaceBayesian.__init__-677"><span class="linenos">677</span></a>        <span class="n">gw_decoders</span><span class="p">:</span> <span class="n">Mapping</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">Module</span><span class="p">],</span>
+</span><span id="GlobalWorkspaceBayesian.__init__-678"><a href="#GlobalWorkspaceBayesian.__init__-678"><span class="linenos">678</span></a>        <span class="n">workspace_dim</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span>
+</span><span id="GlobalWorkspaceBayesian.__init__-679"><a href="#GlobalWorkspaceBayesian.__init__-679"><span class="linenos">679</span></a>        <span class="n">loss_coefs</span><span class="p">:</span> <span class="n">BroadcastLossCoefs</span><span class="p">,</span>
+</span><span id="GlobalWorkspaceBayesian.__init__-680"><a href="#GlobalWorkspaceBayesian.__init__-680"><span class="linenos">680</span></a>        <span class="n">sensitivity_selection</span><span class="p">:</span> <span class="nb">float</span> <span class="o">=</span> <span class="mi">1</span><span class="p">,</span>
+</span><span id="GlobalWorkspaceBayesian.__init__-681"><a href="#GlobalWorkspaceBayesian.__init__-681"><span class="linenos">681</span></a>        <span class="n">sensitivity_precision</span><span class="p">:</span> <span class="nb">float</span> <span class="o">=</span> <span class="mi">1</span><span class="p">,</span>
+</span><span id="GlobalWorkspaceBayesian.__init__-682"><a href="#GlobalWorkspaceBayesian.__init__-682"><span class="linenos">682</span></a>        <span class="n">optim_lr</span><span class="p">:</span> <span class="nb">float</span> <span class="o">=</span> <span class="mf">1e-3</span><span class="p">,</span>
+</span><span id="GlobalWorkspaceBayesian.__init__-683"><a href="#GlobalWorkspaceBayesian.__init__-683"><span class="linenos">683</span></a>        <span class="n">optim_weight_decay</span><span class="p">:</span> <span class="nb">float</span> <span class="o">=</span> <span class="mf">0.0</span><span class="p">,</span>
+</span><span id="GlobalWorkspaceBayesian.__init__-684"><a href="#GlobalWorkspaceBayesian.__init__-684"><span class="linenos">684</span></a>        <span class="n">scheduler_args</span><span class="p">:</span> <span class="n">SchedulerArgs</span> <span class="o">|</span> <span class="kc">None</span> <span class="o">=</span> <span class="kc">None</span><span class="p">,</span>
+</span><span id="GlobalWorkspaceBayesian.__init__-685"><a href="#GlobalWorkspaceBayesian.__init__-685"><span class="linenos">685</span></a>        <span class="n">learn_logit_scale</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">False</span><span class="p">,</span>
+</span><span id="GlobalWorkspaceBayesian.__init__-686"><a href="#GlobalWorkspaceBayesian.__init__-686"><span class="linenos">686</span></a>        <span class="n">use_normalized_constrastive</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">True</span><span class="p">,</span>
+</span><span id="GlobalWorkspaceBayesian.__init__-687"><a href="#GlobalWorkspaceBayesian.__init__-687"><span class="linenos">687</span></a>        <span class="n">contrastive_loss</span><span class="p">:</span> <span class="n">ContrastiveLossType</span> <span class="o">|</span> <span class="kc">None</span> <span class="o">=</span> <span class="kc">None</span><span class="p">,</span>
+</span><span id="GlobalWorkspaceBayesian.__init__-688"><a href="#GlobalWorkspaceBayesian.__init__-688"><span class="linenos">688</span></a>        <span class="n">precision_softmax_temp</span><span class="p">:</span> <span class="nb">float</span> <span class="o">=</span> <span class="mf">0.01</span><span class="p">,</span>
+</span><span id="GlobalWorkspaceBayesian.__init__-689"><a href="#GlobalWorkspaceBayesian.__init__-689"><span class="linenos">689</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="GlobalWorkspaceBayesian.__init__-690"><a href="#GlobalWorkspaceBayesian.__init__-690"><span class="linenos">690</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="GlobalWorkspaceBayesian.__init__-691"><a href="#GlobalWorkspaceBayesian.__init__-691"><span class="linenos">691</span></a><span class="sd">        Initializes a Global Workspace</span>
+</span><span id="GlobalWorkspaceBayesian.__init__-692"><a href="#GlobalWorkspaceBayesian.__init__-692"><span class="linenos">692</span></a>
+</span><span id="GlobalWorkspaceBayesian.__init__-693"><a href="#GlobalWorkspaceBayesian.__init__-693"><span class="linenos">693</span></a><span class="sd">        Args:</span>
+</span><span id="GlobalWorkspaceBayesian.__init__-694"><a href="#GlobalWorkspaceBayesian.__init__-694"><span class="linenos">694</span></a><span class="sd">            domain_mods (`Mapping[str, DomainModule]`): mapping of the domains</span>
+</span><span id="GlobalWorkspaceBayesian.__init__-695"><a href="#GlobalWorkspaceBayesian.__init__-695"><span class="linenos">695</span></a><span class="sd">                connected to the GW. Keys are domain names, values are the</span>
+</span><span id="GlobalWorkspaceBayesian.__init__-696"><a href="#GlobalWorkspaceBayesian.__init__-696"><span class="linenos">696</span></a><span class="sd">                `DomainModule`.</span>
+</span><span id="GlobalWorkspaceBayesian.__init__-697"><a href="#GlobalWorkspaceBayesian.__init__-697"><span class="linenos">697</span></a><span class="sd">            gw_encoders (`Mapping[str, torch.nn.Module]`): mapping for each domain</span>
+</span><span id="GlobalWorkspaceBayesian.__init__-698"><a href="#GlobalWorkspaceBayesian.__init__-698"><span class="linenos">698</span></a><span class="sd">                name to a `torch.nn.Module` class which role is to encode a</span>
+</span><span id="GlobalWorkspaceBayesian.__init__-699"><a href="#GlobalWorkspaceBayesian.__init__-699"><span class="linenos">699</span></a><span class="sd">                unimodal latent representations into a GW representation (pre fusion).</span>
+</span><span id="GlobalWorkspaceBayesian.__init__-700"><a href="#GlobalWorkspaceBayesian.__init__-700"><span class="linenos">700</span></a><span class="sd">            gw_decoders (`Mapping[str, torch.nn.Module]`): mapping for each domain</span>
+</span><span id="GlobalWorkspaceBayesian.__init__-701"><a href="#GlobalWorkspaceBayesian.__init__-701"><span class="linenos">701</span></a><span class="sd">                name to a `torch.nn.Module` class which role is to decode a</span>
+</span><span id="GlobalWorkspaceBayesian.__init__-702"><a href="#GlobalWorkspaceBayesian.__init__-702"><span class="linenos">702</span></a><span class="sd">                GW representation into a unimodal latent representations.</span>
+</span><span id="GlobalWorkspaceBayesian.__init__-703"><a href="#GlobalWorkspaceBayesian.__init__-703"><span class="linenos">703</span></a><span class="sd">            workspace_dim (`int`): dimension of the GW.</span>
+</span><span id="GlobalWorkspaceBayesian.__init__-704"><a href="#GlobalWorkspaceBayesian.__init__-704"><span class="linenos">704</span></a><span class="sd">            loss_coefs (`LossCoefs`): loss coefficients</span>
+</span><span id="GlobalWorkspaceBayesian.__init__-705"><a href="#GlobalWorkspaceBayesian.__init__-705"><span class="linenos">705</span></a><span class="sd">            sensitivity_selection (`float`): sensivity coef $c&#39;_1$</span>
+</span><span id="GlobalWorkspaceBayesian.__init__-706"><a href="#GlobalWorkspaceBayesian.__init__-706"><span class="linenos">706</span></a><span class="sd">            sensitivity_precision (`float`): sensitivity coef $c&#39;_2$</span>
+</span><span id="GlobalWorkspaceBayesian.__init__-707"><a href="#GlobalWorkspaceBayesian.__init__-707"><span class="linenos">707</span></a><span class="sd">            optim_lr (`float`): learning rate</span>
+</span><span id="GlobalWorkspaceBayesian.__init__-708"><a href="#GlobalWorkspaceBayesian.__init__-708"><span class="linenos">708</span></a><span class="sd">            optim_weight_decay (`float`): weight decay</span>
+</span><span id="GlobalWorkspaceBayesian.__init__-709"><a href="#GlobalWorkspaceBayesian.__init__-709"><span class="linenos">709</span></a><span class="sd">            scheduler_args (`SchedulerArgs | None`): optimization scheduler&#39;s arguments</span>
+</span><span id="GlobalWorkspaceBayesian.__init__-710"><a href="#GlobalWorkspaceBayesian.__init__-710"><span class="linenos">710</span></a><span class="sd">            learn_logit_scale (`bool`): whether to learn the contrastive learning</span>
+</span><span id="GlobalWorkspaceBayesian.__init__-711"><a href="#GlobalWorkspaceBayesian.__init__-711"><span class="linenos">711</span></a><span class="sd">                contrastive loss when using the default contrastive loss.</span>
+</span><span id="GlobalWorkspaceBayesian.__init__-712"><a href="#GlobalWorkspaceBayesian.__init__-712"><span class="linenos">712</span></a><span class="sd">            use_normalized_constrastive (`bool`): whether to use the normalized cont</span>
+</span><span id="GlobalWorkspaceBayesian.__init__-713"><a href="#GlobalWorkspaceBayesian.__init__-713"><span class="linenos">713</span></a><span class="sd">                loss by the precision coefs</span>
+</span><span id="GlobalWorkspaceBayesian.__init__-714"><a href="#GlobalWorkspaceBayesian.__init__-714"><span class="linenos">714</span></a><span class="sd">            contrastive_loss (`ContrastiveLossType | None`): a contrastive loss</span>
+</span><span id="GlobalWorkspaceBayesian.__init__-715"><a href="#GlobalWorkspaceBayesian.__init__-715"><span class="linenos">715</span></a><span class="sd">                function used for alignment. `learn_logit_scale` will not affect custom</span>
+</span><span id="GlobalWorkspaceBayesian.__init__-716"><a href="#GlobalWorkspaceBayesian.__init__-716"><span class="linenos">716</span></a><span class="sd">                contrastive losses.</span>
+</span><span id="GlobalWorkspaceBayesian.__init__-717"><a href="#GlobalWorkspaceBayesian.__init__-717"><span class="linenos">717</span></a><span class="sd">            precision_softmax_temp (`float`): temperature to use in softmax of</span>
+</span><span id="GlobalWorkspaceBayesian.__init__-718"><a href="#GlobalWorkspaceBayesian.__init__-718"><span class="linenos">718</span></a><span class="sd">                precision</span>
+</span><span id="GlobalWorkspaceBayesian.__init__-719"><a href="#GlobalWorkspaceBayesian.__init__-719"><span class="linenos">719</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="GlobalWorkspaceBayesian.__init__-720"><a href="#GlobalWorkspaceBayesian.__init__-720"><span class="linenos">720</span></a>        <span class="n">domain_mods</span> <span class="o">=</span> <span class="n">freeze_domain_modules</span><span class="p">(</span><span class="n">domain_mods</span><span class="p">)</span>
+</span><span id="GlobalWorkspaceBayesian.__init__-721"><a href="#GlobalWorkspaceBayesian.__init__-721"><span class="linenos">721</span></a>
+</span><span id="GlobalWorkspaceBayesian.__init__-722"><a href="#GlobalWorkspaceBayesian.__init__-722"><span class="linenos">722</span></a>        <span class="n">gw_mod</span> <span class="o">=</span> <span class="n">GWModuleBayesian</span><span class="p">(</span>
+</span><span id="GlobalWorkspaceBayesian.__init__-723"><a href="#GlobalWorkspaceBayesian.__init__-723"><span class="linenos">723</span></a>            <span class="n">domain_mods</span><span class="p">,</span>
+</span><span id="GlobalWorkspaceBayesian.__init__-724"><a href="#GlobalWorkspaceBayesian.__init__-724"><span class="linenos">724</span></a>            <span class="n">workspace_dim</span><span class="p">,</span>
+</span><span id="GlobalWorkspaceBayesian.__init__-725"><a href="#GlobalWorkspaceBayesian.__init__-725"><span class="linenos">725</span></a>            <span class="n">gw_encoders</span><span class="p">,</span>
+</span><span id="GlobalWorkspaceBayesian.__init__-726"><a href="#GlobalWorkspaceBayesian.__init__-726"><span class="linenos">726</span></a>            <span class="n">gw_decoders</span><span class="p">,</span>
+</span><span id="GlobalWorkspaceBayesian.__init__-727"><a href="#GlobalWorkspaceBayesian.__init__-727"><span class="linenos">727</span></a>            <span class="n">sensitivity_selection</span><span class="p">,</span>
+</span><span id="GlobalWorkspaceBayesian.__init__-728"><a href="#GlobalWorkspaceBayesian.__init__-728"><span class="linenos">728</span></a>            <span class="n">sensitivity_precision</span><span class="p">,</span>
+</span><span id="GlobalWorkspaceBayesian.__init__-729"><a href="#GlobalWorkspaceBayesian.__init__-729"><span class="linenos">729</span></a>            <span class="n">precision_softmax_temp</span><span class="p">,</span>
+</span><span id="GlobalWorkspaceBayesian.__init__-730"><a href="#GlobalWorkspaceBayesian.__init__-730"><span class="linenos">730</span></a>        <span class="p">)</span>
+</span><span id="GlobalWorkspaceBayesian.__init__-731"><a href="#GlobalWorkspaceBayesian.__init__-731"><span class="linenos">731</span></a>
+</span><span id="GlobalWorkspaceBayesian.__init__-732"><a href="#GlobalWorkspaceBayesian.__init__-732"><span class="linenos">732</span></a>        <span class="n">selection_mod</span> <span class="o">=</span> <span class="n">FixedSharedSelection</span><span class="p">()</span>
+</span><span id="GlobalWorkspaceBayesian.__init__-733"><a href="#GlobalWorkspaceBayesian.__init__-733"><span class="linenos">733</span></a>
+</span><span id="GlobalWorkspaceBayesian.__init__-734"><a href="#GlobalWorkspaceBayesian.__init__-734"><span class="linenos">734</span></a>        <span class="n">contrastive_loss</span> <span class="o">=</span> <span class="n">ContrastiveLoss</span><span class="p">(</span>
+</span><span id="GlobalWorkspaceBayesian.__init__-735"><a href="#GlobalWorkspaceBayesian.__init__-735"><span class="linenos">735</span></a>            <span class="n">torch</span><span class="o">.</span><span class="n">tensor</span><span class="p">([</span><span class="mi">1</span><span class="p">])</span><span class="o">.</span><span class="n">log</span><span class="p">(),</span> <span class="s2">&quot;mean&quot;</span><span class="p">,</span> <span class="n">learn_logit_scale</span>
+</span><span id="GlobalWorkspaceBayesian.__init__-736"><a href="#GlobalWorkspaceBayesian.__init__-736"><span class="linenos">736</span></a>        <span class="p">)</span>
+</span><span id="GlobalWorkspaceBayesian.__init__-737"><a href="#GlobalWorkspaceBayesian.__init__-737"><span class="linenos">737</span></a>
+</span><span id="GlobalWorkspaceBayesian.__init__-738"><a href="#GlobalWorkspaceBayesian.__init__-738"><span class="linenos">738</span></a>        <span class="n">loss_mod</span> <span class="o">=</span> <span class="n">GWLossesBayesian</span><span class="p">(</span>
+</span><span id="GlobalWorkspaceBayesian.__init__-739"><a href="#GlobalWorkspaceBayesian.__init__-739"><span class="linenos">739</span></a>            <span class="n">gw_mod</span><span class="p">,</span>
+</span><span id="GlobalWorkspaceBayesian.__init__-740"><a href="#GlobalWorkspaceBayesian.__init__-740"><span class="linenos">740</span></a>            <span class="n">selection_mod</span><span class="p">,</span>
+</span><span id="GlobalWorkspaceBayesian.__init__-741"><a href="#GlobalWorkspaceBayesian.__init__-741"><span class="linenos">741</span></a>            <span class="n">domain_mods</span><span class="p">,</span>
+</span><span id="GlobalWorkspaceBayesian.__init__-742"><a href="#GlobalWorkspaceBayesian.__init__-742"><span class="linenos">742</span></a>            <span class="n">loss_coefs</span><span class="p">,</span>
+</span><span id="GlobalWorkspaceBayesian.__init__-743"><a href="#GlobalWorkspaceBayesian.__init__-743"><span class="linenos">743</span></a>            <span class="n">contrastive_loss</span><span class="p">,</span>
+</span><span id="GlobalWorkspaceBayesian.__init__-744"><a href="#GlobalWorkspaceBayesian.__init__-744"><span class="linenos">744</span></a>            <span class="n">use_normalized_constrastive</span><span class="p">,</span>
+</span><span id="GlobalWorkspaceBayesian.__init__-745"><a href="#GlobalWorkspaceBayesian.__init__-745"><span class="linenos">745</span></a>        <span class="p">)</span>
+</span><span id="GlobalWorkspaceBayesian.__init__-746"><a href="#GlobalWorkspaceBayesian.__init__-746"><span class="linenos">746</span></a>
+</span><span id="GlobalWorkspaceBayesian.__init__-747"><a href="#GlobalWorkspaceBayesian.__init__-747"><span class="linenos">747</span></a>        <span class="nb">super</span><span class="p">()</span><span class="o">.</span><span class="fm">__init__</span><span class="p">(</span>
+</span><span id="GlobalWorkspaceBayesian.__init__-748"><a href="#GlobalWorkspaceBayesian.__init__-748"><span class="linenos">748</span></a>            <span class="n">gw_mod</span><span class="p">,</span>
+</span><span id="GlobalWorkspaceBayesian.__init__-749"><a href="#GlobalWorkspaceBayesian.__init__-749"><span class="linenos">749</span></a>            <span class="n">selection_mod</span><span class="p">,</span>
+</span><span id="GlobalWorkspaceBayesian.__init__-750"><a href="#GlobalWorkspaceBayesian.__init__-750"><span class="linenos">750</span></a>            <span class="n">loss_mod</span><span class="p">,</span>
+</span><span id="GlobalWorkspaceBayesian.__init__-751"><a href="#GlobalWorkspaceBayesian.__init__-751"><span class="linenos">751</span></a>            <span class="n">optim_lr</span><span class="p">,</span>
+</span><span id="GlobalWorkspaceBayesian.__init__-752"><a href="#GlobalWorkspaceBayesian.__init__-752"><span class="linenos">752</span></a>            <span class="n">optim_weight_decay</span><span class="p">,</span>
+</span><span id="GlobalWorkspaceBayesian.__init__-753"><a href="#GlobalWorkspaceBayesian.__init__-753"><span class="linenos">753</span></a>            <span class="n">scheduler_args</span><span class="p">,</span>
+</span><span id="GlobalWorkspaceBayesian.__init__-754"><a href="#GlobalWorkspaceBayesian.__init__-754"><span class="linenos">754</span></a>        <span class="p">)</span>
+</span></pre></div>
+
+
+            <div class="docstring"><p>Initializes a Global Workspace</p>
+
+<h6 id="arguments">Arguments:</h6>
+
+<ul>
+<li><strong>domain_mods (<code>Mapping[str, DomainModule]</code>):</strong>  mapping of the domains
+connected to the GW. Keys are domain names, values are the
+<code>DomainModule</code>.</li>
+<li><strong>gw_encoders (<code>Mapping[str, torch.nn.Module]</code>):</strong>  mapping for each domain
+name to a <code>torch.nn.Module</code> class which role is to encode a
+unimodal latent representations into a GW representation (pre fusion).</li>
+<li><strong>gw_decoders (<code>Mapping[str, torch.nn.Module]</code>):</strong>  mapping for each domain
+name to a <code>torch.nn.Module</code> class which role is to decode a
+GW representation into a unimodal latent representations.</li>
+<li><strong>workspace_dim (<code>int</code>):</strong>  dimension of the GW.</li>
+<li><strong>loss_coefs (<code>LossCoefs</code>):</strong>  loss coefficients</li>
+<li><strong>sensitivity_selection (<code><a href="#GlobalWorkspaceBayesian.float">float</a></code>):</strong>  sensivity coef $c'_1$</li>
+<li><strong>sensitivity_precision (<code><a href="#GlobalWorkspaceBayesian.float">float</a></code>):</strong>  sensitivity coef $c'_2$</li>
+<li><strong>optim_lr (<code><a href="#GlobalWorkspaceBayesian.float">float</a></code>):</strong>  learning rate</li>
+<li><strong>optim_weight_decay (<code><a href="#GlobalWorkspaceBayesian.float">float</a></code>):</strong>  weight decay</li>
+<li><strong>scheduler_args (<code>SchedulerArgs | None</code>):</strong>  optimization scheduler's arguments</li>
+<li><strong>learn_logit_scale (<code>bool</code>):</strong>  whether to learn the contrastive learning
+contrastive loss when using the default contrastive loss.</li>
+<li><strong>use_normalized_constrastive (<code>bool</code>):</strong>  whether to use the normalized cont
+loss by the precision coefs</li>
+<li><strong>contrastive_loss (<code>ContrastiveLossType | None</code>):</strong>  a contrastive loss
+function used for alignment. <code>learn_logit_scale</code> will not affect custom
+contrastive losses.</li>
+<li><strong>precision_softmax_temp (<code><a href="#GlobalWorkspaceBayesian.float">float</a></code>):</strong>  temperature to use in softmax of
+precision</li>
+</ul>
+</div>
+
+
+                            </div>
+                            <div id="GlobalWorkspaceBayesian.forward" class="classattr">
+                                        <input id="GlobalWorkspaceBayesian.forward-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
+<div class="attr function">
+            
+        <span class="def">def</span>
+        <span class="name">forward</span><span class="signature pdoc-code multiline">(<span class="param">	<span class="bp">self</span>,</span><span class="param">	<span class="n">latent_domains</span><span class="p">:</span> <span class="n">collections</span><span class="o">.</span><span class="n">abc</span><span class="o">.</span><span class="n">Mapping</span><span class="p">[</span><span class="nb">frozenset</span><span class="p">[</span><span class="nb">str</span><span class="p">],</span> <span class="n">collections</span><span class="o">.</span><span class="n">abc</span><span class="o">.</span><span class="n">Mapping</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]]</span></span><span class="return-annotation">) -> <span class="n"><a href="#GWPredictions">GWPredictions</a></span>:</span></span>
+
+                <label class="view-source-button" for="GlobalWorkspaceBayesian.forward-view-source"><span>View Source</span></label>
+
+    </div>
+    <a class="headerlink" href="#GlobalWorkspaceBayesian.forward"></a>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="GlobalWorkspaceBayesian.forward-756"><a href="#GlobalWorkspaceBayesian.forward-756"><span class="linenos">756</span></a>    <span class="k">def</span> <span class="nf">forward</span><span class="p">(</span>  <span class="c1"># type: ignore</span>
+</span><span id="GlobalWorkspaceBayesian.forward-757"><a href="#GlobalWorkspaceBayesian.forward-757"><span class="linenos">757</span></a>        <span class="bp">self</span><span class="p">,</span>
+</span><span id="GlobalWorkspaceBayesian.forward-758"><a href="#GlobalWorkspaceBayesian.forward-758"><span class="linenos">758</span></a>        <span class="n">latent_domains</span><span class="p">:</span> <span class="n">LatentsDomainGroupsT</span><span class="p">,</span>
+</span><span id="GlobalWorkspaceBayesian.forward-759"><a href="#GlobalWorkspaceBayesian.forward-759"><span class="linenos">759</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="n">GWPredictions</span><span class="p">:</span>
+</span><span id="GlobalWorkspaceBayesian.forward-760"><a href="#GlobalWorkspaceBayesian.forward-760"><span class="linenos">760</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="GlobalWorkspaceBayesian.forward-761"><a href="#GlobalWorkspaceBayesian.forward-761"><span class="linenos">761</span></a><span class="sd">        Computes demi-cycles, cycles, and translations.</span>
+</span><span id="GlobalWorkspaceBayesian.forward-762"><a href="#GlobalWorkspaceBayesian.forward-762"><span class="linenos">762</span></a>
+</span><span id="GlobalWorkspaceBayesian.forward-763"><a href="#GlobalWorkspaceBayesian.forward-763"><span class="linenos">763</span></a><span class="sd">        Args:</span>
+</span><span id="GlobalWorkspaceBayesian.forward-764"><a href="#GlobalWorkspaceBayesian.forward-764"><span class="linenos">764</span></a><span class="sd">            latent_domains (`LatentsT`): Groups of domains for the computation.</span>
+</span><span id="GlobalWorkspaceBayesian.forward-765"><a href="#GlobalWorkspaceBayesian.forward-765"><span class="linenos">765</span></a>
+</span><span id="GlobalWorkspaceBayesian.forward-766"><a href="#GlobalWorkspaceBayesian.forward-766"><span class="linenos">766</span></a><span class="sd">        Returns:</span>
+</span><span id="GlobalWorkspaceBayesian.forward-767"><a href="#GlobalWorkspaceBayesian.forward-767"><span class="linenos">767</span></a><span class="sd">            `GWPredictions`: the predictions on the batch.</span>
+</span><span id="GlobalWorkspaceBayesian.forward-768"><a href="#GlobalWorkspaceBayesian.forward-768"><span class="linenos">768</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="GlobalWorkspaceBayesian.forward-769"><a href="#GlobalWorkspaceBayesian.forward-769"><span class="linenos">769</span></a>        <span class="k">return</span> <span class="n">GWPredictions</span><span class="p">(</span>
+</span><span id="GlobalWorkspaceBayesian.forward-770"><a href="#GlobalWorkspaceBayesian.forward-770"><span class="linenos">770</span></a>            <span class="n">demi_cycles</span><span class="o">=</span><span class="n">batch_demi_cycles</span><span class="p">(</span>
+</span><span id="GlobalWorkspaceBayesian.forward-771"><a href="#GlobalWorkspaceBayesian.forward-771"><span class="linenos">771</span></a>                <span class="bp">self</span><span class="o">.</span><span class="n">gw_mod</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">selection_mod</span><span class="p">,</span> <span class="n">latent_domains</span>
+</span><span id="GlobalWorkspaceBayesian.forward-772"><a href="#GlobalWorkspaceBayesian.forward-772"><span class="linenos">772</span></a>            <span class="p">),</span>
+</span><span id="GlobalWorkspaceBayesian.forward-773"><a href="#GlobalWorkspaceBayesian.forward-773"><span class="linenos">773</span></a>            <span class="n">cycles</span><span class="o">=</span><span class="n">batch_cycles</span><span class="p">(</span>
+</span><span id="GlobalWorkspaceBayesian.forward-774"><a href="#GlobalWorkspaceBayesian.forward-774"><span class="linenos">774</span></a>                <span class="bp">self</span><span class="o">.</span><span class="n">gw_mod</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">selection_mod</span><span class="p">,</span> <span class="n">latent_domains</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">domain_mods</span><span class="o">.</span><span class="n">keys</span><span class="p">()</span>
+</span><span id="GlobalWorkspaceBayesian.forward-775"><a href="#GlobalWorkspaceBayesian.forward-775"><span class="linenos">775</span></a>            <span class="p">),</span>
+</span><span id="GlobalWorkspaceBayesian.forward-776"><a href="#GlobalWorkspaceBayesian.forward-776"><span class="linenos">776</span></a>            <span class="n">translations</span><span class="o">=</span><span class="n">batch_translations</span><span class="p">(</span>
+</span><span id="GlobalWorkspaceBayesian.forward-777"><a href="#GlobalWorkspaceBayesian.forward-777"><span class="linenos">777</span></a>                <span class="bp">self</span><span class="o">.</span><span class="n">gw_mod</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">selection_mod</span><span class="p">,</span> <span class="n">latent_domains</span>
+</span><span id="GlobalWorkspaceBayesian.forward-778"><a href="#GlobalWorkspaceBayesian.forward-778"><span class="linenos">778</span></a>            <span class="p">),</span>
+</span><span id="GlobalWorkspaceBayesian.forward-779"><a href="#GlobalWorkspaceBayesian.forward-779"><span class="linenos">779</span></a>            <span class="o">**</span><span class="nb">super</span><span class="p">()</span><span class="o">.</span><span class="n">forward</span><span class="p">(</span><span class="n">latent_domains</span><span class="p">),</span>
+</span><span id="GlobalWorkspaceBayesian.forward-780"><a href="#GlobalWorkspaceBayesian.forward-780"><span class="linenos">780</span></a>        <span class="p">)</span>
+</span></pre></div>
+
+
+            <div class="docstring"><p>Computes demi-cycles, cycles, and translations.</p>
+
+<h6 id="arguments">Arguments:</h6>
+
+<ul>
+<li><strong>latent_domains (<code>LatentsT</code>):</strong>  Groups of domains for the computation.</li>
+</ul>
+
+<h6 id="returns">Returns:</h6>
+
+<blockquote>
+  <p><code><a href="#GWPredictions">GWPredictions</a></code>: the predictions on the batch.</p>
+</blockquote>
+</div>
+
+
+                            </div>
+                            <div class="inherited">
+                                <h5>Inherited Members</h5>
+                                <dl>
+                                    <div><dt><a href="#GlobalWorkspaceBase">GlobalWorkspaceBase</a></dt>
+                                <dd id="GlobalWorkspaceBayesian.gw_mod" class="variable"><a href="#GlobalWorkspaceBase.gw_mod">gw_mod</a></dd>
+                <dd id="GlobalWorkspaceBayesian.selection_mod" class="variable"><a href="#GlobalWorkspaceBase.selection_mod">selection_mod</a></dd>
+                <dd id="GlobalWorkspaceBayesian.loss_mod" class="variable"><a href="#GlobalWorkspaceBase.loss_mod">loss_mod</a></dd>
+                <dd id="GlobalWorkspaceBayesian.optim_lr" class="variable"><a href="#GlobalWorkspaceBase.optim_lr">optim_lr</a></dd>
+                <dd id="GlobalWorkspaceBayesian.optim_weight_decay" class="variable"><a href="#GlobalWorkspaceBase.optim_weight_decay">optim_weight_decay</a></dd>
+                <dd id="GlobalWorkspaceBayesian.scheduler_args" class="variable"><a href="#GlobalWorkspaceBase.scheduler_args">scheduler_args</a></dd>
+                <dd id="GlobalWorkspaceBayesian.domain_mods" class="variable"><a href="#GlobalWorkspaceBase.domain_mods">domain_mods</a></dd>
+                <dd id="GlobalWorkspaceBayesian.workspace_dim" class="variable"><a href="#GlobalWorkspaceBase.workspace_dim">workspace_dim</a></dd>
+                <dd id="GlobalWorkspaceBayesian.encode_and_fuse" class="function"><a href="#GlobalWorkspaceBase.encode_and_fuse">encode_and_fuse</a></dd>
+                <dd id="GlobalWorkspaceBayesian.encode" class="function"><a href="#GlobalWorkspaceBase.encode">encode</a></dd>
+                <dd id="GlobalWorkspaceBayesian.fuse" class="function"><a href="#GlobalWorkspaceBase.fuse">fuse</a></dd>
+                <dd id="GlobalWorkspaceBayesian.decode" class="function"><a href="#GlobalWorkspaceBase.decode">decode</a></dd>
+                <dd id="GlobalWorkspaceBayesian.batch_gw_states" class="function"><a href="#GlobalWorkspaceBase.batch_gw_states">batch_gw_states</a></dd>
+                <dd id="GlobalWorkspaceBayesian.encode_domain" class="function"><a href="#GlobalWorkspaceBase.encode_domain">encode_domain</a></dd>
+                <dd id="GlobalWorkspaceBayesian.encode_domains" class="function"><a href="#GlobalWorkspaceBase.encode_domains">encode_domains</a></dd>
+                <dd id="GlobalWorkspaceBayesian.decode_domain" class="function"><a href="#GlobalWorkspaceBase.decode_domain">decode_domain</a></dd>
+                <dd id="GlobalWorkspaceBayesian.decode_domains" class="function"><a href="#GlobalWorkspaceBase.decode_domains">decode_domains</a></dd>
+                <dd id="GlobalWorkspaceBayesian.generic_step" class="function"><a href="#GlobalWorkspaceBase.generic_step">generic_step</a></dd>
+                <dd id="GlobalWorkspaceBayesian.validation_step" class="function"><a href="#GlobalWorkspaceBase.validation_step">validation_step</a></dd>
+                <dd id="GlobalWorkspaceBayesian.test_step" class="function"><a href="#GlobalWorkspaceBase.test_step">test_step</a></dd>
+                <dd id="GlobalWorkspaceBayesian.training_step" class="function"><a href="#GlobalWorkspaceBase.training_step">training_step</a></dd>
+                <dd id="GlobalWorkspaceBayesian.predict_step" class="function"><a href="#GlobalWorkspaceBase.predict_step">predict_step</a></dd>
+                <dd id="GlobalWorkspaceBayesian.configure_optimizers" class="function"><a href="#GlobalWorkspaceBase.configure_optimizers">configure_optimizers</a></dd>
+
+            </div>
+            <div><dt>lightning.pytorch.core.module.LightningModule</dt>
+                                <dd id="GlobalWorkspaceBayesian.CHECKPOINT_HYPER_PARAMS_KEY" class="variable">CHECKPOINT_HYPER_PARAMS_KEY</dd>
+                <dd id="GlobalWorkspaceBayesian.CHECKPOINT_HYPER_PARAMS_NAME" class="variable">CHECKPOINT_HYPER_PARAMS_NAME</dd>
+                <dd id="GlobalWorkspaceBayesian.CHECKPOINT_HYPER_PARAMS_TYPE" class="variable">CHECKPOINT_HYPER_PARAMS_TYPE</dd>
+                <dd id="GlobalWorkspaceBayesian.optimizers" class="function">optimizers</dd>
+                <dd id="GlobalWorkspaceBayesian.lr_schedulers" class="function">lr_schedulers</dd>
+                <dd id="GlobalWorkspaceBayesian.trainer" class="variable">trainer</dd>
+                <dd id="GlobalWorkspaceBayesian.fabric" class="variable">fabric</dd>
+                <dd id="GlobalWorkspaceBayesian.example_input_array" class="variable">example_input_array</dd>
+                <dd id="GlobalWorkspaceBayesian.current_epoch" class="variable">current_epoch</dd>
+                <dd id="GlobalWorkspaceBayesian.global_step" class="variable">global_step</dd>
+                <dd id="GlobalWorkspaceBayesian.global_rank" class="variable">global_rank</dd>
+                <dd id="GlobalWorkspaceBayesian.local_rank" class="variable">local_rank</dd>
+                <dd id="GlobalWorkspaceBayesian.on_gpu" class="variable">on_gpu</dd>
+                <dd id="GlobalWorkspaceBayesian.automatic_optimization" class="variable">automatic_optimization</dd>
+                <dd id="GlobalWorkspaceBayesian.strict_loading" class="variable">strict_loading</dd>
+                <dd id="GlobalWorkspaceBayesian.logger" class="variable">logger</dd>
+                <dd id="GlobalWorkspaceBayesian.loggers" class="variable">loggers</dd>
+                <dd id="GlobalWorkspaceBayesian.print" class="function">print</dd>
+                <dd id="GlobalWorkspaceBayesian.log" class="function">log</dd>
+                <dd id="GlobalWorkspaceBayesian.log_dict" class="function">log_dict</dd>
+                <dd id="GlobalWorkspaceBayesian.all_gather" class="function">all_gather</dd>
+                <dd id="GlobalWorkspaceBayesian.configure_callbacks" class="function">configure_callbacks</dd>
+                <dd id="GlobalWorkspaceBayesian.manual_backward" class="function">manual_backward</dd>
+                <dd id="GlobalWorkspaceBayesian.backward" class="function">backward</dd>
+                <dd id="GlobalWorkspaceBayesian.toggle_optimizer" class="function">toggle_optimizer</dd>
+                <dd id="GlobalWorkspaceBayesian.untoggle_optimizer" class="function">untoggle_optimizer</dd>
+                <dd id="GlobalWorkspaceBayesian.clip_gradients" class="function">clip_gradients</dd>
+                <dd id="GlobalWorkspaceBayesian.configure_gradient_clipping" class="function">configure_gradient_clipping</dd>
+                <dd id="GlobalWorkspaceBayesian.lr_scheduler_step" class="function">lr_scheduler_step</dd>
+                <dd id="GlobalWorkspaceBayesian.optimizer_step" class="function">optimizer_step</dd>
+                <dd id="GlobalWorkspaceBayesian.optimizer_zero_grad" class="function">optimizer_zero_grad</dd>
+                <dd id="GlobalWorkspaceBayesian.freeze" class="function">freeze</dd>
+                <dd id="GlobalWorkspaceBayesian.unfreeze" class="function">unfreeze</dd>
+                <dd id="GlobalWorkspaceBayesian.to_onnx" class="function">to_onnx</dd>
+                <dd id="GlobalWorkspaceBayesian.to_torchscript" class="function">to_torchscript</dd>
+                <dd id="GlobalWorkspaceBayesian.load_from_checkpoint" class="function">load_from_checkpoint</dd>
+
+            </div>
+            <div><dt>lightning.fabric.utilities.device_dtype_mixin._DeviceDtypeModuleMixin</dt>
+                                <dd id="GlobalWorkspaceBayesian.dtype" class="variable">dtype</dd>
+                <dd id="GlobalWorkspaceBayesian.device" class="variable">device</dd>
+                <dd id="GlobalWorkspaceBayesian.to" class="function">to</dd>
+                <dd id="GlobalWorkspaceBayesian.cuda" class="function">cuda</dd>
+                <dd id="GlobalWorkspaceBayesian.cpu" class="function">cpu</dd>
+                <dd id="GlobalWorkspaceBayesian.type" class="function">type</dd>
+                <dd id="GlobalWorkspaceBayesian.float" class="function">float</dd>
+                <dd id="GlobalWorkspaceBayesian.double" class="function">double</dd>
+                <dd id="GlobalWorkspaceBayesian.half" class="function">half</dd>
+
+            </div>
+            <div><dt>lightning.pytorch.core.mixins.hparams_mixin.HyperparametersMixin</dt>
+                                <dd id="GlobalWorkspaceBayesian.save_hyperparameters" class="function">save_hyperparameters</dd>
+                <dd id="GlobalWorkspaceBayesian.hparams" class="variable">hparams</dd>
+                <dd id="GlobalWorkspaceBayesian.hparams_initial" class="variable">hparams_initial</dd>
+
+            </div>
+            <div><dt>lightning.pytorch.core.hooks.ModelHooks</dt>
+                                <dd id="GlobalWorkspaceBayesian.on_fit_start" class="function">on_fit_start</dd>
+                <dd id="GlobalWorkspaceBayesian.on_fit_end" class="function">on_fit_end</dd>
+                <dd id="GlobalWorkspaceBayesian.on_train_start" class="function">on_train_start</dd>
+                <dd id="GlobalWorkspaceBayesian.on_train_end" class="function">on_train_end</dd>
+                <dd id="GlobalWorkspaceBayesian.on_validation_start" class="function">on_validation_start</dd>
+                <dd id="GlobalWorkspaceBayesian.on_validation_end" class="function">on_validation_end</dd>
+                <dd id="GlobalWorkspaceBayesian.on_test_start" class="function">on_test_start</dd>
+                <dd id="GlobalWorkspaceBayesian.on_test_end" class="function">on_test_end</dd>
+                <dd id="GlobalWorkspaceBayesian.on_predict_start" class="function">on_predict_start</dd>
+                <dd id="GlobalWorkspaceBayesian.on_predict_end" class="function">on_predict_end</dd>
+                <dd id="GlobalWorkspaceBayesian.on_train_batch_start" class="function">on_train_batch_start</dd>
+                <dd id="GlobalWorkspaceBayesian.on_train_batch_end" class="function">on_train_batch_end</dd>
+                <dd id="GlobalWorkspaceBayesian.on_validation_batch_start" class="function">on_validation_batch_start</dd>
+                <dd id="GlobalWorkspaceBayesian.on_validation_batch_end" class="function">on_validation_batch_end</dd>
+                <dd id="GlobalWorkspaceBayesian.on_test_batch_start" class="function">on_test_batch_start</dd>
+                <dd id="GlobalWorkspaceBayesian.on_test_batch_end" class="function">on_test_batch_end</dd>
+                <dd id="GlobalWorkspaceBayesian.on_predict_batch_start" class="function">on_predict_batch_start</dd>
+                <dd id="GlobalWorkspaceBayesian.on_predict_batch_end" class="function">on_predict_batch_end</dd>
+                <dd id="GlobalWorkspaceBayesian.on_validation_model_zero_grad" class="function">on_validation_model_zero_grad</dd>
+                <dd id="GlobalWorkspaceBayesian.on_validation_model_eval" class="function">on_validation_model_eval</dd>
+                <dd id="GlobalWorkspaceBayesian.on_validation_model_train" class="function">on_validation_model_train</dd>
+                <dd id="GlobalWorkspaceBayesian.on_test_model_eval" class="function">on_test_model_eval</dd>
+                <dd id="GlobalWorkspaceBayesian.on_test_model_train" class="function">on_test_model_train</dd>
+                <dd id="GlobalWorkspaceBayesian.on_predict_model_eval" class="function">on_predict_model_eval</dd>
+                <dd id="GlobalWorkspaceBayesian.on_train_epoch_start" class="function">on_train_epoch_start</dd>
+                <dd id="GlobalWorkspaceBayesian.on_train_epoch_end" class="function">on_train_epoch_end</dd>
+                <dd id="GlobalWorkspaceBayesian.on_validation_epoch_start" class="function">on_validation_epoch_start</dd>
+                <dd id="GlobalWorkspaceBayesian.on_validation_epoch_end" class="function">on_validation_epoch_end</dd>
+                <dd id="GlobalWorkspaceBayesian.on_test_epoch_start" class="function">on_test_epoch_start</dd>
+                <dd id="GlobalWorkspaceBayesian.on_test_epoch_end" class="function">on_test_epoch_end</dd>
+                <dd id="GlobalWorkspaceBayesian.on_predict_epoch_start" class="function">on_predict_epoch_start</dd>
+                <dd id="GlobalWorkspaceBayesian.on_predict_epoch_end" class="function">on_predict_epoch_end</dd>
+                <dd id="GlobalWorkspaceBayesian.on_before_zero_grad" class="function">on_before_zero_grad</dd>
+                <dd id="GlobalWorkspaceBayesian.on_before_backward" class="function">on_before_backward</dd>
+                <dd id="GlobalWorkspaceBayesian.on_after_backward" class="function">on_after_backward</dd>
+                <dd id="GlobalWorkspaceBayesian.on_before_optimizer_step" class="function">on_before_optimizer_step</dd>
+                <dd id="GlobalWorkspaceBayesian.configure_sharded_model" class="function">configure_sharded_model</dd>
+                <dd id="GlobalWorkspaceBayesian.configure_model" class="function">configure_model</dd>
+
+            </div>
+            <div><dt>lightning.pytorch.core.hooks.DataHooks</dt>
+                                <dd id="GlobalWorkspaceBayesian.prepare_data_per_node" class="variable">prepare_data_per_node</dd>
+                <dd id="GlobalWorkspaceBayesian.allow_zero_length_dataloader_with_multiple_devices" class="variable">allow_zero_length_dataloader_with_multiple_devices</dd>
+                <dd id="GlobalWorkspaceBayesian.prepare_data" class="function">prepare_data</dd>
+                <dd id="GlobalWorkspaceBayesian.setup" class="function">setup</dd>
+                <dd id="GlobalWorkspaceBayesian.teardown" class="function">teardown</dd>
+                <dd id="GlobalWorkspaceBayesian.train_dataloader" class="function">train_dataloader</dd>
+                <dd id="GlobalWorkspaceBayesian.test_dataloader" class="function">test_dataloader</dd>
+                <dd id="GlobalWorkspaceBayesian.val_dataloader" class="function">val_dataloader</dd>
+                <dd id="GlobalWorkspaceBayesian.predict_dataloader" class="function">predict_dataloader</dd>
+                <dd id="GlobalWorkspaceBayesian.transfer_batch_to_device" class="function">transfer_batch_to_device</dd>
+                <dd id="GlobalWorkspaceBayesian.on_before_batch_transfer" class="function">on_before_batch_transfer</dd>
+                <dd id="GlobalWorkspaceBayesian.on_after_batch_transfer" class="function">on_after_batch_transfer</dd>
+
+            </div>
+            <div><dt>lightning.pytorch.core.hooks.CheckpointHooks</dt>
+                                <dd id="GlobalWorkspaceBayesian.on_load_checkpoint" class="function">on_load_checkpoint</dd>
+                <dd id="GlobalWorkspaceBayesian.on_save_checkpoint" class="function">on_save_checkpoint</dd>
+
+            </div>
+            <div><dt>torch.nn.modules.module.Module</dt>
+                                <dd id="GlobalWorkspaceBayesian.dump_patches" class="variable">dump_patches</dd>
+                <dd id="GlobalWorkspaceBayesian.training" class="variable">training</dd>
+                <dd id="GlobalWorkspaceBayesian.call_super_init" class="variable">call_super_init</dd>
+                <dd id="GlobalWorkspaceBayesian.register_buffer" class="function">register_buffer</dd>
+                <dd id="GlobalWorkspaceBayesian.register_parameter" class="function">register_parameter</dd>
+                <dd id="GlobalWorkspaceBayesian.add_module" class="function">add_module</dd>
+                <dd id="GlobalWorkspaceBayesian.register_module" class="function">register_module</dd>
+                <dd id="GlobalWorkspaceBayesian.get_submodule" class="function">get_submodule</dd>
+                <dd id="GlobalWorkspaceBayesian.get_parameter" class="function">get_parameter</dd>
+                <dd id="GlobalWorkspaceBayesian.get_buffer" class="function">get_buffer</dd>
+                <dd id="GlobalWorkspaceBayesian.get_extra_state" class="function">get_extra_state</dd>
+                <dd id="GlobalWorkspaceBayesian.set_extra_state" class="function">set_extra_state</dd>
+                <dd id="GlobalWorkspaceBayesian.apply" class="function">apply</dd>
+                <dd id="GlobalWorkspaceBayesian.ipu" class="function">ipu</dd>
+                <dd id="GlobalWorkspaceBayesian.xpu" class="function">xpu</dd>
+                <dd id="GlobalWorkspaceBayesian.bfloat16" class="function">bfloat16</dd>
+                <dd id="GlobalWorkspaceBayesian.to_empty" class="function">to_empty</dd>
+                <dd id="GlobalWorkspaceBayesian.register_full_backward_pre_hook" class="function">register_full_backward_pre_hook</dd>
+                <dd id="GlobalWorkspaceBayesian.register_backward_hook" class="function">register_backward_hook</dd>
+                <dd id="GlobalWorkspaceBayesian.register_full_backward_hook" class="function">register_full_backward_hook</dd>
+                <dd id="GlobalWorkspaceBayesian.register_forward_pre_hook" class="function">register_forward_pre_hook</dd>
+                <dd id="GlobalWorkspaceBayesian.register_forward_hook" class="function">register_forward_hook</dd>
+                <dd id="GlobalWorkspaceBayesian.register_state_dict_pre_hook" class="function">register_state_dict_pre_hook</dd>
+                <dd id="GlobalWorkspaceBayesian.state_dict" class="function">state_dict</dd>
+                <dd id="GlobalWorkspaceBayesian.register_load_state_dict_post_hook" class="function">register_load_state_dict_post_hook</dd>
+                <dd id="GlobalWorkspaceBayesian.load_state_dict" class="function">load_state_dict</dd>
+                <dd id="GlobalWorkspaceBayesian.parameters" class="function">parameters</dd>
+                <dd id="GlobalWorkspaceBayesian.named_parameters" class="function">named_parameters</dd>
+                <dd id="GlobalWorkspaceBayesian.buffers" class="function">buffers</dd>
+                <dd id="GlobalWorkspaceBayesian.named_buffers" class="function">named_buffers</dd>
+                <dd id="GlobalWorkspaceBayesian.children" class="function">children</dd>
+                <dd id="GlobalWorkspaceBayesian.named_children" class="function">named_children</dd>
+                <dd id="GlobalWorkspaceBayesian.modules" class="function">modules</dd>
+                <dd id="GlobalWorkspaceBayesian.named_modules" class="function">named_modules</dd>
+                <dd id="GlobalWorkspaceBayesian.train" class="function">train</dd>
+                <dd id="GlobalWorkspaceBayesian.eval" class="function">eval</dd>
+                <dd id="GlobalWorkspaceBayesian.requires_grad_" class="function">requires_grad_</dd>
+                <dd id="GlobalWorkspaceBayesian.zero_grad" class="function">zero_grad</dd>
+                <dd id="GlobalWorkspaceBayesian.share_memory" class="function">share_memory</dd>
+                <dd id="GlobalWorkspaceBayesian.extra_repr" class="function">extra_repr</dd>
+                <dd id="GlobalWorkspaceBayesian.compile" class="function">compile</dd>
+
+            </div>
+                                </dl>
+                            </div>
+                </section>
+                <section id="pretrained_global_workspace">
+                            <input id="pretrained_global_workspace-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
+<div class="attr function">
+            
+        <span class="def">def</span>
+        <span class="name">pretrained_global_workspace</span><span class="signature pdoc-code multiline">(<span class="param">	<span class="n">checkpoint_path</span><span class="p">:</span> <span class="nb">str</span> <span class="o">|</span> <span class="n">pathlib</span><span class="o">.</span><span class="n">Path</span>,</span><span class="param">	<span class="n">domain_mods</span><span class="p">:</span> <span class="n">collections</span><span class="o">.</span><span class="n">abc</span><span class="o">.</span><span class="n">Mapping</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n"><a href="domain.html#DomainModule">shimmer.modules.domain.DomainModule</a></span><span class="p">]</span>,</span><span class="param">	<span class="n">gw_encoders</span><span class="p">:</span> <span class="n">collections</span><span class="o">.</span><span class="n">abc</span><span class="o">.</span><span class="n">Mapping</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">nn</span><span class="o">.</span><span class="n">modules</span><span class="o">.</span><span class="n">module</span><span class="o">.</span><span class="n">Module</span><span class="p">]</span>,</span><span class="param">	<span class="n">gw_decoders</span><span class="p">:</span> <span class="n">collections</span><span class="o">.</span><span class="n">abc</span><span class="o">.</span><span class="n">Mapping</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">nn</span><span class="o">.</span><span class="n">modules</span><span class="o">.</span><span class="n">module</span><span class="o">.</span><span class="n">Module</span><span class="p">]</span>,</span><span class="param">	<span class="n">workspace_dim</span><span class="p">:</span> <span class="nb">int</span>,</span><span class="param">	<span class="n">loss_coefs</span><span class="p">:</span> <span class="n"><a href="losses.html#LossCoefs">shimmer.modules.losses.LossCoefs</a></span>,</span><span class="param">	<span class="n">contrastive_fn</span><span class="p">:</span> <span class="n">collections</span><span class="o">.</span><span class="n">abc</span><span class="o">.</span><span class="n">Callable</span><span class="p">[[</span><span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">],</span> <span class="n"><a href="domain.html#LossOutput">shimmer.modules.domain.LossOutput</a></span><span class="p">]</span>,</span><span class="param">	<span class="o">**</span><span class="n">kwargs</span></span><span class="return-annotation">) -> <span class="n"><a href="#GlobalWorkspace2Domains">GlobalWorkspace2Domains</a></span>:</span></span>
+
+                <label class="view-source-button" for="pretrained_global_workspace-view-source"><span>View Source</span></label>
+
+    </div>
+    <a class="headerlink" href="#pretrained_global_workspace"></a>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="pretrained_global_workspace-783"><a href="#pretrained_global_workspace-783"><span class="linenos">783</span></a><span class="k">def</span> <span class="nf">pretrained_global_workspace</span><span class="p">(</span>
+</span><span id="pretrained_global_workspace-784"><a href="#pretrained_global_workspace-784"><span class="linenos">784</span></a>    <span class="n">checkpoint_path</span><span class="p">:</span> <span class="nb">str</span> <span class="o">|</span> <span class="n">Path</span><span class="p">,</span>
+</span><span id="pretrained_global_workspace-785"><a href="#pretrained_global_workspace-785"><span class="linenos">785</span></a>    <span class="n">domain_mods</span><span class="p">:</span> <span class="n">Mapping</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">DomainModule</span><span class="p">],</span>
+</span><span id="pretrained_global_workspace-786"><a href="#pretrained_global_workspace-786"><span class="linenos">786</span></a>    <span class="n">gw_encoders</span><span class="p">:</span> <span class="n">Mapping</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">Module</span><span class="p">],</span>
+</span><span id="pretrained_global_workspace-787"><a href="#pretrained_global_workspace-787"><span class="linenos">787</span></a>    <span class="n">gw_decoders</span><span class="p">:</span> <span class="n">Mapping</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">Module</span><span class="p">],</span>
+</span><span id="pretrained_global_workspace-788"><a href="#pretrained_global_workspace-788"><span class="linenos">788</span></a>    <span class="n">workspace_dim</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span>
+</span><span id="pretrained_global_workspace-789"><a href="#pretrained_global_workspace-789"><span class="linenos">789</span></a>    <span class="n">loss_coefs</span><span class="p">:</span> <span class="n">LossCoefs</span><span class="p">,</span>
+</span><span id="pretrained_global_workspace-790"><a href="#pretrained_global_workspace-790"><span class="linenos">790</span></a>    <span class="n">contrastive_fn</span><span class="p">:</span> <span class="n">ContrastiveLossType</span><span class="p">,</span>
+</span><span id="pretrained_global_workspace-791"><a href="#pretrained_global_workspace-791"><span class="linenos">791</span></a>    <span class="o">**</span><span class="n">kwargs</span><span class="p">,</span>
+</span><span id="pretrained_global_workspace-792"><a href="#pretrained_global_workspace-792"><span class="linenos">792</span></a><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">GlobalWorkspace2Domains</span><span class="p">:</span>
+</span><span id="pretrained_global_workspace-793"><a href="#pretrained_global_workspace-793"><span class="linenos">793</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="pretrained_global_workspace-794"><a href="#pretrained_global_workspace-794"><span class="linenos">794</span></a><span class="sd">    Load a `GlobalWorkspace` flavor of `GlobalWorkspaceBase` from a checkpoint.</span>
+</span><span id="pretrained_global_workspace-795"><a href="#pretrained_global_workspace-795"><span class="linenos">795</span></a>
+</span><span id="pretrained_global_workspace-796"><a href="#pretrained_global_workspace-796"><span class="linenos">796</span></a><span class="sd">    Args:</span>
+</span><span id="pretrained_global_workspace-797"><a href="#pretrained_global_workspace-797"><span class="linenos">797</span></a><span class="sd">        checkpoint_path (`str | Path`): path to checkpoint</span>
+</span><span id="pretrained_global_workspace-798"><a href="#pretrained_global_workspace-798"><span class="linenos">798</span></a><span class="sd">        domain_mods (`Mapping[str, DomainModule]`): mapping of the domains</span>
+</span><span id="pretrained_global_workspace-799"><a href="#pretrained_global_workspace-799"><span class="linenos">799</span></a><span class="sd">            connected to the GW. Keys are domain names, values are the</span>
+</span><span id="pretrained_global_workspace-800"><a href="#pretrained_global_workspace-800"><span class="linenos">800</span></a><span class="sd">            `DomainModule`.</span>
+</span><span id="pretrained_global_workspace-801"><a href="#pretrained_global_workspace-801"><span class="linenos">801</span></a><span class="sd">        gw_encoders (`Mapping[str, torch.nn.Module]`): mapping for each domain</span>
+</span><span id="pretrained_global_workspace-802"><a href="#pretrained_global_workspace-802"><span class="linenos">802</span></a><span class="sd">            name to a `torch.nn.Module` class which role is to encode a</span>
+</span><span id="pretrained_global_workspace-803"><a href="#pretrained_global_workspace-803"><span class="linenos">803</span></a><span class="sd">            unimodal latent representations into a GW representation (pre fusion).</span>
+</span><span id="pretrained_global_workspace-804"><a href="#pretrained_global_workspace-804"><span class="linenos">804</span></a><span class="sd">        gw_decoders (`Mapping[str, torch.nn.Module]`): mapping for each domain</span>
+</span><span id="pretrained_global_workspace-805"><a href="#pretrained_global_workspace-805"><span class="linenos">805</span></a><span class="sd">            name to a `torch.nn.Module` class which role is to decode a</span>
+</span><span id="pretrained_global_workspace-806"><a href="#pretrained_global_workspace-806"><span class="linenos">806</span></a><span class="sd">            GW representation into a unimodal latent representations.</span>
+</span><span id="pretrained_global_workspace-807"><a href="#pretrained_global_workspace-807"><span class="linenos">807</span></a><span class="sd">        workspace_dim (`int`): dimension of the GW.</span>
+</span><span id="pretrained_global_workspace-808"><a href="#pretrained_global_workspace-808"><span class="linenos">808</span></a><span class="sd">        loss_coefs (`LossCoefs`): loss coefficients</span>
+</span><span id="pretrained_global_workspace-809"><a href="#pretrained_global_workspace-809"><span class="linenos">809</span></a><span class="sd">        contrastive_loss (`ContrastiveLossType`): a contrastive loss</span>
+</span><span id="pretrained_global_workspace-810"><a href="#pretrained_global_workspace-810"><span class="linenos">810</span></a><span class="sd">            function used for alignment. `learn_logit_scale` will not affect custom</span>
+</span><span id="pretrained_global_workspace-811"><a href="#pretrained_global_workspace-811"><span class="linenos">811</span></a><span class="sd">            contrastive losses.</span>
+</span><span id="pretrained_global_workspace-812"><a href="#pretrained_global_workspace-812"><span class="linenos">812</span></a><span class="sd">        **kwargs: additional arguments to pass to</span>
+</span><span id="pretrained_global_workspace-813"><a href="#pretrained_global_workspace-813"><span class="linenos">813</span></a><span class="sd">            `GlobalWorkspace.load_from_checkpoint`.</span>
+</span><span id="pretrained_global_workspace-814"><a href="#pretrained_global_workspace-814"><span class="linenos">814</span></a>
+</span><span id="pretrained_global_workspace-815"><a href="#pretrained_global_workspace-815"><span class="linenos">815</span></a><span class="sd">    Returns:</span>
+</span><span id="pretrained_global_workspace-816"><a href="#pretrained_global_workspace-816"><span class="linenos">816</span></a><span class="sd">        `GlobalWorkspace`: the pretrained `GlobalWorkspace`.</span>
+</span><span id="pretrained_global_workspace-817"><a href="#pretrained_global_workspace-817"><span class="linenos">817</span></a>
+</span><span id="pretrained_global_workspace-818"><a href="#pretrained_global_workspace-818"><span class="linenos">818</span></a><span class="sd">    Raises:</span>
+</span><span id="pretrained_global_workspace-819"><a href="#pretrained_global_workspace-819"><span class="linenos">819</span></a><span class="sd">        `TypeError`: if loaded type is not `GlobalWorkspace`.</span>
+</span><span id="pretrained_global_workspace-820"><a href="#pretrained_global_workspace-820"><span class="linenos">820</span></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="pretrained_global_workspace-821"><a href="#pretrained_global_workspace-821"><span class="linenos">821</span></a>    <span class="n">domain_mods</span> <span class="o">=</span> <span class="n">freeze_domain_modules</span><span class="p">(</span><span class="n">domain_mods</span><span class="p">)</span>
+</span><span id="pretrained_global_workspace-822"><a href="#pretrained_global_workspace-822"><span class="linenos">822</span></a>    <span class="n">gw_mod</span> <span class="o">=</span> <span class="n">GWModule</span><span class="p">(</span><span class="n">domain_mods</span><span class="p">,</span> <span class="n">workspace_dim</span><span class="p">,</span> <span class="n">gw_encoders</span><span class="p">,</span> <span class="n">gw_decoders</span><span class="p">)</span>
+</span><span id="pretrained_global_workspace-823"><a href="#pretrained_global_workspace-823"><span class="linenos">823</span></a>    <span class="n">selection_mod</span> <span class="o">=</span> <span class="n">SingleDomainSelection</span><span class="p">()</span>
+</span><span id="pretrained_global_workspace-824"><a href="#pretrained_global_workspace-824"><span class="linenos">824</span></a>    <span class="n">loss_mod</span> <span class="o">=</span> <span class="n">GWLosses2Domains</span><span class="p">(</span>
+</span><span id="pretrained_global_workspace-825"><a href="#pretrained_global_workspace-825"><span class="linenos">825</span></a>        <span class="n">gw_mod</span><span class="p">,</span> <span class="n">selection_mod</span><span class="p">,</span> <span class="n">domain_mods</span><span class="p">,</span> <span class="n">loss_coefs</span><span class="p">,</span> <span class="n">contrastive_fn</span>
+</span><span id="pretrained_global_workspace-826"><a href="#pretrained_global_workspace-826"><span class="linenos">826</span></a>    <span class="p">)</span>
+</span><span id="pretrained_global_workspace-827"><a href="#pretrained_global_workspace-827"><span class="linenos">827</span></a>
+</span><span id="pretrained_global_workspace-828"><a href="#pretrained_global_workspace-828"><span class="linenos">828</span></a>    <span class="n">gw</span> <span class="o">=</span> <span class="n">GlobalWorkspace2Domains</span><span class="o">.</span><span class="n">load_from_checkpoint</span><span class="p">(</span>
+</span><span id="pretrained_global_workspace-829"><a href="#pretrained_global_workspace-829"><span class="linenos">829</span></a>        <span class="n">checkpoint_path</span><span class="p">,</span>
+</span><span id="pretrained_global_workspace-830"><a href="#pretrained_global_workspace-830"><span class="linenos">830</span></a>        <span class="n">gw_mod</span><span class="o">=</span><span class="n">gw_mod</span><span class="p">,</span>
+</span><span id="pretrained_global_workspace-831"><a href="#pretrained_global_workspace-831"><span class="linenos">831</span></a>        <span class="n">selection_mid</span><span class="o">=</span><span class="n">selection_mod</span><span class="p">,</span>
+</span><span id="pretrained_global_workspace-832"><a href="#pretrained_global_workspace-832"><span class="linenos">832</span></a>        <span class="n">loss_coefs</span><span class="o">=</span><span class="n">loss_coefs</span><span class="p">,</span>
+</span><span id="pretrained_global_workspace-833"><a href="#pretrained_global_workspace-833"><span class="linenos">833</span></a>        <span class="n">loss_mod</span><span class="o">=</span><span class="n">loss_mod</span><span class="p">,</span>
+</span><span id="pretrained_global_workspace-834"><a href="#pretrained_global_workspace-834"><span class="linenos">834</span></a>        <span class="o">**</span><span class="n">kwargs</span><span class="p">,</span>
+</span><span id="pretrained_global_workspace-835"><a href="#pretrained_global_workspace-835"><span class="linenos">835</span></a>    <span class="p">)</span>
+</span><span id="pretrained_global_workspace-836"><a href="#pretrained_global_workspace-836"><span class="linenos">836</span></a>    <span class="k">if</span> <span class="ow">not</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">gw</span><span class="p">,</span> <span class="n">GlobalWorkspace2Domains</span><span class="p">):</span>
+</span><span id="pretrained_global_workspace-837"><a href="#pretrained_global_workspace-837"><span class="linenos">837</span></a>        <span class="k">raise</span> <span class="ne">TypeError</span><span class="p">(</span><span class="s2">&quot;model should be of type GlobalWorkspace&quot;</span><span class="p">)</span>
+</span><span id="pretrained_global_workspace-838"><a href="#pretrained_global_workspace-838"><span class="linenos">838</span></a>    <span class="k">return</span> <span class="n">gw</span>
+</span></pre></div>
+
+
+            <div class="docstring"><p>Load a <code><a href="#GlobalWorkspace">GlobalWorkspace</a></code> flavor of <code><a href="#GlobalWorkspaceBase">GlobalWorkspaceBase</a></code> from a checkpoint.</p>
+
+<h6 id="arguments">Arguments:</h6>
+
+<ul>
+<li><strong>checkpoint_path (<code>str | Path</code>):</strong>  path to checkpoint</li>
+<li><strong>domain_mods (<code>Mapping[str, DomainModule]</code>):</strong>  mapping of the domains
+connected to the GW. Keys are domain names, values are the
+<code>DomainModule</code>.</li>
+<li><strong>gw_encoders (<code>Mapping[str, torch.nn.Module]</code>):</strong>  mapping for each domain
+name to a <code>torch.nn.Module</code> class which role is to encode a
+unimodal latent representations into a GW representation (pre fusion).</li>
+<li><strong>gw_decoders (<code>Mapping[str, torch.nn.Module]</code>):</strong>  mapping for each domain
+name to a <code>torch.nn.Module</code> class which role is to decode a
+GW representation into a unimodal latent representations.</li>
+<li><strong>workspace_dim (<code>int</code>):</strong>  dimension of the GW.</li>
+<li><strong>loss_coefs (<code>LossCoefs</code>):</strong>  loss coefficients</li>
+<li><strong>contrastive_loss (<code>ContrastiveLossType</code>):</strong>  a contrastive loss
+function used for alignment. <code>learn_logit_scale</code> will not affect custom
+contrastive losses.</li>
+<li><strong>**kwargs:</strong>  additional arguments to pass to
+<code><a href="#GlobalWorkspace.load_from_checkpoint">GlobalWorkspace.load_from_checkpoint</a></code>.</li>
+</ul>
+
+<h6 id="returns">Returns:</h6>
+
+<blockquote>
+  <p><code><a href="#GlobalWorkspace">GlobalWorkspace</a></code>: the pretrained <code><a href="#GlobalWorkspace">GlobalWorkspace</a></code>.</p>
+</blockquote>
+
+<h6 id="raises">Raises:</h6>
+
+<ul>
+<li><strong><code>TypeError</code>:</strong>  if loaded type is not <code><a href="#GlobalWorkspace">GlobalWorkspace</a></code>.</li>
+</ul>
+</div>
+
+
+                </section>
+    </main>
+<script>
+    function escapeHTML(html) {
+        return document.createElement('div').appendChild(document.createTextNode(html)).parentNode.innerHTML;
+    }
+
+    const originalContent = document.querySelector("main.pdoc");
+    let currentContent = originalContent;
+
+    function setContent(innerHTML) {
+        let elem;
+        if (innerHTML) {
+            elem = document.createElement("main");
+            elem.classList.add("pdoc");
+            elem.innerHTML = innerHTML;
+        } else {
+            elem = originalContent;
+        }
+        if (currentContent !== elem) {
+            currentContent.replaceWith(elem);
+            currentContent = elem;
+        }
+    }
+
+    function getSearchTerm() {
+        return (new URL(window.location)).searchParams.get("search");
+    }
+
+    const searchBox = document.querySelector(".pdoc input[type=search]");
+    searchBox.addEventListener("input", function () {
+        let url = new URL(window.location);
+        if (searchBox.value.trim()) {
+            url.hash = "";
+            url.searchParams.set("search", searchBox.value);
+        } else {
+            url.searchParams.delete("search");
+        }
+        history.replaceState("", "", url.toString());
+        onInput();
+    });
+    window.addEventListener("popstate", onInput);
+
+
+    let search, searchErr;
+
+    async function initialize() {
+        try {
+            search = await new Promise((resolve, reject) => {
+                const script = document.createElement("script");
+                script.type = "text/javascript";
+                script.async = true;
+                script.onload = () => resolve(window.pdocSearch);
+                script.onerror = (e) => reject(e);
+                script.src = "../../search.js";
+                document.getElementsByTagName("head")[0].appendChild(script);
+            });
+        } catch (e) {
+            console.error("Cannot fetch pdoc search index");
+            searchErr = "Cannot fetch search index.";
+        }
+        onInput();
+
+        document.querySelector("nav.pdoc").addEventListener("click", e => {
+            if (e.target.hash) {
+                searchBox.value = "";
+                searchBox.dispatchEvent(new Event("input"));
+            }
+        });
+    }
+
+    function onInput() {
+        setContent((() => {
+            const term = getSearchTerm();
+            if (!term) {
+                return null
+            }
+            if (searchErr) {
+                return `<h3>Error: ${searchErr}</h3>`
+            }
+            if (!search) {
+                return "<h3>Searching...</h3>"
+            }
+
+            window.scrollTo({top: 0, left: 0, behavior: 'auto'});
+
+            const results = search(term);
+
+            let html;
+            if (results.length === 0) {
+                html = `No search results for '${escapeHTML(term)}'.`
+            } else {
+                html = `<h4>${results.length} search result${results.length > 1 ? "s" : ""} for '${escapeHTML(term)}'.</h4>`;
+            }
+            for (let result of results.slice(0, 10)) {
+                let doc = result.doc;
+                let url = `../../${doc.modulename.replaceAll(".", "/")}.html`;
+                if (doc.qualname) {
+                    url += `#${doc.qualname}`;
+                }
+
+                let heading;
+                switch (result.doc.kind) {
+                    case "function":
+                        if (doc.fullname.endsWith(".__init__")) {
+                            heading = `<span class="name">${doc.fullname.replace(/\.__init__$/, "")}</span>${doc.signature}`;
+                        } else {
+                            heading = `<span class="def">${doc.funcdef}</span> <span class="name">${doc.fullname}</span>${doc.signature}`;
+                        }
+                        break;
+                    case "class":
+                        heading = `<span class="def">class</span> <span class="name">${doc.fullname}</span>`;
+                        if (doc.bases)
+                            heading += `<wbr>(<span class="base">${doc.bases}</span>)`;
+                        heading += `:`;
+                        break;
+                    case "variable":
+                        heading = `<span class="name">${doc.fullname}</span>`;
+                        if (doc.annotation)
+                            heading += `<span class="annotation">${doc.annotation}</span>`;
+                        if (doc.default_value)
+                            heading += `<span class="default_value"> = ${doc.default_value}</span>`;
+                        break;
+                    default:
+                        heading = `<span class="name">${doc.fullname}</span>`;
+                        break;
+                }
+                html += `
+                        <section class="search-result">
+                        <a href="${url}" class="attr ${doc.kind}">${heading}</a>
+                        <div class="docstring">${doc.doc}</div>
+                        </section>
+                    `;
+
+            }
+            return html;
+        })());
+    }
+
+    if (getSearchTerm()) {
+        initialize();
+        searchBox.value = getSearchTerm();
+        onInput();
+    } else {
+        searchBox.addEventListener("focus", initialize, {once: true});
+    }
+
+    searchBox.addEventListener("keydown", e => {
+        if (["ArrowDown", "ArrowUp", "Enter"].includes(e.key)) {
+            let focused = currentContent.querySelector(".search-result.focused");
+            if (!focused) {
+                currentContent.querySelector(".search-result").classList.add("focused");
+            } else if (
+                e.key === "ArrowDown"
+                && focused.nextElementSibling
+                && focused.nextElementSibling.classList.contains("search-result")
+            ) {
+                focused.classList.remove("focused");
+                focused.nextElementSibling.classList.add("focused");
+                focused.nextElementSibling.scrollIntoView({
+                    behavior: "smooth",
+                    block: "nearest",
+                    inline: "nearest"
+                });
+            } else if (
+                e.key === "ArrowUp"
+                && focused.previousElementSibling
+                && focused.previousElementSibling.classList.contains("search-result")
+            ) {
+                focused.classList.remove("focused");
+                focused.previousElementSibling.classList.add("focused");
+                focused.previousElementSibling.scrollIntoView({
+                    behavior: "smooth",
+                    block: "nearest",
+                    inline: "nearest"
+                });
+            } else if (
+                e.key === "Enter"
+            ) {
+                focused.querySelector("a").click();
+            }
+        }
+    });
+</script></body>
+</html>
\ No newline at end of file
diff --git a/docs/api/v0.5.1/shimmer/modules/gw_module.html b/docs/api/v0.5.1/shimmer/modules/gw_module.html
new file mode 100644
index 00000000..bf539184
--- /dev/null
+++ b/docs/api/v0.5.1/shimmer/modules/gw_module.html
@@ -0,0 +1,2893 @@
+<!doctype html>
+<html lang="en">
+<head>
+    <meta charset="utf-8">
+    <meta name="viewport" content="width=device-width, initial-scale=1">
+    <meta name="generator" content="pdoc 14.4.0"/>
+    <title>shimmer.modules.gw_module API documentation</title>
+
+    <style>/*! * Bootstrap Reboot v5.0.0 (https://getbootstrap.com/) * Copyright 2011-2021 The Bootstrap Authors * Copyright 2011-2021 Twitter, Inc. * Licensed under MIT (https://github.com/twbs/bootstrap/blob/main/LICENSE) * Forked from Normalize.css, licensed MIT (https://github.com/necolas/normalize.css/blob/master/LICENSE.md) */*,::after,::before{box-sizing:border-box}@media (prefers-reduced-motion:no-preference){:root{scroll-behavior:smooth}}body{margin:0;font-family:system-ui,-apple-system,"Segoe UI",Roboto,"Helvetica Neue",Arial,"Noto Sans","Liberation Sans",sans-serif,"Apple Color Emoji","Segoe UI Emoji","Segoe UI Symbol","Noto Color Emoji";font-size:1rem;font-weight:400;line-height:1.5;color:#212529;background-color:#fff;-webkit-text-size-adjust:100%;-webkit-tap-highlight-color:transparent}hr{margin:1rem 0;color:inherit;background-color:currentColor;border:0;opacity:.25}hr:not([size]){height:1px}h1,h2,h3,h4,h5,h6{margin-top:0;margin-bottom:.5rem;font-weight:500;line-height:1.2}h1{font-size:calc(1.375rem + 1.5vw)}@media (min-width:1200px){h1{font-size:2.5rem}}h2{font-size:calc(1.325rem + .9vw)}@media (min-width:1200px){h2{font-size:2rem}}h3{font-size:calc(1.3rem + .6vw)}@media (min-width:1200px){h3{font-size:1.75rem}}h4{font-size:calc(1.275rem + .3vw)}@media (min-width:1200px){h4{font-size:1.5rem}}h5{font-size:1.25rem}h6{font-size:1rem}p{margin-top:0;margin-bottom:1rem}abbr[data-bs-original-title],abbr[title]{-webkit-text-decoration:underline dotted;text-decoration:underline dotted;cursor:help;-webkit-text-decoration-skip-ink:none;text-decoration-skip-ink:none}address{margin-bottom:1rem;font-style:normal;line-height:inherit}ol,ul{padding-left:2rem}dl,ol,ul{margin-top:0;margin-bottom:1rem}ol ol,ol ul,ul ol,ul ul{margin-bottom:0}dt{font-weight:700}dd{margin-bottom:.5rem;margin-left:0}blockquote{margin:0 0 1rem}b,strong{font-weight:bolder}small{font-size:.875em}mark{padding:.2em;background-color:#fcf8e3}sub,sup{position:relative;font-size:.75em;line-height:0;vertical-align:baseline}sub{bottom:-.25em}sup{top:-.5em}a{color:#0d6efd;text-decoration:underline}a:hover{color:#0a58ca}a:not([href]):not([class]),a:not([href]):not([class]):hover{color:inherit;text-decoration:none}code,kbd,pre,samp{font-family:SFMono-Regular,Menlo,Monaco,Consolas,"Liberation Mono","Courier New",monospace;font-size:1em;direction:ltr;unicode-bidi:bidi-override}pre{display:block;margin-top:0;margin-bottom:1rem;overflow:auto;font-size:.875em}pre code{font-size:inherit;color:inherit;word-break:normal}code{font-size:.875em;color:#d63384;word-wrap:break-word}a>code{color:inherit}kbd{padding:.2rem .4rem;font-size:.875em;color:#fff;background-color:#212529;border-radius:.2rem}kbd kbd{padding:0;font-size:1em;font-weight:700}figure{margin:0 0 1rem}img,svg{vertical-align:middle}table{caption-side:bottom;border-collapse:collapse}caption{padding-top:.5rem;padding-bottom:.5rem;color:#6c757d;text-align:left}th{text-align:inherit;text-align:-webkit-match-parent}tbody,td,tfoot,th,thead,tr{border-color:inherit;border-style:solid;border-width:0}label{display:inline-block}button{border-radius:0}button:focus:not(:focus-visible){outline:0}button,input,optgroup,select,textarea{margin:0;font-family:inherit;font-size:inherit;line-height:inherit}button,select{text-transform:none}[role=button]{cursor:pointer}select{word-wrap:normal}select:disabled{opacity:1}[list]::-webkit-calendar-picker-indicator{display:none}[type=button],[type=reset],[type=submit],button{-webkit-appearance:button}[type=button]:not(:disabled),[type=reset]:not(:disabled),[type=submit]:not(:disabled),button:not(:disabled){cursor:pointer}::-moz-focus-inner{padding:0;border-style:none}textarea{resize:vertical}fieldset{min-width:0;padding:0;margin:0;border:0}legend{float:left;width:100%;padding:0;margin-bottom:.5rem;font-size:calc(1.275rem + .3vw);line-height:inherit}@media (min-width:1200px){legend{font-size:1.5rem}}legend+*{clear:left}::-webkit-datetime-edit-day-field,::-webkit-datetime-edit-fields-wrapper,::-webkit-datetime-edit-hour-field,::-webkit-datetime-edit-minute,::-webkit-datetime-edit-month-field,::-webkit-datetime-edit-text,::-webkit-datetime-edit-year-field{padding:0}::-webkit-inner-spin-button{height:auto}[type=search]{outline-offset:-2px;-webkit-appearance:textfield}::-webkit-search-decoration{-webkit-appearance:none}::-webkit-color-swatch-wrapper{padding:0}::file-selector-button{font:inherit}::-webkit-file-upload-button{font:inherit;-webkit-appearance:button}output{display:inline-block}iframe{border:0}summary{display:list-item;cursor:pointer}progress{vertical-align:baseline}[hidden]{display:none!important}</style>
+    <style>/*! syntax-highlighting.css */pre{line-height:125%;}span.linenos{color:inherit; background-color:transparent; padding-left:5px; padding-right:20px;}.pdoc-code .hll{background-color:#ffffcc}.pdoc-code{background:#f8f8f8;}.pdoc-code .c{color:#3D7B7B; font-style:italic}.pdoc-code .err{border:1px solid #FF0000}.pdoc-code .k{color:#008000; font-weight:bold}.pdoc-code .o{color:#666666}.pdoc-code .ch{color:#3D7B7B; font-style:italic}.pdoc-code .cm{color:#3D7B7B; font-style:italic}.pdoc-code .cp{color:#9C6500}.pdoc-code .cpf{color:#3D7B7B; font-style:italic}.pdoc-code .c1{color:#3D7B7B; font-style:italic}.pdoc-code .cs{color:#3D7B7B; font-style:italic}.pdoc-code .gd{color:#A00000}.pdoc-code .ge{font-style:italic}.pdoc-code .gr{color:#E40000}.pdoc-code .gh{color:#000080; font-weight:bold}.pdoc-code .gi{color:#008400}.pdoc-code .go{color:#717171}.pdoc-code .gp{color:#000080; font-weight:bold}.pdoc-code .gs{font-weight:bold}.pdoc-code .gu{color:#800080; font-weight:bold}.pdoc-code .gt{color:#0044DD}.pdoc-code .kc{color:#008000; font-weight:bold}.pdoc-code .kd{color:#008000; font-weight:bold}.pdoc-code .kn{color:#008000; font-weight:bold}.pdoc-code .kp{color:#008000}.pdoc-code .kr{color:#008000; font-weight:bold}.pdoc-code .kt{color:#B00040}.pdoc-code .m{color:#666666}.pdoc-code .s{color:#BA2121}.pdoc-code .na{color:#687822}.pdoc-code .nb{color:#008000}.pdoc-code .nc{color:#0000FF; font-weight:bold}.pdoc-code .no{color:#880000}.pdoc-code .nd{color:#AA22FF}.pdoc-code .ni{color:#717171; font-weight:bold}.pdoc-code .ne{color:#CB3F38; font-weight:bold}.pdoc-code .nf{color:#0000FF}.pdoc-code .nl{color:#767600}.pdoc-code .nn{color:#0000FF; font-weight:bold}.pdoc-code .nt{color:#008000; font-weight:bold}.pdoc-code .nv{color:#19177C}.pdoc-code .ow{color:#AA22FF; font-weight:bold}.pdoc-code .w{color:#bbbbbb}.pdoc-code .mb{color:#666666}.pdoc-code .mf{color:#666666}.pdoc-code .mh{color:#666666}.pdoc-code .mi{color:#666666}.pdoc-code .mo{color:#666666}.pdoc-code .sa{color:#BA2121}.pdoc-code .sb{color:#BA2121}.pdoc-code .sc{color:#BA2121}.pdoc-code .dl{color:#BA2121}.pdoc-code .sd{color:#BA2121; font-style:italic}.pdoc-code .s2{color:#BA2121}.pdoc-code .se{color:#AA5D1F; font-weight:bold}.pdoc-code .sh{color:#BA2121}.pdoc-code .si{color:#A45A77; font-weight:bold}.pdoc-code .sx{color:#008000}.pdoc-code .sr{color:#A45A77}.pdoc-code .s1{color:#BA2121}.pdoc-code .ss{color:#19177C}.pdoc-code .bp{color:#008000}.pdoc-code .fm{color:#0000FF}.pdoc-code .vc{color:#19177C}.pdoc-code .vg{color:#19177C}.pdoc-code .vi{color:#19177C}.pdoc-code .vm{color:#19177C}.pdoc-code .il{color:#666666}</style>
+    <style>/*! theme.css */:root{--pdoc-background:#fff;}.pdoc{--text:#212529;--muted:#6c757d;--link:#3660a5;--link-hover:#1659c5;--code:#f8f8f8;--active:#fff598;--accent:#eee;--accent2:#c1c1c1;--nav-hover:rgba(255, 255, 255, 0.5);--name:#0066BB;--def:#008800;--annotation:#007020;}</style>
+    <style>/*! layout.css */html, body{width:100%;height:100%;}html, main{scroll-behavior:smooth;}body{background-color:var(--pdoc-background);}@media (max-width:769px){#navtoggle{cursor:pointer;position:absolute;width:50px;height:40px;top:1rem;right:1rem;border-color:var(--text);color:var(--text);display:flex;opacity:0.8;z-index:999;}#navtoggle:hover{opacity:1;}#togglestate + div{display:none;}#togglestate:checked + div{display:inherit;}main, header{padding:2rem 3vw;}header + main{margin-top:-3rem;}.git-button{display:none !important;}nav input[type="search"]{max-width:77%;}nav input[type="search"]:first-child{margin-top:-6px;}nav input[type="search"]:valid ~ *{display:none !important;}}@media (min-width:770px){:root{--sidebar-width:clamp(12.5rem, 28vw, 22rem);}nav{position:fixed;overflow:auto;height:100vh;width:var(--sidebar-width);}main, header{padding:3rem 2rem 3rem calc(var(--sidebar-width) + 3rem);width:calc(54rem + var(--sidebar-width));max-width:100%;}header + main{margin-top:-4rem;}#navtoggle{display:none;}}#togglestate{position:absolute;height:0;opacity:0;}nav.pdoc{--pad:clamp(0.5rem, 2vw, 1.75rem);--indent:1.5rem;background-color:var(--accent);border-right:1px solid var(--accent2);box-shadow:0 0 20px rgba(50, 50, 50, .2) inset;padding:0 0 0 var(--pad);overflow-wrap:anywhere;scrollbar-width:thin; scrollbar-color:var(--accent2) transparent; z-index:1}nav.pdoc::-webkit-scrollbar{width:.4rem; }nav.pdoc::-webkit-scrollbar-thumb{background-color:var(--accent2); }nav.pdoc > div{padding:var(--pad) 0;}nav.pdoc .module-list-button{display:inline-flex;align-items:center;color:var(--text);border-color:var(--muted);margin-bottom:1rem;}nav.pdoc .module-list-button:hover{border-color:var(--text);}nav.pdoc input[type=search]{display:block;outline-offset:0;width:calc(100% - var(--pad));}nav.pdoc .logo{max-width:calc(100% - var(--pad));max-height:35vh;display:block;margin:0 auto 1rem;transform:translate(calc(-.5 * var(--pad)), 0);}nav.pdoc ul{list-style:none;padding-left:0;}nav.pdoc > div > ul{margin-left:calc(0px - var(--pad));}nav.pdoc li a{padding:.2rem 0 .2rem calc(var(--pad) + var(--indent));}nav.pdoc > div > ul > li > a{padding-left:var(--pad);}nav.pdoc li{transition:all 100ms;}nav.pdoc li:hover{background-color:var(--nav-hover);}nav.pdoc a, nav.pdoc a:hover{color:var(--text);}nav.pdoc a{display:block;}nav.pdoc > h2:first-of-type{margin-top:1.5rem;}nav.pdoc .class:before{content:"class ";color:var(--muted);}nav.pdoc .function:after{content:"()";color:var(--muted);}nav.pdoc footer:before{content:"";display:block;width:calc(100% - var(--pad));border-top:solid var(--accent2) 1px;margin-top:1.5rem;padding-top:.5rem;}nav.pdoc footer{font-size:small;}</style>
+    <style>/*! content.css */.pdoc{color:var(--text);box-sizing:border-box;line-height:1.5;background:none;}.pdoc .pdoc-button{cursor:pointer;display:inline-block;border:solid black 1px;border-radius:2px;font-size:.75rem;padding:calc(0.5em - 1px) 1em;transition:100ms all;}.pdoc .pdoc-alert{padding:1rem 1rem 1rem calc(1.5rem + 24px);border:1px solid transparent;border-radius:.25rem;background-repeat:no-repeat;background-position:1rem center;margin-bottom:1rem;}.pdoc .pdoc-alert > *:last-child{margin-bottom:0;}.pdoc .pdoc-alert-note {color:#084298;background-color:#cfe2ff;border-color:#b6d4fe;background-image:url("data:image/svg+xml,%3Csvg%20xmlns%3D%22http%3A//www.w3.org/2000/svg%22%20width%3D%2224%22%20height%3D%2224%22%20fill%3D%22%23084298%22%20viewBox%3D%220%200%2016%2016%22%3E%3Cpath%20d%3D%22M8%2016A8%208%200%201%200%208%200a8%208%200%200%200%200%2016zm.93-9.412-1%204.705c-.07.34.029.533.304.533.194%200%20.487-.07.686-.246l-.088.416c-.287.346-.92.598-1.465.598-.703%200-1.002-.422-.808-1.319l.738-3.468c.064-.293.006-.399-.287-.47l-.451-.081.082-.381%202.29-.287zM8%205.5a1%201%200%201%201%200-2%201%201%200%200%201%200%202z%22/%3E%3C/svg%3E");}.pdoc .pdoc-alert-warning{color:#664d03;background-color:#fff3cd;border-color:#ffecb5;background-image:url("data:image/svg+xml,%3Csvg%20xmlns%3D%22http%3A//www.w3.org/2000/svg%22%20width%3D%2224%22%20height%3D%2224%22%20fill%3D%22%23664d03%22%20viewBox%3D%220%200%2016%2016%22%3E%3Cpath%20d%3D%22M8.982%201.566a1.13%201.13%200%200%200-1.96%200L.165%2013.233c-.457.778.091%201.767.98%201.767h13.713c.889%200%201.438-.99.98-1.767L8.982%201.566zM8%205c.535%200%20.954.462.9.995l-.35%203.507a.552.552%200%200%201-1.1%200L7.1%205.995A.905.905%200%200%201%208%205zm.002%206a1%201%200%201%201%200%202%201%201%200%200%201%200-2z%22/%3E%3C/svg%3E");}.pdoc .pdoc-alert-danger{color:#842029;background-color:#f8d7da;border-color:#f5c2c7;background-image:url("data:image/svg+xml,%3Csvg%20xmlns%3D%22http%3A//www.w3.org/2000/svg%22%20width%3D%2224%22%20height%3D%2224%22%20fill%3D%22%23842029%22%20viewBox%3D%220%200%2016%2016%22%3E%3Cpath%20d%3D%22M5.52.359A.5.5%200%200%201%206%200h4a.5.5%200%200%201%20.474.658L8.694%206H12.5a.5.5%200%200%201%20.395.807l-7%209a.5.5%200%200%201-.873-.454L6.823%209.5H3.5a.5.5%200%200%201-.48-.641l2.5-8.5z%22/%3E%3C/svg%3E");}.pdoc .visually-hidden{position:absolute !important;width:1px !important;height:1px !important;padding:0 !important;margin:-1px !important;overflow:hidden !important;clip:rect(0, 0, 0, 0) !important;white-space:nowrap !important;border:0 !important;}.pdoc h1, .pdoc h2, .pdoc h3{font-weight:300;margin:.3em 0;padding:.2em 0;}.pdoc > section:not(.module-info) h1{font-size:1.5rem;font-weight:500;}.pdoc > section:not(.module-info) h2{font-size:1.4rem;font-weight:500;}.pdoc > section:not(.module-info) h3{font-size:1.3rem;font-weight:500;}.pdoc > section:not(.module-info) h4{font-size:1.2rem;}.pdoc > section:not(.module-info) h5{font-size:1.1rem;}.pdoc a{text-decoration:none;color:var(--link);}.pdoc a:hover{color:var(--link-hover);}.pdoc blockquote{margin-left:2rem;}.pdoc pre{border-top:1px solid var(--accent2);border-bottom:1px solid var(--accent2);margin-top:0;margin-bottom:1em;padding:.5rem 0 .5rem .5rem;overflow-x:auto;background-color:var(--code);}.pdoc code{color:var(--text);padding:.2em .4em;margin:0;font-size:85%;background-color:var(--accent);border-radius:6px;}.pdoc a > code{color:inherit;}.pdoc pre > code{display:inline-block;font-size:inherit;background:none;border:none;padding:0;}.pdoc > section:not(.module-info){margin-bottom:1.5rem;}.pdoc .modulename{margin-top:0;font-weight:bold;}.pdoc .modulename a{color:var(--link);transition:100ms all;}.pdoc .git-button{float:right;border:solid var(--link) 1px;}.pdoc .git-button:hover{background-color:var(--link);color:var(--pdoc-background);}.view-source-toggle-state,.view-source-toggle-state ~ .pdoc-code{display:none;}.view-source-toggle-state:checked ~ .pdoc-code{display:block;}.view-source-button{display:inline-block;float:right;font-size:.75rem;line-height:1.5rem;color:var(--muted);padding:0 .4rem 0 1.3rem;cursor:pointer;text-indent:-2px;}.view-source-button > span{visibility:hidden;}.module-info .view-source-button{float:none;display:flex;justify-content:flex-end;margin:-1.2rem .4rem -.2rem 0;}.view-source-button::before{position:absolute;content:"View Source";display:list-item;list-style-type:disclosure-closed;}.view-source-toggle-state:checked ~ .attr .view-source-button::before,.view-source-toggle-state:checked ~ .view-source-button::before{list-style-type:disclosure-open;}.pdoc .docstring{margin-bottom:1.5rem;}.pdoc section:not(.module-info) .docstring{margin-left:clamp(0rem, 5vw - 2rem, 1rem);}.pdoc .docstring .pdoc-code{margin-left:1em;margin-right:1em;}.pdoc h1:target,.pdoc h2:target,.pdoc h3:target,.pdoc h4:target,.pdoc h5:target,.pdoc h6:target,.pdoc .pdoc-code > pre > span:target{background-color:var(--active);box-shadow:-1rem 0 0 0 var(--active);}.pdoc .pdoc-code > pre > span:target{display:block;}.pdoc div:target > .attr,.pdoc section:target > .attr,.pdoc dd:target > a{background-color:var(--active);}.pdoc *{scroll-margin:2rem;}.pdoc .pdoc-code .linenos{user-select:none;}.pdoc .attr:hover{filter:contrast(0.95);}.pdoc section, .pdoc .classattr{position:relative;}.pdoc .headerlink{--width:clamp(1rem, 3vw, 2rem);position:absolute;top:0;left:calc(0rem - var(--width));transition:all 100ms ease-in-out;opacity:0;}.pdoc .headerlink::before{content:"#";display:block;text-align:center;width:var(--width);height:2.3rem;line-height:2.3rem;font-size:1.5rem;}.pdoc .attr:hover ~ .headerlink,.pdoc *:target > .headerlink,.pdoc .headerlink:hover{opacity:1;}.pdoc .attr{display:block;margin:.5rem 0 .5rem;padding:.4rem .4rem .4rem 1rem;background-color:var(--accent);overflow-x:auto;}.pdoc .classattr{margin-left:2rem;}.pdoc .name{color:var(--name);font-weight:bold;}.pdoc .def{color:var(--def);font-weight:bold;}.pdoc .signature{background-color:transparent;}.pdoc .param, .pdoc .return-annotation{white-space:pre;}.pdoc .signature.multiline .param{display:block;}.pdoc .signature.condensed .param{display:inline-block;}.pdoc .annotation{color:var(--annotation);}.pdoc .view-value-toggle-state,.pdoc .view-value-toggle-state ~ .default_value{display:none;}.pdoc .view-value-toggle-state:checked ~ .default_value{display:inherit;}.pdoc .view-value-button{font-size:.5rem;vertical-align:middle;border-style:dashed;margin-top:-0.1rem;}.pdoc .view-value-button:hover{background:white;}.pdoc .view-value-button::before{content:"show";text-align:center;width:2.2em;display:inline-block;}.pdoc .view-value-toggle-state:checked ~ .view-value-button::before{content:"hide";}.pdoc .inherited{margin-left:2rem;}.pdoc .inherited dt{font-weight:700;}.pdoc .inherited dt, .pdoc .inherited dd{display:inline;margin-left:0;margin-bottom:.5rem;}.pdoc .inherited dd:not(:last-child):after{content:", ";}.pdoc .inherited .class:before{content:"class ";}.pdoc .inherited .function a:after{content:"()";}.pdoc .search-result .docstring{overflow:auto;max-height:25vh;}.pdoc .search-result.focused > .attr{background-color:var(--active);}.pdoc .attribution{margin-top:2rem;display:block;opacity:0.5;transition:all 200ms;filter:grayscale(100%);}.pdoc .attribution:hover{opacity:1;filter:grayscale(0%);}.pdoc .attribution img{margin-left:5px;height:35px;vertical-align:middle;width:70px;transition:all 200ms;}.pdoc table{display:block;width:max-content;max-width:100%;overflow:auto;margin-bottom:1rem;}.pdoc table th{font-weight:600;}.pdoc table th, .pdoc table td{padding:6px 13px;border:1px solid var(--accent2);}</style>
+    <style>/*! custom.css */</style><script>
+    window.MathJax = {
+        tex: {
+            inlineMath: [['$', '$'], ['\\(', '\\)']]
+        }
+    };
+</script>
+<script src="https://polyfill.io/v3/polyfill.min.js?features=es6"></script>
+<script id="MathJax-script" async src="https://cdn.jsdelivr.net/npm/mathjax@3/es5/tex-mml-chtml.js"></script>
+<script>
+    /* Re-invoke MathJax when DOM content changes, for example during search. */
+    document.addEventListener("DOMContentLoaded", () => {
+        new MutationObserver(() => MathJax.typeset()).observe(
+            document.querySelector("main.pdoc").parentNode,
+            {childList: true}
+        );
+    })
+</script>
+<style>
+    mjx-container {
+        overflow-x: auto;
+    }
+</style></head>
+<body>
+    <nav class="pdoc">
+        <label id="navtoggle" for="togglestate" class="pdoc-button"><svg xmlns='http://www.w3.org/2000/svg' viewBox='0 0 30 30'><path stroke-linecap='round' stroke="currentColor" stroke-miterlimit='10' stroke-width='2' d='M4 7h22M4 15h22M4 23h22'/></svg></label>
+        <input id="togglestate" type="checkbox" aria-hidden="true" tabindex="-1">
+        <div>            <a class="pdoc-button module-list-button" href="../../index.html">
+<svg xmlns="http://www.w3.org/2000/svg" width="16" height="16" fill="currentColor" class="bi bi-box-arrow-in-left" viewBox="0 0 16 16">
+  <path fill-rule="evenodd" d="M10 3.5a.5.5 0 0 0-.5-.5h-8a.5.5 0 0 0-.5.5v9a.5.5 0 0 0 .5.5h8a.5.5 0 0 0 .5-.5v-2a.5.5 0 0 1 1 0v2A1.5 1.5 0 0 1 9.5 14h-8A1.5 1.5 0 0 1 0 12.5v-9A1.5 1.5 0 0 1 1.5 2h8A1.5 1.5 0 0 1 11 3.5v2a.5.5 0 0 1-1 0v-2z"/>
+  <path fill-rule="evenodd" d="M4.146 8.354a.5.5 0 0 1 0-.708l3-3a.5.5 0 1 1 .708.708L5.707 7.5H14.5a.5.5 0 0 1 0 1H5.707l2.147 2.146a.5.5 0 0 1-.708.708l-3-3z"/>
+</svg>                &nbsp;
+                Module Index
+            </a>
+
+
+            <input type="search" placeholder="Search..." role="searchbox" aria-label="search"
+                   pattern=".+" required>
+
+
+
+            <h2>API Documentation</h2>
+                <ul class="memberlist">
+            <li>
+                    <a class="function" href="#get_n_layers">get_n_layers</a>
+            </li>
+            <li>
+                    <a class="class" href="#GWDecoder">GWDecoder</a>
+                            <ul class="memberlist">
+                        <li>
+                                <a class="function" href="#GWDecoder.__init__">GWDecoder</a>
+                        </li>
+                        <li>
+                                <a class="variable" href="#GWDecoder.in_dim">in_dim</a>
+                        </li>
+                        <li>
+                                <a class="variable" href="#GWDecoder.hidden_dim">hidden_dim</a>
+                        </li>
+                        <li>
+                                <a class="variable" href="#GWDecoder.out_dim">out_dim</a>
+                        </li>
+                        <li>
+                                <a class="variable" href="#GWDecoder.n_layers">n_layers</a>
+                        </li>
+                </ul>
+
+            </li>
+            <li>
+                    <a class="class" href="#GWEncoder">GWEncoder</a>
+                            <ul class="memberlist">
+                        <li>
+                                <a class="function" href="#GWEncoder.__init__">GWEncoder</a>
+                        </li>
+                        <li>
+                                <a class="function" href="#GWEncoder.forward">forward</a>
+                        </li>
+                </ul>
+
+            </li>
+            <li>
+                    <a class="class" href="#GWEncoderLinear">GWEncoderLinear</a>
+                            <ul class="memberlist">
+                        <li>
+                                <a class="function" href="#GWEncoderLinear.forward">forward</a>
+                        </li>
+                </ul>
+
+            </li>
+            <li>
+                    <a class="class" href="#GWModuleBase">GWModuleBase</a>
+                            <ul class="memberlist">
+                        <li>
+                                <a class="function" href="#GWModuleBase.__init__">GWModuleBase</a>
+                        </li>
+                        <li>
+                                <a class="variable" href="#GWModuleBase.domain_mods">domain_mods</a>
+                        </li>
+                        <li>
+                                <a class="variable" href="#GWModuleBase.workspace_dim">workspace_dim</a>
+                        </li>
+                        <li>
+                                <a class="function" href="#GWModuleBase.fuse">fuse</a>
+                        </li>
+                        <li>
+                                <a class="function" href="#GWModuleBase.encode">encode</a>
+                        </li>
+                        <li>
+                                <a class="function" href="#GWModuleBase.encode_and_fuse">encode_and_fuse</a>
+                        </li>
+                        <li>
+                                <a class="function" href="#GWModuleBase.decode">decode</a>
+                        </li>
+                </ul>
+
+            </li>
+            <li>
+                    <a class="class" href="#GWModule">GWModule</a>
+                            <ul class="memberlist">
+                        <li>
+                                <a class="function" href="#GWModule.__init__">GWModule</a>
+                        </li>
+                        <li>
+                                <a class="variable" href="#GWModule.gw_encoders">gw_encoders</a>
+                        </li>
+                        <li>
+                                <a class="variable" href="#GWModule.gw_decoders">gw_decoders</a>
+                        </li>
+                        <li>
+                                <a class="function" href="#GWModule.fuse">fuse</a>
+                        </li>
+                        <li>
+                                <a class="function" href="#GWModule.encode">encode</a>
+                        </li>
+                        <li>
+                                <a class="function" href="#GWModule.decode">decode</a>
+                        </li>
+                </ul>
+
+            </li>
+            <li>
+                    <a class="function" href="#compute_fusion_scores">compute_fusion_scores</a>
+            </li>
+            <li>
+                    <a class="class" href="#GWModuleBayesian">GWModuleBayesian</a>
+                            <ul class="memberlist">
+                        <li>
+                                <a class="function" href="#GWModuleBayesian.__init__">GWModuleBayesian</a>
+                        </li>
+                        <li>
+                                <a class="variable" href="#GWModuleBayesian.precisions">precisions</a>
+                        </li>
+                        <li>
+                                <a class="variable" href="#GWModuleBayesian.sensitivity_selection">sensitivity_selection</a>
+                        </li>
+                        <li>
+                                <a class="variable" href="#GWModuleBayesian.sensitivity_precision">sensitivity_precision</a>
+                        </li>
+                        <li>
+                                <a class="variable" href="#GWModuleBayesian.precision_softmax_temp">precision_softmax_temp</a>
+                        </li>
+                        <li>
+                                <a class="function" href="#GWModuleBayesian.get_precision">get_precision</a>
+                        </li>
+                        <li>
+                                <a class="function" href="#GWModuleBayesian.fuse">fuse</a>
+                        </li>
+                </ul>
+
+            </li>
+    </ul>
+
+
+
+        <a class="attribution" title="pdoc: Python API documentation generator" href="https://pdoc.dev" target="_blank">
+            built with <span class="visually-hidden">pdoc</span><img
+                alt="pdoc logo"
+                src="data:image/svg+xml,%3Csvg%20xmlns%3D%22http%3A//www.w3.org/2000/svg%22%20role%3D%22img%22%20aria-label%3D%22pdoc%20logo%22%20width%3D%22300%22%20height%3D%22150%22%20viewBox%3D%22-1%200%2060%2030%22%3E%3Ctitle%3Epdoc%3C/title%3E%3Cpath%20d%3D%22M29.621%2021.293c-.011-.273-.214-.475-.511-.481a.5.5%200%200%200-.489.503l-.044%201.393c-.097.551-.695%201.215-1.566%201.704-.577.428-1.306.486-2.193.182-1.426-.617-2.467-1.654-3.304-2.487l-.173-.172a3.43%203.43%200%200%200-.365-.306.49.49%200%200%200-.286-.196c-1.718-1.06-4.931-1.47-7.353.191l-.219.15c-1.707%201.187-3.413%202.131-4.328%201.03-.02-.027-.49-.685-.141-1.763.233-.721.546-2.408.772-4.076.042-.09.067-.187.046-.288.166-1.347.277-2.625.241-3.351%201.378-1.008%202.271-2.586%202.271-4.362%200-.976-.272-1.935-.788-2.774-.057-.094-.122-.18-.184-.268.033-.167.052-.339.052-.516%200-1.477-1.202-2.679-2.679-2.679-.791%200-1.496.352-1.987.9a6.3%206.3%200%200%200-1.001.029c-.492-.564-1.207-.929-2.012-.929-1.477%200-2.679%201.202-2.679%202.679A2.65%202.65%200%200%200%20.97%206.554c-.383.747-.595%201.572-.595%202.41%200%202.311%201.507%204.29%203.635%205.107-.037.699-.147%202.27-.423%203.294l-.137.461c-.622%202.042-2.515%208.257%201.727%2010.643%201.614.908%203.06%201.248%204.317%201.248%202.665%200%204.492-1.524%205.322-2.401%201.476-1.559%202.886-1.854%206.491.82%201.877%201.393%203.514%201.753%204.861%201.068%202.223-1.713%202.811-3.867%203.399-6.374.077-.846.056-1.469.054-1.537zm-4.835%204.313c-.054.305-.156.586-.242.629-.034-.007-.131-.022-.307-.157-.145-.111-.314-.478-.456-.908.221.121.432.25.675.355.115.039.219.051.33.081zm-2.251-1.238c-.05.33-.158.648-.252.694-.022.001-.125-.018-.307-.157-.217-.166-.488-.906-.639-1.573.358.344.754.693%201.198%201.036zm-3.887-2.337c-.006-.116-.018-.231-.041-.342.635.145%201.189.368%201.599.625.097.231.166.481.174.642-.03.049-.055.101-.067.158-.046.013-.128.026-.298.004-.278-.037-.901-.57-1.367-1.087zm-1.127-.497c.116.306.176.625.12.71-.019.014-.117.045-.345.016-.206-.027-.604-.332-.986-.695.41-.051.816-.056%201.211-.031zm-4.535%201.535c.209.22.379.47.358.598-.006.041-.088.138-.351.234-.144.055-.539-.063-.979-.259a11.66%2011.66%200%200%200%20.972-.573zm.983-.664c.359-.237.738-.418%201.126-.554.25.237.479.548.457.694-.006.042-.087.138-.351.235-.174.064-.694-.105-1.232-.375zm-3.381%201.794c-.022.145-.061.29-.149.401-.133.166-.358.248-.69.251h-.002c-.133%200-.306-.26-.45-.621.417.091.854.07%201.291-.031zm-2.066-8.077a4.78%204.78%200%200%201-.775-.584c.172-.115.505-.254.88-.378l-.105.962zm-.331%202.302a10.32%2010.32%200%200%201-.828-.502c.202-.143.576-.328.984-.49l-.156.992zm-.45%202.157l-.701-.403c.214-.115.536-.249.891-.376a11.57%2011.57%200%200%201-.19.779zm-.181%201.716c.064.398.194.702.298.893-.194-.051-.435-.162-.736-.398.061-.119.224-.3.438-.495zM8.87%204.141c0%20.152-.123.276-.276.276s-.275-.124-.275-.276.123-.276.276-.276.275.124.275.276zm-.735-.389a1.15%201.15%200%200%200-.314.783%201.16%201.16%200%200%200%201.162%201.162c.457%200%20.842-.27%201.032-.653.026.117.042.238.042.362a1.68%201.68%200%200%201-1.679%201.679%201.68%201.68%200%200%201-1.679-1.679c0-.843.626-1.535%201.436-1.654zM5.059%205.406A1.68%201.68%200%200%201%203.38%207.085a1.68%201.68%200%200%201-1.679-1.679c0-.037.009-.072.011-.109.21.3.541.508.935.508a1.16%201.16%200%200%200%201.162-1.162%201.14%201.14%200%200%200-.474-.912c.015%200%20.03-.005.045-.005.926.001%201.679.754%201.679%201.68zM3.198%204.141c0%20.152-.123.276-.276.276s-.275-.124-.275-.276.123-.276.276-.276.275.124.275.276zM1.375%208.964c0-.52.103-1.035.288-1.52.466.394%201.06.64%201.717.64%201.144%200%202.116-.725%202.499-1.738.383%201.012%201.355%201.738%202.499%201.738.867%200%201.631-.421%202.121-1.062.307.605.478%201.267.478%201.942%200%202.486-2.153%204.51-4.801%204.51s-4.801-2.023-4.801-4.51zm24.342%2019.349c-.985.498-2.267.168-3.813-.979-3.073-2.281-5.453-3.199-7.813-.705-1.315%201.391-4.163%203.365-8.423.97-3.174-1.786-2.239-6.266-1.261-9.479l.146-.492c.276-1.02.395-2.457.444-3.268a6.11%206.11%200%200%200%201.18.115%206.01%206.01%200%200%200%202.536-.562l-.006.175c-.802.215-1.848.612-2.021%201.25-.079.295.021.601.274.837.219.203.415.364.598.501-.667.304-1.243.698-1.311%201.179-.02.144-.022.507.393.787.213.144.395.26.564.365-1.285.521-1.361.96-1.381%201.126-.018.142-.011.496.427.746l.854.489c-.473.389-.971.914-.999%201.429-.018.278.095.532.316.713.675.556%201.231.721%201.653.721.059%200%20.104-.014.158-.02.207.707.641%201.64%201.513%201.64h.013c.8-.008%201.236-.345%201.462-.626.173-.216.268-.457.325-.692.424.195.93.374%201.372.374.151%200%20.294-.021.423-.068.732-.27.944-.704.993-1.021.009-.061.003-.119.002-.179.266.086.538.147.789.147.15%200%20.294-.021.423-.069.542-.2.797-.489.914-.754.237.147.478.258.704.288.106.014.205.021.296.021.356%200%20.595-.101.767-.229.438.435%201.094.992%201.656%201.067.106.014.205.021.296.021a1.56%201.56%200%200%200%20.323-.035c.17.575.453%201.289.866%201.605.358.273.665.362.914.362a.99.99%200%200%200%20.421-.093%201.03%201.03%200%200%200%20.245-.164c.168.428.39.846.68%201.068.358.273.665.362.913.362a.99.99%200%200%200%20.421-.093c.317-.148.512-.448.639-.762.251.157.495.257.726.257.127%200%20.25-.024.37-.071.427-.17.706-.617.841-1.314.022-.015.047-.022.068-.038.067-.051.133-.104.196-.159-.443%201.486-1.107%202.761-2.086%203.257zM8.66%209.925a.5.5%200%201%200-1%200c0%20.653-.818%201.205-1.787%201.205s-1.787-.552-1.787-1.205a.5.5%200%201%200-1%200c0%201.216%201.25%202.205%202.787%202.205s2.787-.989%202.787-2.205zm4.4%2015.965l-.208.097c-2.661%201.258-4.708%201.436-6.086.527-1.542-1.017-1.88-3.19-1.844-4.198a.4.4%200%200%200-.385-.414c-.242-.029-.406.164-.414.385-.046%201.249.367%203.686%202.202%204.896.708.467%201.547.7%202.51.7%201.248%200%202.706-.392%204.362-1.174l.185-.086a.4.4%200%200%200%20.205-.527c-.089-.204-.326-.291-.527-.206zM9.547%202.292c.093.077.205.114.317.114a.5.5%200%200%200%20.318-.886L8.817.397a.5.5%200%200%200-.703.068.5.5%200%200%200%20.069.703l1.364%201.124zm-7.661-.065c.086%200%20.173-.022.253-.068l1.523-.893a.5.5%200%200%200-.506-.863l-1.523.892a.5.5%200%200%200-.179.685c.094.158.261.247.432.247z%22%20transform%3D%22matrix%28-1%200%200%201%2058%200%29%22%20fill%3D%22%233bb300%22/%3E%3Cpath%20d%3D%22M.3%2021.86V10.18q0-.46.02-.68.04-.22.18-.5.28-.54%201.34-.54%201.06%200%201.42.28.38.26.44.78.76-1.04%202.38-1.04%201.64%200%203.1%201.54%201.46%201.54%201.46%203.58%200%202.04-1.46%203.58-1.44%201.54-3.08%201.54-1.64%200-2.38-.92v4.04q0%20.46-.04.68-.02.22-.18.5-.14.3-.5.42-.36.12-.98.12-.62%200-1-.12-.36-.12-.52-.4-.14-.28-.18-.5-.02-.22-.02-.68zm3.96-9.42q-.46.54-.46%201.18%200%20.64.46%201.18.48.52%201.2.52.74%200%201.24-.52.52-.52.52-1.18%200-.66-.48-1.18-.48-.54-1.26-.54-.76%200-1.22.54zm14.741-8.36q.16-.3.54-.42.38-.12%201-.12.64%200%201.02.12.38.12.52.42.16.3.18.54.04.22.04.68v11.94q0%20.46-.04.7-.02.22-.18.5-.3.54-1.7.54-1.38%200-1.54-.98-.84.96-2.34.96-1.8%200-3.28-1.56-1.48-1.58-1.48-3.66%200-2.1%201.48-3.68%201.5-1.58%203.28-1.58%201.48%200%202.3%201v-4.2q0-.46.02-.68.04-.24.18-.52zm-3.24%2010.86q.52.54%201.26.54.74%200%201.22-.54.5-.54.5-1.18%200-.66-.48-1.22-.46-.56-1.26-.56-.8%200-1.28.56-.48.54-.48%201.2%200%20.66.52%201.2zm7.833-1.2q0-2.4%201.68-3.96%201.68-1.56%203.84-1.56%202.16%200%203.82%201.56%201.66%201.54%201.66%203.94%200%201.66-.86%202.96-.86%201.28-2.1%201.9-1.22.6-2.54.6-1.32%200-2.56-.64-1.24-.66-2.1-1.92-.84-1.28-.84-2.88zm4.18%201.44q.64.48%201.3.48.66%200%201.32-.5.66-.5.66-1.48%200-.98-.62-1.46-.62-.48-1.34-.48-.72%200-1.34.5-.62.5-.62%201.48%200%20.96.64%201.46zm11.412-1.44q0%20.84.56%201.32.56.46%201.18.46.64%200%201.18-.36.56-.38.9-.38.6%200%201.46%201.06.46.58.46%201.04%200%20.76-1.1%201.42-1.14.8-2.8.8-1.86%200-3.58-1.34-.82-.64-1.34-1.7-.52-1.08-.52-2.36%200-1.3.52-2.34.52-1.06%201.34-1.7%201.66-1.32%203.54-1.32.76%200%201.48.22.72.2%201.06.4l.32.2q.36.24.56.38.52.4.52.92%200%20.5-.42%201.14-.72%201.1-1.38%201.1-.38%200-1.08-.44-.36-.34-1.04-.34-.66%200-1.24.48-.58.48-.58%201.34z%22%20fill%3D%22green%22/%3E%3C/svg%3E"/>
+        </a>
+</div>
+    </nav>
+    <main class="pdoc">
+            <section class="module-info">
+                    <h1 class="modulename">
+shimmer<wbr>.modules<wbr>.gw_module    </h1>
+
+                
+                        <input id="mod-gw_module-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
+
+                        <label class="view-source-button" for="mod-gw_module-view-source"><span>View Source</span></label>
+
+                        <div class="pdoc-code codehilite"><pre><span></span><span id="L-1"><a href="#L-1"><span class="linenos">  1</span></a><span class="kn">from</span> <span class="nn">abc</span> <span class="kn">import</span> <span class="n">ABC</span><span class="p">,</span> <span class="n">abstractmethod</span>
+</span><span id="L-2"><a href="#L-2"><span class="linenos">  2</span></a><span class="kn">from</span> <span class="nn">collections.abc</span> <span class="kn">import</span> <span class="n">Iterable</span><span class="p">,</span> <span class="n">Mapping</span>
+</span><span id="L-3"><a href="#L-3"><span class="linenos">  3</span></a><span class="kn">from</span> <span class="nn">typing</span> <span class="kn">import</span> <span class="n">cast</span>
+</span><span id="L-4"><a href="#L-4"><span class="linenos">  4</span></a>
+</span><span id="L-5"><a href="#L-5"><span class="linenos">  5</span></a><span class="kn">import</span> <span class="nn">torch</span>
+</span><span id="L-6"><a href="#L-6"><span class="linenos">  6</span></a><span class="kn">from</span> <span class="nn">torch</span> <span class="kn">import</span> <span class="n">nn</span>
+</span><span id="L-7"><a href="#L-7"><span class="linenos">  7</span></a>
+</span><span id="L-8"><a href="#L-8"><span class="linenos">  8</span></a><span class="kn">from</span> <span class="nn">shimmer.modules.domain</span> <span class="kn">import</span> <span class="n">DomainModule</span>
+</span><span id="L-9"><a href="#L-9"><span class="linenos">  9</span></a><span class="kn">from</span> <span class="nn">shimmer.modules.selection</span> <span class="kn">import</span> <span class="n">SelectionBase</span>
+</span><span id="L-10"><a href="#L-10"><span class="linenos"> 10</span></a><span class="kn">from</span> <span class="nn">shimmer.types</span> <span class="kn">import</span> <span class="n">LatentsDomainGroupDT</span><span class="p">,</span> <span class="n">LatentsDomainGroupT</span>
+</span><span id="L-11"><a href="#L-11"><span class="linenos"> 11</span></a>
+</span><span id="L-12"><a href="#L-12"><span class="linenos"> 12</span></a>
+</span><span id="L-13"><a href="#L-13"><span class="linenos"> 13</span></a><span class="k">def</span> <span class="nf">get_n_layers</span><span class="p">(</span><span class="n">n_layers</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span> <span class="n">hidden_dim</span><span class="p">:</span> <span class="nb">int</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">list</span><span class="p">[</span><span class="n">nn</span><span class="o">.</span><span class="n">Module</span><span class="p">]:</span>
+</span><span id="L-14"><a href="#L-14"><span class="linenos"> 14</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="L-15"><a href="#L-15"><span class="linenos"> 15</span></a><span class="sd">    Makes a list of `n_layers` `nn.Linear` layers with `nn.ReLU`.</span>
+</span><span id="L-16"><a href="#L-16"><span class="linenos"> 16</span></a>
+</span><span id="L-17"><a href="#L-17"><span class="linenos"> 17</span></a><span class="sd">    Args:</span>
+</span><span id="L-18"><a href="#L-18"><span class="linenos"> 18</span></a><span class="sd">        n_layers (`int`): number of layers</span>
+</span><span id="L-19"><a href="#L-19"><span class="linenos"> 19</span></a><span class="sd">        hidden_dim (`int`): size of the hidden dimension</span>
+</span><span id="L-20"><a href="#L-20"><span class="linenos"> 20</span></a>
+</span><span id="L-21"><a href="#L-21"><span class="linenos"> 21</span></a><span class="sd">    Returns:</span>
+</span><span id="L-22"><a href="#L-22"><span class="linenos"> 22</span></a><span class="sd">        `list[nn.Module]`: list of linear and relu layers.</span>
+</span><span id="L-23"><a href="#L-23"><span class="linenos"> 23</span></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="L-24"><a href="#L-24"><span class="linenos"> 24</span></a>    <span class="n">layers</span><span class="p">:</span> <span class="nb">list</span><span class="p">[</span><span class="n">nn</span><span class="o">.</span><span class="n">Module</span><span class="p">]</span> <span class="o">=</span> <span class="p">[]</span>
+</span><span id="L-25"><a href="#L-25"><span class="linenos"> 25</span></a>    <span class="k">for</span> <span class="n">_</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="n">n_layers</span><span class="p">):</span>
+</span><span id="L-26"><a href="#L-26"><span class="linenos"> 26</span></a>        <span class="n">layers</span><span class="o">.</span><span class="n">extend</span><span class="p">([</span><span class="n">nn</span><span class="o">.</span><span class="n">Linear</span><span class="p">(</span><span class="n">hidden_dim</span><span class="p">,</span> <span class="n">hidden_dim</span><span class="p">),</span> <span class="n">nn</span><span class="o">.</span><span class="n">ReLU</span><span class="p">()])</span>
+</span><span id="L-27"><a href="#L-27"><span class="linenos"> 27</span></a>    <span class="k">return</span> <span class="n">layers</span>
+</span><span id="L-28"><a href="#L-28"><span class="linenos"> 28</span></a>
+</span><span id="L-29"><a href="#L-29"><span class="linenos"> 29</span></a>
+</span><span id="L-30"><a href="#L-30"><span class="linenos"> 30</span></a><span class="k">class</span> <span class="nc">GWDecoder</span><span class="p">(</span><span class="n">nn</span><span class="o">.</span><span class="n">Sequential</span><span class="p">):</span>
+</span><span id="L-31"><a href="#L-31"><span class="linenos"> 31</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;A Decoder network for GWModules.&quot;&quot;&quot;</span>
+</span><span id="L-32"><a href="#L-32"><span class="linenos"> 32</span></a>
+</span><span id="L-33"><a href="#L-33"><span class="linenos"> 33</span></a>    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span>
+</span><span id="L-34"><a href="#L-34"><span class="linenos"> 34</span></a>        <span class="bp">self</span><span class="p">,</span>
+</span><span id="L-35"><a href="#L-35"><span class="linenos"> 35</span></a>        <span class="n">in_dim</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span>
+</span><span id="L-36"><a href="#L-36"><span class="linenos"> 36</span></a>        <span class="n">hidden_dim</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span>
+</span><span id="L-37"><a href="#L-37"><span class="linenos"> 37</span></a>        <span class="n">out_dim</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span>
+</span><span id="L-38"><a href="#L-38"><span class="linenos"> 38</span></a>        <span class="n">n_layers</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span>
+</span><span id="L-39"><a href="#L-39"><span class="linenos"> 39</span></a>    <span class="p">):</span>
+</span><span id="L-40"><a href="#L-40"><span class="linenos"> 40</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="L-41"><a href="#L-41"><span class="linenos"> 41</span></a><span class="sd">        Initializes the decoder.</span>
+</span><span id="L-42"><a href="#L-42"><span class="linenos"> 42</span></a>
+</span><span id="L-43"><a href="#L-43"><span class="linenos"> 43</span></a><span class="sd">        Args:</span>
+</span><span id="L-44"><a href="#L-44"><span class="linenos"> 44</span></a><span class="sd">            in_dim (`int`): input dimension</span>
+</span><span id="L-45"><a href="#L-45"><span class="linenos"> 45</span></a><span class="sd">            hidden_dim (`int`): hidden dimension</span>
+</span><span id="L-46"><a href="#L-46"><span class="linenos"> 46</span></a><span class="sd">            out_dim (`int`): output dimension</span>
+</span><span id="L-47"><a href="#L-47"><span class="linenos"> 47</span></a><span class="sd">            n_layers (`int`): number of hidden layers. The total number of layers</span>
+</span><span id="L-48"><a href="#L-48"><span class="linenos"> 48</span></a><span class="sd">                will be `n_layers` + 2 (one before, one after).</span>
+</span><span id="L-49"><a href="#L-49"><span class="linenos"> 49</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="L-50"><a href="#L-50"><span class="linenos"> 50</span></a>
+</span><span id="L-51"><a href="#L-51"><span class="linenos"> 51</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">in_dim</span> <span class="o">=</span> <span class="n">in_dim</span>
+</span><span id="L-52"><a href="#L-52"><span class="linenos"> 52</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;input dimension&quot;&quot;&quot;</span>
+</span><span id="L-53"><a href="#L-53"><span class="linenos"> 53</span></a>
+</span><span id="L-54"><a href="#L-54"><span class="linenos"> 54</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">hidden_dim</span> <span class="o">=</span> <span class="n">hidden_dim</span>
+</span><span id="L-55"><a href="#L-55"><span class="linenos"> 55</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;hidden dimension&quot;&quot;&quot;</span>
+</span><span id="L-56"><a href="#L-56"><span class="linenos"> 56</span></a>
+</span><span id="L-57"><a href="#L-57"><span class="linenos"> 57</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">out_dim</span> <span class="o">=</span> <span class="n">out_dim</span>
+</span><span id="L-58"><a href="#L-58"><span class="linenos"> 58</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;output dimension&quot;&quot;&quot;</span>
+</span><span id="L-59"><a href="#L-59"><span class="linenos"> 59</span></a>
+</span><span id="L-60"><a href="#L-60"><span class="linenos"> 60</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">n_layers</span> <span class="o">=</span> <span class="n">n_layers</span>
+</span><span id="L-61"><a href="#L-61"><span class="linenos"> 61</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="L-62"><a href="#L-62"><span class="linenos"> 62</span></a><span class="sd">        number of hidden layers. The total number of layers</span>
+</span><span id="L-63"><a href="#L-63"><span class="linenos"> 63</span></a><span class="sd">                will be `n_layers` + 2 (one before, one after).&quot;&quot;&quot;</span>
+</span><span id="L-64"><a href="#L-64"><span class="linenos"> 64</span></a>
+</span><span id="L-65"><a href="#L-65"><span class="linenos"> 65</span></a>        <span class="nb">super</span><span class="p">()</span><span class="o">.</span><span class="fm">__init__</span><span class="p">(</span>
+</span><span id="L-66"><a href="#L-66"><span class="linenos"> 66</span></a>            <span class="n">nn</span><span class="o">.</span><span class="n">Linear</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">in_dim</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">hidden_dim</span><span class="p">),</span>
+</span><span id="L-67"><a href="#L-67"><span class="linenos"> 67</span></a>            <span class="n">nn</span><span class="o">.</span><span class="n">ReLU</span><span class="p">(),</span>
+</span><span id="L-68"><a href="#L-68"><span class="linenos"> 68</span></a>            <span class="o">*</span><span class="n">get_n_layers</span><span class="p">(</span><span class="n">n_layers</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">hidden_dim</span><span class="p">),</span>
+</span><span id="L-69"><a href="#L-69"><span class="linenos"> 69</span></a>            <span class="n">nn</span><span class="o">.</span><span class="n">Linear</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">hidden_dim</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">out_dim</span><span class="p">),</span>
+</span><span id="L-70"><a href="#L-70"><span class="linenos"> 70</span></a>        <span class="p">)</span>
+</span><span id="L-71"><a href="#L-71"><span class="linenos"> 71</span></a>
+</span><span id="L-72"><a href="#L-72"><span class="linenos"> 72</span></a>
+</span><span id="L-73"><a href="#L-73"><span class="linenos"> 73</span></a><span class="k">class</span> <span class="nc">GWEncoder</span><span class="p">(</span><span class="n">GWDecoder</span><span class="p">):</span>
+</span><span id="L-74"><a href="#L-74"><span class="linenos"> 74</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="L-75"><a href="#L-75"><span class="linenos"> 75</span></a><span class="sd">    An Encoder network used in GWModules.</span>
+</span><span id="L-76"><a href="#L-76"><span class="linenos"> 76</span></a>
+</span><span id="L-77"><a href="#L-77"><span class="linenos"> 77</span></a><span class="sd">    This is similar to the decoder, but adds a tanh non-linearity at the end.</span>
+</span><span id="L-78"><a href="#L-78"><span class="linenos"> 78</span></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="L-79"><a href="#L-79"><span class="linenos"> 79</span></a>
+</span><span id="L-80"><a href="#L-80"><span class="linenos"> 80</span></a>    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span>
+</span><span id="L-81"><a href="#L-81"><span class="linenos"> 81</span></a>        <span class="bp">self</span><span class="p">,</span>
+</span><span id="L-82"><a href="#L-82"><span class="linenos"> 82</span></a>        <span class="n">in_dim</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span>
+</span><span id="L-83"><a href="#L-83"><span class="linenos"> 83</span></a>        <span class="n">hidden_dim</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span>
+</span><span id="L-84"><a href="#L-84"><span class="linenos"> 84</span></a>        <span class="n">out_dim</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span>
+</span><span id="L-85"><a href="#L-85"><span class="linenos"> 85</span></a>        <span class="n">n_layers</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span>
+</span><span id="L-86"><a href="#L-86"><span class="linenos"> 86</span></a>    <span class="p">):</span>
+</span><span id="L-87"><a href="#L-87"><span class="linenos"> 87</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="L-88"><a href="#L-88"><span class="linenos"> 88</span></a><span class="sd">        Initializes the encoder.</span>
+</span><span id="L-89"><a href="#L-89"><span class="linenos"> 89</span></a>
+</span><span id="L-90"><a href="#L-90"><span class="linenos"> 90</span></a><span class="sd">        Args:</span>
+</span><span id="L-91"><a href="#L-91"><span class="linenos"> 91</span></a><span class="sd">            in_dim (`int`): input dimension</span>
+</span><span id="L-92"><a href="#L-92"><span class="linenos"> 92</span></a><span class="sd">            hidden_dim (`int`): hidden dimension</span>
+</span><span id="L-93"><a href="#L-93"><span class="linenos"> 93</span></a><span class="sd">            out_dim (`int`): output dimension</span>
+</span><span id="L-94"><a href="#L-94"><span class="linenos"> 94</span></a><span class="sd">            n_layers (`int`): number of hidden layers. The total number of layers</span>
+</span><span id="L-95"><a href="#L-95"><span class="linenos"> 95</span></a><span class="sd">                will be `n_layers` + 2 (one before, one after).</span>
+</span><span id="L-96"><a href="#L-96"><span class="linenos"> 96</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="L-97"><a href="#L-97"><span class="linenos"> 97</span></a>        <span class="nb">super</span><span class="p">()</span><span class="o">.</span><span class="fm">__init__</span><span class="p">(</span><span class="n">in_dim</span><span class="p">,</span> <span class="n">hidden_dim</span><span class="p">,</span> <span class="n">out_dim</span><span class="p">,</span> <span class="n">n_layers</span><span class="p">)</span>
+</span><span id="L-98"><a href="#L-98"><span class="linenos"> 98</span></a>
+</span><span id="L-99"><a href="#L-99"><span class="linenos"> 99</span></a>    <span class="k">def</span> <span class="nf">forward</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="nb">input</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">:</span>
+</span><span id="L-100"><a href="#L-100"><span class="linenos">100</span></a>        <span class="k">return</span> <span class="nb">super</span><span class="p">()</span><span class="o">.</span><span class="n">forward</span><span class="p">(</span><span class="nb">input</span><span class="p">)</span>
+</span><span id="L-101"><a href="#L-101"><span class="linenos">101</span></a>
+</span><span id="L-102"><a href="#L-102"><span class="linenos">102</span></a>
+</span><span id="L-103"><a href="#L-103"><span class="linenos">103</span></a><span class="k">class</span> <span class="nc">GWEncoderLinear</span><span class="p">(</span><span class="n">nn</span><span class="o">.</span><span class="n">Linear</span><span class="p">):</span>
+</span><span id="L-104"><a href="#L-104"><span class="linenos">104</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;A linear Encoder network used in GWModules.&quot;&quot;&quot;</span>
+</span><span id="L-105"><a href="#L-105"><span class="linenos">105</span></a>
+</span><span id="L-106"><a href="#L-106"><span class="linenos">106</span></a>    <span class="k">def</span> <span class="nf">forward</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="nb">input</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">:</span>
+</span><span id="L-107"><a href="#L-107"><span class="linenos">107</span></a>        <span class="k">return</span> <span class="n">torch</span><span class="o">.</span><span class="n">tanh</span><span class="p">(</span><span class="nb">super</span><span class="p">()</span><span class="o">.</span><span class="n">forward</span><span class="p">(</span><span class="nb">input</span><span class="p">))</span>
+</span><span id="L-108"><a href="#L-108"><span class="linenos">108</span></a>
+</span><span id="L-109"><a href="#L-109"><span class="linenos">109</span></a>
+</span><span id="L-110"><a href="#L-110"><span class="linenos">110</span></a><span class="k">class</span> <span class="nc">GWModuleBase</span><span class="p">(</span><span class="n">nn</span><span class="o">.</span><span class="n">Module</span><span class="p">,</span> <span class="n">ABC</span><span class="p">):</span>
+</span><span id="L-111"><a href="#L-111"><span class="linenos">111</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="L-112"><a href="#L-112"><span class="linenos">112</span></a><span class="sd">    Base class for GWModule.</span>
+</span><span id="L-113"><a href="#L-113"><span class="linenos">113</span></a>
+</span><span id="L-114"><a href="#L-114"><span class="linenos">114</span></a><span class="sd">    GWModule handles encoding, decoding the unimodal representations</span>
+</span><span id="L-115"><a href="#L-115"><span class="linenos">115</span></a><span class="sd">    using the `gw_encoders` and`gw_decoders`, and define</span>
+</span><span id="L-116"><a href="#L-116"><span class="linenos">116</span></a><span class="sd">    some common operations in GW like cycles and translations.</span>
+</span><span id="L-117"><a href="#L-117"><span class="linenos">117</span></a>
+</span><span id="L-118"><a href="#L-118"><span class="linenos">118</span></a><span class="sd">    This is an abstract class and should be implemented.</span>
+</span><span id="L-119"><a href="#L-119"><span class="linenos">119</span></a><span class="sd">    For an implemented interface, see `GWModule`.</span>
+</span><span id="L-120"><a href="#L-120"><span class="linenos">120</span></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="L-121"><a href="#L-121"><span class="linenos">121</span></a>
+</span><span id="L-122"><a href="#L-122"><span class="linenos">122</span></a>    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span>
+</span><span id="L-123"><a href="#L-123"><span class="linenos">123</span></a>        <span class="bp">self</span><span class="p">,</span>
+</span><span id="L-124"><a href="#L-124"><span class="linenos">124</span></a>        <span class="n">domain_mods</span><span class="p">:</span> <span class="n">Mapping</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">DomainModule</span><span class="p">],</span>
+</span><span id="L-125"><a href="#L-125"><span class="linenos">125</span></a>        <span class="n">workspace_dim</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span>
+</span><span id="L-126"><a href="#L-126"><span class="linenos">126</span></a>        <span class="o">*</span><span class="n">args</span><span class="p">,</span>
+</span><span id="L-127"><a href="#L-127"><span class="linenos">127</span></a>        <span class="o">**</span><span class="n">kwargs</span><span class="p">,</span>
+</span><span id="L-128"><a href="#L-128"><span class="linenos">128</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="L-129"><a href="#L-129"><span class="linenos">129</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="L-130"><a href="#L-130"><span class="linenos">130</span></a><span class="sd">        Initializes the GWModule.</span>
+</span><span id="L-131"><a href="#L-131"><span class="linenos">131</span></a>
+</span><span id="L-132"><a href="#L-132"><span class="linenos">132</span></a><span class="sd">        Args:</span>
+</span><span id="L-133"><a href="#L-133"><span class="linenos">133</span></a><span class="sd">            domain_modules (`Mapping[str, DomainModule]`): the domain modules.</span>
+</span><span id="L-134"><a href="#L-134"><span class="linenos">134</span></a><span class="sd">            workspace_dim (`int`): dimension of the GW.</span>
+</span><span id="L-135"><a href="#L-135"><span class="linenos">135</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="L-136"><a href="#L-136"><span class="linenos">136</span></a>        <span class="nb">super</span><span class="p">()</span><span class="o">.</span><span class="fm">__init__</span><span class="p">()</span>
+</span><span id="L-137"><a href="#L-137"><span class="linenos">137</span></a>
+</span><span id="L-138"><a href="#L-138"><span class="linenos">138</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">domain_mods</span> <span class="o">=</span> <span class="n">domain_mods</span>
+</span><span id="L-139"><a href="#L-139"><span class="linenos">139</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;The unimodal domain modules.&quot;&quot;&quot;</span>
+</span><span id="L-140"><a href="#L-140"><span class="linenos">140</span></a>
+</span><span id="L-141"><a href="#L-141"><span class="linenos">141</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">workspace_dim</span> <span class="o">=</span> <span class="n">workspace_dim</span>
+</span><span id="L-142"><a href="#L-142"><span class="linenos">142</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;Dimension of the GW&quot;&quot;&quot;</span>
+</span><span id="L-143"><a href="#L-143"><span class="linenos">143</span></a>
+</span><span id="L-144"><a href="#L-144"><span class="linenos">144</span></a>    <span class="nd">@abstractmethod</span>
+</span><span id="L-145"><a href="#L-145"><span class="linenos">145</span></a>    <span class="k">def</span> <span class="nf">fuse</span><span class="p">(</span>
+</span><span id="L-146"><a href="#L-146"><span class="linenos">146</span></a>        <span class="bp">self</span><span class="p">,</span> <span class="n">x</span><span class="p">:</span> <span class="n">LatentsDomainGroupT</span><span class="p">,</span> <span class="n">selection_scores</span><span class="p">:</span> <span class="n">Mapping</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]</span>
+</span><span id="L-147"><a href="#L-147"><span class="linenos">147</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">:</span>
+</span><span id="L-148"><a href="#L-148"><span class="linenos">148</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="L-149"><a href="#L-149"><span class="linenos">149</span></a><span class="sd">        Merge function used to combine domains.</span>
+</span><span id="L-150"><a href="#L-150"><span class="linenos">150</span></a>
+</span><span id="L-151"><a href="#L-151"><span class="linenos">151</span></a><span class="sd">        Args:</span>
+</span><span id="L-152"><a href="#L-152"><span class="linenos">152</span></a><span class="sd">            x (`LatentsDomainGroupT`): the group of latent representation.</span>
+</span><span id="L-153"><a href="#L-153"><span class="linenos">153</span></a><span class="sd">            selection_score (`Mapping[str, torch.Tensor]`): attention scores to</span>
+</span><span id="L-154"><a href="#L-154"><span class="linenos">154</span></a><span class="sd">                use to encode the reprensetation.</span>
+</span><span id="L-155"><a href="#L-155"><span class="linenos">155</span></a><span class="sd">        Returns:</span>
+</span><span id="L-156"><a href="#L-156"><span class="linenos">156</span></a><span class="sd">            `torch.Tensor`: The merged representation.</span>
+</span><span id="L-157"><a href="#L-157"><span class="linenos">157</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="L-158"><a href="#L-158"><span class="linenos">158</span></a>        <span class="o">...</span>
+</span><span id="L-159"><a href="#L-159"><span class="linenos">159</span></a>
+</span><span id="L-160"><a href="#L-160"><span class="linenos">160</span></a>    <span class="nd">@abstractmethod</span>
+</span><span id="L-161"><a href="#L-161"><span class="linenos">161</span></a>    <span class="k">def</span> <span class="nf">encode</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">x</span><span class="p">:</span> <span class="n">LatentsDomainGroupT</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">LatentsDomainGroupDT</span><span class="p">:</span>
+</span><span id="L-162"><a href="#L-162"><span class="linenos">162</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="L-163"><a href="#L-163"><span class="linenos">163</span></a><span class="sd">        Encode the latent representation infos to the pre-fusion GW representation.</span>
+</span><span id="L-164"><a href="#L-164"><span class="linenos">164</span></a>
+</span><span id="L-165"><a href="#L-165"><span class="linenos">165</span></a><span class="sd">        Args:</span>
+</span><span id="L-166"><a href="#L-166"><span class="linenos">166</span></a><span class="sd">            x (`LatentsDomainGroupT`): the input domain representations</span>
+</span><span id="L-167"><a href="#L-167"><span class="linenos">167</span></a>
+</span><span id="L-168"><a href="#L-168"><span class="linenos">168</span></a><span class="sd">        Returns:</span>
+</span><span id="L-169"><a href="#L-169"><span class="linenos">169</span></a><span class="sd">            `LatentsDomainGroupT`: pre-fusion GW representations</span>
+</span><span id="L-170"><a href="#L-170"><span class="linenos">170</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="L-171"><a href="#L-171"><span class="linenos">171</span></a>        <span class="o">...</span>
+</span><span id="L-172"><a href="#L-172"><span class="linenos">172</span></a>
+</span><span id="L-173"><a href="#L-173"><span class="linenos">173</span></a>    <span class="k">def</span> <span class="nf">encode_and_fuse</span><span class="p">(</span>
+</span><span id="L-174"><a href="#L-174"><span class="linenos">174</span></a>        <span class="bp">self</span><span class="p">,</span> <span class="n">x</span><span class="p">:</span> <span class="n">LatentsDomainGroupT</span><span class="p">,</span> <span class="n">selection_module</span><span class="p">:</span> <span class="n">SelectionBase</span>
+</span><span id="L-175"><a href="#L-175"><span class="linenos">175</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">:</span>
+</span><span id="L-176"><a href="#L-176"><span class="linenos">176</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="L-177"><a href="#L-177"><span class="linenos">177</span></a><span class="sd">        Encode the latent representation infos to the final GW representation.</span>
+</span><span id="L-178"><a href="#L-178"><span class="linenos">178</span></a><span class="sd">        It combines the encode and fuse methods.</span>
+</span><span id="L-179"><a href="#L-179"><span class="linenos">179</span></a>
+</span><span id="L-180"><a href="#L-180"><span class="linenos">180</span></a><span class="sd">        Args:</span>
+</span><span id="L-181"><a href="#L-181"><span class="linenos">181</span></a><span class="sd">            x (`LatentsDomainGroupT`): the input domain representations</span>
+</span><span id="L-182"><a href="#L-182"><span class="linenos">182</span></a><span class="sd">            selection_score (`Mapping[str, torch.Tensor]`): attention scores to</span>
+</span><span id="L-183"><a href="#L-183"><span class="linenos">183</span></a><span class="sd">                use to encode the reprensetation.</span>
+</span><span id="L-184"><a href="#L-184"><span class="linenos">184</span></a>
+</span><span id="L-185"><a href="#L-185"><span class="linenos">185</span></a><span class="sd">        Returns:</span>
+</span><span id="L-186"><a href="#L-186"><span class="linenos">186</span></a><span class="sd">            `torch.Tensor`: The merged representation.</span>
+</span><span id="L-187"><a href="#L-187"><span class="linenos">187</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="L-188"><a href="#L-188"><span class="linenos">188</span></a>        <span class="n">encodings</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">encode</span><span class="p">(</span><span class="n">x</span><span class="p">)</span>
+</span><span id="L-189"><a href="#L-189"><span class="linenos">189</span></a>        <span class="n">selection_scores</span> <span class="o">=</span> <span class="n">selection_module</span><span class="p">(</span><span class="n">x</span><span class="p">,</span> <span class="n">encodings</span><span class="p">)</span>
+</span><span id="L-190"><a href="#L-190"><span class="linenos">190</span></a>        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">fuse</span><span class="p">(</span><span class="n">encodings</span><span class="p">,</span> <span class="n">selection_scores</span><span class="p">)</span>
+</span><span id="L-191"><a href="#L-191"><span class="linenos">191</span></a>
+</span><span id="L-192"><a href="#L-192"><span class="linenos">192</span></a>    <span class="nd">@abstractmethod</span>
+</span><span id="L-193"><a href="#L-193"><span class="linenos">193</span></a>    <span class="k">def</span> <span class="nf">decode</span><span class="p">(</span>
+</span><span id="L-194"><a href="#L-194"><span class="linenos">194</span></a>        <span class="bp">self</span><span class="p">,</span> <span class="n">z</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">,</span> <span class="n">domains</span><span class="p">:</span> <span class="n">Iterable</span><span class="p">[</span><span class="nb">str</span><span class="p">]</span> <span class="o">|</span> <span class="kc">None</span> <span class="o">=</span> <span class="kc">None</span>
+</span><span id="L-195"><a href="#L-195"><span class="linenos">195</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="n">LatentsDomainGroupDT</span><span class="p">:</span>
+</span><span id="L-196"><a href="#L-196"><span class="linenos">196</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="L-197"><a href="#L-197"><span class="linenos">197</span></a><span class="sd">        Decode the GW representation into given `domains`.</span>
+</span><span id="L-198"><a href="#L-198"><span class="linenos">198</span></a>
+</span><span id="L-199"><a href="#L-199"><span class="linenos">199</span></a><span class="sd">        Args:</span>
+</span><span id="L-200"><a href="#L-200"><span class="linenos">200</span></a><span class="sd">            z (`torch.Tensor`): the GW representation.</span>
+</span><span id="L-201"><a href="#L-201"><span class="linenos">201</span></a><span class="sd">            domains (`Iterable[str]`): iterable of domains to decode.</span>
+</span><span id="L-202"><a href="#L-202"><span class="linenos">202</span></a>
+</span><span id="L-203"><a href="#L-203"><span class="linenos">203</span></a><span class="sd">        Returns:</span>
+</span><span id="L-204"><a href="#L-204"><span class="linenos">204</span></a><span class="sd">            `LatentsDomainGroupDT`: the decoded unimodal representations.</span>
+</span><span id="L-205"><a href="#L-205"><span class="linenos">205</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="L-206"><a href="#L-206"><span class="linenos">206</span></a>        <span class="o">...</span>
+</span><span id="L-207"><a href="#L-207"><span class="linenos">207</span></a>
+</span><span id="L-208"><a href="#L-208"><span class="linenos">208</span></a>
+</span><span id="L-209"><a href="#L-209"><span class="linenos">209</span></a><span class="k">class</span> <span class="nc">GWModule</span><span class="p">(</span><span class="n">GWModuleBase</span><span class="p">):</span>
+</span><span id="L-210"><a href="#L-210"><span class="linenos">210</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;GW nn.Module. Implements `GWModuleBase`.&quot;&quot;&quot;</span>
+</span><span id="L-211"><a href="#L-211"><span class="linenos">211</span></a>
+</span><span id="L-212"><a href="#L-212"><span class="linenos">212</span></a>    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span>
+</span><span id="L-213"><a href="#L-213"><span class="linenos">213</span></a>        <span class="bp">self</span><span class="p">,</span>
+</span><span id="L-214"><a href="#L-214"><span class="linenos">214</span></a>        <span class="n">domain_modules</span><span class="p">:</span> <span class="n">Mapping</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">DomainModule</span><span class="p">],</span>
+</span><span id="L-215"><a href="#L-215"><span class="linenos">215</span></a>        <span class="n">workspace_dim</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span>
+</span><span id="L-216"><a href="#L-216"><span class="linenos">216</span></a>        <span class="n">gw_encoders</span><span class="p">:</span> <span class="n">Mapping</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">nn</span><span class="o">.</span><span class="n">Module</span><span class="p">],</span>
+</span><span id="L-217"><a href="#L-217"><span class="linenos">217</span></a>        <span class="n">gw_decoders</span><span class="p">:</span> <span class="n">Mapping</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">nn</span><span class="o">.</span><span class="n">Module</span><span class="p">],</span>
+</span><span id="L-218"><a href="#L-218"><span class="linenos">218</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="L-219"><a href="#L-219"><span class="linenos">219</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="L-220"><a href="#L-220"><span class="linenos">220</span></a><span class="sd">        Initializes the GWModule.</span>
+</span><span id="L-221"><a href="#L-221"><span class="linenos">221</span></a>
+</span><span id="L-222"><a href="#L-222"><span class="linenos">222</span></a><span class="sd">        Args:</span>
+</span><span id="L-223"><a href="#L-223"><span class="linenos">223</span></a><span class="sd">            domain_modules (`Mapping[str, DomainModule]`): the domain modules.</span>
+</span><span id="L-224"><a href="#L-224"><span class="linenos">224</span></a><span class="sd">            workspace_dim (`int`): dimension of the GW.</span>
+</span><span id="L-225"><a href="#L-225"><span class="linenos">225</span></a><span class="sd">            gw_encoders (`Mapping[str, torch.nn.Module]`): mapping for each domain</span>
+</span><span id="L-226"><a href="#L-226"><span class="linenos">226</span></a><span class="sd">                name to a an torch.nn.Module class that encodes a</span>
+</span><span id="L-227"><a href="#L-227"><span class="linenos">227</span></a><span class="sd">                unimodal latent representations into a GW representation (pre fusion).</span>
+</span><span id="L-228"><a href="#L-228"><span class="linenos">228</span></a><span class="sd">            gw_decoders (`Mapping[str, torch.nn.Module]`): mapping for each domain</span>
+</span><span id="L-229"><a href="#L-229"><span class="linenos">229</span></a><span class="sd">                name to a an torch.nn.Module class that decodes a</span>
+</span><span id="L-230"><a href="#L-230"><span class="linenos">230</span></a><span class="sd">                 GW representation to a unimodal latent representation.</span>
+</span><span id="L-231"><a href="#L-231"><span class="linenos">231</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="L-232"><a href="#L-232"><span class="linenos">232</span></a>        <span class="nb">super</span><span class="p">()</span><span class="o">.</span><span class="fm">__init__</span><span class="p">(</span><span class="n">domain_modules</span><span class="p">,</span> <span class="n">workspace_dim</span><span class="p">)</span>
+</span><span id="L-233"><a href="#L-233"><span class="linenos">233</span></a>
+</span><span id="L-234"><a href="#L-234"><span class="linenos">234</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">gw_encoders</span> <span class="o">=</span> <span class="n">nn</span><span class="o">.</span><span class="n">ModuleDict</span><span class="p">(</span><span class="n">gw_encoders</span><span class="p">)</span>
+</span><span id="L-235"><a href="#L-235"><span class="linenos">235</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;The module&#39;s encoders&quot;&quot;&quot;</span>
+</span><span id="L-236"><a href="#L-236"><span class="linenos">236</span></a>
+</span><span id="L-237"><a href="#L-237"><span class="linenos">237</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">gw_decoders</span> <span class="o">=</span> <span class="n">nn</span><span class="o">.</span><span class="n">ModuleDict</span><span class="p">(</span><span class="n">gw_decoders</span><span class="p">)</span>
+</span><span id="L-238"><a href="#L-238"><span class="linenos">238</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;The module&#39;s decoders&quot;&quot;&quot;</span>
+</span><span id="L-239"><a href="#L-239"><span class="linenos">239</span></a>
+</span><span id="L-240"><a href="#L-240"><span class="linenos">240</span></a>    <span class="k">def</span> <span class="nf">fuse</span><span class="p">(</span>
+</span><span id="L-241"><a href="#L-241"><span class="linenos">241</span></a>        <span class="bp">self</span><span class="p">,</span>
+</span><span id="L-242"><a href="#L-242"><span class="linenos">242</span></a>        <span class="n">x</span><span class="p">:</span> <span class="n">LatentsDomainGroupT</span><span class="p">,</span>
+</span><span id="L-243"><a href="#L-243"><span class="linenos">243</span></a>        <span class="n">selection_scores</span><span class="p">:</span> <span class="n">Mapping</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">],</span>
+</span><span id="L-244"><a href="#L-244"><span class="linenos">244</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">:</span>
+</span><span id="L-245"><a href="#L-245"><span class="linenos">245</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="L-246"><a href="#L-246"><span class="linenos">246</span></a><span class="sd">        Merge function used to combine domains.</span>
+</span><span id="L-247"><a href="#L-247"><span class="linenos">247</span></a>
+</span><span id="L-248"><a href="#L-248"><span class="linenos">248</span></a><span class="sd">        Args:</span>
+</span><span id="L-249"><a href="#L-249"><span class="linenos">249</span></a><span class="sd">            x (`LatentsDomainGroupT`): the group of latent representation.</span>
+</span><span id="L-250"><a href="#L-250"><span class="linenos">250</span></a><span class="sd">            selection_score (`Mapping[str, torch.Tensor]`): attention scores to</span>
+</span><span id="L-251"><a href="#L-251"><span class="linenos">251</span></a><span class="sd">                use to encode the reprensetation.</span>
+</span><span id="L-252"><a href="#L-252"><span class="linenos">252</span></a><span class="sd">        Returns:</span>
+</span><span id="L-253"><a href="#L-253"><span class="linenos">253</span></a><span class="sd">            `torch.Tensor`: The merged representation.</span>
+</span><span id="L-254"><a href="#L-254"><span class="linenos">254</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="L-255"><a href="#L-255"><span class="linenos">255</span></a>        <span class="k">return</span> <span class="n">torch</span><span class="o">.</span><span class="n">tanh</span><span class="p">(</span>
+</span><span id="L-256"><a href="#L-256"><span class="linenos">256</span></a>            <span class="n">torch</span><span class="o">.</span><span class="n">sum</span><span class="p">(</span>
+</span><span id="L-257"><a href="#L-257"><span class="linenos">257</span></a>                <span class="n">torch</span><span class="o">.</span><span class="n">stack</span><span class="p">(</span>
+</span><span id="L-258"><a href="#L-258"><span class="linenos">258</span></a>                    <span class="p">[</span>
+</span><span id="L-259"><a href="#L-259"><span class="linenos">259</span></a>                        <span class="n">selection_scores</span><span class="p">[</span><span class="n">domain</span><span class="p">]</span><span class="o">.</span><span class="n">unsqueeze</span><span class="p">(</span><span class="mi">1</span><span class="p">)</span> <span class="o">*</span> <span class="n">x</span><span class="p">[</span><span class="n">domain</span><span class="p">]</span>
+</span><span id="L-260"><a href="#L-260"><span class="linenos">260</span></a>                        <span class="k">for</span> <span class="n">domain</span> <span class="ow">in</span> <span class="n">selection_scores</span>
+</span><span id="L-261"><a href="#L-261"><span class="linenos">261</span></a>                    <span class="p">]</span>
+</span><span id="L-262"><a href="#L-262"><span class="linenos">262</span></a>                <span class="p">),</span>
+</span><span id="L-263"><a href="#L-263"><span class="linenos">263</span></a>                <span class="n">dim</span><span class="o">=</span><span class="mi">0</span><span class="p">,</span>
+</span><span id="L-264"><a href="#L-264"><span class="linenos">264</span></a>            <span class="p">)</span>
+</span><span id="L-265"><a href="#L-265"><span class="linenos">265</span></a>        <span class="p">)</span>
+</span><span id="L-266"><a href="#L-266"><span class="linenos">266</span></a>
+</span><span id="L-267"><a href="#L-267"><span class="linenos">267</span></a>    <span class="k">def</span> <span class="nf">encode</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">x</span><span class="p">:</span> <span class="n">LatentsDomainGroupT</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">LatentsDomainGroupDT</span><span class="p">:</span>
+</span><span id="L-268"><a href="#L-268"><span class="linenos">268</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="L-269"><a href="#L-269"><span class="linenos">269</span></a><span class="sd">        Encode the latent representation infos to the pre-fusion GW representation.</span>
+</span><span id="L-270"><a href="#L-270"><span class="linenos">270</span></a>
+</span><span id="L-271"><a href="#L-271"><span class="linenos">271</span></a><span class="sd">        Args:</span>
+</span><span id="L-272"><a href="#L-272"><span class="linenos">272</span></a><span class="sd">            x (`LatentsDomainGroupT`): the input domain representations.</span>
+</span><span id="L-273"><a href="#L-273"><span class="linenos">273</span></a>
+</span><span id="L-274"><a href="#L-274"><span class="linenos">274</span></a><span class="sd">        Returns:</span>
+</span><span id="L-275"><a href="#L-275"><span class="linenos">275</span></a><span class="sd">            `LatentsDomainGroupT`: pre-fusion representation</span>
+</span><span id="L-276"><a href="#L-276"><span class="linenos">276</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="L-277"><a href="#L-277"><span class="linenos">277</span></a>        <span class="k">return</span> <span class="p">{</span>
+</span><span id="L-278"><a href="#L-278"><span class="linenos">278</span></a>            <span class="n">domain_name</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">gw_encoders</span><span class="p">[</span><span class="n">domain_name</span><span class="p">](</span><span class="n">domain</span><span class="p">)</span>
+</span><span id="L-279"><a href="#L-279"><span class="linenos">279</span></a>            <span class="k">for</span> <span class="n">domain_name</span><span class="p">,</span> <span class="n">domain</span> <span class="ow">in</span> <span class="n">x</span><span class="o">.</span><span class="n">items</span><span class="p">()</span>
+</span><span id="L-280"><a href="#L-280"><span class="linenos">280</span></a>        <span class="p">}</span>
+</span><span id="L-281"><a href="#L-281"><span class="linenos">281</span></a>
+</span><span id="L-282"><a href="#L-282"><span class="linenos">282</span></a>    <span class="k">def</span> <span class="nf">decode</span><span class="p">(</span>
+</span><span id="L-283"><a href="#L-283"><span class="linenos">283</span></a>        <span class="bp">self</span><span class="p">,</span> <span class="n">z</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">,</span> <span class="n">domains</span><span class="p">:</span> <span class="n">Iterable</span><span class="p">[</span><span class="nb">str</span><span class="p">]</span> <span class="o">|</span> <span class="kc">None</span> <span class="o">=</span> <span class="kc">None</span>
+</span><span id="L-284"><a href="#L-284"><span class="linenos">284</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="n">LatentsDomainGroupDT</span><span class="p">:</span>
+</span><span id="L-285"><a href="#L-285"><span class="linenos">285</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="L-286"><a href="#L-286"><span class="linenos">286</span></a><span class="sd">        Decodes a GW representation to multiple domains.</span>
+</span><span id="L-287"><a href="#L-287"><span class="linenos">287</span></a>
+</span><span id="L-288"><a href="#L-288"><span class="linenos">288</span></a><span class="sd">        Args:</span>
+</span><span id="L-289"><a href="#L-289"><span class="linenos">289</span></a><span class="sd">            z (`torch.Tensor`): the GW representation</span>
+</span><span id="L-290"><a href="#L-290"><span class="linenos">290</span></a><span class="sd">            domains (`Iterable[str] | None`): the domains to decode to. Defaults to</span>
+</span><span id="L-291"><a href="#L-291"><span class="linenos">291</span></a><span class="sd">                use keys in `gw_interfaces` (all domains).</span>
+</span><span id="L-292"><a href="#L-292"><span class="linenos">292</span></a><span class="sd">        Returns:</span>
+</span><span id="L-293"><a href="#L-293"><span class="linenos">293</span></a><span class="sd">            `LatentsDomainGroupDT`: decoded unimodal representation</span>
+</span><span id="L-294"><a href="#L-294"><span class="linenos">294</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="L-295"><a href="#L-295"><span class="linenos">295</span></a>        <span class="k">return</span> <span class="p">{</span>
+</span><span id="L-296"><a href="#L-296"><span class="linenos">296</span></a>            <span class="n">domain</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">gw_decoders</span><span class="p">[</span><span class="n">domain</span><span class="p">](</span><span class="n">z</span><span class="p">)</span>
+</span><span id="L-297"><a href="#L-297"><span class="linenos">297</span></a>            <span class="k">for</span> <span class="n">domain</span> <span class="ow">in</span> <span class="n">domains</span> <span class="ow">or</span> <span class="bp">self</span><span class="o">.</span><span class="n">gw_decoders</span><span class="o">.</span><span class="n">keys</span><span class="p">()</span>
+</span><span id="L-298"><a href="#L-298"><span class="linenos">298</span></a>        <span class="p">}</span>
+</span><span id="L-299"><a href="#L-299"><span class="linenos">299</span></a>
+</span><span id="L-300"><a href="#L-300"><span class="linenos">300</span></a>
+</span><span id="L-301"><a href="#L-301"><span class="linenos">301</span></a><span class="k">def</span> <span class="nf">compute_fusion_scores</span><span class="p">(</span>
+</span><span id="L-302"><a href="#L-302"><span class="linenos">302</span></a>    <span class="n">score_1</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">,</span>
+</span><span id="L-303"><a href="#L-303"><span class="linenos">303</span></a>    <span class="n">score_2</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">,</span>
+</span><span id="L-304"><a href="#L-304"><span class="linenos">304</span></a>    <span class="n">sensitivity_1</span><span class="p">:</span> <span class="nb">float</span> <span class="o">=</span> <span class="mf">1.0</span><span class="p">,</span>
+</span><span id="L-305"><a href="#L-305"><span class="linenos">305</span></a>    <span class="n">sensitivity_2</span><span class="p">:</span> <span class="nb">float</span> <span class="o">=</span> <span class="mf">1.0</span><span class="p">,</span>
+</span><span id="L-306"><a href="#L-306"><span class="linenos">306</span></a>    <span class="n">eps</span><span class="p">:</span> <span class="nb">float</span> <span class="o">=</span> <span class="mf">1e-6</span><span class="p">,</span>
+</span><span id="L-307"><a href="#L-307"><span class="linenos">307</span></a><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">:</span>
+</span><span id="L-308"><a href="#L-308"><span class="linenos">308</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="L-309"><a href="#L-309"><span class="linenos">309</span></a><span class="sd">    Combine precision scores using std summation in quadrature</span>
+</span><span id="L-310"><a href="#L-310"><span class="linenos">310</span></a>
+</span><span id="L-311"><a href="#L-311"><span class="linenos">311</span></a><span class="sd">    The two scores should have the same dimension.</span>
+</span><span id="L-312"><a href="#L-312"><span class="linenos">312</span></a>
+</span><span id="L-313"><a href="#L-313"><span class="linenos">313</span></a><span class="sd">    Args:</span>
+</span><span id="L-314"><a href="#L-314"><span class="linenos">314</span></a><span class="sd">        score_1 (`torch.Tensor`): First scores.</span>
+</span><span id="L-315"><a href="#L-315"><span class="linenos">315</span></a><span class="sd">        score_2 (`torch.Tensor`): Second scores.</span>
+</span><span id="L-316"><a href="#L-316"><span class="linenos">316</span></a><span class="sd">        sensitivity_1 (`float`): sensitivity for the first score</span>
+</span><span id="L-317"><a href="#L-317"><span class="linenos">317</span></a><span class="sd">        sensitivity_2 (`float`): sensitivity for the second score</span>
+</span><span id="L-318"><a href="#L-318"><span class="linenos">318</span></a><span class="sd">        eps (`float`): a value added to avoid numerical unstability.</span>
+</span><span id="L-319"><a href="#L-319"><span class="linenos">319</span></a>
+</span><span id="L-320"><a href="#L-320"><span class="linenos">320</span></a><span class="sd">    Returns:</span>
+</span><span id="L-321"><a href="#L-321"><span class="linenos">321</span></a><span class="sd">        `torch.Tensor`: the combined scores</span>
+</span><span id="L-322"><a href="#L-322"><span class="linenos">322</span></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="L-323"><a href="#L-323"><span class="linenos">323</span></a>    <span class="n">total_uncertainty</span> <span class="o">=</span> <span class="n">sensitivity_1</span> <span class="o">/</span> <span class="p">(</span><span class="n">eps</span> <span class="o">+</span> <span class="n">score_1</span><span class="p">)</span> <span class="o">+</span> <span class="n">sensitivity_2</span> <span class="o">/</span> <span class="p">(</span>
+</span><span id="L-324"><a href="#L-324"><span class="linenos">324</span></a>        <span class="n">eps</span> <span class="o">+</span> <span class="n">score_2</span>
+</span><span id="L-325"><a href="#L-325"><span class="linenos">325</span></a>    <span class="p">)</span>
+</span><span id="L-326"><a href="#L-326"><span class="linenos">326</span></a>    <span class="n">final_scores</span> <span class="o">=</span> <span class="mi">1</span> <span class="o">/</span> <span class="p">(</span><span class="n">eps</span> <span class="o">+</span> <span class="n">total_uncertainty</span><span class="p">)</span>
+</span><span id="L-327"><a href="#L-327"><span class="linenos">327</span></a>    <span class="k">return</span> <span class="n">final_scores</span> <span class="o">/</span> <span class="n">final_scores</span><span class="o">.</span><span class="n">sum</span><span class="p">(</span><span class="n">dim</span><span class="o">=</span><span class="mi">0</span><span class="p">,</span> <span class="n">keepdim</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
+</span><span id="L-328"><a href="#L-328"><span class="linenos">328</span></a>
+</span><span id="L-329"><a href="#L-329"><span class="linenos">329</span></a>
+</span><span id="L-330"><a href="#L-330"><span class="linenos">330</span></a><span class="k">class</span> <span class="nc">GWModuleBayesian</span><span class="p">(</span><span class="n">GWModule</span><span class="p">):</span>
+</span><span id="L-331"><a href="#L-331"><span class="linenos">331</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;`GWModule` with a Bayesian based uncertainty prediction.&quot;&quot;&quot;</span>
+</span><span id="L-332"><a href="#L-332"><span class="linenos">332</span></a>
+</span><span id="L-333"><a href="#L-333"><span class="linenos">333</span></a>    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span>
+</span><span id="L-334"><a href="#L-334"><span class="linenos">334</span></a>        <span class="bp">self</span><span class="p">,</span>
+</span><span id="L-335"><a href="#L-335"><span class="linenos">335</span></a>        <span class="n">domain_modules</span><span class="p">:</span> <span class="n">Mapping</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">DomainModule</span><span class="p">],</span>
+</span><span id="L-336"><a href="#L-336"><span class="linenos">336</span></a>        <span class="n">workspace_dim</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span>
+</span><span id="L-337"><a href="#L-337"><span class="linenos">337</span></a>        <span class="n">gw_encoders</span><span class="p">:</span> <span class="n">Mapping</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">nn</span><span class="o">.</span><span class="n">Module</span><span class="p">],</span>
+</span><span id="L-338"><a href="#L-338"><span class="linenos">338</span></a>        <span class="n">gw_decoders</span><span class="p">:</span> <span class="n">Mapping</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">nn</span><span class="o">.</span><span class="n">Module</span><span class="p">],</span>
+</span><span id="L-339"><a href="#L-339"><span class="linenos">339</span></a>        <span class="n">sensitivity_selection</span><span class="p">:</span> <span class="nb">float</span> <span class="o">=</span> <span class="mi">1</span><span class="p">,</span>
+</span><span id="L-340"><a href="#L-340"><span class="linenos">340</span></a>        <span class="n">sensitivity_precision</span><span class="p">:</span> <span class="nb">float</span> <span class="o">=</span> <span class="mi">1</span><span class="p">,</span>
+</span><span id="L-341"><a href="#L-341"><span class="linenos">341</span></a>        <span class="n">precision_softmax_temp</span><span class="p">:</span> <span class="nb">float</span> <span class="o">=</span> <span class="mf">0.01</span><span class="p">,</span>
+</span><span id="L-342"><a href="#L-342"><span class="linenos">342</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="L-343"><a href="#L-343"><span class="linenos">343</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="L-344"><a href="#L-344"><span class="linenos">344</span></a><span class="sd">        Initializes the GWModuleBayesian.</span>
+</span><span id="L-345"><a href="#L-345"><span class="linenos">345</span></a>
+</span><span id="L-346"><a href="#L-346"><span class="linenos">346</span></a><span class="sd">        Args:</span>
+</span><span id="L-347"><a href="#L-347"><span class="linenos">347</span></a><span class="sd">            domain_modules (`Mapping[str, DomainModule]`): the domain modules.</span>
+</span><span id="L-348"><a href="#L-348"><span class="linenos">348</span></a><span class="sd">            workspace_dim (`int`): dimension of the GW.</span>
+</span><span id="L-349"><a href="#L-349"><span class="linenos">349</span></a><span class="sd">            gw_encoders (`Mapping[str, torch.nn.Module]`): mapping for each domain</span>
+</span><span id="L-350"><a href="#L-350"><span class="linenos">350</span></a><span class="sd">                name to a an torch.nn.Module class that encodes a</span>
+</span><span id="L-351"><a href="#L-351"><span class="linenos">351</span></a><span class="sd">                unimodal latent representations into a GW representation (pre fusion).</span>
+</span><span id="L-352"><a href="#L-352"><span class="linenos">352</span></a><span class="sd">            gw_decoders (`Mapping[str, torch.nn.Module]`): mapping for each domain</span>
+</span><span id="L-353"><a href="#L-353"><span class="linenos">353</span></a><span class="sd">                name to a an torch.nn.Module class that decodes a</span>
+</span><span id="L-354"><a href="#L-354"><span class="linenos">354</span></a><span class="sd">                 GW representation to a unimodal latent representation.</span>
+</span><span id="L-355"><a href="#L-355"><span class="linenos">355</span></a><span class="sd">            sensitivity_selection (`float`): sensivity coef $c&#39;_1$</span>
+</span><span id="L-356"><a href="#L-356"><span class="linenos">356</span></a><span class="sd">            sensitivity_precision (`float`): sensitivity coef $c&#39;_2$</span>
+</span><span id="L-357"><a href="#L-357"><span class="linenos">357</span></a><span class="sd">            precision_softmax_temp (`float`): temperature to use in softmax of</span>
+</span><span id="L-358"><a href="#L-358"><span class="linenos">358</span></a><span class="sd">                precision</span>
+</span><span id="L-359"><a href="#L-359"><span class="linenos">359</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="L-360"><a href="#L-360"><span class="linenos">360</span></a>        <span class="nb">super</span><span class="p">()</span><span class="o">.</span><span class="fm">__init__</span><span class="p">(</span><span class="n">domain_modules</span><span class="p">,</span> <span class="n">workspace_dim</span><span class="p">,</span> <span class="n">gw_encoders</span><span class="p">,</span> <span class="n">gw_decoders</span><span class="p">)</span>
+</span><span id="L-361"><a href="#L-361"><span class="linenos">361</span></a>
+</span><span id="L-362"><a href="#L-362"><span class="linenos">362</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">precisions</span> <span class="o">=</span> <span class="n">cast</span><span class="p">(</span>
+</span><span id="L-363"><a href="#L-363"><span class="linenos">363</span></a>            <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">],</span>
+</span><span id="L-364"><a href="#L-364"><span class="linenos">364</span></a>            <span class="n">nn</span><span class="o">.</span><span class="n">ParameterDict</span><span class="p">(</span>
+</span><span id="L-365"><a href="#L-365"><span class="linenos">365</span></a>                <span class="p">{</span><span class="n">domain</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">randn</span><span class="p">(</span><span class="n">workspace_dim</span><span class="p">)</span> <span class="k">for</span> <span class="n">domain</span> <span class="ow">in</span> <span class="n">gw_encoders</span><span class="p">}</span>
+</span><span id="L-366"><a href="#L-366"><span class="linenos">366</span></a>            <span class="p">),</span>
+</span><span id="L-367"><a href="#L-367"><span class="linenos">367</span></a>        <span class="p">)</span>
+</span><span id="L-368"><a href="#L-368"><span class="linenos">368</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;Precision at the neuron level for every domain.&quot;&quot;&quot;</span>
+</span><span id="L-369"><a href="#L-369"><span class="linenos">369</span></a>
+</span><span id="L-370"><a href="#L-370"><span class="linenos">370</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">sensitivity_selection</span> <span class="o">=</span> <span class="n">sensitivity_selection</span>
+</span><span id="L-371"><a href="#L-371"><span class="linenos">371</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">sensitivity_precision</span> <span class="o">=</span> <span class="n">sensitivity_precision</span>
+</span><span id="L-372"><a href="#L-372"><span class="linenos">372</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">precision_softmax_temp</span> <span class="o">=</span> <span class="n">precision_softmax_temp</span>
+</span><span id="L-373"><a href="#L-373"><span class="linenos">373</span></a>
+</span><span id="L-374"><a href="#L-374"><span class="linenos">374</span></a>    <span class="k">def</span> <span class="nf">get_precision</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">domain</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span> <span class="n">x</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">:</span>
+</span><span id="L-375"><a href="#L-375"><span class="linenos">375</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="L-376"><a href="#L-376"><span class="linenos">376</span></a><span class="sd">        Get the precision vector of given domain and batch</span>
+</span><span id="L-377"><a href="#L-377"><span class="linenos">377</span></a>
+</span><span id="L-378"><a href="#L-378"><span class="linenos">378</span></a><span class="sd">        Args:</span>
+</span><span id="L-379"><a href="#L-379"><span class="linenos">379</span></a><span class="sd">            domain (`str`):</span>
+</span><span id="L-380"><a href="#L-380"><span class="linenos">380</span></a><span class="sd">            x (`torch.Tensor`): batch of inputs</span>
+</span><span id="L-381"><a href="#L-381"><span class="linenos">381</span></a>
+</span><span id="L-382"><a href="#L-382"><span class="linenos">382</span></a><span class="sd">        Returns:</span>
+</span><span id="L-383"><a href="#L-383"><span class="linenos">383</span></a><span class="sd">            `torch.Tensor`: batch of precision</span>
+</span><span id="L-384"><a href="#L-384"><span class="linenos">384</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="L-385"><a href="#L-385"><span class="linenos">385</span></a>        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">precisions</span><span class="p">[</span><span class="n">domain</span><span class="p">]</span><span class="o">.</span><span class="n">unsqueeze</span><span class="p">(</span><span class="mi">0</span><span class="p">)</span><span class="o">.</span><span class="n">expand</span><span class="p">(</span><span class="n">x</span><span class="o">.</span><span class="n">size</span><span class="p">(</span><span class="mi">0</span><span class="p">),</span> <span class="o">-</span><span class="mi">1</span><span class="p">)</span>
+</span><span id="L-386"><a href="#L-386"><span class="linenos">386</span></a>
+</span><span id="L-387"><a href="#L-387"><span class="linenos">387</span></a>    <span class="k">def</span> <span class="nf">fuse</span><span class="p">(</span>
+</span><span id="L-388"><a href="#L-388"><span class="linenos">388</span></a>        <span class="bp">self</span><span class="p">,</span>
+</span><span id="L-389"><a href="#L-389"><span class="linenos">389</span></a>        <span class="n">x</span><span class="p">:</span> <span class="n">LatentsDomainGroupT</span><span class="p">,</span>
+</span><span id="L-390"><a href="#L-390"><span class="linenos">390</span></a>        <span class="n">selection_scores</span><span class="p">:</span> <span class="n">Mapping</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">],</span>
+</span><span id="L-391"><a href="#L-391"><span class="linenos">391</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">:</span>
+</span><span id="L-392"><a href="#L-392"><span class="linenos">392</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="L-393"><a href="#L-393"><span class="linenos">393</span></a><span class="sd">        Merge function used to combine domains.</span>
+</span><span id="L-394"><a href="#L-394"><span class="linenos">394</span></a>
+</span><span id="L-395"><a href="#L-395"><span class="linenos">395</span></a><span class="sd">        In the following, $D$ is the number of domains, $N$ the batch size, and $d$ the</span>
+</span><span id="L-396"><a href="#L-396"><span class="linenos">396</span></a><span class="sd">        dimension of the Global Workspace.</span>
+</span><span id="L-397"><a href="#L-397"><span class="linenos">397</span></a>
+</span><span id="L-398"><a href="#L-398"><span class="linenos">398</span></a><span class="sd">        This function needs to merge two kind of scores:</span>
+</span><span id="L-399"><a href="#L-399"><span class="linenos">399</span></a><span class="sd">        * the selection scores $a\\in [0,1]^{D\\times N}$;</span>
+</span><span id="L-400"><a href="#L-400"><span class="linenos">400</span></a><span class="sd">        * the precision scores $b \\in [0,1]^{D\\times N \\times d}$.</span>
+</span><span id="L-401"><a href="#L-401"><span class="linenos">401</span></a>
+</span><span id="L-402"><a href="#L-402"><span class="linenos">402</span></a><span class="sd">        .. note::</span>
+</span><span id="L-403"><a href="#L-403"><span class="linenos">403</span></a><span class="sd">            The precision score is obtained by predicting logits and using a softmax</span>
+</span><span id="L-404"><a href="#L-404"><span class="linenos">404</span></a>
+</span><span id="L-405"><a href="#L-405"><span class="linenos">405</span></a><span class="sd">        We can obtain associated uncertainties to the scores by introducing a std</span>
+</span><span id="L-406"><a href="#L-406"><span class="linenos">406</span></a><span class="sd">        variable and using bayesian integration:</span>
+</span><span id="L-407"><a href="#L-407"><span class="linenos">407</span></a>
+</span><span id="L-408"><a href="#L-408"><span class="linenos">408</span></a><span class="sd">        $$a_k = \\frac{M_1}{\\sigma_k^2}$$</span>
+</span><span id="L-409"><a href="#L-409"><span class="linenos">409</span></a><span class="sd">        where $M_1 = \\frac{1}{\\sum_{i=1}^D \\frac{1}{\\sigma_i^2}}$.</span>
+</span><span id="L-410"><a href="#L-410"><span class="linenos">410</span></a>
+</span><span id="L-411"><a href="#L-411"><span class="linenos">411</span></a><span class="sd">        Similarly,</span>
+</span><span id="L-412"><a href="#L-412"><span class="linenos">412</span></a><span class="sd">        $$b_k = \\frac{M_2}{\\mu_k^2}$$</span>
+</span><span id="L-413"><a href="#L-413"><span class="linenos">413</span></a><span class="sd">        where $M_2 = \\frac{1}{\\sum_{i=1}^D \\frac{1}{\\mu_i^2}}$.</span>
+</span><span id="L-414"><a href="#L-414"><span class="linenos">414</span></a>
+</span><span id="L-415"><a href="#L-415"><span class="linenos">415</span></a><span class="sd">        The we can sum the variances to obtain the final uncertainty (squared) $\\xi$:</span>
+</span><span id="L-416"><a href="#L-416"><span class="linenos">416</span></a><span class="sd">        $$\\xi_k^2 = c_1 \\sigma_k^2 + c_2 \\mu_k^2$$</span>
+</span><span id="L-417"><a href="#L-417"><span class="linenos">417</span></a>
+</span><span id="L-418"><a href="#L-418"><span class="linenos">418</span></a><span class="sd">        which, in terms of $a_k$ and $b_k$ yields:</span>
+</span><span id="L-419"><a href="#L-419"><span class="linenos">419</span></a><span class="sd">        $$\\xi_k^2 = \\frac{c&#39;_1}{a_k} + \\frac{c&#39;_2}{b_k}$$</span>
+</span><span id="L-420"><a href="#L-420"><span class="linenos">420</span></a><span class="sd">        where $c&#39;_1 = c_1 \\cdot M_1$ and $c&#39;_2 = c_2 \\cdot M_2$.</span>
+</span><span id="L-421"><a href="#L-421"><span class="linenos">421</span></a>
+</span><span id="L-422"><a href="#L-422"><span class="linenos">422</span></a><span class="sd">        Finally, the finale combined coefficient is</span>
+</span><span id="L-423"><a href="#L-423"><span class="linenos">423</span></a><span class="sd">        $$\\lambda_k = \\frac{M_3}{\\frac{c&#39;_1}{a_k} + \\frac{c&#39;_2}{b_k}}$$</span>
+</span><span id="L-424"><a href="#L-424"><span class="linenos">424</span></a><span class="sd">        where</span>
+</span><span id="L-425"><a href="#L-425"><span class="linenos">425</span></a><span class="sd">        $$M_3 = \\frac{1}{\\sum_{i=1}^D</span>
+</span><span id="L-426"><a href="#L-426"><span class="linenos">426</span></a><span class="sd">            \\frac{1}{\\frac{c&#39;_1}{a_i} + \\frac{c&#39;_2}{b_i}}}$$</span>
+</span><span id="L-427"><a href="#L-427"><span class="linenos">427</span></a>
+</span><span id="L-428"><a href="#L-428"><span class="linenos">428</span></a><span class="sd">        Args:</span>
+</span><span id="L-429"><a href="#L-429"><span class="linenos">429</span></a><span class="sd">            x (`LatentsDomainGroupT`): the group of latent representation.</span>
+</span><span id="L-430"><a href="#L-430"><span class="linenos">430</span></a><span class="sd">            selection_score (`Mapping[str, torch.Tensor]`): attention scores to</span>
+</span><span id="L-431"><a href="#L-431"><span class="linenos">431</span></a><span class="sd">                use to encode the reprensetation.</span>
+</span><span id="L-432"><a href="#L-432"><span class="linenos">432</span></a><span class="sd">        Returns:</span>
+</span><span id="L-433"><a href="#L-433"><span class="linenos">433</span></a><span class="sd">            `torch.Tensor`: The merged representation.</span>
+</span><span id="L-434"><a href="#L-434"><span class="linenos">434</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="L-435"><a href="#L-435"><span class="linenos">435</span></a>        <span class="n">scores</span><span class="p">:</span> <span class="nb">list</span><span class="p">[</span><span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]</span> <span class="o">=</span> <span class="p">[]</span>
+</span><span id="L-436"><a href="#L-436"><span class="linenos">436</span></a>        <span class="n">precisions</span><span class="p">:</span> <span class="nb">list</span><span class="p">[</span><span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]</span> <span class="o">=</span> <span class="p">[]</span>
+</span><span id="L-437"><a href="#L-437"><span class="linenos">437</span></a>        <span class="n">domains</span><span class="p">:</span> <span class="nb">list</span><span class="p">[</span><span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]</span> <span class="o">=</span> <span class="p">[]</span>
+</span><span id="L-438"><a href="#L-438"><span class="linenos">438</span></a>        <span class="k">for</span> <span class="n">domain</span><span class="p">,</span> <span class="n">score</span> <span class="ow">in</span> <span class="n">selection_scores</span><span class="o">.</span><span class="n">items</span><span class="p">():</span>
+</span><span id="L-439"><a href="#L-439"><span class="linenos">439</span></a>            <span class="n">scores</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">score</span><span class="p">)</span>
+</span><span id="L-440"><a href="#L-440"><span class="linenos">440</span></a>            <span class="n">precisions</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">get_precision</span><span class="p">(</span><span class="n">domain</span><span class="p">,</span> <span class="n">x</span><span class="p">[</span><span class="n">domain</span><span class="p">]))</span>
+</span><span id="L-441"><a href="#L-441"><span class="linenos">441</span></a>            <span class="n">domains</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">x</span><span class="p">[</span><span class="n">domain</span><span class="p">])</span>
+</span><span id="L-442"><a href="#L-442"><span class="linenos">442</span></a>        <span class="n">combined_scores</span> <span class="o">=</span> <span class="n">compute_fusion_scores</span><span class="p">(</span>
+</span><span id="L-443"><a href="#L-443"><span class="linenos">443</span></a>            <span class="n">torch</span><span class="o">.</span><span class="n">stack</span><span class="p">(</span><span class="n">scores</span><span class="p">)</span><span class="o">.</span><span class="n">unsqueeze</span><span class="p">(</span><span class="o">-</span><span class="mi">1</span><span class="p">),</span>
+</span><span id="L-444"><a href="#L-444"><span class="linenos">444</span></a>            <span class="n">torch</span><span class="o">.</span><span class="n">softmax</span><span class="p">(</span>
+</span><span id="L-445"><a href="#L-445"><span class="linenos">445</span></a>                <span class="n">torch</span><span class="o">.</span><span class="n">tanh</span><span class="p">(</span><span class="n">torch</span><span class="o">.</span><span class="n">stack</span><span class="p">(</span><span class="n">precisions</span><span class="p">))</span> <span class="o">*</span> <span class="bp">self</span><span class="o">.</span><span class="n">precision_softmax_temp</span><span class="p">,</span> <span class="n">dim</span><span class="o">=</span><span class="mi">0</span>
+</span><span id="L-446"><a href="#L-446"><span class="linenos">446</span></a>            <span class="p">),</span>
+</span><span id="L-447"><a href="#L-447"><span class="linenos">447</span></a>            <span class="bp">self</span><span class="o">.</span><span class="n">sensitivity_selection</span><span class="p">,</span>
+</span><span id="L-448"><a href="#L-448"><span class="linenos">448</span></a>            <span class="bp">self</span><span class="o">.</span><span class="n">sensitivity_precision</span><span class="p">,</span>
+</span><span id="L-449"><a href="#L-449"><span class="linenos">449</span></a>        <span class="p">)</span>
+</span><span id="L-450"><a href="#L-450"><span class="linenos">450</span></a>        <span class="k">return</span> <span class="n">torch</span><span class="o">.</span><span class="n">tanh</span><span class="p">(</span>
+</span><span id="L-451"><a href="#L-451"><span class="linenos">451</span></a>            <span class="n">torch</span><span class="o">.</span><span class="n">sum</span><span class="p">(</span>
+</span><span id="L-452"><a href="#L-452"><span class="linenos">452</span></a>                <span class="n">combined_scores</span> <span class="o">*</span> <span class="n">torch</span><span class="o">.</span><span class="n">stack</span><span class="p">(</span><span class="n">domains</span><span class="p">),</span>
+</span><span id="L-453"><a href="#L-453"><span class="linenos">453</span></a>                <span class="n">dim</span><span class="o">=</span><span class="mi">0</span><span class="p">,</span>
+</span><span id="L-454"><a href="#L-454"><span class="linenos">454</span></a>            <span class="p">)</span>
+</span><span id="L-455"><a href="#L-455"><span class="linenos">455</span></a>        <span class="p">)</span>
+</span></pre></div>
+
+
+            </section>
+                <section id="get_n_layers">
+                            <input id="get_n_layers-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
+<div class="attr function">
+            
+        <span class="def">def</span>
+        <span class="name">get_n_layers</span><span class="signature pdoc-code condensed">(<span class="param"><span class="n">n_layers</span><span class="p">:</span> <span class="nb">int</span>, </span><span class="param"><span class="n">hidden_dim</span><span class="p">:</span> <span class="nb">int</span></span><span class="return-annotation">) -> <span class="nb">list</span><span class="p">[</span><span class="n">torch</span><span class="o">.</span><span class="n">nn</span><span class="o">.</span><span class="n">modules</span><span class="o">.</span><span class="n">module</span><span class="o">.</span><span class="n">Module</span><span class="p">]</span>:</span></span>
+
+                <label class="view-source-button" for="get_n_layers-view-source"><span>View Source</span></label>
+
+    </div>
+    <a class="headerlink" href="#get_n_layers"></a>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="get_n_layers-14"><a href="#get_n_layers-14"><span class="linenos">14</span></a><span class="k">def</span> <span class="nf">get_n_layers</span><span class="p">(</span><span class="n">n_layers</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span> <span class="n">hidden_dim</span><span class="p">:</span> <span class="nb">int</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">list</span><span class="p">[</span><span class="n">nn</span><span class="o">.</span><span class="n">Module</span><span class="p">]:</span>
+</span><span id="get_n_layers-15"><a href="#get_n_layers-15"><span class="linenos">15</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="get_n_layers-16"><a href="#get_n_layers-16"><span class="linenos">16</span></a><span class="sd">    Makes a list of `n_layers` `nn.Linear` layers with `nn.ReLU`.</span>
+</span><span id="get_n_layers-17"><a href="#get_n_layers-17"><span class="linenos">17</span></a>
+</span><span id="get_n_layers-18"><a href="#get_n_layers-18"><span class="linenos">18</span></a><span class="sd">    Args:</span>
+</span><span id="get_n_layers-19"><a href="#get_n_layers-19"><span class="linenos">19</span></a><span class="sd">        n_layers (`int`): number of layers</span>
+</span><span id="get_n_layers-20"><a href="#get_n_layers-20"><span class="linenos">20</span></a><span class="sd">        hidden_dim (`int`): size of the hidden dimension</span>
+</span><span id="get_n_layers-21"><a href="#get_n_layers-21"><span class="linenos">21</span></a>
+</span><span id="get_n_layers-22"><a href="#get_n_layers-22"><span class="linenos">22</span></a><span class="sd">    Returns:</span>
+</span><span id="get_n_layers-23"><a href="#get_n_layers-23"><span class="linenos">23</span></a><span class="sd">        `list[nn.Module]`: list of linear and relu layers.</span>
+</span><span id="get_n_layers-24"><a href="#get_n_layers-24"><span class="linenos">24</span></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="get_n_layers-25"><a href="#get_n_layers-25"><span class="linenos">25</span></a>    <span class="n">layers</span><span class="p">:</span> <span class="nb">list</span><span class="p">[</span><span class="n">nn</span><span class="o">.</span><span class="n">Module</span><span class="p">]</span> <span class="o">=</span> <span class="p">[]</span>
+</span><span id="get_n_layers-26"><a href="#get_n_layers-26"><span class="linenos">26</span></a>    <span class="k">for</span> <span class="n">_</span> <span class="ow">in</span> <span class="nb">range</span><span class="p">(</span><span class="n">n_layers</span><span class="p">):</span>
+</span><span id="get_n_layers-27"><a href="#get_n_layers-27"><span class="linenos">27</span></a>        <span class="n">layers</span><span class="o">.</span><span class="n">extend</span><span class="p">([</span><span class="n">nn</span><span class="o">.</span><span class="n">Linear</span><span class="p">(</span><span class="n">hidden_dim</span><span class="p">,</span> <span class="n">hidden_dim</span><span class="p">),</span> <span class="n">nn</span><span class="o">.</span><span class="n">ReLU</span><span class="p">()])</span>
+</span><span id="get_n_layers-28"><a href="#get_n_layers-28"><span class="linenos">28</span></a>    <span class="k">return</span> <span class="n">layers</span>
+</span></pre></div>
+
+
+            <div class="docstring"><p>Makes a list of <code>n_layers</code> <code>nn.Linear</code> layers with <code>nn.ReLU</code>.</p>
+
+<h6 id="arguments">Arguments:</h6>
+
+<ul>
+<li><strong>n_layers (<code>int</code>):</strong>  number of layers</li>
+<li><strong>hidden_dim (<code>int</code>):</strong>  size of the hidden dimension</li>
+</ul>
+
+<h6 id="returns">Returns:</h6>
+
+<blockquote>
+  <p><code>list[nn.Module]</code>: list of linear and relu layers.</p>
+</blockquote>
+</div>
+
+
+                </section>
+                <section id="GWDecoder">
+                            <input id="GWDecoder-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
+<div class="attr class">
+            
+    <span class="def">class</span>
+    <span class="name">GWDecoder</span><wbr>(<span class="base">torch.nn.modules.container.Sequential</span>):
+
+                <label class="view-source-button" for="GWDecoder-view-source"><span>View Source</span></label>
+
+    </div>
+    <a class="headerlink" href="#GWDecoder"></a>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="GWDecoder-31"><a href="#GWDecoder-31"><span class="linenos">31</span></a><span class="k">class</span> <span class="nc">GWDecoder</span><span class="p">(</span><span class="n">nn</span><span class="o">.</span><span class="n">Sequential</span><span class="p">):</span>
+</span><span id="GWDecoder-32"><a href="#GWDecoder-32"><span class="linenos">32</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;A Decoder network for GWModules.&quot;&quot;&quot;</span>
+</span><span id="GWDecoder-33"><a href="#GWDecoder-33"><span class="linenos">33</span></a>
+</span><span id="GWDecoder-34"><a href="#GWDecoder-34"><span class="linenos">34</span></a>    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span>
+</span><span id="GWDecoder-35"><a href="#GWDecoder-35"><span class="linenos">35</span></a>        <span class="bp">self</span><span class="p">,</span>
+</span><span id="GWDecoder-36"><a href="#GWDecoder-36"><span class="linenos">36</span></a>        <span class="n">in_dim</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span>
+</span><span id="GWDecoder-37"><a href="#GWDecoder-37"><span class="linenos">37</span></a>        <span class="n">hidden_dim</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span>
+</span><span id="GWDecoder-38"><a href="#GWDecoder-38"><span class="linenos">38</span></a>        <span class="n">out_dim</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span>
+</span><span id="GWDecoder-39"><a href="#GWDecoder-39"><span class="linenos">39</span></a>        <span class="n">n_layers</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span>
+</span><span id="GWDecoder-40"><a href="#GWDecoder-40"><span class="linenos">40</span></a>    <span class="p">):</span>
+</span><span id="GWDecoder-41"><a href="#GWDecoder-41"><span class="linenos">41</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="GWDecoder-42"><a href="#GWDecoder-42"><span class="linenos">42</span></a><span class="sd">        Initializes the decoder.</span>
+</span><span id="GWDecoder-43"><a href="#GWDecoder-43"><span class="linenos">43</span></a>
+</span><span id="GWDecoder-44"><a href="#GWDecoder-44"><span class="linenos">44</span></a><span class="sd">        Args:</span>
+</span><span id="GWDecoder-45"><a href="#GWDecoder-45"><span class="linenos">45</span></a><span class="sd">            in_dim (`int`): input dimension</span>
+</span><span id="GWDecoder-46"><a href="#GWDecoder-46"><span class="linenos">46</span></a><span class="sd">            hidden_dim (`int`): hidden dimension</span>
+</span><span id="GWDecoder-47"><a href="#GWDecoder-47"><span class="linenos">47</span></a><span class="sd">            out_dim (`int`): output dimension</span>
+</span><span id="GWDecoder-48"><a href="#GWDecoder-48"><span class="linenos">48</span></a><span class="sd">            n_layers (`int`): number of hidden layers. The total number of layers</span>
+</span><span id="GWDecoder-49"><a href="#GWDecoder-49"><span class="linenos">49</span></a><span class="sd">                will be `n_layers` + 2 (one before, one after).</span>
+</span><span id="GWDecoder-50"><a href="#GWDecoder-50"><span class="linenos">50</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="GWDecoder-51"><a href="#GWDecoder-51"><span class="linenos">51</span></a>
+</span><span id="GWDecoder-52"><a href="#GWDecoder-52"><span class="linenos">52</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">in_dim</span> <span class="o">=</span> <span class="n">in_dim</span>
+</span><span id="GWDecoder-53"><a href="#GWDecoder-53"><span class="linenos">53</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;input dimension&quot;&quot;&quot;</span>
+</span><span id="GWDecoder-54"><a href="#GWDecoder-54"><span class="linenos">54</span></a>
+</span><span id="GWDecoder-55"><a href="#GWDecoder-55"><span class="linenos">55</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">hidden_dim</span> <span class="o">=</span> <span class="n">hidden_dim</span>
+</span><span id="GWDecoder-56"><a href="#GWDecoder-56"><span class="linenos">56</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;hidden dimension&quot;&quot;&quot;</span>
+</span><span id="GWDecoder-57"><a href="#GWDecoder-57"><span class="linenos">57</span></a>
+</span><span id="GWDecoder-58"><a href="#GWDecoder-58"><span class="linenos">58</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">out_dim</span> <span class="o">=</span> <span class="n">out_dim</span>
+</span><span id="GWDecoder-59"><a href="#GWDecoder-59"><span class="linenos">59</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;output dimension&quot;&quot;&quot;</span>
+</span><span id="GWDecoder-60"><a href="#GWDecoder-60"><span class="linenos">60</span></a>
+</span><span id="GWDecoder-61"><a href="#GWDecoder-61"><span class="linenos">61</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">n_layers</span> <span class="o">=</span> <span class="n">n_layers</span>
+</span><span id="GWDecoder-62"><a href="#GWDecoder-62"><span class="linenos">62</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="GWDecoder-63"><a href="#GWDecoder-63"><span class="linenos">63</span></a><span class="sd">        number of hidden layers. The total number of layers</span>
+</span><span id="GWDecoder-64"><a href="#GWDecoder-64"><span class="linenos">64</span></a><span class="sd">                will be `n_layers` + 2 (one before, one after).&quot;&quot;&quot;</span>
+</span><span id="GWDecoder-65"><a href="#GWDecoder-65"><span class="linenos">65</span></a>
+</span><span id="GWDecoder-66"><a href="#GWDecoder-66"><span class="linenos">66</span></a>        <span class="nb">super</span><span class="p">()</span><span class="o">.</span><span class="fm">__init__</span><span class="p">(</span>
+</span><span id="GWDecoder-67"><a href="#GWDecoder-67"><span class="linenos">67</span></a>            <span class="n">nn</span><span class="o">.</span><span class="n">Linear</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">in_dim</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">hidden_dim</span><span class="p">),</span>
+</span><span id="GWDecoder-68"><a href="#GWDecoder-68"><span class="linenos">68</span></a>            <span class="n">nn</span><span class="o">.</span><span class="n">ReLU</span><span class="p">(),</span>
+</span><span id="GWDecoder-69"><a href="#GWDecoder-69"><span class="linenos">69</span></a>            <span class="o">*</span><span class="n">get_n_layers</span><span class="p">(</span><span class="n">n_layers</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">hidden_dim</span><span class="p">),</span>
+</span><span id="GWDecoder-70"><a href="#GWDecoder-70"><span class="linenos">70</span></a>            <span class="n">nn</span><span class="o">.</span><span class="n">Linear</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">hidden_dim</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">out_dim</span><span class="p">),</span>
+</span><span id="GWDecoder-71"><a href="#GWDecoder-71"><span class="linenos">71</span></a>        <span class="p">)</span>
+</span></pre></div>
+
+
+            <div class="docstring"><p>A Decoder network for GWModules.</p>
+</div>
+
+
+                            <div id="GWDecoder.__init__" class="classattr">
+                                        <input id="GWDecoder.__init__-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
+<div class="attr function">
+            
+        <span class="name">GWDecoder</span><span class="signature pdoc-code condensed">(<span class="param"><span class="n">in_dim</span><span class="p">:</span> <span class="nb">int</span>, </span><span class="param"><span class="n">hidden_dim</span><span class="p">:</span> <span class="nb">int</span>, </span><span class="param"><span class="n">out_dim</span><span class="p">:</span> <span class="nb">int</span>, </span><span class="param"><span class="n">n_layers</span><span class="p">:</span> <span class="nb">int</span></span>)</span>
+
+                <label class="view-source-button" for="GWDecoder.__init__-view-source"><span>View Source</span></label>
+
+    </div>
+    <a class="headerlink" href="#GWDecoder.__init__"></a>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="GWDecoder.__init__-34"><a href="#GWDecoder.__init__-34"><span class="linenos">34</span></a>    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span>
+</span><span id="GWDecoder.__init__-35"><a href="#GWDecoder.__init__-35"><span class="linenos">35</span></a>        <span class="bp">self</span><span class="p">,</span>
+</span><span id="GWDecoder.__init__-36"><a href="#GWDecoder.__init__-36"><span class="linenos">36</span></a>        <span class="n">in_dim</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span>
+</span><span id="GWDecoder.__init__-37"><a href="#GWDecoder.__init__-37"><span class="linenos">37</span></a>        <span class="n">hidden_dim</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span>
+</span><span id="GWDecoder.__init__-38"><a href="#GWDecoder.__init__-38"><span class="linenos">38</span></a>        <span class="n">out_dim</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span>
+</span><span id="GWDecoder.__init__-39"><a href="#GWDecoder.__init__-39"><span class="linenos">39</span></a>        <span class="n">n_layers</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span>
+</span><span id="GWDecoder.__init__-40"><a href="#GWDecoder.__init__-40"><span class="linenos">40</span></a>    <span class="p">):</span>
+</span><span id="GWDecoder.__init__-41"><a href="#GWDecoder.__init__-41"><span class="linenos">41</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="GWDecoder.__init__-42"><a href="#GWDecoder.__init__-42"><span class="linenos">42</span></a><span class="sd">        Initializes the decoder.</span>
+</span><span id="GWDecoder.__init__-43"><a href="#GWDecoder.__init__-43"><span class="linenos">43</span></a>
+</span><span id="GWDecoder.__init__-44"><a href="#GWDecoder.__init__-44"><span class="linenos">44</span></a><span class="sd">        Args:</span>
+</span><span id="GWDecoder.__init__-45"><a href="#GWDecoder.__init__-45"><span class="linenos">45</span></a><span class="sd">            in_dim (`int`): input dimension</span>
+</span><span id="GWDecoder.__init__-46"><a href="#GWDecoder.__init__-46"><span class="linenos">46</span></a><span class="sd">            hidden_dim (`int`): hidden dimension</span>
+</span><span id="GWDecoder.__init__-47"><a href="#GWDecoder.__init__-47"><span class="linenos">47</span></a><span class="sd">            out_dim (`int`): output dimension</span>
+</span><span id="GWDecoder.__init__-48"><a href="#GWDecoder.__init__-48"><span class="linenos">48</span></a><span class="sd">            n_layers (`int`): number of hidden layers. The total number of layers</span>
+</span><span id="GWDecoder.__init__-49"><a href="#GWDecoder.__init__-49"><span class="linenos">49</span></a><span class="sd">                will be `n_layers` + 2 (one before, one after).</span>
+</span><span id="GWDecoder.__init__-50"><a href="#GWDecoder.__init__-50"><span class="linenos">50</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="GWDecoder.__init__-51"><a href="#GWDecoder.__init__-51"><span class="linenos">51</span></a>
+</span><span id="GWDecoder.__init__-52"><a href="#GWDecoder.__init__-52"><span class="linenos">52</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">in_dim</span> <span class="o">=</span> <span class="n">in_dim</span>
+</span><span id="GWDecoder.__init__-53"><a href="#GWDecoder.__init__-53"><span class="linenos">53</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;input dimension&quot;&quot;&quot;</span>
+</span><span id="GWDecoder.__init__-54"><a href="#GWDecoder.__init__-54"><span class="linenos">54</span></a>
+</span><span id="GWDecoder.__init__-55"><a href="#GWDecoder.__init__-55"><span class="linenos">55</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">hidden_dim</span> <span class="o">=</span> <span class="n">hidden_dim</span>
+</span><span id="GWDecoder.__init__-56"><a href="#GWDecoder.__init__-56"><span class="linenos">56</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;hidden dimension&quot;&quot;&quot;</span>
+</span><span id="GWDecoder.__init__-57"><a href="#GWDecoder.__init__-57"><span class="linenos">57</span></a>
+</span><span id="GWDecoder.__init__-58"><a href="#GWDecoder.__init__-58"><span class="linenos">58</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">out_dim</span> <span class="o">=</span> <span class="n">out_dim</span>
+</span><span id="GWDecoder.__init__-59"><a href="#GWDecoder.__init__-59"><span class="linenos">59</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;output dimension&quot;&quot;&quot;</span>
+</span><span id="GWDecoder.__init__-60"><a href="#GWDecoder.__init__-60"><span class="linenos">60</span></a>
+</span><span id="GWDecoder.__init__-61"><a href="#GWDecoder.__init__-61"><span class="linenos">61</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">n_layers</span> <span class="o">=</span> <span class="n">n_layers</span>
+</span><span id="GWDecoder.__init__-62"><a href="#GWDecoder.__init__-62"><span class="linenos">62</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="GWDecoder.__init__-63"><a href="#GWDecoder.__init__-63"><span class="linenos">63</span></a><span class="sd">        number of hidden layers. The total number of layers</span>
+</span><span id="GWDecoder.__init__-64"><a href="#GWDecoder.__init__-64"><span class="linenos">64</span></a><span class="sd">                will be `n_layers` + 2 (one before, one after).&quot;&quot;&quot;</span>
+</span><span id="GWDecoder.__init__-65"><a href="#GWDecoder.__init__-65"><span class="linenos">65</span></a>
+</span><span id="GWDecoder.__init__-66"><a href="#GWDecoder.__init__-66"><span class="linenos">66</span></a>        <span class="nb">super</span><span class="p">()</span><span class="o">.</span><span class="fm">__init__</span><span class="p">(</span>
+</span><span id="GWDecoder.__init__-67"><a href="#GWDecoder.__init__-67"><span class="linenos">67</span></a>            <span class="n">nn</span><span class="o">.</span><span class="n">Linear</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">in_dim</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">hidden_dim</span><span class="p">),</span>
+</span><span id="GWDecoder.__init__-68"><a href="#GWDecoder.__init__-68"><span class="linenos">68</span></a>            <span class="n">nn</span><span class="o">.</span><span class="n">ReLU</span><span class="p">(),</span>
+</span><span id="GWDecoder.__init__-69"><a href="#GWDecoder.__init__-69"><span class="linenos">69</span></a>            <span class="o">*</span><span class="n">get_n_layers</span><span class="p">(</span><span class="n">n_layers</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">hidden_dim</span><span class="p">),</span>
+</span><span id="GWDecoder.__init__-70"><a href="#GWDecoder.__init__-70"><span class="linenos">70</span></a>            <span class="n">nn</span><span class="o">.</span><span class="n">Linear</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">hidden_dim</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">out_dim</span><span class="p">),</span>
+</span><span id="GWDecoder.__init__-71"><a href="#GWDecoder.__init__-71"><span class="linenos">71</span></a>        <span class="p">)</span>
+</span></pre></div>
+
+
+            <div class="docstring"><p>Initializes the decoder.</p>
+
+<h6 id="arguments">Arguments:</h6>
+
+<ul>
+<li><strong>in_dim (<code>int</code>):</strong>  input dimension</li>
+<li><strong>hidden_dim (<code>int</code>):</strong>  hidden dimension</li>
+<li><strong>out_dim (<code>int</code>):</strong>  output dimension</li>
+<li><strong>n_layers (<code>int</code>):</strong>  number of hidden layers. The total number of layers
+will be <code><a href="#GWDecoder.n_layers">n_layers</a></code> + 2 (one before, one after).</li>
+</ul>
+</div>
+
+
+                            </div>
+                            <div id="GWDecoder.in_dim" class="classattr">
+                                <div class="attr variable">
+            <span class="name">in_dim</span>
+
+        
+    </div>
+    <a class="headerlink" href="#GWDecoder.in_dim"></a>
+    
+            <div class="docstring"><p>input dimension</p>
+</div>
+
+
+                            </div>
+                            <div id="GWDecoder.hidden_dim" class="classattr">
+                                <div class="attr variable">
+            <span class="name">hidden_dim</span>
+
+        
+    </div>
+    <a class="headerlink" href="#GWDecoder.hidden_dim"></a>
+    
+            <div class="docstring"><p>hidden dimension</p>
+</div>
+
+
+                            </div>
+                            <div id="GWDecoder.out_dim" class="classattr">
+                                <div class="attr variable">
+            <span class="name">out_dim</span>
+
+        
+    </div>
+    <a class="headerlink" href="#GWDecoder.out_dim"></a>
+    
+            <div class="docstring"><p>output dimension</p>
+</div>
+
+
+                            </div>
+                            <div id="GWDecoder.n_layers" class="classattr">
+                                <div class="attr variable">
+            <span class="name">n_layers</span>
+
+        
+    </div>
+    <a class="headerlink" href="#GWDecoder.n_layers"></a>
+    
+            <div class="docstring"><p>number of hidden layers. The total number of layers
+        will be <code><a href="#GWDecoder.n_layers">n_layers</a></code> + 2 (one before, one after).</p>
+</div>
+
+
+                            </div>
+                            <div class="inherited">
+                                <h5>Inherited Members</h5>
+                                <dl>
+                                    <div><dt>torch.nn.modules.container.Sequential</dt>
+                                <dd id="GWDecoder.pop" class="function">pop</dd>
+                <dd id="GWDecoder.forward" class="function">forward</dd>
+                <dd id="GWDecoder.append" class="function">append</dd>
+                <dd id="GWDecoder.insert" class="function">insert</dd>
+                <dd id="GWDecoder.extend" class="function">extend</dd>
+
+            </div>
+            <div><dt>torch.nn.modules.module.Module</dt>
+                                <dd id="GWDecoder.dump_patches" class="variable">dump_patches</dd>
+                <dd id="GWDecoder.training" class="variable">training</dd>
+                <dd id="GWDecoder.call_super_init" class="variable">call_super_init</dd>
+                <dd id="GWDecoder.register_buffer" class="function">register_buffer</dd>
+                <dd id="GWDecoder.register_parameter" class="function">register_parameter</dd>
+                <dd id="GWDecoder.add_module" class="function">add_module</dd>
+                <dd id="GWDecoder.register_module" class="function">register_module</dd>
+                <dd id="GWDecoder.get_submodule" class="function">get_submodule</dd>
+                <dd id="GWDecoder.get_parameter" class="function">get_parameter</dd>
+                <dd id="GWDecoder.get_buffer" class="function">get_buffer</dd>
+                <dd id="GWDecoder.get_extra_state" class="function">get_extra_state</dd>
+                <dd id="GWDecoder.set_extra_state" class="function">set_extra_state</dd>
+                <dd id="GWDecoder.apply" class="function">apply</dd>
+                <dd id="GWDecoder.cuda" class="function">cuda</dd>
+                <dd id="GWDecoder.ipu" class="function">ipu</dd>
+                <dd id="GWDecoder.xpu" class="function">xpu</dd>
+                <dd id="GWDecoder.cpu" class="function">cpu</dd>
+                <dd id="GWDecoder.type" class="function">type</dd>
+                <dd id="GWDecoder.float" class="function">float</dd>
+                <dd id="GWDecoder.double" class="function">double</dd>
+                <dd id="GWDecoder.half" class="function">half</dd>
+                <dd id="GWDecoder.bfloat16" class="function">bfloat16</dd>
+                <dd id="GWDecoder.to_empty" class="function">to_empty</dd>
+                <dd id="GWDecoder.to" class="function">to</dd>
+                <dd id="GWDecoder.register_full_backward_pre_hook" class="function">register_full_backward_pre_hook</dd>
+                <dd id="GWDecoder.register_backward_hook" class="function">register_backward_hook</dd>
+                <dd id="GWDecoder.register_full_backward_hook" class="function">register_full_backward_hook</dd>
+                <dd id="GWDecoder.register_forward_pre_hook" class="function">register_forward_pre_hook</dd>
+                <dd id="GWDecoder.register_forward_hook" class="function">register_forward_hook</dd>
+                <dd id="GWDecoder.register_state_dict_pre_hook" class="function">register_state_dict_pre_hook</dd>
+                <dd id="GWDecoder.state_dict" class="function">state_dict</dd>
+                <dd id="GWDecoder.register_load_state_dict_post_hook" class="function">register_load_state_dict_post_hook</dd>
+                <dd id="GWDecoder.load_state_dict" class="function">load_state_dict</dd>
+                <dd id="GWDecoder.parameters" class="function">parameters</dd>
+                <dd id="GWDecoder.named_parameters" class="function">named_parameters</dd>
+                <dd id="GWDecoder.buffers" class="function">buffers</dd>
+                <dd id="GWDecoder.named_buffers" class="function">named_buffers</dd>
+                <dd id="GWDecoder.children" class="function">children</dd>
+                <dd id="GWDecoder.named_children" class="function">named_children</dd>
+                <dd id="GWDecoder.modules" class="function">modules</dd>
+                <dd id="GWDecoder.named_modules" class="function">named_modules</dd>
+                <dd id="GWDecoder.train" class="function">train</dd>
+                <dd id="GWDecoder.eval" class="function">eval</dd>
+                <dd id="GWDecoder.requires_grad_" class="function">requires_grad_</dd>
+                <dd id="GWDecoder.zero_grad" class="function">zero_grad</dd>
+                <dd id="GWDecoder.share_memory" class="function">share_memory</dd>
+                <dd id="GWDecoder.extra_repr" class="function">extra_repr</dd>
+                <dd id="GWDecoder.compile" class="function">compile</dd>
+
+            </div>
+                                </dl>
+                            </div>
+                </section>
+                <section id="GWEncoder">
+                            <input id="GWEncoder-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
+<div class="attr class">
+            
+    <span class="def">class</span>
+    <span class="name">GWEncoder</span><wbr>(<span class="base"><a href="#GWDecoder">GWDecoder</a></span>):
+
+                <label class="view-source-button" for="GWEncoder-view-source"><span>View Source</span></label>
+
+    </div>
+    <a class="headerlink" href="#GWEncoder"></a>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="GWEncoder-74"><a href="#GWEncoder-74"><span class="linenos"> 74</span></a><span class="k">class</span> <span class="nc">GWEncoder</span><span class="p">(</span><span class="n">GWDecoder</span><span class="p">):</span>
+</span><span id="GWEncoder-75"><a href="#GWEncoder-75"><span class="linenos"> 75</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="GWEncoder-76"><a href="#GWEncoder-76"><span class="linenos"> 76</span></a><span class="sd">    An Encoder network used in GWModules.</span>
+</span><span id="GWEncoder-77"><a href="#GWEncoder-77"><span class="linenos"> 77</span></a>
+</span><span id="GWEncoder-78"><a href="#GWEncoder-78"><span class="linenos"> 78</span></a><span class="sd">    This is similar to the decoder, but adds a tanh non-linearity at the end.</span>
+</span><span id="GWEncoder-79"><a href="#GWEncoder-79"><span class="linenos"> 79</span></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="GWEncoder-80"><a href="#GWEncoder-80"><span class="linenos"> 80</span></a>
+</span><span id="GWEncoder-81"><a href="#GWEncoder-81"><span class="linenos"> 81</span></a>    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span>
+</span><span id="GWEncoder-82"><a href="#GWEncoder-82"><span class="linenos"> 82</span></a>        <span class="bp">self</span><span class="p">,</span>
+</span><span id="GWEncoder-83"><a href="#GWEncoder-83"><span class="linenos"> 83</span></a>        <span class="n">in_dim</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span>
+</span><span id="GWEncoder-84"><a href="#GWEncoder-84"><span class="linenos"> 84</span></a>        <span class="n">hidden_dim</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span>
+</span><span id="GWEncoder-85"><a href="#GWEncoder-85"><span class="linenos"> 85</span></a>        <span class="n">out_dim</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span>
+</span><span id="GWEncoder-86"><a href="#GWEncoder-86"><span class="linenos"> 86</span></a>        <span class="n">n_layers</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span>
+</span><span id="GWEncoder-87"><a href="#GWEncoder-87"><span class="linenos"> 87</span></a>    <span class="p">):</span>
+</span><span id="GWEncoder-88"><a href="#GWEncoder-88"><span class="linenos"> 88</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="GWEncoder-89"><a href="#GWEncoder-89"><span class="linenos"> 89</span></a><span class="sd">        Initializes the encoder.</span>
+</span><span id="GWEncoder-90"><a href="#GWEncoder-90"><span class="linenos"> 90</span></a>
+</span><span id="GWEncoder-91"><a href="#GWEncoder-91"><span class="linenos"> 91</span></a><span class="sd">        Args:</span>
+</span><span id="GWEncoder-92"><a href="#GWEncoder-92"><span class="linenos"> 92</span></a><span class="sd">            in_dim (`int`): input dimension</span>
+</span><span id="GWEncoder-93"><a href="#GWEncoder-93"><span class="linenos"> 93</span></a><span class="sd">            hidden_dim (`int`): hidden dimension</span>
+</span><span id="GWEncoder-94"><a href="#GWEncoder-94"><span class="linenos"> 94</span></a><span class="sd">            out_dim (`int`): output dimension</span>
+</span><span id="GWEncoder-95"><a href="#GWEncoder-95"><span class="linenos"> 95</span></a><span class="sd">            n_layers (`int`): number of hidden layers. The total number of layers</span>
+</span><span id="GWEncoder-96"><a href="#GWEncoder-96"><span class="linenos"> 96</span></a><span class="sd">                will be `n_layers` + 2 (one before, one after).</span>
+</span><span id="GWEncoder-97"><a href="#GWEncoder-97"><span class="linenos"> 97</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="GWEncoder-98"><a href="#GWEncoder-98"><span class="linenos"> 98</span></a>        <span class="nb">super</span><span class="p">()</span><span class="o">.</span><span class="fm">__init__</span><span class="p">(</span><span class="n">in_dim</span><span class="p">,</span> <span class="n">hidden_dim</span><span class="p">,</span> <span class="n">out_dim</span><span class="p">,</span> <span class="n">n_layers</span><span class="p">)</span>
+</span><span id="GWEncoder-99"><a href="#GWEncoder-99"><span class="linenos"> 99</span></a>
+</span><span id="GWEncoder-100"><a href="#GWEncoder-100"><span class="linenos">100</span></a>    <span class="k">def</span> <span class="nf">forward</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="nb">input</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">:</span>
+</span><span id="GWEncoder-101"><a href="#GWEncoder-101"><span class="linenos">101</span></a>        <span class="k">return</span> <span class="nb">super</span><span class="p">()</span><span class="o">.</span><span class="n">forward</span><span class="p">(</span><span class="nb">input</span><span class="p">)</span>
+</span></pre></div>
+
+
+            <div class="docstring"><p>An Encoder network used in GWModules.</p>
+
+<p>This is similar to the decoder, but adds a tanh non-linearity at the end.</p>
+</div>
+
+
+                            <div id="GWEncoder.__init__" class="classattr">
+                                        <input id="GWEncoder.__init__-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
+<div class="attr function">
+            
+        <span class="name">GWEncoder</span><span class="signature pdoc-code condensed">(<span class="param"><span class="n">in_dim</span><span class="p">:</span> <span class="nb">int</span>, </span><span class="param"><span class="n">hidden_dim</span><span class="p">:</span> <span class="nb">int</span>, </span><span class="param"><span class="n">out_dim</span><span class="p">:</span> <span class="nb">int</span>, </span><span class="param"><span class="n">n_layers</span><span class="p">:</span> <span class="nb">int</span></span>)</span>
+
+                <label class="view-source-button" for="GWEncoder.__init__-view-source"><span>View Source</span></label>
+
+    </div>
+    <a class="headerlink" href="#GWEncoder.__init__"></a>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="GWEncoder.__init__-81"><a href="#GWEncoder.__init__-81"><span class="linenos">81</span></a>    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span>
+</span><span id="GWEncoder.__init__-82"><a href="#GWEncoder.__init__-82"><span class="linenos">82</span></a>        <span class="bp">self</span><span class="p">,</span>
+</span><span id="GWEncoder.__init__-83"><a href="#GWEncoder.__init__-83"><span class="linenos">83</span></a>        <span class="n">in_dim</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span>
+</span><span id="GWEncoder.__init__-84"><a href="#GWEncoder.__init__-84"><span class="linenos">84</span></a>        <span class="n">hidden_dim</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span>
+</span><span id="GWEncoder.__init__-85"><a href="#GWEncoder.__init__-85"><span class="linenos">85</span></a>        <span class="n">out_dim</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span>
+</span><span id="GWEncoder.__init__-86"><a href="#GWEncoder.__init__-86"><span class="linenos">86</span></a>        <span class="n">n_layers</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span>
+</span><span id="GWEncoder.__init__-87"><a href="#GWEncoder.__init__-87"><span class="linenos">87</span></a>    <span class="p">):</span>
+</span><span id="GWEncoder.__init__-88"><a href="#GWEncoder.__init__-88"><span class="linenos">88</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="GWEncoder.__init__-89"><a href="#GWEncoder.__init__-89"><span class="linenos">89</span></a><span class="sd">        Initializes the encoder.</span>
+</span><span id="GWEncoder.__init__-90"><a href="#GWEncoder.__init__-90"><span class="linenos">90</span></a>
+</span><span id="GWEncoder.__init__-91"><a href="#GWEncoder.__init__-91"><span class="linenos">91</span></a><span class="sd">        Args:</span>
+</span><span id="GWEncoder.__init__-92"><a href="#GWEncoder.__init__-92"><span class="linenos">92</span></a><span class="sd">            in_dim (`int`): input dimension</span>
+</span><span id="GWEncoder.__init__-93"><a href="#GWEncoder.__init__-93"><span class="linenos">93</span></a><span class="sd">            hidden_dim (`int`): hidden dimension</span>
+</span><span id="GWEncoder.__init__-94"><a href="#GWEncoder.__init__-94"><span class="linenos">94</span></a><span class="sd">            out_dim (`int`): output dimension</span>
+</span><span id="GWEncoder.__init__-95"><a href="#GWEncoder.__init__-95"><span class="linenos">95</span></a><span class="sd">            n_layers (`int`): number of hidden layers. The total number of layers</span>
+</span><span id="GWEncoder.__init__-96"><a href="#GWEncoder.__init__-96"><span class="linenos">96</span></a><span class="sd">                will be `n_layers` + 2 (one before, one after).</span>
+</span><span id="GWEncoder.__init__-97"><a href="#GWEncoder.__init__-97"><span class="linenos">97</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="GWEncoder.__init__-98"><a href="#GWEncoder.__init__-98"><span class="linenos">98</span></a>        <span class="nb">super</span><span class="p">()</span><span class="o">.</span><span class="fm">__init__</span><span class="p">(</span><span class="n">in_dim</span><span class="p">,</span> <span class="n">hidden_dim</span><span class="p">,</span> <span class="n">out_dim</span><span class="p">,</span> <span class="n">n_layers</span><span class="p">)</span>
+</span></pre></div>
+
+
+            <div class="docstring"><p>Initializes the encoder.</p>
+
+<h6 id="arguments">Arguments:</h6>
+
+<ul>
+<li><strong>in_dim (<code>int</code>):</strong>  input dimension</li>
+<li><strong>hidden_dim (<code>int</code>):</strong>  hidden dimension</li>
+<li><strong>out_dim (<code>int</code>):</strong>  output dimension</li>
+<li><strong>n_layers (<code>int</code>):</strong>  number of hidden layers. The total number of layers
+will be <code><a href="#GWEncoder.n_layers">n_layers</a></code> + 2 (one before, one after).</li>
+</ul>
+</div>
+
+
+                            </div>
+                            <div id="GWEncoder.forward" class="classattr">
+                                        <input id="GWEncoder.forward-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
+<div class="attr function">
+            
+        <span class="def">def</span>
+        <span class="name">forward</span><span class="signature pdoc-code condensed">(<span class="param"><span class="bp">self</span>, </span><span class="param"><span class="nb">input</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span></span><span class="return-annotation">) -> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span>:</span></span>
+
+                <label class="view-source-button" for="GWEncoder.forward-view-source"><span>View Source</span></label>
+
+    </div>
+    <a class="headerlink" href="#GWEncoder.forward"></a>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="GWEncoder.forward-100"><a href="#GWEncoder.forward-100"><span class="linenos">100</span></a>    <span class="k">def</span> <span class="nf">forward</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="nb">input</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">:</span>
+</span><span id="GWEncoder.forward-101"><a href="#GWEncoder.forward-101"><span class="linenos">101</span></a>        <span class="k">return</span> <span class="nb">super</span><span class="p">()</span><span class="o">.</span><span class="n">forward</span><span class="p">(</span><span class="nb">input</span><span class="p">)</span>
+</span></pre></div>
+
+
+            <div class="docstring"><p>Define the computation performed at every call.</p>
+
+<p>Should be overridden by all subclasses.</p>
+
+<div class="pdoc-alert pdoc-alert-note">
+
+<p>Although the recipe for forward pass needs to be defined within
+this function, one should call the <code>Module</code> instance afterwards
+instead of this since the former takes care of running the
+registered hooks while the latter silently ignores them.</p>
+
+</div>
+</div>
+
+
+                            </div>
+                            <div class="inherited">
+                                <h5>Inherited Members</h5>
+                                <dl>
+                                    <div><dt><a href="#GWDecoder">GWDecoder</a></dt>
+                                <dd id="GWEncoder.in_dim" class="variable"><a href="#GWDecoder.in_dim">in_dim</a></dd>
+                <dd id="GWEncoder.hidden_dim" class="variable"><a href="#GWDecoder.hidden_dim">hidden_dim</a></dd>
+                <dd id="GWEncoder.out_dim" class="variable"><a href="#GWDecoder.out_dim">out_dim</a></dd>
+                <dd id="GWEncoder.n_layers" class="variable"><a href="#GWDecoder.n_layers">n_layers</a></dd>
+
+            </div>
+            <div><dt>torch.nn.modules.container.Sequential</dt>
+                                <dd id="GWEncoder.pop" class="function">pop</dd>
+                <dd id="GWEncoder.append" class="function">append</dd>
+                <dd id="GWEncoder.insert" class="function">insert</dd>
+                <dd id="GWEncoder.extend" class="function">extend</dd>
+
+            </div>
+            <div><dt>torch.nn.modules.module.Module</dt>
+                                <dd id="GWEncoder.dump_patches" class="variable">dump_patches</dd>
+                <dd id="GWEncoder.training" class="variable">training</dd>
+                <dd id="GWEncoder.call_super_init" class="variable">call_super_init</dd>
+                <dd id="GWEncoder.register_buffer" class="function">register_buffer</dd>
+                <dd id="GWEncoder.register_parameter" class="function">register_parameter</dd>
+                <dd id="GWEncoder.add_module" class="function">add_module</dd>
+                <dd id="GWEncoder.register_module" class="function">register_module</dd>
+                <dd id="GWEncoder.get_submodule" class="function">get_submodule</dd>
+                <dd id="GWEncoder.get_parameter" class="function">get_parameter</dd>
+                <dd id="GWEncoder.get_buffer" class="function">get_buffer</dd>
+                <dd id="GWEncoder.get_extra_state" class="function">get_extra_state</dd>
+                <dd id="GWEncoder.set_extra_state" class="function">set_extra_state</dd>
+                <dd id="GWEncoder.apply" class="function">apply</dd>
+                <dd id="GWEncoder.cuda" class="function">cuda</dd>
+                <dd id="GWEncoder.ipu" class="function">ipu</dd>
+                <dd id="GWEncoder.xpu" class="function">xpu</dd>
+                <dd id="GWEncoder.cpu" class="function">cpu</dd>
+                <dd id="GWEncoder.type" class="function">type</dd>
+                <dd id="GWEncoder.float" class="function">float</dd>
+                <dd id="GWEncoder.double" class="function">double</dd>
+                <dd id="GWEncoder.half" class="function">half</dd>
+                <dd id="GWEncoder.bfloat16" class="function">bfloat16</dd>
+                <dd id="GWEncoder.to_empty" class="function">to_empty</dd>
+                <dd id="GWEncoder.to" class="function">to</dd>
+                <dd id="GWEncoder.register_full_backward_pre_hook" class="function">register_full_backward_pre_hook</dd>
+                <dd id="GWEncoder.register_backward_hook" class="function">register_backward_hook</dd>
+                <dd id="GWEncoder.register_full_backward_hook" class="function">register_full_backward_hook</dd>
+                <dd id="GWEncoder.register_forward_pre_hook" class="function">register_forward_pre_hook</dd>
+                <dd id="GWEncoder.register_forward_hook" class="function">register_forward_hook</dd>
+                <dd id="GWEncoder.register_state_dict_pre_hook" class="function">register_state_dict_pre_hook</dd>
+                <dd id="GWEncoder.state_dict" class="function">state_dict</dd>
+                <dd id="GWEncoder.register_load_state_dict_post_hook" class="function">register_load_state_dict_post_hook</dd>
+                <dd id="GWEncoder.load_state_dict" class="function">load_state_dict</dd>
+                <dd id="GWEncoder.parameters" class="function">parameters</dd>
+                <dd id="GWEncoder.named_parameters" class="function">named_parameters</dd>
+                <dd id="GWEncoder.buffers" class="function">buffers</dd>
+                <dd id="GWEncoder.named_buffers" class="function">named_buffers</dd>
+                <dd id="GWEncoder.children" class="function">children</dd>
+                <dd id="GWEncoder.named_children" class="function">named_children</dd>
+                <dd id="GWEncoder.modules" class="function">modules</dd>
+                <dd id="GWEncoder.named_modules" class="function">named_modules</dd>
+                <dd id="GWEncoder.train" class="function">train</dd>
+                <dd id="GWEncoder.eval" class="function">eval</dd>
+                <dd id="GWEncoder.requires_grad_" class="function">requires_grad_</dd>
+                <dd id="GWEncoder.zero_grad" class="function">zero_grad</dd>
+                <dd id="GWEncoder.share_memory" class="function">share_memory</dd>
+                <dd id="GWEncoder.extra_repr" class="function">extra_repr</dd>
+                <dd id="GWEncoder.compile" class="function">compile</dd>
+
+            </div>
+                                </dl>
+                            </div>
+                </section>
+                <section id="GWEncoderLinear">
+                            <input id="GWEncoderLinear-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
+<div class="attr class">
+            
+    <span class="def">class</span>
+    <span class="name">GWEncoderLinear</span><wbr>(<span class="base">torch.nn.modules.linear.Linear</span>):
+
+                <label class="view-source-button" for="GWEncoderLinear-view-source"><span>View Source</span></label>
+
+    </div>
+    <a class="headerlink" href="#GWEncoderLinear"></a>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="GWEncoderLinear-104"><a href="#GWEncoderLinear-104"><span class="linenos">104</span></a><span class="k">class</span> <span class="nc">GWEncoderLinear</span><span class="p">(</span><span class="n">nn</span><span class="o">.</span><span class="n">Linear</span><span class="p">):</span>
+</span><span id="GWEncoderLinear-105"><a href="#GWEncoderLinear-105"><span class="linenos">105</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;A linear Encoder network used in GWModules.&quot;&quot;&quot;</span>
+</span><span id="GWEncoderLinear-106"><a href="#GWEncoderLinear-106"><span class="linenos">106</span></a>
+</span><span id="GWEncoderLinear-107"><a href="#GWEncoderLinear-107"><span class="linenos">107</span></a>    <span class="k">def</span> <span class="nf">forward</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="nb">input</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">:</span>
+</span><span id="GWEncoderLinear-108"><a href="#GWEncoderLinear-108"><span class="linenos">108</span></a>        <span class="k">return</span> <span class="n">torch</span><span class="o">.</span><span class="n">tanh</span><span class="p">(</span><span class="nb">super</span><span class="p">()</span><span class="o">.</span><span class="n">forward</span><span class="p">(</span><span class="nb">input</span><span class="p">))</span>
+</span></pre></div>
+
+
+            <div class="docstring"><p>A linear Encoder network used in GWModules.</p>
+</div>
+
+
+                            <div id="GWEncoderLinear.forward" class="classattr">
+                                        <input id="GWEncoderLinear.forward-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
+<div class="attr function">
+            
+        <span class="def">def</span>
+        <span class="name">forward</span><span class="signature pdoc-code condensed">(<span class="param"><span class="bp">self</span>, </span><span class="param"><span class="nb">input</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span></span><span class="return-annotation">) -> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span>:</span></span>
+
+                <label class="view-source-button" for="GWEncoderLinear.forward-view-source"><span>View Source</span></label>
+
+    </div>
+    <a class="headerlink" href="#GWEncoderLinear.forward"></a>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="GWEncoderLinear.forward-107"><a href="#GWEncoderLinear.forward-107"><span class="linenos">107</span></a>    <span class="k">def</span> <span class="nf">forward</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="nb">input</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">:</span>
+</span><span id="GWEncoderLinear.forward-108"><a href="#GWEncoderLinear.forward-108"><span class="linenos">108</span></a>        <span class="k">return</span> <span class="n">torch</span><span class="o">.</span><span class="n">tanh</span><span class="p">(</span><span class="nb">super</span><span class="p">()</span><span class="o">.</span><span class="n">forward</span><span class="p">(</span><span class="nb">input</span><span class="p">))</span>
+</span></pre></div>
+
+
+            <div class="docstring"><p>Define the computation performed at every call.</p>
+
+<p>Should be overridden by all subclasses.</p>
+
+<div class="pdoc-alert pdoc-alert-note">
+
+<p>Although the recipe for forward pass needs to be defined within
+this function, one should call the <code>Module</code> instance afterwards
+instead of this since the former takes care of running the
+registered hooks while the latter silently ignores them.</p>
+
+</div>
+</div>
+
+
+                            </div>
+                            <div class="inherited">
+                                <h5>Inherited Members</h5>
+                                <dl>
+                                    <div><dt>torch.nn.modules.linear.Linear</dt>
+                                <dd id="GWEncoderLinear.__init__" class="function">Linear</dd>
+                <dd id="GWEncoderLinear.in_features" class="variable">in_features</dd>
+                <dd id="GWEncoderLinear.out_features" class="variable">out_features</dd>
+                <dd id="GWEncoderLinear.weight" class="variable">weight</dd>
+                <dd id="GWEncoderLinear.reset_parameters" class="function">reset_parameters</dd>
+                <dd id="GWEncoderLinear.extra_repr" class="function">extra_repr</dd>
+
+            </div>
+            <div><dt>torch.nn.modules.module.Module</dt>
+                                <dd id="GWEncoderLinear.dump_patches" class="variable">dump_patches</dd>
+                <dd id="GWEncoderLinear.training" class="variable">training</dd>
+                <dd id="GWEncoderLinear.call_super_init" class="variable">call_super_init</dd>
+                <dd id="GWEncoderLinear.register_buffer" class="function">register_buffer</dd>
+                <dd id="GWEncoderLinear.register_parameter" class="function">register_parameter</dd>
+                <dd id="GWEncoderLinear.add_module" class="function">add_module</dd>
+                <dd id="GWEncoderLinear.register_module" class="function">register_module</dd>
+                <dd id="GWEncoderLinear.get_submodule" class="function">get_submodule</dd>
+                <dd id="GWEncoderLinear.get_parameter" class="function">get_parameter</dd>
+                <dd id="GWEncoderLinear.get_buffer" class="function">get_buffer</dd>
+                <dd id="GWEncoderLinear.get_extra_state" class="function">get_extra_state</dd>
+                <dd id="GWEncoderLinear.set_extra_state" class="function">set_extra_state</dd>
+                <dd id="GWEncoderLinear.apply" class="function">apply</dd>
+                <dd id="GWEncoderLinear.cuda" class="function">cuda</dd>
+                <dd id="GWEncoderLinear.ipu" class="function">ipu</dd>
+                <dd id="GWEncoderLinear.xpu" class="function">xpu</dd>
+                <dd id="GWEncoderLinear.cpu" class="function">cpu</dd>
+                <dd id="GWEncoderLinear.type" class="function">type</dd>
+                <dd id="GWEncoderLinear.float" class="function">float</dd>
+                <dd id="GWEncoderLinear.double" class="function">double</dd>
+                <dd id="GWEncoderLinear.half" class="function">half</dd>
+                <dd id="GWEncoderLinear.bfloat16" class="function">bfloat16</dd>
+                <dd id="GWEncoderLinear.to_empty" class="function">to_empty</dd>
+                <dd id="GWEncoderLinear.to" class="function">to</dd>
+                <dd id="GWEncoderLinear.register_full_backward_pre_hook" class="function">register_full_backward_pre_hook</dd>
+                <dd id="GWEncoderLinear.register_backward_hook" class="function">register_backward_hook</dd>
+                <dd id="GWEncoderLinear.register_full_backward_hook" class="function">register_full_backward_hook</dd>
+                <dd id="GWEncoderLinear.register_forward_pre_hook" class="function">register_forward_pre_hook</dd>
+                <dd id="GWEncoderLinear.register_forward_hook" class="function">register_forward_hook</dd>
+                <dd id="GWEncoderLinear.register_state_dict_pre_hook" class="function">register_state_dict_pre_hook</dd>
+                <dd id="GWEncoderLinear.state_dict" class="function">state_dict</dd>
+                <dd id="GWEncoderLinear.register_load_state_dict_post_hook" class="function">register_load_state_dict_post_hook</dd>
+                <dd id="GWEncoderLinear.load_state_dict" class="function">load_state_dict</dd>
+                <dd id="GWEncoderLinear.parameters" class="function">parameters</dd>
+                <dd id="GWEncoderLinear.named_parameters" class="function">named_parameters</dd>
+                <dd id="GWEncoderLinear.buffers" class="function">buffers</dd>
+                <dd id="GWEncoderLinear.named_buffers" class="function">named_buffers</dd>
+                <dd id="GWEncoderLinear.children" class="function">children</dd>
+                <dd id="GWEncoderLinear.named_children" class="function">named_children</dd>
+                <dd id="GWEncoderLinear.modules" class="function">modules</dd>
+                <dd id="GWEncoderLinear.named_modules" class="function">named_modules</dd>
+                <dd id="GWEncoderLinear.train" class="function">train</dd>
+                <dd id="GWEncoderLinear.eval" class="function">eval</dd>
+                <dd id="GWEncoderLinear.requires_grad_" class="function">requires_grad_</dd>
+                <dd id="GWEncoderLinear.zero_grad" class="function">zero_grad</dd>
+                <dd id="GWEncoderLinear.share_memory" class="function">share_memory</dd>
+                <dd id="GWEncoderLinear.compile" class="function">compile</dd>
+
+            </div>
+                                </dl>
+                            </div>
+                </section>
+                <section id="GWModuleBase">
+                            <input id="GWModuleBase-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
+<div class="attr class">
+            
+    <span class="def">class</span>
+    <span class="name">GWModuleBase</span><wbr>(<span class="base">torch.nn.modules.module.Module</span>, <span class="base">abc.ABC</span>):
+
+                <label class="view-source-button" for="GWModuleBase-view-source"><span>View Source</span></label>
+
+    </div>
+    <a class="headerlink" href="#GWModuleBase"></a>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="GWModuleBase-111"><a href="#GWModuleBase-111"><span class="linenos">111</span></a><span class="k">class</span> <span class="nc">GWModuleBase</span><span class="p">(</span><span class="n">nn</span><span class="o">.</span><span class="n">Module</span><span class="p">,</span> <span class="n">ABC</span><span class="p">):</span>
+</span><span id="GWModuleBase-112"><a href="#GWModuleBase-112"><span class="linenos">112</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="GWModuleBase-113"><a href="#GWModuleBase-113"><span class="linenos">113</span></a><span class="sd">    Base class for GWModule.</span>
+</span><span id="GWModuleBase-114"><a href="#GWModuleBase-114"><span class="linenos">114</span></a>
+</span><span id="GWModuleBase-115"><a href="#GWModuleBase-115"><span class="linenos">115</span></a><span class="sd">    GWModule handles encoding, decoding the unimodal representations</span>
+</span><span id="GWModuleBase-116"><a href="#GWModuleBase-116"><span class="linenos">116</span></a><span class="sd">    using the `gw_encoders` and`gw_decoders`, and define</span>
+</span><span id="GWModuleBase-117"><a href="#GWModuleBase-117"><span class="linenos">117</span></a><span class="sd">    some common operations in GW like cycles and translations.</span>
+</span><span id="GWModuleBase-118"><a href="#GWModuleBase-118"><span class="linenos">118</span></a>
+</span><span id="GWModuleBase-119"><a href="#GWModuleBase-119"><span class="linenos">119</span></a><span class="sd">    This is an abstract class and should be implemented.</span>
+</span><span id="GWModuleBase-120"><a href="#GWModuleBase-120"><span class="linenos">120</span></a><span class="sd">    For an implemented interface, see `GWModule`.</span>
+</span><span id="GWModuleBase-121"><a href="#GWModuleBase-121"><span class="linenos">121</span></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="GWModuleBase-122"><a href="#GWModuleBase-122"><span class="linenos">122</span></a>
+</span><span id="GWModuleBase-123"><a href="#GWModuleBase-123"><span class="linenos">123</span></a>    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span>
+</span><span id="GWModuleBase-124"><a href="#GWModuleBase-124"><span class="linenos">124</span></a>        <span class="bp">self</span><span class="p">,</span>
+</span><span id="GWModuleBase-125"><a href="#GWModuleBase-125"><span class="linenos">125</span></a>        <span class="n">domain_mods</span><span class="p">:</span> <span class="n">Mapping</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">DomainModule</span><span class="p">],</span>
+</span><span id="GWModuleBase-126"><a href="#GWModuleBase-126"><span class="linenos">126</span></a>        <span class="n">workspace_dim</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span>
+</span><span id="GWModuleBase-127"><a href="#GWModuleBase-127"><span class="linenos">127</span></a>        <span class="o">*</span><span class="n">args</span><span class="p">,</span>
+</span><span id="GWModuleBase-128"><a href="#GWModuleBase-128"><span class="linenos">128</span></a>        <span class="o">**</span><span class="n">kwargs</span><span class="p">,</span>
+</span><span id="GWModuleBase-129"><a href="#GWModuleBase-129"><span class="linenos">129</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="GWModuleBase-130"><a href="#GWModuleBase-130"><span class="linenos">130</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="GWModuleBase-131"><a href="#GWModuleBase-131"><span class="linenos">131</span></a><span class="sd">        Initializes the GWModule.</span>
+</span><span id="GWModuleBase-132"><a href="#GWModuleBase-132"><span class="linenos">132</span></a>
+</span><span id="GWModuleBase-133"><a href="#GWModuleBase-133"><span class="linenos">133</span></a><span class="sd">        Args:</span>
+</span><span id="GWModuleBase-134"><a href="#GWModuleBase-134"><span class="linenos">134</span></a><span class="sd">            domain_modules (`Mapping[str, DomainModule]`): the domain modules.</span>
+</span><span id="GWModuleBase-135"><a href="#GWModuleBase-135"><span class="linenos">135</span></a><span class="sd">            workspace_dim (`int`): dimension of the GW.</span>
+</span><span id="GWModuleBase-136"><a href="#GWModuleBase-136"><span class="linenos">136</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="GWModuleBase-137"><a href="#GWModuleBase-137"><span class="linenos">137</span></a>        <span class="nb">super</span><span class="p">()</span><span class="o">.</span><span class="fm">__init__</span><span class="p">()</span>
+</span><span id="GWModuleBase-138"><a href="#GWModuleBase-138"><span class="linenos">138</span></a>
+</span><span id="GWModuleBase-139"><a href="#GWModuleBase-139"><span class="linenos">139</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">domain_mods</span> <span class="o">=</span> <span class="n">domain_mods</span>
+</span><span id="GWModuleBase-140"><a href="#GWModuleBase-140"><span class="linenos">140</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;The unimodal domain modules.&quot;&quot;&quot;</span>
+</span><span id="GWModuleBase-141"><a href="#GWModuleBase-141"><span class="linenos">141</span></a>
+</span><span id="GWModuleBase-142"><a href="#GWModuleBase-142"><span class="linenos">142</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">workspace_dim</span> <span class="o">=</span> <span class="n">workspace_dim</span>
+</span><span id="GWModuleBase-143"><a href="#GWModuleBase-143"><span class="linenos">143</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;Dimension of the GW&quot;&quot;&quot;</span>
+</span><span id="GWModuleBase-144"><a href="#GWModuleBase-144"><span class="linenos">144</span></a>
+</span><span id="GWModuleBase-145"><a href="#GWModuleBase-145"><span class="linenos">145</span></a>    <span class="nd">@abstractmethod</span>
+</span><span id="GWModuleBase-146"><a href="#GWModuleBase-146"><span class="linenos">146</span></a>    <span class="k">def</span> <span class="nf">fuse</span><span class="p">(</span>
+</span><span id="GWModuleBase-147"><a href="#GWModuleBase-147"><span class="linenos">147</span></a>        <span class="bp">self</span><span class="p">,</span> <span class="n">x</span><span class="p">:</span> <span class="n">LatentsDomainGroupT</span><span class="p">,</span> <span class="n">selection_scores</span><span class="p">:</span> <span class="n">Mapping</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]</span>
+</span><span id="GWModuleBase-148"><a href="#GWModuleBase-148"><span class="linenos">148</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">:</span>
+</span><span id="GWModuleBase-149"><a href="#GWModuleBase-149"><span class="linenos">149</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="GWModuleBase-150"><a href="#GWModuleBase-150"><span class="linenos">150</span></a><span class="sd">        Merge function used to combine domains.</span>
+</span><span id="GWModuleBase-151"><a href="#GWModuleBase-151"><span class="linenos">151</span></a>
+</span><span id="GWModuleBase-152"><a href="#GWModuleBase-152"><span class="linenos">152</span></a><span class="sd">        Args:</span>
+</span><span id="GWModuleBase-153"><a href="#GWModuleBase-153"><span class="linenos">153</span></a><span class="sd">            x (`LatentsDomainGroupT`): the group of latent representation.</span>
+</span><span id="GWModuleBase-154"><a href="#GWModuleBase-154"><span class="linenos">154</span></a><span class="sd">            selection_score (`Mapping[str, torch.Tensor]`): attention scores to</span>
+</span><span id="GWModuleBase-155"><a href="#GWModuleBase-155"><span class="linenos">155</span></a><span class="sd">                use to encode the reprensetation.</span>
+</span><span id="GWModuleBase-156"><a href="#GWModuleBase-156"><span class="linenos">156</span></a><span class="sd">        Returns:</span>
+</span><span id="GWModuleBase-157"><a href="#GWModuleBase-157"><span class="linenos">157</span></a><span class="sd">            `torch.Tensor`: The merged representation.</span>
+</span><span id="GWModuleBase-158"><a href="#GWModuleBase-158"><span class="linenos">158</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="GWModuleBase-159"><a href="#GWModuleBase-159"><span class="linenos">159</span></a>        <span class="o">...</span>
+</span><span id="GWModuleBase-160"><a href="#GWModuleBase-160"><span class="linenos">160</span></a>
+</span><span id="GWModuleBase-161"><a href="#GWModuleBase-161"><span class="linenos">161</span></a>    <span class="nd">@abstractmethod</span>
+</span><span id="GWModuleBase-162"><a href="#GWModuleBase-162"><span class="linenos">162</span></a>    <span class="k">def</span> <span class="nf">encode</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">x</span><span class="p">:</span> <span class="n">LatentsDomainGroupT</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">LatentsDomainGroupDT</span><span class="p">:</span>
+</span><span id="GWModuleBase-163"><a href="#GWModuleBase-163"><span class="linenos">163</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="GWModuleBase-164"><a href="#GWModuleBase-164"><span class="linenos">164</span></a><span class="sd">        Encode the latent representation infos to the pre-fusion GW representation.</span>
+</span><span id="GWModuleBase-165"><a href="#GWModuleBase-165"><span class="linenos">165</span></a>
+</span><span id="GWModuleBase-166"><a href="#GWModuleBase-166"><span class="linenos">166</span></a><span class="sd">        Args:</span>
+</span><span id="GWModuleBase-167"><a href="#GWModuleBase-167"><span class="linenos">167</span></a><span class="sd">            x (`LatentsDomainGroupT`): the input domain representations</span>
+</span><span id="GWModuleBase-168"><a href="#GWModuleBase-168"><span class="linenos">168</span></a>
+</span><span id="GWModuleBase-169"><a href="#GWModuleBase-169"><span class="linenos">169</span></a><span class="sd">        Returns:</span>
+</span><span id="GWModuleBase-170"><a href="#GWModuleBase-170"><span class="linenos">170</span></a><span class="sd">            `LatentsDomainGroupT`: pre-fusion GW representations</span>
+</span><span id="GWModuleBase-171"><a href="#GWModuleBase-171"><span class="linenos">171</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="GWModuleBase-172"><a href="#GWModuleBase-172"><span class="linenos">172</span></a>        <span class="o">...</span>
+</span><span id="GWModuleBase-173"><a href="#GWModuleBase-173"><span class="linenos">173</span></a>
+</span><span id="GWModuleBase-174"><a href="#GWModuleBase-174"><span class="linenos">174</span></a>    <span class="k">def</span> <span class="nf">encode_and_fuse</span><span class="p">(</span>
+</span><span id="GWModuleBase-175"><a href="#GWModuleBase-175"><span class="linenos">175</span></a>        <span class="bp">self</span><span class="p">,</span> <span class="n">x</span><span class="p">:</span> <span class="n">LatentsDomainGroupT</span><span class="p">,</span> <span class="n">selection_module</span><span class="p">:</span> <span class="n">SelectionBase</span>
+</span><span id="GWModuleBase-176"><a href="#GWModuleBase-176"><span class="linenos">176</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">:</span>
+</span><span id="GWModuleBase-177"><a href="#GWModuleBase-177"><span class="linenos">177</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="GWModuleBase-178"><a href="#GWModuleBase-178"><span class="linenos">178</span></a><span class="sd">        Encode the latent representation infos to the final GW representation.</span>
+</span><span id="GWModuleBase-179"><a href="#GWModuleBase-179"><span class="linenos">179</span></a><span class="sd">        It combines the encode and fuse methods.</span>
+</span><span id="GWModuleBase-180"><a href="#GWModuleBase-180"><span class="linenos">180</span></a>
+</span><span id="GWModuleBase-181"><a href="#GWModuleBase-181"><span class="linenos">181</span></a><span class="sd">        Args:</span>
+</span><span id="GWModuleBase-182"><a href="#GWModuleBase-182"><span class="linenos">182</span></a><span class="sd">            x (`LatentsDomainGroupT`): the input domain representations</span>
+</span><span id="GWModuleBase-183"><a href="#GWModuleBase-183"><span class="linenos">183</span></a><span class="sd">            selection_score (`Mapping[str, torch.Tensor]`): attention scores to</span>
+</span><span id="GWModuleBase-184"><a href="#GWModuleBase-184"><span class="linenos">184</span></a><span class="sd">                use to encode the reprensetation.</span>
+</span><span id="GWModuleBase-185"><a href="#GWModuleBase-185"><span class="linenos">185</span></a>
+</span><span id="GWModuleBase-186"><a href="#GWModuleBase-186"><span class="linenos">186</span></a><span class="sd">        Returns:</span>
+</span><span id="GWModuleBase-187"><a href="#GWModuleBase-187"><span class="linenos">187</span></a><span class="sd">            `torch.Tensor`: The merged representation.</span>
+</span><span id="GWModuleBase-188"><a href="#GWModuleBase-188"><span class="linenos">188</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="GWModuleBase-189"><a href="#GWModuleBase-189"><span class="linenos">189</span></a>        <span class="n">encodings</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">encode</span><span class="p">(</span><span class="n">x</span><span class="p">)</span>
+</span><span id="GWModuleBase-190"><a href="#GWModuleBase-190"><span class="linenos">190</span></a>        <span class="n">selection_scores</span> <span class="o">=</span> <span class="n">selection_module</span><span class="p">(</span><span class="n">x</span><span class="p">,</span> <span class="n">encodings</span><span class="p">)</span>
+</span><span id="GWModuleBase-191"><a href="#GWModuleBase-191"><span class="linenos">191</span></a>        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">fuse</span><span class="p">(</span><span class="n">encodings</span><span class="p">,</span> <span class="n">selection_scores</span><span class="p">)</span>
+</span><span id="GWModuleBase-192"><a href="#GWModuleBase-192"><span class="linenos">192</span></a>
+</span><span id="GWModuleBase-193"><a href="#GWModuleBase-193"><span class="linenos">193</span></a>    <span class="nd">@abstractmethod</span>
+</span><span id="GWModuleBase-194"><a href="#GWModuleBase-194"><span class="linenos">194</span></a>    <span class="k">def</span> <span class="nf">decode</span><span class="p">(</span>
+</span><span id="GWModuleBase-195"><a href="#GWModuleBase-195"><span class="linenos">195</span></a>        <span class="bp">self</span><span class="p">,</span> <span class="n">z</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">,</span> <span class="n">domains</span><span class="p">:</span> <span class="n">Iterable</span><span class="p">[</span><span class="nb">str</span><span class="p">]</span> <span class="o">|</span> <span class="kc">None</span> <span class="o">=</span> <span class="kc">None</span>
+</span><span id="GWModuleBase-196"><a href="#GWModuleBase-196"><span class="linenos">196</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="n">LatentsDomainGroupDT</span><span class="p">:</span>
+</span><span id="GWModuleBase-197"><a href="#GWModuleBase-197"><span class="linenos">197</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="GWModuleBase-198"><a href="#GWModuleBase-198"><span class="linenos">198</span></a><span class="sd">        Decode the GW representation into given `domains`.</span>
+</span><span id="GWModuleBase-199"><a href="#GWModuleBase-199"><span class="linenos">199</span></a>
+</span><span id="GWModuleBase-200"><a href="#GWModuleBase-200"><span class="linenos">200</span></a><span class="sd">        Args:</span>
+</span><span id="GWModuleBase-201"><a href="#GWModuleBase-201"><span class="linenos">201</span></a><span class="sd">            z (`torch.Tensor`): the GW representation.</span>
+</span><span id="GWModuleBase-202"><a href="#GWModuleBase-202"><span class="linenos">202</span></a><span class="sd">            domains (`Iterable[str]`): iterable of domains to decode.</span>
+</span><span id="GWModuleBase-203"><a href="#GWModuleBase-203"><span class="linenos">203</span></a>
+</span><span id="GWModuleBase-204"><a href="#GWModuleBase-204"><span class="linenos">204</span></a><span class="sd">        Returns:</span>
+</span><span id="GWModuleBase-205"><a href="#GWModuleBase-205"><span class="linenos">205</span></a><span class="sd">            `LatentsDomainGroupDT`: the decoded unimodal representations.</span>
+</span><span id="GWModuleBase-206"><a href="#GWModuleBase-206"><span class="linenos">206</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="GWModuleBase-207"><a href="#GWModuleBase-207"><span class="linenos">207</span></a>        <span class="o">...</span>
+</span></pre></div>
+
+
+            <div class="docstring"><p>Base class for GWModule.</p>
+
+<p>GWModule handles encoding, decoding the unimodal representations
+using the <code>gw_encoders</code> and<code>gw_decoders</code>, and define
+some common operations in GW like cycles and translations.</p>
+
+<p>This is an abstract class and should be implemented.
+For an implemented interface, see <code><a href="#GWModule">GWModule</a></code>.</p>
+</div>
+
+
+                            <div id="GWModuleBase.__init__" class="classattr">
+                                        <input id="GWModuleBase.__init__-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
+<div class="attr function">
+            
+        <span class="name">GWModuleBase</span><span class="signature pdoc-code multiline">(<span class="param">	<span class="n">domain_mods</span><span class="p">:</span> <span class="n">collections</span><span class="o">.</span><span class="n">abc</span><span class="o">.</span><span class="n">Mapping</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n"><a href="domain.html#DomainModule">shimmer.modules.domain.DomainModule</a></span><span class="p">]</span>,</span><span class="param">	<span class="n">workspace_dim</span><span class="p">:</span> <span class="nb">int</span>,</span><span class="param">	<span class="o">*</span><span class="n">args</span>,</span><span class="param">	<span class="o">**</span><span class="n">kwargs</span></span>)</span>
+
+                <label class="view-source-button" for="GWModuleBase.__init__-view-source"><span>View Source</span></label>
+
+    </div>
+    <a class="headerlink" href="#GWModuleBase.__init__"></a>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="GWModuleBase.__init__-123"><a href="#GWModuleBase.__init__-123"><span class="linenos">123</span></a>    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span>
+</span><span id="GWModuleBase.__init__-124"><a href="#GWModuleBase.__init__-124"><span class="linenos">124</span></a>        <span class="bp">self</span><span class="p">,</span>
+</span><span id="GWModuleBase.__init__-125"><a href="#GWModuleBase.__init__-125"><span class="linenos">125</span></a>        <span class="n">domain_mods</span><span class="p">:</span> <span class="n">Mapping</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">DomainModule</span><span class="p">],</span>
+</span><span id="GWModuleBase.__init__-126"><a href="#GWModuleBase.__init__-126"><span class="linenos">126</span></a>        <span class="n">workspace_dim</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span>
+</span><span id="GWModuleBase.__init__-127"><a href="#GWModuleBase.__init__-127"><span class="linenos">127</span></a>        <span class="o">*</span><span class="n">args</span><span class="p">,</span>
+</span><span id="GWModuleBase.__init__-128"><a href="#GWModuleBase.__init__-128"><span class="linenos">128</span></a>        <span class="o">**</span><span class="n">kwargs</span><span class="p">,</span>
+</span><span id="GWModuleBase.__init__-129"><a href="#GWModuleBase.__init__-129"><span class="linenos">129</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="GWModuleBase.__init__-130"><a href="#GWModuleBase.__init__-130"><span class="linenos">130</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="GWModuleBase.__init__-131"><a href="#GWModuleBase.__init__-131"><span class="linenos">131</span></a><span class="sd">        Initializes the GWModule.</span>
+</span><span id="GWModuleBase.__init__-132"><a href="#GWModuleBase.__init__-132"><span class="linenos">132</span></a>
+</span><span id="GWModuleBase.__init__-133"><a href="#GWModuleBase.__init__-133"><span class="linenos">133</span></a><span class="sd">        Args:</span>
+</span><span id="GWModuleBase.__init__-134"><a href="#GWModuleBase.__init__-134"><span class="linenos">134</span></a><span class="sd">            domain_modules (`Mapping[str, DomainModule]`): the domain modules.</span>
+</span><span id="GWModuleBase.__init__-135"><a href="#GWModuleBase.__init__-135"><span class="linenos">135</span></a><span class="sd">            workspace_dim (`int`): dimension of the GW.</span>
+</span><span id="GWModuleBase.__init__-136"><a href="#GWModuleBase.__init__-136"><span class="linenos">136</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="GWModuleBase.__init__-137"><a href="#GWModuleBase.__init__-137"><span class="linenos">137</span></a>        <span class="nb">super</span><span class="p">()</span><span class="o">.</span><span class="fm">__init__</span><span class="p">()</span>
+</span><span id="GWModuleBase.__init__-138"><a href="#GWModuleBase.__init__-138"><span class="linenos">138</span></a>
+</span><span id="GWModuleBase.__init__-139"><a href="#GWModuleBase.__init__-139"><span class="linenos">139</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">domain_mods</span> <span class="o">=</span> <span class="n">domain_mods</span>
+</span><span id="GWModuleBase.__init__-140"><a href="#GWModuleBase.__init__-140"><span class="linenos">140</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;The unimodal domain modules.&quot;&quot;&quot;</span>
+</span><span id="GWModuleBase.__init__-141"><a href="#GWModuleBase.__init__-141"><span class="linenos">141</span></a>
+</span><span id="GWModuleBase.__init__-142"><a href="#GWModuleBase.__init__-142"><span class="linenos">142</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">workspace_dim</span> <span class="o">=</span> <span class="n">workspace_dim</span>
+</span><span id="GWModuleBase.__init__-143"><a href="#GWModuleBase.__init__-143"><span class="linenos">143</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;Dimension of the GW&quot;&quot;&quot;</span>
+</span></pre></div>
+
+
+            <div class="docstring"><p>Initializes the GWModule.</p>
+
+<h6 id="arguments">Arguments:</h6>
+
+<ul>
+<li><strong>domain_modules (<code>Mapping[str, DomainModule]</code>):</strong>  the domain modules.</li>
+<li><strong>workspace_dim (<code>int</code>):</strong>  dimension of the GW.</li>
+</ul>
+</div>
+
+
+                            </div>
+                            <div id="GWModuleBase.domain_mods" class="classattr">
+                                <div class="attr variable">
+            <span class="name">domain_mods</span>
+
+        
+    </div>
+    <a class="headerlink" href="#GWModuleBase.domain_mods"></a>
+    
+            <div class="docstring"><p>The unimodal domain modules.</p>
+</div>
+
+
+                            </div>
+                            <div id="GWModuleBase.workspace_dim" class="classattr">
+                                <div class="attr variable">
+            <span class="name">workspace_dim</span>
+
+        
+    </div>
+    <a class="headerlink" href="#GWModuleBase.workspace_dim"></a>
+    
+            <div class="docstring"><p>Dimension of the GW</p>
+</div>
+
+
+                            </div>
+                            <div id="GWModuleBase.fuse" class="classattr">
+                                        <input id="GWModuleBase.fuse-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
+<div class="attr function">
+                    <div class="decorator">@abstractmethod</div>
+
+        <span class="def">def</span>
+        <span class="name">fuse</span><span class="signature pdoc-code multiline">(<span class="param">	<span class="bp">self</span>,</span><span class="param">	<span class="n">x</span><span class="p">:</span> <span class="n">collections</span><span class="o">.</span><span class="n">abc</span><span class="o">.</span><span class="n">Mapping</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]</span>,</span><span class="param">	<span class="n">selection_scores</span><span class="p">:</span> <span class="n">collections</span><span class="o">.</span><span class="n">abc</span><span class="o">.</span><span class="n">Mapping</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]</span></span><span class="return-annotation">) -> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span>:</span></span>
+
+                <label class="view-source-button" for="GWModuleBase.fuse-view-source"><span>View Source</span></label>
+
+    </div>
+    <a class="headerlink" href="#GWModuleBase.fuse"></a>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="GWModuleBase.fuse-145"><a href="#GWModuleBase.fuse-145"><span class="linenos">145</span></a>    <span class="nd">@abstractmethod</span>
+</span><span id="GWModuleBase.fuse-146"><a href="#GWModuleBase.fuse-146"><span class="linenos">146</span></a>    <span class="k">def</span> <span class="nf">fuse</span><span class="p">(</span>
+</span><span id="GWModuleBase.fuse-147"><a href="#GWModuleBase.fuse-147"><span class="linenos">147</span></a>        <span class="bp">self</span><span class="p">,</span> <span class="n">x</span><span class="p">:</span> <span class="n">LatentsDomainGroupT</span><span class="p">,</span> <span class="n">selection_scores</span><span class="p">:</span> <span class="n">Mapping</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]</span>
+</span><span id="GWModuleBase.fuse-148"><a href="#GWModuleBase.fuse-148"><span class="linenos">148</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">:</span>
+</span><span id="GWModuleBase.fuse-149"><a href="#GWModuleBase.fuse-149"><span class="linenos">149</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="GWModuleBase.fuse-150"><a href="#GWModuleBase.fuse-150"><span class="linenos">150</span></a><span class="sd">        Merge function used to combine domains.</span>
+</span><span id="GWModuleBase.fuse-151"><a href="#GWModuleBase.fuse-151"><span class="linenos">151</span></a>
+</span><span id="GWModuleBase.fuse-152"><a href="#GWModuleBase.fuse-152"><span class="linenos">152</span></a><span class="sd">        Args:</span>
+</span><span id="GWModuleBase.fuse-153"><a href="#GWModuleBase.fuse-153"><span class="linenos">153</span></a><span class="sd">            x (`LatentsDomainGroupT`): the group of latent representation.</span>
+</span><span id="GWModuleBase.fuse-154"><a href="#GWModuleBase.fuse-154"><span class="linenos">154</span></a><span class="sd">            selection_score (`Mapping[str, torch.Tensor]`): attention scores to</span>
+</span><span id="GWModuleBase.fuse-155"><a href="#GWModuleBase.fuse-155"><span class="linenos">155</span></a><span class="sd">                use to encode the reprensetation.</span>
+</span><span id="GWModuleBase.fuse-156"><a href="#GWModuleBase.fuse-156"><span class="linenos">156</span></a><span class="sd">        Returns:</span>
+</span><span id="GWModuleBase.fuse-157"><a href="#GWModuleBase.fuse-157"><span class="linenos">157</span></a><span class="sd">            `torch.Tensor`: The merged representation.</span>
+</span><span id="GWModuleBase.fuse-158"><a href="#GWModuleBase.fuse-158"><span class="linenos">158</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="GWModuleBase.fuse-159"><a href="#GWModuleBase.fuse-159"><span class="linenos">159</span></a>        <span class="o">...</span>
+</span></pre></div>
+
+
+            <div class="docstring"><p>Merge function used to combine domains.</p>
+
+<h6 id="arguments">Arguments:</h6>
+
+<ul>
+<li><strong>x (<code>LatentsDomainGroupT</code>):</strong>  the group of latent representation.</li>
+<li><strong>selection_score (<code>Mapping[str, torch.Tensor]</code>):</strong>  attention scores to
+use to encode the reprensetation.</li>
+</ul>
+
+<h6 id="returns">Returns:</h6>
+
+<blockquote>
+  <p><code>torch.Tensor</code>: The merged representation.</p>
+</blockquote>
+</div>
+
+
+                            </div>
+                            <div id="GWModuleBase.encode" class="classattr">
+                                        <input id="GWModuleBase.encode-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
+<div class="attr function">
+                    <div class="decorator">@abstractmethod</div>
+
+        <span class="def">def</span>
+        <span class="name">encode</span><span class="signature pdoc-code multiline">(<span class="param">	<span class="bp">self</span>,</span><span class="param">	<span class="n">x</span><span class="p">:</span> <span class="n">collections</span><span class="o">.</span><span class="n">abc</span><span class="o">.</span><span class="n">Mapping</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]</span></span><span class="return-annotation">) -> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]</span>:</span></span>
+
+                <label class="view-source-button" for="GWModuleBase.encode-view-source"><span>View Source</span></label>
+
+    </div>
+    <a class="headerlink" href="#GWModuleBase.encode"></a>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="GWModuleBase.encode-161"><a href="#GWModuleBase.encode-161"><span class="linenos">161</span></a>    <span class="nd">@abstractmethod</span>
+</span><span id="GWModuleBase.encode-162"><a href="#GWModuleBase.encode-162"><span class="linenos">162</span></a>    <span class="k">def</span> <span class="nf">encode</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">x</span><span class="p">:</span> <span class="n">LatentsDomainGroupT</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">LatentsDomainGroupDT</span><span class="p">:</span>
+</span><span id="GWModuleBase.encode-163"><a href="#GWModuleBase.encode-163"><span class="linenos">163</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="GWModuleBase.encode-164"><a href="#GWModuleBase.encode-164"><span class="linenos">164</span></a><span class="sd">        Encode the latent representation infos to the pre-fusion GW representation.</span>
+</span><span id="GWModuleBase.encode-165"><a href="#GWModuleBase.encode-165"><span class="linenos">165</span></a>
+</span><span id="GWModuleBase.encode-166"><a href="#GWModuleBase.encode-166"><span class="linenos">166</span></a><span class="sd">        Args:</span>
+</span><span id="GWModuleBase.encode-167"><a href="#GWModuleBase.encode-167"><span class="linenos">167</span></a><span class="sd">            x (`LatentsDomainGroupT`): the input domain representations</span>
+</span><span id="GWModuleBase.encode-168"><a href="#GWModuleBase.encode-168"><span class="linenos">168</span></a>
+</span><span id="GWModuleBase.encode-169"><a href="#GWModuleBase.encode-169"><span class="linenos">169</span></a><span class="sd">        Returns:</span>
+</span><span id="GWModuleBase.encode-170"><a href="#GWModuleBase.encode-170"><span class="linenos">170</span></a><span class="sd">            `LatentsDomainGroupT`: pre-fusion GW representations</span>
+</span><span id="GWModuleBase.encode-171"><a href="#GWModuleBase.encode-171"><span class="linenos">171</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="GWModuleBase.encode-172"><a href="#GWModuleBase.encode-172"><span class="linenos">172</span></a>        <span class="o">...</span>
+</span></pre></div>
+
+
+            <div class="docstring"><p>Encode the latent representation infos to the pre-fusion GW representation.</p>
+
+<h6 id="arguments">Arguments:</h6>
+
+<ul>
+<li><strong>x (<code>LatentsDomainGroupT</code>):</strong>  the input domain representations</li>
+</ul>
+
+<h6 id="returns">Returns:</h6>
+
+<blockquote>
+  <p><code>LatentsDomainGroupT</code>: pre-fusion GW representations</p>
+</blockquote>
+</div>
+
+
+                            </div>
+                            <div id="GWModuleBase.encode_and_fuse" class="classattr">
+                                        <input id="GWModuleBase.encode_and_fuse-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
+<div class="attr function">
+            
+        <span class="def">def</span>
+        <span class="name">encode_and_fuse</span><span class="signature pdoc-code multiline">(<span class="param">	<span class="bp">self</span>,</span><span class="param">	<span class="n">x</span><span class="p">:</span> <span class="n">collections</span><span class="o">.</span><span class="n">abc</span><span class="o">.</span><span class="n">Mapping</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]</span>,</span><span class="param">	<span class="n">selection_module</span><span class="p">:</span> <span class="n"><a href="selection.html#SelectionBase">shimmer.modules.selection.SelectionBase</a></span></span><span class="return-annotation">) -> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span>:</span></span>
+
+                <label class="view-source-button" for="GWModuleBase.encode_and_fuse-view-source"><span>View Source</span></label>
+
+    </div>
+    <a class="headerlink" href="#GWModuleBase.encode_and_fuse"></a>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="GWModuleBase.encode_and_fuse-174"><a href="#GWModuleBase.encode_and_fuse-174"><span class="linenos">174</span></a>    <span class="k">def</span> <span class="nf">encode_and_fuse</span><span class="p">(</span>
+</span><span id="GWModuleBase.encode_and_fuse-175"><a href="#GWModuleBase.encode_and_fuse-175"><span class="linenos">175</span></a>        <span class="bp">self</span><span class="p">,</span> <span class="n">x</span><span class="p">:</span> <span class="n">LatentsDomainGroupT</span><span class="p">,</span> <span class="n">selection_module</span><span class="p">:</span> <span class="n">SelectionBase</span>
+</span><span id="GWModuleBase.encode_and_fuse-176"><a href="#GWModuleBase.encode_and_fuse-176"><span class="linenos">176</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">:</span>
+</span><span id="GWModuleBase.encode_and_fuse-177"><a href="#GWModuleBase.encode_and_fuse-177"><span class="linenos">177</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="GWModuleBase.encode_and_fuse-178"><a href="#GWModuleBase.encode_and_fuse-178"><span class="linenos">178</span></a><span class="sd">        Encode the latent representation infos to the final GW representation.</span>
+</span><span id="GWModuleBase.encode_and_fuse-179"><a href="#GWModuleBase.encode_and_fuse-179"><span class="linenos">179</span></a><span class="sd">        It combines the encode and fuse methods.</span>
+</span><span id="GWModuleBase.encode_and_fuse-180"><a href="#GWModuleBase.encode_and_fuse-180"><span class="linenos">180</span></a>
+</span><span id="GWModuleBase.encode_and_fuse-181"><a href="#GWModuleBase.encode_and_fuse-181"><span class="linenos">181</span></a><span class="sd">        Args:</span>
+</span><span id="GWModuleBase.encode_and_fuse-182"><a href="#GWModuleBase.encode_and_fuse-182"><span class="linenos">182</span></a><span class="sd">            x (`LatentsDomainGroupT`): the input domain representations</span>
+</span><span id="GWModuleBase.encode_and_fuse-183"><a href="#GWModuleBase.encode_and_fuse-183"><span class="linenos">183</span></a><span class="sd">            selection_score (`Mapping[str, torch.Tensor]`): attention scores to</span>
+</span><span id="GWModuleBase.encode_and_fuse-184"><a href="#GWModuleBase.encode_and_fuse-184"><span class="linenos">184</span></a><span class="sd">                use to encode the reprensetation.</span>
+</span><span id="GWModuleBase.encode_and_fuse-185"><a href="#GWModuleBase.encode_and_fuse-185"><span class="linenos">185</span></a>
+</span><span id="GWModuleBase.encode_and_fuse-186"><a href="#GWModuleBase.encode_and_fuse-186"><span class="linenos">186</span></a><span class="sd">        Returns:</span>
+</span><span id="GWModuleBase.encode_and_fuse-187"><a href="#GWModuleBase.encode_and_fuse-187"><span class="linenos">187</span></a><span class="sd">            `torch.Tensor`: The merged representation.</span>
+</span><span id="GWModuleBase.encode_and_fuse-188"><a href="#GWModuleBase.encode_and_fuse-188"><span class="linenos">188</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="GWModuleBase.encode_and_fuse-189"><a href="#GWModuleBase.encode_and_fuse-189"><span class="linenos">189</span></a>        <span class="n">encodings</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">encode</span><span class="p">(</span><span class="n">x</span><span class="p">)</span>
+</span><span id="GWModuleBase.encode_and_fuse-190"><a href="#GWModuleBase.encode_and_fuse-190"><span class="linenos">190</span></a>        <span class="n">selection_scores</span> <span class="o">=</span> <span class="n">selection_module</span><span class="p">(</span><span class="n">x</span><span class="p">,</span> <span class="n">encodings</span><span class="p">)</span>
+</span><span id="GWModuleBase.encode_and_fuse-191"><a href="#GWModuleBase.encode_and_fuse-191"><span class="linenos">191</span></a>        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">fuse</span><span class="p">(</span><span class="n">encodings</span><span class="p">,</span> <span class="n">selection_scores</span><span class="p">)</span>
+</span></pre></div>
+
+
+            <div class="docstring"><p>Encode the latent representation infos to the final GW representation.
+It combines the encode and fuse methods.</p>
+
+<h6 id="arguments">Arguments:</h6>
+
+<ul>
+<li><strong>x (<code>LatentsDomainGroupT</code>):</strong>  the input domain representations</li>
+<li><strong>selection_score (<code>Mapping[str, torch.Tensor]</code>):</strong>  attention scores to
+use to encode the reprensetation.</li>
+</ul>
+
+<h6 id="returns">Returns:</h6>
+
+<blockquote>
+  <p><code>torch.Tensor</code>: The merged representation.</p>
+</blockquote>
+</div>
+
+
+                            </div>
+                            <div id="GWModuleBase.decode" class="classattr">
+                                        <input id="GWModuleBase.decode-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
+<div class="attr function">
+                    <div class="decorator">@abstractmethod</div>
+
+        <span class="def">def</span>
+        <span class="name">decode</span><span class="signature pdoc-code multiline">(<span class="param">	<span class="bp">self</span>,</span><span class="param">	<span class="n">z</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span>,</span><span class="param">	<span class="n">domains</span><span class="p">:</span> <span class="n">collections</span><span class="o">.</span><span class="n">abc</span><span class="o">.</span><span class="n">Iterable</span><span class="p">[</span><span class="nb">str</span><span class="p">]</span> <span class="o">|</span> <span class="kc">None</span> <span class="o">=</span> <span class="kc">None</span></span><span class="return-annotation">) -> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]</span>:</span></span>
+
+                <label class="view-source-button" for="GWModuleBase.decode-view-source"><span>View Source</span></label>
+
+    </div>
+    <a class="headerlink" href="#GWModuleBase.decode"></a>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="GWModuleBase.decode-193"><a href="#GWModuleBase.decode-193"><span class="linenos">193</span></a>    <span class="nd">@abstractmethod</span>
+</span><span id="GWModuleBase.decode-194"><a href="#GWModuleBase.decode-194"><span class="linenos">194</span></a>    <span class="k">def</span> <span class="nf">decode</span><span class="p">(</span>
+</span><span id="GWModuleBase.decode-195"><a href="#GWModuleBase.decode-195"><span class="linenos">195</span></a>        <span class="bp">self</span><span class="p">,</span> <span class="n">z</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">,</span> <span class="n">domains</span><span class="p">:</span> <span class="n">Iterable</span><span class="p">[</span><span class="nb">str</span><span class="p">]</span> <span class="o">|</span> <span class="kc">None</span> <span class="o">=</span> <span class="kc">None</span>
+</span><span id="GWModuleBase.decode-196"><a href="#GWModuleBase.decode-196"><span class="linenos">196</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="n">LatentsDomainGroupDT</span><span class="p">:</span>
+</span><span id="GWModuleBase.decode-197"><a href="#GWModuleBase.decode-197"><span class="linenos">197</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="GWModuleBase.decode-198"><a href="#GWModuleBase.decode-198"><span class="linenos">198</span></a><span class="sd">        Decode the GW representation into given `domains`.</span>
+</span><span id="GWModuleBase.decode-199"><a href="#GWModuleBase.decode-199"><span class="linenos">199</span></a>
+</span><span id="GWModuleBase.decode-200"><a href="#GWModuleBase.decode-200"><span class="linenos">200</span></a><span class="sd">        Args:</span>
+</span><span id="GWModuleBase.decode-201"><a href="#GWModuleBase.decode-201"><span class="linenos">201</span></a><span class="sd">            z (`torch.Tensor`): the GW representation.</span>
+</span><span id="GWModuleBase.decode-202"><a href="#GWModuleBase.decode-202"><span class="linenos">202</span></a><span class="sd">            domains (`Iterable[str]`): iterable of domains to decode.</span>
+</span><span id="GWModuleBase.decode-203"><a href="#GWModuleBase.decode-203"><span class="linenos">203</span></a>
+</span><span id="GWModuleBase.decode-204"><a href="#GWModuleBase.decode-204"><span class="linenos">204</span></a><span class="sd">        Returns:</span>
+</span><span id="GWModuleBase.decode-205"><a href="#GWModuleBase.decode-205"><span class="linenos">205</span></a><span class="sd">            `LatentsDomainGroupDT`: the decoded unimodal representations.</span>
+</span><span id="GWModuleBase.decode-206"><a href="#GWModuleBase.decode-206"><span class="linenos">206</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="GWModuleBase.decode-207"><a href="#GWModuleBase.decode-207"><span class="linenos">207</span></a>        <span class="o">...</span>
+</span></pre></div>
+
+
+            <div class="docstring"><p>Decode the GW representation into given <code>domains</code>.</p>
+
+<h6 id="arguments">Arguments:</h6>
+
+<ul>
+<li><strong>z (<code>torch.Tensor</code>):</strong>  the GW representation.</li>
+<li><strong>domains (<code>Iterable[str]</code>):</strong>  iterable of domains to decode.</li>
+</ul>
+
+<h6 id="returns">Returns:</h6>
+
+<blockquote>
+  <p><code>LatentsDomainGroupDT</code>: the decoded unimodal representations.</p>
+</blockquote>
+</div>
+
+
+                            </div>
+                            <div class="inherited">
+                                <h5>Inherited Members</h5>
+                                <dl>
+                                    <div><dt>torch.nn.modules.module.Module</dt>
+                                <dd id="GWModuleBase.dump_patches" class="variable">dump_patches</dd>
+                <dd id="GWModuleBase.training" class="variable">training</dd>
+                <dd id="GWModuleBase.call_super_init" class="variable">call_super_init</dd>
+                <dd id="GWModuleBase.forward" class="function">forward</dd>
+                <dd id="GWModuleBase.register_buffer" class="function">register_buffer</dd>
+                <dd id="GWModuleBase.register_parameter" class="function">register_parameter</dd>
+                <dd id="GWModuleBase.add_module" class="function">add_module</dd>
+                <dd id="GWModuleBase.register_module" class="function">register_module</dd>
+                <dd id="GWModuleBase.get_submodule" class="function">get_submodule</dd>
+                <dd id="GWModuleBase.get_parameter" class="function">get_parameter</dd>
+                <dd id="GWModuleBase.get_buffer" class="function">get_buffer</dd>
+                <dd id="GWModuleBase.get_extra_state" class="function">get_extra_state</dd>
+                <dd id="GWModuleBase.set_extra_state" class="function">set_extra_state</dd>
+                <dd id="GWModuleBase.apply" class="function">apply</dd>
+                <dd id="GWModuleBase.cuda" class="function">cuda</dd>
+                <dd id="GWModuleBase.ipu" class="function">ipu</dd>
+                <dd id="GWModuleBase.xpu" class="function">xpu</dd>
+                <dd id="GWModuleBase.cpu" class="function">cpu</dd>
+                <dd id="GWModuleBase.type" class="function">type</dd>
+                <dd id="GWModuleBase.float" class="function">float</dd>
+                <dd id="GWModuleBase.double" class="function">double</dd>
+                <dd id="GWModuleBase.half" class="function">half</dd>
+                <dd id="GWModuleBase.bfloat16" class="function">bfloat16</dd>
+                <dd id="GWModuleBase.to_empty" class="function">to_empty</dd>
+                <dd id="GWModuleBase.to" class="function">to</dd>
+                <dd id="GWModuleBase.register_full_backward_pre_hook" class="function">register_full_backward_pre_hook</dd>
+                <dd id="GWModuleBase.register_backward_hook" class="function">register_backward_hook</dd>
+                <dd id="GWModuleBase.register_full_backward_hook" class="function">register_full_backward_hook</dd>
+                <dd id="GWModuleBase.register_forward_pre_hook" class="function">register_forward_pre_hook</dd>
+                <dd id="GWModuleBase.register_forward_hook" class="function">register_forward_hook</dd>
+                <dd id="GWModuleBase.register_state_dict_pre_hook" class="function">register_state_dict_pre_hook</dd>
+                <dd id="GWModuleBase.state_dict" class="function">state_dict</dd>
+                <dd id="GWModuleBase.register_load_state_dict_post_hook" class="function">register_load_state_dict_post_hook</dd>
+                <dd id="GWModuleBase.load_state_dict" class="function">load_state_dict</dd>
+                <dd id="GWModuleBase.parameters" class="function">parameters</dd>
+                <dd id="GWModuleBase.named_parameters" class="function">named_parameters</dd>
+                <dd id="GWModuleBase.buffers" class="function">buffers</dd>
+                <dd id="GWModuleBase.named_buffers" class="function">named_buffers</dd>
+                <dd id="GWModuleBase.children" class="function">children</dd>
+                <dd id="GWModuleBase.named_children" class="function">named_children</dd>
+                <dd id="GWModuleBase.modules" class="function">modules</dd>
+                <dd id="GWModuleBase.named_modules" class="function">named_modules</dd>
+                <dd id="GWModuleBase.train" class="function">train</dd>
+                <dd id="GWModuleBase.eval" class="function">eval</dd>
+                <dd id="GWModuleBase.requires_grad_" class="function">requires_grad_</dd>
+                <dd id="GWModuleBase.zero_grad" class="function">zero_grad</dd>
+                <dd id="GWModuleBase.share_memory" class="function">share_memory</dd>
+                <dd id="GWModuleBase.extra_repr" class="function">extra_repr</dd>
+                <dd id="GWModuleBase.compile" class="function">compile</dd>
+
+            </div>
+                                </dl>
+                            </div>
+                </section>
+                <section id="GWModule">
+                            <input id="GWModule-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
+<div class="attr class">
+            
+    <span class="def">class</span>
+    <span class="name">GWModule</span><wbr>(<span class="base"><a href="#GWModuleBase">GWModuleBase</a></span>):
+
+                <label class="view-source-button" for="GWModule-view-source"><span>View Source</span></label>
+
+    </div>
+    <a class="headerlink" href="#GWModule"></a>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="GWModule-210"><a href="#GWModule-210"><span class="linenos">210</span></a><span class="k">class</span> <span class="nc">GWModule</span><span class="p">(</span><span class="n">GWModuleBase</span><span class="p">):</span>
+</span><span id="GWModule-211"><a href="#GWModule-211"><span class="linenos">211</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;GW nn.Module. Implements `GWModuleBase`.&quot;&quot;&quot;</span>
+</span><span id="GWModule-212"><a href="#GWModule-212"><span class="linenos">212</span></a>
+</span><span id="GWModule-213"><a href="#GWModule-213"><span class="linenos">213</span></a>    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span>
+</span><span id="GWModule-214"><a href="#GWModule-214"><span class="linenos">214</span></a>        <span class="bp">self</span><span class="p">,</span>
+</span><span id="GWModule-215"><a href="#GWModule-215"><span class="linenos">215</span></a>        <span class="n">domain_modules</span><span class="p">:</span> <span class="n">Mapping</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">DomainModule</span><span class="p">],</span>
+</span><span id="GWModule-216"><a href="#GWModule-216"><span class="linenos">216</span></a>        <span class="n">workspace_dim</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span>
+</span><span id="GWModule-217"><a href="#GWModule-217"><span class="linenos">217</span></a>        <span class="n">gw_encoders</span><span class="p">:</span> <span class="n">Mapping</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">nn</span><span class="o">.</span><span class="n">Module</span><span class="p">],</span>
+</span><span id="GWModule-218"><a href="#GWModule-218"><span class="linenos">218</span></a>        <span class="n">gw_decoders</span><span class="p">:</span> <span class="n">Mapping</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">nn</span><span class="o">.</span><span class="n">Module</span><span class="p">],</span>
+</span><span id="GWModule-219"><a href="#GWModule-219"><span class="linenos">219</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="GWModule-220"><a href="#GWModule-220"><span class="linenos">220</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="GWModule-221"><a href="#GWModule-221"><span class="linenos">221</span></a><span class="sd">        Initializes the GWModule.</span>
+</span><span id="GWModule-222"><a href="#GWModule-222"><span class="linenos">222</span></a>
+</span><span id="GWModule-223"><a href="#GWModule-223"><span class="linenos">223</span></a><span class="sd">        Args:</span>
+</span><span id="GWModule-224"><a href="#GWModule-224"><span class="linenos">224</span></a><span class="sd">            domain_modules (`Mapping[str, DomainModule]`): the domain modules.</span>
+</span><span id="GWModule-225"><a href="#GWModule-225"><span class="linenos">225</span></a><span class="sd">            workspace_dim (`int`): dimension of the GW.</span>
+</span><span id="GWModule-226"><a href="#GWModule-226"><span class="linenos">226</span></a><span class="sd">            gw_encoders (`Mapping[str, torch.nn.Module]`): mapping for each domain</span>
+</span><span id="GWModule-227"><a href="#GWModule-227"><span class="linenos">227</span></a><span class="sd">                name to a an torch.nn.Module class that encodes a</span>
+</span><span id="GWModule-228"><a href="#GWModule-228"><span class="linenos">228</span></a><span class="sd">                unimodal latent representations into a GW representation (pre fusion).</span>
+</span><span id="GWModule-229"><a href="#GWModule-229"><span class="linenos">229</span></a><span class="sd">            gw_decoders (`Mapping[str, torch.nn.Module]`): mapping for each domain</span>
+</span><span id="GWModule-230"><a href="#GWModule-230"><span class="linenos">230</span></a><span class="sd">                name to a an torch.nn.Module class that decodes a</span>
+</span><span id="GWModule-231"><a href="#GWModule-231"><span class="linenos">231</span></a><span class="sd">                 GW representation to a unimodal latent representation.</span>
+</span><span id="GWModule-232"><a href="#GWModule-232"><span class="linenos">232</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="GWModule-233"><a href="#GWModule-233"><span class="linenos">233</span></a>        <span class="nb">super</span><span class="p">()</span><span class="o">.</span><span class="fm">__init__</span><span class="p">(</span><span class="n">domain_modules</span><span class="p">,</span> <span class="n">workspace_dim</span><span class="p">)</span>
+</span><span id="GWModule-234"><a href="#GWModule-234"><span class="linenos">234</span></a>
+</span><span id="GWModule-235"><a href="#GWModule-235"><span class="linenos">235</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">gw_encoders</span> <span class="o">=</span> <span class="n">nn</span><span class="o">.</span><span class="n">ModuleDict</span><span class="p">(</span><span class="n">gw_encoders</span><span class="p">)</span>
+</span><span id="GWModule-236"><a href="#GWModule-236"><span class="linenos">236</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;The module&#39;s encoders&quot;&quot;&quot;</span>
+</span><span id="GWModule-237"><a href="#GWModule-237"><span class="linenos">237</span></a>
+</span><span id="GWModule-238"><a href="#GWModule-238"><span class="linenos">238</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">gw_decoders</span> <span class="o">=</span> <span class="n">nn</span><span class="o">.</span><span class="n">ModuleDict</span><span class="p">(</span><span class="n">gw_decoders</span><span class="p">)</span>
+</span><span id="GWModule-239"><a href="#GWModule-239"><span class="linenos">239</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;The module&#39;s decoders&quot;&quot;&quot;</span>
+</span><span id="GWModule-240"><a href="#GWModule-240"><span class="linenos">240</span></a>
+</span><span id="GWModule-241"><a href="#GWModule-241"><span class="linenos">241</span></a>    <span class="k">def</span> <span class="nf">fuse</span><span class="p">(</span>
+</span><span id="GWModule-242"><a href="#GWModule-242"><span class="linenos">242</span></a>        <span class="bp">self</span><span class="p">,</span>
+</span><span id="GWModule-243"><a href="#GWModule-243"><span class="linenos">243</span></a>        <span class="n">x</span><span class="p">:</span> <span class="n">LatentsDomainGroupT</span><span class="p">,</span>
+</span><span id="GWModule-244"><a href="#GWModule-244"><span class="linenos">244</span></a>        <span class="n">selection_scores</span><span class="p">:</span> <span class="n">Mapping</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">],</span>
+</span><span id="GWModule-245"><a href="#GWModule-245"><span class="linenos">245</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">:</span>
+</span><span id="GWModule-246"><a href="#GWModule-246"><span class="linenos">246</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="GWModule-247"><a href="#GWModule-247"><span class="linenos">247</span></a><span class="sd">        Merge function used to combine domains.</span>
+</span><span id="GWModule-248"><a href="#GWModule-248"><span class="linenos">248</span></a>
+</span><span id="GWModule-249"><a href="#GWModule-249"><span class="linenos">249</span></a><span class="sd">        Args:</span>
+</span><span id="GWModule-250"><a href="#GWModule-250"><span class="linenos">250</span></a><span class="sd">            x (`LatentsDomainGroupT`): the group of latent representation.</span>
+</span><span id="GWModule-251"><a href="#GWModule-251"><span class="linenos">251</span></a><span class="sd">            selection_score (`Mapping[str, torch.Tensor]`): attention scores to</span>
+</span><span id="GWModule-252"><a href="#GWModule-252"><span class="linenos">252</span></a><span class="sd">                use to encode the reprensetation.</span>
+</span><span id="GWModule-253"><a href="#GWModule-253"><span class="linenos">253</span></a><span class="sd">        Returns:</span>
+</span><span id="GWModule-254"><a href="#GWModule-254"><span class="linenos">254</span></a><span class="sd">            `torch.Tensor`: The merged representation.</span>
+</span><span id="GWModule-255"><a href="#GWModule-255"><span class="linenos">255</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="GWModule-256"><a href="#GWModule-256"><span class="linenos">256</span></a>        <span class="k">return</span> <span class="n">torch</span><span class="o">.</span><span class="n">tanh</span><span class="p">(</span>
+</span><span id="GWModule-257"><a href="#GWModule-257"><span class="linenos">257</span></a>            <span class="n">torch</span><span class="o">.</span><span class="n">sum</span><span class="p">(</span>
+</span><span id="GWModule-258"><a href="#GWModule-258"><span class="linenos">258</span></a>                <span class="n">torch</span><span class="o">.</span><span class="n">stack</span><span class="p">(</span>
+</span><span id="GWModule-259"><a href="#GWModule-259"><span class="linenos">259</span></a>                    <span class="p">[</span>
+</span><span id="GWModule-260"><a href="#GWModule-260"><span class="linenos">260</span></a>                        <span class="n">selection_scores</span><span class="p">[</span><span class="n">domain</span><span class="p">]</span><span class="o">.</span><span class="n">unsqueeze</span><span class="p">(</span><span class="mi">1</span><span class="p">)</span> <span class="o">*</span> <span class="n">x</span><span class="p">[</span><span class="n">domain</span><span class="p">]</span>
+</span><span id="GWModule-261"><a href="#GWModule-261"><span class="linenos">261</span></a>                        <span class="k">for</span> <span class="n">domain</span> <span class="ow">in</span> <span class="n">selection_scores</span>
+</span><span id="GWModule-262"><a href="#GWModule-262"><span class="linenos">262</span></a>                    <span class="p">]</span>
+</span><span id="GWModule-263"><a href="#GWModule-263"><span class="linenos">263</span></a>                <span class="p">),</span>
+</span><span id="GWModule-264"><a href="#GWModule-264"><span class="linenos">264</span></a>                <span class="n">dim</span><span class="o">=</span><span class="mi">0</span><span class="p">,</span>
+</span><span id="GWModule-265"><a href="#GWModule-265"><span class="linenos">265</span></a>            <span class="p">)</span>
+</span><span id="GWModule-266"><a href="#GWModule-266"><span class="linenos">266</span></a>        <span class="p">)</span>
+</span><span id="GWModule-267"><a href="#GWModule-267"><span class="linenos">267</span></a>
+</span><span id="GWModule-268"><a href="#GWModule-268"><span class="linenos">268</span></a>    <span class="k">def</span> <span class="nf">encode</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">x</span><span class="p">:</span> <span class="n">LatentsDomainGroupT</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">LatentsDomainGroupDT</span><span class="p">:</span>
+</span><span id="GWModule-269"><a href="#GWModule-269"><span class="linenos">269</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="GWModule-270"><a href="#GWModule-270"><span class="linenos">270</span></a><span class="sd">        Encode the latent representation infos to the pre-fusion GW representation.</span>
+</span><span id="GWModule-271"><a href="#GWModule-271"><span class="linenos">271</span></a>
+</span><span id="GWModule-272"><a href="#GWModule-272"><span class="linenos">272</span></a><span class="sd">        Args:</span>
+</span><span id="GWModule-273"><a href="#GWModule-273"><span class="linenos">273</span></a><span class="sd">            x (`LatentsDomainGroupT`): the input domain representations.</span>
+</span><span id="GWModule-274"><a href="#GWModule-274"><span class="linenos">274</span></a>
+</span><span id="GWModule-275"><a href="#GWModule-275"><span class="linenos">275</span></a><span class="sd">        Returns:</span>
+</span><span id="GWModule-276"><a href="#GWModule-276"><span class="linenos">276</span></a><span class="sd">            `LatentsDomainGroupT`: pre-fusion representation</span>
+</span><span id="GWModule-277"><a href="#GWModule-277"><span class="linenos">277</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="GWModule-278"><a href="#GWModule-278"><span class="linenos">278</span></a>        <span class="k">return</span> <span class="p">{</span>
+</span><span id="GWModule-279"><a href="#GWModule-279"><span class="linenos">279</span></a>            <span class="n">domain_name</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">gw_encoders</span><span class="p">[</span><span class="n">domain_name</span><span class="p">](</span><span class="n">domain</span><span class="p">)</span>
+</span><span id="GWModule-280"><a href="#GWModule-280"><span class="linenos">280</span></a>            <span class="k">for</span> <span class="n">domain_name</span><span class="p">,</span> <span class="n">domain</span> <span class="ow">in</span> <span class="n">x</span><span class="o">.</span><span class="n">items</span><span class="p">()</span>
+</span><span id="GWModule-281"><a href="#GWModule-281"><span class="linenos">281</span></a>        <span class="p">}</span>
+</span><span id="GWModule-282"><a href="#GWModule-282"><span class="linenos">282</span></a>
+</span><span id="GWModule-283"><a href="#GWModule-283"><span class="linenos">283</span></a>    <span class="k">def</span> <span class="nf">decode</span><span class="p">(</span>
+</span><span id="GWModule-284"><a href="#GWModule-284"><span class="linenos">284</span></a>        <span class="bp">self</span><span class="p">,</span> <span class="n">z</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">,</span> <span class="n">domains</span><span class="p">:</span> <span class="n">Iterable</span><span class="p">[</span><span class="nb">str</span><span class="p">]</span> <span class="o">|</span> <span class="kc">None</span> <span class="o">=</span> <span class="kc">None</span>
+</span><span id="GWModule-285"><a href="#GWModule-285"><span class="linenos">285</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="n">LatentsDomainGroupDT</span><span class="p">:</span>
+</span><span id="GWModule-286"><a href="#GWModule-286"><span class="linenos">286</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="GWModule-287"><a href="#GWModule-287"><span class="linenos">287</span></a><span class="sd">        Decodes a GW representation to multiple domains.</span>
+</span><span id="GWModule-288"><a href="#GWModule-288"><span class="linenos">288</span></a>
+</span><span id="GWModule-289"><a href="#GWModule-289"><span class="linenos">289</span></a><span class="sd">        Args:</span>
+</span><span id="GWModule-290"><a href="#GWModule-290"><span class="linenos">290</span></a><span class="sd">            z (`torch.Tensor`): the GW representation</span>
+</span><span id="GWModule-291"><a href="#GWModule-291"><span class="linenos">291</span></a><span class="sd">            domains (`Iterable[str] | None`): the domains to decode to. Defaults to</span>
+</span><span id="GWModule-292"><a href="#GWModule-292"><span class="linenos">292</span></a><span class="sd">                use keys in `gw_interfaces` (all domains).</span>
+</span><span id="GWModule-293"><a href="#GWModule-293"><span class="linenos">293</span></a><span class="sd">        Returns:</span>
+</span><span id="GWModule-294"><a href="#GWModule-294"><span class="linenos">294</span></a><span class="sd">            `LatentsDomainGroupDT`: decoded unimodal representation</span>
+</span><span id="GWModule-295"><a href="#GWModule-295"><span class="linenos">295</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="GWModule-296"><a href="#GWModule-296"><span class="linenos">296</span></a>        <span class="k">return</span> <span class="p">{</span>
+</span><span id="GWModule-297"><a href="#GWModule-297"><span class="linenos">297</span></a>            <span class="n">domain</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">gw_decoders</span><span class="p">[</span><span class="n">domain</span><span class="p">](</span><span class="n">z</span><span class="p">)</span>
+</span><span id="GWModule-298"><a href="#GWModule-298"><span class="linenos">298</span></a>            <span class="k">for</span> <span class="n">domain</span> <span class="ow">in</span> <span class="n">domains</span> <span class="ow">or</span> <span class="bp">self</span><span class="o">.</span><span class="n">gw_decoders</span><span class="o">.</span><span class="n">keys</span><span class="p">()</span>
+</span><span id="GWModule-299"><a href="#GWModule-299"><span class="linenos">299</span></a>        <span class="p">}</span>
+</span></pre></div>
+
+
+            <div class="docstring"><p>GW nn.Module. Implements <code><a href="#GWModuleBase">GWModuleBase</a></code>.</p>
+</div>
+
+
+                            <div id="GWModule.__init__" class="classattr">
+                                        <input id="GWModule.__init__-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
+<div class="attr function">
+            
+        <span class="name">GWModule</span><span class="signature pdoc-code multiline">(<span class="param">	<span class="n">domain_modules</span><span class="p">:</span> <span class="n">collections</span><span class="o">.</span><span class="n">abc</span><span class="o">.</span><span class="n">Mapping</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n"><a href="domain.html#DomainModule">shimmer.modules.domain.DomainModule</a></span><span class="p">]</span>,</span><span class="param">	<span class="n">workspace_dim</span><span class="p">:</span> <span class="nb">int</span>,</span><span class="param">	<span class="n">gw_encoders</span><span class="p">:</span> <span class="n">collections</span><span class="o">.</span><span class="n">abc</span><span class="o">.</span><span class="n">Mapping</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">nn</span><span class="o">.</span><span class="n">modules</span><span class="o">.</span><span class="n">module</span><span class="o">.</span><span class="n">Module</span><span class="p">]</span>,</span><span class="param">	<span class="n">gw_decoders</span><span class="p">:</span> <span class="n">collections</span><span class="o">.</span><span class="n">abc</span><span class="o">.</span><span class="n">Mapping</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">nn</span><span class="o">.</span><span class="n">modules</span><span class="o">.</span><span class="n">module</span><span class="o">.</span><span class="n">Module</span><span class="p">]</span></span>)</span>
+
+                <label class="view-source-button" for="GWModule.__init__-view-source"><span>View Source</span></label>
+
+    </div>
+    <a class="headerlink" href="#GWModule.__init__"></a>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="GWModule.__init__-213"><a href="#GWModule.__init__-213"><span class="linenos">213</span></a>    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span>
+</span><span id="GWModule.__init__-214"><a href="#GWModule.__init__-214"><span class="linenos">214</span></a>        <span class="bp">self</span><span class="p">,</span>
+</span><span id="GWModule.__init__-215"><a href="#GWModule.__init__-215"><span class="linenos">215</span></a>        <span class="n">domain_modules</span><span class="p">:</span> <span class="n">Mapping</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">DomainModule</span><span class="p">],</span>
+</span><span id="GWModule.__init__-216"><a href="#GWModule.__init__-216"><span class="linenos">216</span></a>        <span class="n">workspace_dim</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span>
+</span><span id="GWModule.__init__-217"><a href="#GWModule.__init__-217"><span class="linenos">217</span></a>        <span class="n">gw_encoders</span><span class="p">:</span> <span class="n">Mapping</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">nn</span><span class="o">.</span><span class="n">Module</span><span class="p">],</span>
+</span><span id="GWModule.__init__-218"><a href="#GWModule.__init__-218"><span class="linenos">218</span></a>        <span class="n">gw_decoders</span><span class="p">:</span> <span class="n">Mapping</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">nn</span><span class="o">.</span><span class="n">Module</span><span class="p">],</span>
+</span><span id="GWModule.__init__-219"><a href="#GWModule.__init__-219"><span class="linenos">219</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="GWModule.__init__-220"><a href="#GWModule.__init__-220"><span class="linenos">220</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="GWModule.__init__-221"><a href="#GWModule.__init__-221"><span class="linenos">221</span></a><span class="sd">        Initializes the GWModule.</span>
+</span><span id="GWModule.__init__-222"><a href="#GWModule.__init__-222"><span class="linenos">222</span></a>
+</span><span id="GWModule.__init__-223"><a href="#GWModule.__init__-223"><span class="linenos">223</span></a><span class="sd">        Args:</span>
+</span><span id="GWModule.__init__-224"><a href="#GWModule.__init__-224"><span class="linenos">224</span></a><span class="sd">            domain_modules (`Mapping[str, DomainModule]`): the domain modules.</span>
+</span><span id="GWModule.__init__-225"><a href="#GWModule.__init__-225"><span class="linenos">225</span></a><span class="sd">            workspace_dim (`int`): dimension of the GW.</span>
+</span><span id="GWModule.__init__-226"><a href="#GWModule.__init__-226"><span class="linenos">226</span></a><span class="sd">            gw_encoders (`Mapping[str, torch.nn.Module]`): mapping for each domain</span>
+</span><span id="GWModule.__init__-227"><a href="#GWModule.__init__-227"><span class="linenos">227</span></a><span class="sd">                name to a an torch.nn.Module class that encodes a</span>
+</span><span id="GWModule.__init__-228"><a href="#GWModule.__init__-228"><span class="linenos">228</span></a><span class="sd">                unimodal latent representations into a GW representation (pre fusion).</span>
+</span><span id="GWModule.__init__-229"><a href="#GWModule.__init__-229"><span class="linenos">229</span></a><span class="sd">            gw_decoders (`Mapping[str, torch.nn.Module]`): mapping for each domain</span>
+</span><span id="GWModule.__init__-230"><a href="#GWModule.__init__-230"><span class="linenos">230</span></a><span class="sd">                name to a an torch.nn.Module class that decodes a</span>
+</span><span id="GWModule.__init__-231"><a href="#GWModule.__init__-231"><span class="linenos">231</span></a><span class="sd">                 GW representation to a unimodal latent representation.</span>
+</span><span id="GWModule.__init__-232"><a href="#GWModule.__init__-232"><span class="linenos">232</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="GWModule.__init__-233"><a href="#GWModule.__init__-233"><span class="linenos">233</span></a>        <span class="nb">super</span><span class="p">()</span><span class="o">.</span><span class="fm">__init__</span><span class="p">(</span><span class="n">domain_modules</span><span class="p">,</span> <span class="n">workspace_dim</span><span class="p">)</span>
+</span><span id="GWModule.__init__-234"><a href="#GWModule.__init__-234"><span class="linenos">234</span></a>
+</span><span id="GWModule.__init__-235"><a href="#GWModule.__init__-235"><span class="linenos">235</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">gw_encoders</span> <span class="o">=</span> <span class="n">nn</span><span class="o">.</span><span class="n">ModuleDict</span><span class="p">(</span><span class="n">gw_encoders</span><span class="p">)</span>
+</span><span id="GWModule.__init__-236"><a href="#GWModule.__init__-236"><span class="linenos">236</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;The module&#39;s encoders&quot;&quot;&quot;</span>
+</span><span id="GWModule.__init__-237"><a href="#GWModule.__init__-237"><span class="linenos">237</span></a>
+</span><span id="GWModule.__init__-238"><a href="#GWModule.__init__-238"><span class="linenos">238</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">gw_decoders</span> <span class="o">=</span> <span class="n">nn</span><span class="o">.</span><span class="n">ModuleDict</span><span class="p">(</span><span class="n">gw_decoders</span><span class="p">)</span>
+</span><span id="GWModule.__init__-239"><a href="#GWModule.__init__-239"><span class="linenos">239</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;The module&#39;s decoders&quot;&quot;&quot;</span>
+</span></pre></div>
+
+
+            <div class="docstring"><p>Initializes the GWModule.</p>
+
+<h6 id="arguments">Arguments:</h6>
+
+<ul>
+<li><strong>domain_modules (<code>Mapping[str, DomainModule]</code>):</strong>  the domain modules.</li>
+<li><strong>workspace_dim (<code>int</code>):</strong>  dimension of the GW.</li>
+<li><strong>gw_encoders (<code>Mapping[str, torch.nn.Module]</code>):</strong>  mapping for each domain
+name to a an torch.nn.Module class that encodes a
+unimodal latent representations into a GW representation (pre fusion).</li>
+<li><strong>gw_decoders (<code>Mapping[str, torch.nn.Module]</code>):</strong>  mapping for each domain
+name to a an torch.nn.Module class that decodes a
+ GW representation to a unimodal latent representation.</li>
+</ul>
+</div>
+
+
+                            </div>
+                            <div id="GWModule.gw_encoders" class="classattr">
+                                <div class="attr variable">
+            <span class="name">gw_encoders</span>
+
+        
+    </div>
+    <a class="headerlink" href="#GWModule.gw_encoders"></a>
+    
+            <div class="docstring"><p>The module's encoders</p>
+</div>
+
+
+                            </div>
+                            <div id="GWModule.gw_decoders" class="classattr">
+                                <div class="attr variable">
+            <span class="name">gw_decoders</span>
+
+        
+    </div>
+    <a class="headerlink" href="#GWModule.gw_decoders"></a>
+    
+            <div class="docstring"><p>The module's decoders</p>
+</div>
+
+
+                            </div>
+                            <div id="GWModule.fuse" class="classattr">
+                                        <input id="GWModule.fuse-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
+<div class="attr function">
+            
+        <span class="def">def</span>
+        <span class="name">fuse</span><span class="signature pdoc-code multiline">(<span class="param">	<span class="bp">self</span>,</span><span class="param">	<span class="n">x</span><span class="p">:</span> <span class="n">collections</span><span class="o">.</span><span class="n">abc</span><span class="o">.</span><span class="n">Mapping</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]</span>,</span><span class="param">	<span class="n">selection_scores</span><span class="p">:</span> <span class="n">collections</span><span class="o">.</span><span class="n">abc</span><span class="o">.</span><span class="n">Mapping</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]</span></span><span class="return-annotation">) -> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span>:</span></span>
+
+                <label class="view-source-button" for="GWModule.fuse-view-source"><span>View Source</span></label>
+
+    </div>
+    <a class="headerlink" href="#GWModule.fuse"></a>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="GWModule.fuse-241"><a href="#GWModule.fuse-241"><span class="linenos">241</span></a>    <span class="k">def</span> <span class="nf">fuse</span><span class="p">(</span>
+</span><span id="GWModule.fuse-242"><a href="#GWModule.fuse-242"><span class="linenos">242</span></a>        <span class="bp">self</span><span class="p">,</span>
+</span><span id="GWModule.fuse-243"><a href="#GWModule.fuse-243"><span class="linenos">243</span></a>        <span class="n">x</span><span class="p">:</span> <span class="n">LatentsDomainGroupT</span><span class="p">,</span>
+</span><span id="GWModule.fuse-244"><a href="#GWModule.fuse-244"><span class="linenos">244</span></a>        <span class="n">selection_scores</span><span class="p">:</span> <span class="n">Mapping</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">],</span>
+</span><span id="GWModule.fuse-245"><a href="#GWModule.fuse-245"><span class="linenos">245</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">:</span>
+</span><span id="GWModule.fuse-246"><a href="#GWModule.fuse-246"><span class="linenos">246</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="GWModule.fuse-247"><a href="#GWModule.fuse-247"><span class="linenos">247</span></a><span class="sd">        Merge function used to combine domains.</span>
+</span><span id="GWModule.fuse-248"><a href="#GWModule.fuse-248"><span class="linenos">248</span></a>
+</span><span id="GWModule.fuse-249"><a href="#GWModule.fuse-249"><span class="linenos">249</span></a><span class="sd">        Args:</span>
+</span><span id="GWModule.fuse-250"><a href="#GWModule.fuse-250"><span class="linenos">250</span></a><span class="sd">            x (`LatentsDomainGroupT`): the group of latent representation.</span>
+</span><span id="GWModule.fuse-251"><a href="#GWModule.fuse-251"><span class="linenos">251</span></a><span class="sd">            selection_score (`Mapping[str, torch.Tensor]`): attention scores to</span>
+</span><span id="GWModule.fuse-252"><a href="#GWModule.fuse-252"><span class="linenos">252</span></a><span class="sd">                use to encode the reprensetation.</span>
+</span><span id="GWModule.fuse-253"><a href="#GWModule.fuse-253"><span class="linenos">253</span></a><span class="sd">        Returns:</span>
+</span><span id="GWModule.fuse-254"><a href="#GWModule.fuse-254"><span class="linenos">254</span></a><span class="sd">            `torch.Tensor`: The merged representation.</span>
+</span><span id="GWModule.fuse-255"><a href="#GWModule.fuse-255"><span class="linenos">255</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="GWModule.fuse-256"><a href="#GWModule.fuse-256"><span class="linenos">256</span></a>        <span class="k">return</span> <span class="n">torch</span><span class="o">.</span><span class="n">tanh</span><span class="p">(</span>
+</span><span id="GWModule.fuse-257"><a href="#GWModule.fuse-257"><span class="linenos">257</span></a>            <span class="n">torch</span><span class="o">.</span><span class="n">sum</span><span class="p">(</span>
+</span><span id="GWModule.fuse-258"><a href="#GWModule.fuse-258"><span class="linenos">258</span></a>                <span class="n">torch</span><span class="o">.</span><span class="n">stack</span><span class="p">(</span>
+</span><span id="GWModule.fuse-259"><a href="#GWModule.fuse-259"><span class="linenos">259</span></a>                    <span class="p">[</span>
+</span><span id="GWModule.fuse-260"><a href="#GWModule.fuse-260"><span class="linenos">260</span></a>                        <span class="n">selection_scores</span><span class="p">[</span><span class="n">domain</span><span class="p">]</span><span class="o">.</span><span class="n">unsqueeze</span><span class="p">(</span><span class="mi">1</span><span class="p">)</span> <span class="o">*</span> <span class="n">x</span><span class="p">[</span><span class="n">domain</span><span class="p">]</span>
+</span><span id="GWModule.fuse-261"><a href="#GWModule.fuse-261"><span class="linenos">261</span></a>                        <span class="k">for</span> <span class="n">domain</span> <span class="ow">in</span> <span class="n">selection_scores</span>
+</span><span id="GWModule.fuse-262"><a href="#GWModule.fuse-262"><span class="linenos">262</span></a>                    <span class="p">]</span>
+</span><span id="GWModule.fuse-263"><a href="#GWModule.fuse-263"><span class="linenos">263</span></a>                <span class="p">),</span>
+</span><span id="GWModule.fuse-264"><a href="#GWModule.fuse-264"><span class="linenos">264</span></a>                <span class="n">dim</span><span class="o">=</span><span class="mi">0</span><span class="p">,</span>
+</span><span id="GWModule.fuse-265"><a href="#GWModule.fuse-265"><span class="linenos">265</span></a>            <span class="p">)</span>
+</span><span id="GWModule.fuse-266"><a href="#GWModule.fuse-266"><span class="linenos">266</span></a>        <span class="p">)</span>
+</span></pre></div>
+
+
+            <div class="docstring"><p>Merge function used to combine domains.</p>
+
+<h6 id="arguments">Arguments:</h6>
+
+<ul>
+<li><strong>x (<code>LatentsDomainGroupT</code>):</strong>  the group of latent representation.</li>
+<li><strong>selection_score (<code>Mapping[str, torch.Tensor]</code>):</strong>  attention scores to
+use to encode the reprensetation.</li>
+</ul>
+
+<h6 id="returns">Returns:</h6>
+
+<blockquote>
+  <p><code>torch.Tensor</code>: The merged representation.</p>
+</blockquote>
+</div>
+
+
+                            </div>
+                            <div id="GWModule.encode" class="classattr">
+                                        <input id="GWModule.encode-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
+<div class="attr function">
+            
+        <span class="def">def</span>
+        <span class="name">encode</span><span class="signature pdoc-code multiline">(<span class="param">	<span class="bp">self</span>,</span><span class="param">	<span class="n">x</span><span class="p">:</span> <span class="n">collections</span><span class="o">.</span><span class="n">abc</span><span class="o">.</span><span class="n">Mapping</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]</span></span><span class="return-annotation">) -> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]</span>:</span></span>
+
+                <label class="view-source-button" for="GWModule.encode-view-source"><span>View Source</span></label>
+
+    </div>
+    <a class="headerlink" href="#GWModule.encode"></a>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="GWModule.encode-268"><a href="#GWModule.encode-268"><span class="linenos">268</span></a>    <span class="k">def</span> <span class="nf">encode</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">x</span><span class="p">:</span> <span class="n">LatentsDomainGroupT</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">LatentsDomainGroupDT</span><span class="p">:</span>
+</span><span id="GWModule.encode-269"><a href="#GWModule.encode-269"><span class="linenos">269</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="GWModule.encode-270"><a href="#GWModule.encode-270"><span class="linenos">270</span></a><span class="sd">        Encode the latent representation infos to the pre-fusion GW representation.</span>
+</span><span id="GWModule.encode-271"><a href="#GWModule.encode-271"><span class="linenos">271</span></a>
+</span><span id="GWModule.encode-272"><a href="#GWModule.encode-272"><span class="linenos">272</span></a><span class="sd">        Args:</span>
+</span><span id="GWModule.encode-273"><a href="#GWModule.encode-273"><span class="linenos">273</span></a><span class="sd">            x (`LatentsDomainGroupT`): the input domain representations.</span>
+</span><span id="GWModule.encode-274"><a href="#GWModule.encode-274"><span class="linenos">274</span></a>
+</span><span id="GWModule.encode-275"><a href="#GWModule.encode-275"><span class="linenos">275</span></a><span class="sd">        Returns:</span>
+</span><span id="GWModule.encode-276"><a href="#GWModule.encode-276"><span class="linenos">276</span></a><span class="sd">            `LatentsDomainGroupT`: pre-fusion representation</span>
+</span><span id="GWModule.encode-277"><a href="#GWModule.encode-277"><span class="linenos">277</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="GWModule.encode-278"><a href="#GWModule.encode-278"><span class="linenos">278</span></a>        <span class="k">return</span> <span class="p">{</span>
+</span><span id="GWModule.encode-279"><a href="#GWModule.encode-279"><span class="linenos">279</span></a>            <span class="n">domain_name</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">gw_encoders</span><span class="p">[</span><span class="n">domain_name</span><span class="p">](</span><span class="n">domain</span><span class="p">)</span>
+</span><span id="GWModule.encode-280"><a href="#GWModule.encode-280"><span class="linenos">280</span></a>            <span class="k">for</span> <span class="n">domain_name</span><span class="p">,</span> <span class="n">domain</span> <span class="ow">in</span> <span class="n">x</span><span class="o">.</span><span class="n">items</span><span class="p">()</span>
+</span><span id="GWModule.encode-281"><a href="#GWModule.encode-281"><span class="linenos">281</span></a>        <span class="p">}</span>
+</span></pre></div>
+
+
+            <div class="docstring"><p>Encode the latent representation infos to the pre-fusion GW representation.</p>
+
+<h6 id="arguments">Arguments:</h6>
+
+<ul>
+<li><strong>x (<code>LatentsDomainGroupT</code>):</strong>  the input domain representations.</li>
+</ul>
+
+<h6 id="returns">Returns:</h6>
+
+<blockquote>
+  <p><code>LatentsDomainGroupT</code>: pre-fusion representation</p>
+</blockquote>
+</div>
+
+
+                            </div>
+                            <div id="GWModule.decode" class="classattr">
+                                        <input id="GWModule.decode-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
+<div class="attr function">
+            
+        <span class="def">def</span>
+        <span class="name">decode</span><span class="signature pdoc-code multiline">(<span class="param">	<span class="bp">self</span>,</span><span class="param">	<span class="n">z</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span>,</span><span class="param">	<span class="n">domains</span><span class="p">:</span> <span class="n">collections</span><span class="o">.</span><span class="n">abc</span><span class="o">.</span><span class="n">Iterable</span><span class="p">[</span><span class="nb">str</span><span class="p">]</span> <span class="o">|</span> <span class="kc">None</span> <span class="o">=</span> <span class="kc">None</span></span><span class="return-annotation">) -> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]</span>:</span></span>
+
+                <label class="view-source-button" for="GWModule.decode-view-source"><span>View Source</span></label>
+
+    </div>
+    <a class="headerlink" href="#GWModule.decode"></a>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="GWModule.decode-283"><a href="#GWModule.decode-283"><span class="linenos">283</span></a>    <span class="k">def</span> <span class="nf">decode</span><span class="p">(</span>
+</span><span id="GWModule.decode-284"><a href="#GWModule.decode-284"><span class="linenos">284</span></a>        <span class="bp">self</span><span class="p">,</span> <span class="n">z</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">,</span> <span class="n">domains</span><span class="p">:</span> <span class="n">Iterable</span><span class="p">[</span><span class="nb">str</span><span class="p">]</span> <span class="o">|</span> <span class="kc">None</span> <span class="o">=</span> <span class="kc">None</span>
+</span><span id="GWModule.decode-285"><a href="#GWModule.decode-285"><span class="linenos">285</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="n">LatentsDomainGroupDT</span><span class="p">:</span>
+</span><span id="GWModule.decode-286"><a href="#GWModule.decode-286"><span class="linenos">286</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="GWModule.decode-287"><a href="#GWModule.decode-287"><span class="linenos">287</span></a><span class="sd">        Decodes a GW representation to multiple domains.</span>
+</span><span id="GWModule.decode-288"><a href="#GWModule.decode-288"><span class="linenos">288</span></a>
+</span><span id="GWModule.decode-289"><a href="#GWModule.decode-289"><span class="linenos">289</span></a><span class="sd">        Args:</span>
+</span><span id="GWModule.decode-290"><a href="#GWModule.decode-290"><span class="linenos">290</span></a><span class="sd">            z (`torch.Tensor`): the GW representation</span>
+</span><span id="GWModule.decode-291"><a href="#GWModule.decode-291"><span class="linenos">291</span></a><span class="sd">            domains (`Iterable[str] | None`): the domains to decode to. Defaults to</span>
+</span><span id="GWModule.decode-292"><a href="#GWModule.decode-292"><span class="linenos">292</span></a><span class="sd">                use keys in `gw_interfaces` (all domains).</span>
+</span><span id="GWModule.decode-293"><a href="#GWModule.decode-293"><span class="linenos">293</span></a><span class="sd">        Returns:</span>
+</span><span id="GWModule.decode-294"><a href="#GWModule.decode-294"><span class="linenos">294</span></a><span class="sd">            `LatentsDomainGroupDT`: decoded unimodal representation</span>
+</span><span id="GWModule.decode-295"><a href="#GWModule.decode-295"><span class="linenos">295</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="GWModule.decode-296"><a href="#GWModule.decode-296"><span class="linenos">296</span></a>        <span class="k">return</span> <span class="p">{</span>
+</span><span id="GWModule.decode-297"><a href="#GWModule.decode-297"><span class="linenos">297</span></a>            <span class="n">domain</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">gw_decoders</span><span class="p">[</span><span class="n">domain</span><span class="p">](</span><span class="n">z</span><span class="p">)</span>
+</span><span id="GWModule.decode-298"><a href="#GWModule.decode-298"><span class="linenos">298</span></a>            <span class="k">for</span> <span class="n">domain</span> <span class="ow">in</span> <span class="n">domains</span> <span class="ow">or</span> <span class="bp">self</span><span class="o">.</span><span class="n">gw_decoders</span><span class="o">.</span><span class="n">keys</span><span class="p">()</span>
+</span><span id="GWModule.decode-299"><a href="#GWModule.decode-299"><span class="linenos">299</span></a>        <span class="p">}</span>
+</span></pre></div>
+
+
+            <div class="docstring"><p>Decodes a GW representation to multiple domains.</p>
+
+<h6 id="arguments">Arguments:</h6>
+
+<ul>
+<li><strong>z (<code>torch.Tensor</code>):</strong>  the GW representation</li>
+<li><strong>domains (<code>Iterable[str] | None</code>):</strong>  the domains to decode to. Defaults to
+use keys in <code>gw_interfaces</code> (all domains).</li>
+</ul>
+
+<h6 id="returns">Returns:</h6>
+
+<blockquote>
+  <p><code>LatentsDomainGroupDT</code>: decoded unimodal representation</p>
+</blockquote>
+</div>
+
+
+                            </div>
+                            <div class="inherited">
+                                <h5>Inherited Members</h5>
+                                <dl>
+                                    <div><dt><a href="#GWModuleBase">GWModuleBase</a></dt>
+                                <dd id="GWModule.domain_mods" class="variable"><a href="#GWModuleBase.domain_mods">domain_mods</a></dd>
+                <dd id="GWModule.workspace_dim" class="variable"><a href="#GWModuleBase.workspace_dim">workspace_dim</a></dd>
+                <dd id="GWModule.encode_and_fuse" class="function"><a href="#GWModuleBase.encode_and_fuse">encode_and_fuse</a></dd>
+
+            </div>
+            <div><dt>torch.nn.modules.module.Module</dt>
+                                <dd id="GWModule.dump_patches" class="variable">dump_patches</dd>
+                <dd id="GWModule.training" class="variable">training</dd>
+                <dd id="GWModule.call_super_init" class="variable">call_super_init</dd>
+                <dd id="GWModule.forward" class="function">forward</dd>
+                <dd id="GWModule.register_buffer" class="function">register_buffer</dd>
+                <dd id="GWModule.register_parameter" class="function">register_parameter</dd>
+                <dd id="GWModule.add_module" class="function">add_module</dd>
+                <dd id="GWModule.register_module" class="function">register_module</dd>
+                <dd id="GWModule.get_submodule" class="function">get_submodule</dd>
+                <dd id="GWModule.get_parameter" class="function">get_parameter</dd>
+                <dd id="GWModule.get_buffer" class="function">get_buffer</dd>
+                <dd id="GWModule.get_extra_state" class="function">get_extra_state</dd>
+                <dd id="GWModule.set_extra_state" class="function">set_extra_state</dd>
+                <dd id="GWModule.apply" class="function">apply</dd>
+                <dd id="GWModule.cuda" class="function">cuda</dd>
+                <dd id="GWModule.ipu" class="function">ipu</dd>
+                <dd id="GWModule.xpu" class="function">xpu</dd>
+                <dd id="GWModule.cpu" class="function">cpu</dd>
+                <dd id="GWModule.type" class="function">type</dd>
+                <dd id="GWModule.float" class="function">float</dd>
+                <dd id="GWModule.double" class="function">double</dd>
+                <dd id="GWModule.half" class="function">half</dd>
+                <dd id="GWModule.bfloat16" class="function">bfloat16</dd>
+                <dd id="GWModule.to_empty" class="function">to_empty</dd>
+                <dd id="GWModule.to" class="function">to</dd>
+                <dd id="GWModule.register_full_backward_pre_hook" class="function">register_full_backward_pre_hook</dd>
+                <dd id="GWModule.register_backward_hook" class="function">register_backward_hook</dd>
+                <dd id="GWModule.register_full_backward_hook" class="function">register_full_backward_hook</dd>
+                <dd id="GWModule.register_forward_pre_hook" class="function">register_forward_pre_hook</dd>
+                <dd id="GWModule.register_forward_hook" class="function">register_forward_hook</dd>
+                <dd id="GWModule.register_state_dict_pre_hook" class="function">register_state_dict_pre_hook</dd>
+                <dd id="GWModule.state_dict" class="function">state_dict</dd>
+                <dd id="GWModule.register_load_state_dict_post_hook" class="function">register_load_state_dict_post_hook</dd>
+                <dd id="GWModule.load_state_dict" class="function">load_state_dict</dd>
+                <dd id="GWModule.parameters" class="function">parameters</dd>
+                <dd id="GWModule.named_parameters" class="function">named_parameters</dd>
+                <dd id="GWModule.buffers" class="function">buffers</dd>
+                <dd id="GWModule.named_buffers" class="function">named_buffers</dd>
+                <dd id="GWModule.children" class="function">children</dd>
+                <dd id="GWModule.named_children" class="function">named_children</dd>
+                <dd id="GWModule.modules" class="function">modules</dd>
+                <dd id="GWModule.named_modules" class="function">named_modules</dd>
+                <dd id="GWModule.train" class="function">train</dd>
+                <dd id="GWModule.eval" class="function">eval</dd>
+                <dd id="GWModule.requires_grad_" class="function">requires_grad_</dd>
+                <dd id="GWModule.zero_grad" class="function">zero_grad</dd>
+                <dd id="GWModule.share_memory" class="function">share_memory</dd>
+                <dd id="GWModule.extra_repr" class="function">extra_repr</dd>
+                <dd id="GWModule.compile" class="function">compile</dd>
+
+            </div>
+                                </dl>
+                            </div>
+                </section>
+                <section id="compute_fusion_scores">
+                            <input id="compute_fusion_scores-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
+<div class="attr function">
+            
+        <span class="def">def</span>
+        <span class="name">compute_fusion_scores</span><span class="signature pdoc-code multiline">(<span class="param">	<span class="n">score_1</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span>,</span><span class="param">	<span class="n">score_2</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span>,</span><span class="param">	<span class="n">sensitivity_1</span><span class="p">:</span> <span class="nb">float</span> <span class="o">=</span> <span class="mf">1.0</span>,</span><span class="param">	<span class="n">sensitivity_2</span><span class="p">:</span> <span class="nb">float</span> <span class="o">=</span> <span class="mf">1.0</span>,</span><span class="param">	<span class="n">eps</span><span class="p">:</span> <span class="nb">float</span> <span class="o">=</span> <span class="mf">1e-06</span></span><span class="return-annotation">) -> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span>:</span></span>
+
+                <label class="view-source-button" for="compute_fusion_scores-view-source"><span>View Source</span></label>
+
+    </div>
+    <a class="headerlink" href="#compute_fusion_scores"></a>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="compute_fusion_scores-302"><a href="#compute_fusion_scores-302"><span class="linenos">302</span></a><span class="k">def</span> <span class="nf">compute_fusion_scores</span><span class="p">(</span>
+</span><span id="compute_fusion_scores-303"><a href="#compute_fusion_scores-303"><span class="linenos">303</span></a>    <span class="n">score_1</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">,</span>
+</span><span id="compute_fusion_scores-304"><a href="#compute_fusion_scores-304"><span class="linenos">304</span></a>    <span class="n">score_2</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">,</span>
+</span><span id="compute_fusion_scores-305"><a href="#compute_fusion_scores-305"><span class="linenos">305</span></a>    <span class="n">sensitivity_1</span><span class="p">:</span> <span class="nb">float</span> <span class="o">=</span> <span class="mf">1.0</span><span class="p">,</span>
+</span><span id="compute_fusion_scores-306"><a href="#compute_fusion_scores-306"><span class="linenos">306</span></a>    <span class="n">sensitivity_2</span><span class="p">:</span> <span class="nb">float</span> <span class="o">=</span> <span class="mf">1.0</span><span class="p">,</span>
+</span><span id="compute_fusion_scores-307"><a href="#compute_fusion_scores-307"><span class="linenos">307</span></a>    <span class="n">eps</span><span class="p">:</span> <span class="nb">float</span> <span class="o">=</span> <span class="mf">1e-6</span><span class="p">,</span>
+</span><span id="compute_fusion_scores-308"><a href="#compute_fusion_scores-308"><span class="linenos">308</span></a><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">:</span>
+</span><span id="compute_fusion_scores-309"><a href="#compute_fusion_scores-309"><span class="linenos">309</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="compute_fusion_scores-310"><a href="#compute_fusion_scores-310"><span class="linenos">310</span></a><span class="sd">    Combine precision scores using std summation in quadrature</span>
+</span><span id="compute_fusion_scores-311"><a href="#compute_fusion_scores-311"><span class="linenos">311</span></a>
+</span><span id="compute_fusion_scores-312"><a href="#compute_fusion_scores-312"><span class="linenos">312</span></a><span class="sd">    The two scores should have the same dimension.</span>
+</span><span id="compute_fusion_scores-313"><a href="#compute_fusion_scores-313"><span class="linenos">313</span></a>
+</span><span id="compute_fusion_scores-314"><a href="#compute_fusion_scores-314"><span class="linenos">314</span></a><span class="sd">    Args:</span>
+</span><span id="compute_fusion_scores-315"><a href="#compute_fusion_scores-315"><span class="linenos">315</span></a><span class="sd">        score_1 (`torch.Tensor`): First scores.</span>
+</span><span id="compute_fusion_scores-316"><a href="#compute_fusion_scores-316"><span class="linenos">316</span></a><span class="sd">        score_2 (`torch.Tensor`): Second scores.</span>
+</span><span id="compute_fusion_scores-317"><a href="#compute_fusion_scores-317"><span class="linenos">317</span></a><span class="sd">        sensitivity_1 (`float`): sensitivity for the first score</span>
+</span><span id="compute_fusion_scores-318"><a href="#compute_fusion_scores-318"><span class="linenos">318</span></a><span class="sd">        sensitivity_2 (`float`): sensitivity for the second score</span>
+</span><span id="compute_fusion_scores-319"><a href="#compute_fusion_scores-319"><span class="linenos">319</span></a><span class="sd">        eps (`float`): a value added to avoid numerical unstability.</span>
+</span><span id="compute_fusion_scores-320"><a href="#compute_fusion_scores-320"><span class="linenos">320</span></a>
+</span><span id="compute_fusion_scores-321"><a href="#compute_fusion_scores-321"><span class="linenos">321</span></a><span class="sd">    Returns:</span>
+</span><span id="compute_fusion_scores-322"><a href="#compute_fusion_scores-322"><span class="linenos">322</span></a><span class="sd">        `torch.Tensor`: the combined scores</span>
+</span><span id="compute_fusion_scores-323"><a href="#compute_fusion_scores-323"><span class="linenos">323</span></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="compute_fusion_scores-324"><a href="#compute_fusion_scores-324"><span class="linenos">324</span></a>    <span class="n">total_uncertainty</span> <span class="o">=</span> <span class="n">sensitivity_1</span> <span class="o">/</span> <span class="p">(</span><span class="n">eps</span> <span class="o">+</span> <span class="n">score_1</span><span class="p">)</span> <span class="o">+</span> <span class="n">sensitivity_2</span> <span class="o">/</span> <span class="p">(</span>
+</span><span id="compute_fusion_scores-325"><a href="#compute_fusion_scores-325"><span class="linenos">325</span></a>        <span class="n">eps</span> <span class="o">+</span> <span class="n">score_2</span>
+</span><span id="compute_fusion_scores-326"><a href="#compute_fusion_scores-326"><span class="linenos">326</span></a>    <span class="p">)</span>
+</span><span id="compute_fusion_scores-327"><a href="#compute_fusion_scores-327"><span class="linenos">327</span></a>    <span class="n">final_scores</span> <span class="o">=</span> <span class="mi">1</span> <span class="o">/</span> <span class="p">(</span><span class="n">eps</span> <span class="o">+</span> <span class="n">total_uncertainty</span><span class="p">)</span>
+</span><span id="compute_fusion_scores-328"><a href="#compute_fusion_scores-328"><span class="linenos">328</span></a>    <span class="k">return</span> <span class="n">final_scores</span> <span class="o">/</span> <span class="n">final_scores</span><span class="o">.</span><span class="n">sum</span><span class="p">(</span><span class="n">dim</span><span class="o">=</span><span class="mi">0</span><span class="p">,</span> <span class="n">keepdim</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
+</span></pre></div>
+
+
+            <div class="docstring"><p>Combine precision scores using std summation in quadrature</p>
+
+<p>The two scores should have the same dimension.</p>
+
+<h6 id="arguments">Arguments:</h6>
+
+<ul>
+<li><strong>score_1 (<code>torch.Tensor</code>):</strong>  First scores.</li>
+<li><strong>score_2 (<code>torch.Tensor</code>):</strong>  Second scores.</li>
+<li><strong>sensitivity_1 (<code>float</code>):</strong>  sensitivity for the first score</li>
+<li><strong>sensitivity_2 (<code>float</code>):</strong>  sensitivity for the second score</li>
+<li><strong>eps (<code>float</code>):</strong>  a value added to avoid numerical unstability.</li>
+</ul>
+
+<h6 id="returns">Returns:</h6>
+
+<blockquote>
+  <p><code>torch.Tensor</code>: the combined scores</p>
+</blockquote>
+</div>
+
+
+                </section>
+                <section id="GWModuleBayesian">
+                            <input id="GWModuleBayesian-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
+<div class="attr class">
+            
+    <span class="def">class</span>
+    <span class="name">GWModuleBayesian</span><wbr>(<span class="base"><a href="#GWModule">GWModule</a></span>):
+
+                <label class="view-source-button" for="GWModuleBayesian-view-source"><span>View Source</span></label>
+
+    </div>
+    <a class="headerlink" href="#GWModuleBayesian"></a>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="GWModuleBayesian-331"><a href="#GWModuleBayesian-331"><span class="linenos">331</span></a><span class="k">class</span> <span class="nc">GWModuleBayesian</span><span class="p">(</span><span class="n">GWModule</span><span class="p">):</span>
+</span><span id="GWModuleBayesian-332"><a href="#GWModuleBayesian-332"><span class="linenos">332</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;`GWModule` with a Bayesian based uncertainty prediction.&quot;&quot;&quot;</span>
+</span><span id="GWModuleBayesian-333"><a href="#GWModuleBayesian-333"><span class="linenos">333</span></a>
+</span><span id="GWModuleBayesian-334"><a href="#GWModuleBayesian-334"><span class="linenos">334</span></a>    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span>
+</span><span id="GWModuleBayesian-335"><a href="#GWModuleBayesian-335"><span class="linenos">335</span></a>        <span class="bp">self</span><span class="p">,</span>
+</span><span id="GWModuleBayesian-336"><a href="#GWModuleBayesian-336"><span class="linenos">336</span></a>        <span class="n">domain_modules</span><span class="p">:</span> <span class="n">Mapping</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">DomainModule</span><span class="p">],</span>
+</span><span id="GWModuleBayesian-337"><a href="#GWModuleBayesian-337"><span class="linenos">337</span></a>        <span class="n">workspace_dim</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span>
+</span><span id="GWModuleBayesian-338"><a href="#GWModuleBayesian-338"><span class="linenos">338</span></a>        <span class="n">gw_encoders</span><span class="p">:</span> <span class="n">Mapping</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">nn</span><span class="o">.</span><span class="n">Module</span><span class="p">],</span>
+</span><span id="GWModuleBayesian-339"><a href="#GWModuleBayesian-339"><span class="linenos">339</span></a>        <span class="n">gw_decoders</span><span class="p">:</span> <span class="n">Mapping</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">nn</span><span class="o">.</span><span class="n">Module</span><span class="p">],</span>
+</span><span id="GWModuleBayesian-340"><a href="#GWModuleBayesian-340"><span class="linenos">340</span></a>        <span class="n">sensitivity_selection</span><span class="p">:</span> <span class="nb">float</span> <span class="o">=</span> <span class="mi">1</span><span class="p">,</span>
+</span><span id="GWModuleBayesian-341"><a href="#GWModuleBayesian-341"><span class="linenos">341</span></a>        <span class="n">sensitivity_precision</span><span class="p">:</span> <span class="nb">float</span> <span class="o">=</span> <span class="mi">1</span><span class="p">,</span>
+</span><span id="GWModuleBayesian-342"><a href="#GWModuleBayesian-342"><span class="linenos">342</span></a>        <span class="n">precision_softmax_temp</span><span class="p">:</span> <span class="nb">float</span> <span class="o">=</span> <span class="mf">0.01</span><span class="p">,</span>
+</span><span id="GWModuleBayesian-343"><a href="#GWModuleBayesian-343"><span class="linenos">343</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="GWModuleBayesian-344"><a href="#GWModuleBayesian-344"><span class="linenos">344</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="GWModuleBayesian-345"><a href="#GWModuleBayesian-345"><span class="linenos">345</span></a><span class="sd">        Initializes the GWModuleBayesian.</span>
+</span><span id="GWModuleBayesian-346"><a href="#GWModuleBayesian-346"><span class="linenos">346</span></a>
+</span><span id="GWModuleBayesian-347"><a href="#GWModuleBayesian-347"><span class="linenos">347</span></a><span class="sd">        Args:</span>
+</span><span id="GWModuleBayesian-348"><a href="#GWModuleBayesian-348"><span class="linenos">348</span></a><span class="sd">            domain_modules (`Mapping[str, DomainModule]`): the domain modules.</span>
+</span><span id="GWModuleBayesian-349"><a href="#GWModuleBayesian-349"><span class="linenos">349</span></a><span class="sd">            workspace_dim (`int`): dimension of the GW.</span>
+</span><span id="GWModuleBayesian-350"><a href="#GWModuleBayesian-350"><span class="linenos">350</span></a><span class="sd">            gw_encoders (`Mapping[str, torch.nn.Module]`): mapping for each domain</span>
+</span><span id="GWModuleBayesian-351"><a href="#GWModuleBayesian-351"><span class="linenos">351</span></a><span class="sd">                name to a an torch.nn.Module class that encodes a</span>
+</span><span id="GWModuleBayesian-352"><a href="#GWModuleBayesian-352"><span class="linenos">352</span></a><span class="sd">                unimodal latent representations into a GW representation (pre fusion).</span>
+</span><span id="GWModuleBayesian-353"><a href="#GWModuleBayesian-353"><span class="linenos">353</span></a><span class="sd">            gw_decoders (`Mapping[str, torch.nn.Module]`): mapping for each domain</span>
+</span><span id="GWModuleBayesian-354"><a href="#GWModuleBayesian-354"><span class="linenos">354</span></a><span class="sd">                name to a an torch.nn.Module class that decodes a</span>
+</span><span id="GWModuleBayesian-355"><a href="#GWModuleBayesian-355"><span class="linenos">355</span></a><span class="sd">                 GW representation to a unimodal latent representation.</span>
+</span><span id="GWModuleBayesian-356"><a href="#GWModuleBayesian-356"><span class="linenos">356</span></a><span class="sd">            sensitivity_selection (`float`): sensivity coef $c&#39;_1$</span>
+</span><span id="GWModuleBayesian-357"><a href="#GWModuleBayesian-357"><span class="linenos">357</span></a><span class="sd">            sensitivity_precision (`float`): sensitivity coef $c&#39;_2$</span>
+</span><span id="GWModuleBayesian-358"><a href="#GWModuleBayesian-358"><span class="linenos">358</span></a><span class="sd">            precision_softmax_temp (`float`): temperature to use in softmax of</span>
+</span><span id="GWModuleBayesian-359"><a href="#GWModuleBayesian-359"><span class="linenos">359</span></a><span class="sd">                precision</span>
+</span><span id="GWModuleBayesian-360"><a href="#GWModuleBayesian-360"><span class="linenos">360</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="GWModuleBayesian-361"><a href="#GWModuleBayesian-361"><span class="linenos">361</span></a>        <span class="nb">super</span><span class="p">()</span><span class="o">.</span><span class="fm">__init__</span><span class="p">(</span><span class="n">domain_modules</span><span class="p">,</span> <span class="n">workspace_dim</span><span class="p">,</span> <span class="n">gw_encoders</span><span class="p">,</span> <span class="n">gw_decoders</span><span class="p">)</span>
+</span><span id="GWModuleBayesian-362"><a href="#GWModuleBayesian-362"><span class="linenos">362</span></a>
+</span><span id="GWModuleBayesian-363"><a href="#GWModuleBayesian-363"><span class="linenos">363</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">precisions</span> <span class="o">=</span> <span class="n">cast</span><span class="p">(</span>
+</span><span id="GWModuleBayesian-364"><a href="#GWModuleBayesian-364"><span class="linenos">364</span></a>            <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">],</span>
+</span><span id="GWModuleBayesian-365"><a href="#GWModuleBayesian-365"><span class="linenos">365</span></a>            <span class="n">nn</span><span class="o">.</span><span class="n">ParameterDict</span><span class="p">(</span>
+</span><span id="GWModuleBayesian-366"><a href="#GWModuleBayesian-366"><span class="linenos">366</span></a>                <span class="p">{</span><span class="n">domain</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">randn</span><span class="p">(</span><span class="n">workspace_dim</span><span class="p">)</span> <span class="k">for</span> <span class="n">domain</span> <span class="ow">in</span> <span class="n">gw_encoders</span><span class="p">}</span>
+</span><span id="GWModuleBayesian-367"><a href="#GWModuleBayesian-367"><span class="linenos">367</span></a>            <span class="p">),</span>
+</span><span id="GWModuleBayesian-368"><a href="#GWModuleBayesian-368"><span class="linenos">368</span></a>        <span class="p">)</span>
+</span><span id="GWModuleBayesian-369"><a href="#GWModuleBayesian-369"><span class="linenos">369</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;Precision at the neuron level for every domain.&quot;&quot;&quot;</span>
+</span><span id="GWModuleBayesian-370"><a href="#GWModuleBayesian-370"><span class="linenos">370</span></a>
+</span><span id="GWModuleBayesian-371"><a href="#GWModuleBayesian-371"><span class="linenos">371</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">sensitivity_selection</span> <span class="o">=</span> <span class="n">sensitivity_selection</span>
+</span><span id="GWModuleBayesian-372"><a href="#GWModuleBayesian-372"><span class="linenos">372</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">sensitivity_precision</span> <span class="o">=</span> <span class="n">sensitivity_precision</span>
+</span><span id="GWModuleBayesian-373"><a href="#GWModuleBayesian-373"><span class="linenos">373</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">precision_softmax_temp</span> <span class="o">=</span> <span class="n">precision_softmax_temp</span>
+</span><span id="GWModuleBayesian-374"><a href="#GWModuleBayesian-374"><span class="linenos">374</span></a>
+</span><span id="GWModuleBayesian-375"><a href="#GWModuleBayesian-375"><span class="linenos">375</span></a>    <span class="k">def</span> <span class="nf">get_precision</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">domain</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span> <span class="n">x</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">:</span>
+</span><span id="GWModuleBayesian-376"><a href="#GWModuleBayesian-376"><span class="linenos">376</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="GWModuleBayesian-377"><a href="#GWModuleBayesian-377"><span class="linenos">377</span></a><span class="sd">        Get the precision vector of given domain and batch</span>
+</span><span id="GWModuleBayesian-378"><a href="#GWModuleBayesian-378"><span class="linenos">378</span></a>
+</span><span id="GWModuleBayesian-379"><a href="#GWModuleBayesian-379"><span class="linenos">379</span></a><span class="sd">        Args:</span>
+</span><span id="GWModuleBayesian-380"><a href="#GWModuleBayesian-380"><span class="linenos">380</span></a><span class="sd">            domain (`str`):</span>
+</span><span id="GWModuleBayesian-381"><a href="#GWModuleBayesian-381"><span class="linenos">381</span></a><span class="sd">            x (`torch.Tensor`): batch of inputs</span>
+</span><span id="GWModuleBayesian-382"><a href="#GWModuleBayesian-382"><span class="linenos">382</span></a>
+</span><span id="GWModuleBayesian-383"><a href="#GWModuleBayesian-383"><span class="linenos">383</span></a><span class="sd">        Returns:</span>
+</span><span id="GWModuleBayesian-384"><a href="#GWModuleBayesian-384"><span class="linenos">384</span></a><span class="sd">            `torch.Tensor`: batch of precision</span>
+</span><span id="GWModuleBayesian-385"><a href="#GWModuleBayesian-385"><span class="linenos">385</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="GWModuleBayesian-386"><a href="#GWModuleBayesian-386"><span class="linenos">386</span></a>        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">precisions</span><span class="p">[</span><span class="n">domain</span><span class="p">]</span><span class="o">.</span><span class="n">unsqueeze</span><span class="p">(</span><span class="mi">0</span><span class="p">)</span><span class="o">.</span><span class="n">expand</span><span class="p">(</span><span class="n">x</span><span class="o">.</span><span class="n">size</span><span class="p">(</span><span class="mi">0</span><span class="p">),</span> <span class="o">-</span><span class="mi">1</span><span class="p">)</span>
+</span><span id="GWModuleBayesian-387"><a href="#GWModuleBayesian-387"><span class="linenos">387</span></a>
+</span><span id="GWModuleBayesian-388"><a href="#GWModuleBayesian-388"><span class="linenos">388</span></a>    <span class="k">def</span> <span class="nf">fuse</span><span class="p">(</span>
+</span><span id="GWModuleBayesian-389"><a href="#GWModuleBayesian-389"><span class="linenos">389</span></a>        <span class="bp">self</span><span class="p">,</span>
+</span><span id="GWModuleBayesian-390"><a href="#GWModuleBayesian-390"><span class="linenos">390</span></a>        <span class="n">x</span><span class="p">:</span> <span class="n">LatentsDomainGroupT</span><span class="p">,</span>
+</span><span id="GWModuleBayesian-391"><a href="#GWModuleBayesian-391"><span class="linenos">391</span></a>        <span class="n">selection_scores</span><span class="p">:</span> <span class="n">Mapping</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">],</span>
+</span><span id="GWModuleBayesian-392"><a href="#GWModuleBayesian-392"><span class="linenos">392</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">:</span>
+</span><span id="GWModuleBayesian-393"><a href="#GWModuleBayesian-393"><span class="linenos">393</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="GWModuleBayesian-394"><a href="#GWModuleBayesian-394"><span class="linenos">394</span></a><span class="sd">        Merge function used to combine domains.</span>
+</span><span id="GWModuleBayesian-395"><a href="#GWModuleBayesian-395"><span class="linenos">395</span></a>
+</span><span id="GWModuleBayesian-396"><a href="#GWModuleBayesian-396"><span class="linenos">396</span></a><span class="sd">        In the following, $D$ is the number of domains, $N$ the batch size, and $d$ the</span>
+</span><span id="GWModuleBayesian-397"><a href="#GWModuleBayesian-397"><span class="linenos">397</span></a><span class="sd">        dimension of the Global Workspace.</span>
+</span><span id="GWModuleBayesian-398"><a href="#GWModuleBayesian-398"><span class="linenos">398</span></a>
+</span><span id="GWModuleBayesian-399"><a href="#GWModuleBayesian-399"><span class="linenos">399</span></a><span class="sd">        This function needs to merge two kind of scores:</span>
+</span><span id="GWModuleBayesian-400"><a href="#GWModuleBayesian-400"><span class="linenos">400</span></a><span class="sd">        * the selection scores $a\\in [0,1]^{D\\times N}$;</span>
+</span><span id="GWModuleBayesian-401"><a href="#GWModuleBayesian-401"><span class="linenos">401</span></a><span class="sd">        * the precision scores $b \\in [0,1]^{D\\times N \\times d}$.</span>
+</span><span id="GWModuleBayesian-402"><a href="#GWModuleBayesian-402"><span class="linenos">402</span></a>
+</span><span id="GWModuleBayesian-403"><a href="#GWModuleBayesian-403"><span class="linenos">403</span></a><span class="sd">        .. note::</span>
+</span><span id="GWModuleBayesian-404"><a href="#GWModuleBayesian-404"><span class="linenos">404</span></a><span class="sd">            The precision score is obtained by predicting logits and using a softmax</span>
+</span><span id="GWModuleBayesian-405"><a href="#GWModuleBayesian-405"><span class="linenos">405</span></a>
+</span><span id="GWModuleBayesian-406"><a href="#GWModuleBayesian-406"><span class="linenos">406</span></a><span class="sd">        We can obtain associated uncertainties to the scores by introducing a std</span>
+</span><span id="GWModuleBayesian-407"><a href="#GWModuleBayesian-407"><span class="linenos">407</span></a><span class="sd">        variable and using bayesian integration:</span>
+</span><span id="GWModuleBayesian-408"><a href="#GWModuleBayesian-408"><span class="linenos">408</span></a>
+</span><span id="GWModuleBayesian-409"><a href="#GWModuleBayesian-409"><span class="linenos">409</span></a><span class="sd">        $$a_k = \\frac{M_1}{\\sigma_k^2}$$</span>
+</span><span id="GWModuleBayesian-410"><a href="#GWModuleBayesian-410"><span class="linenos">410</span></a><span class="sd">        where $M_1 = \\frac{1}{\\sum_{i=1}^D \\frac{1}{\\sigma_i^2}}$.</span>
+</span><span id="GWModuleBayesian-411"><a href="#GWModuleBayesian-411"><span class="linenos">411</span></a>
+</span><span id="GWModuleBayesian-412"><a href="#GWModuleBayesian-412"><span class="linenos">412</span></a><span class="sd">        Similarly,</span>
+</span><span id="GWModuleBayesian-413"><a href="#GWModuleBayesian-413"><span class="linenos">413</span></a><span class="sd">        $$b_k = \\frac{M_2}{\\mu_k^2}$$</span>
+</span><span id="GWModuleBayesian-414"><a href="#GWModuleBayesian-414"><span class="linenos">414</span></a><span class="sd">        where $M_2 = \\frac{1}{\\sum_{i=1}^D \\frac{1}{\\mu_i^2}}$.</span>
+</span><span id="GWModuleBayesian-415"><a href="#GWModuleBayesian-415"><span class="linenos">415</span></a>
+</span><span id="GWModuleBayesian-416"><a href="#GWModuleBayesian-416"><span class="linenos">416</span></a><span class="sd">        The we can sum the variances to obtain the final uncertainty (squared) $\\xi$:</span>
+</span><span id="GWModuleBayesian-417"><a href="#GWModuleBayesian-417"><span class="linenos">417</span></a><span class="sd">        $$\\xi_k^2 = c_1 \\sigma_k^2 + c_2 \\mu_k^2$$</span>
+</span><span id="GWModuleBayesian-418"><a href="#GWModuleBayesian-418"><span class="linenos">418</span></a>
+</span><span id="GWModuleBayesian-419"><a href="#GWModuleBayesian-419"><span class="linenos">419</span></a><span class="sd">        which, in terms of $a_k$ and $b_k$ yields:</span>
+</span><span id="GWModuleBayesian-420"><a href="#GWModuleBayesian-420"><span class="linenos">420</span></a><span class="sd">        $$\\xi_k^2 = \\frac{c&#39;_1}{a_k} + \\frac{c&#39;_2}{b_k}$$</span>
+</span><span id="GWModuleBayesian-421"><a href="#GWModuleBayesian-421"><span class="linenos">421</span></a><span class="sd">        where $c&#39;_1 = c_1 \\cdot M_1$ and $c&#39;_2 = c_2 \\cdot M_2$.</span>
+</span><span id="GWModuleBayesian-422"><a href="#GWModuleBayesian-422"><span class="linenos">422</span></a>
+</span><span id="GWModuleBayesian-423"><a href="#GWModuleBayesian-423"><span class="linenos">423</span></a><span class="sd">        Finally, the finale combined coefficient is</span>
+</span><span id="GWModuleBayesian-424"><a href="#GWModuleBayesian-424"><span class="linenos">424</span></a><span class="sd">        $$\\lambda_k = \\frac{M_3}{\\frac{c&#39;_1}{a_k} + \\frac{c&#39;_2}{b_k}}$$</span>
+</span><span id="GWModuleBayesian-425"><a href="#GWModuleBayesian-425"><span class="linenos">425</span></a><span class="sd">        where</span>
+</span><span id="GWModuleBayesian-426"><a href="#GWModuleBayesian-426"><span class="linenos">426</span></a><span class="sd">        $$M_3 = \\frac{1}{\\sum_{i=1}^D</span>
+</span><span id="GWModuleBayesian-427"><a href="#GWModuleBayesian-427"><span class="linenos">427</span></a><span class="sd">            \\frac{1}{\\frac{c&#39;_1}{a_i} + \\frac{c&#39;_2}{b_i}}}$$</span>
+</span><span id="GWModuleBayesian-428"><a href="#GWModuleBayesian-428"><span class="linenos">428</span></a>
+</span><span id="GWModuleBayesian-429"><a href="#GWModuleBayesian-429"><span class="linenos">429</span></a><span class="sd">        Args:</span>
+</span><span id="GWModuleBayesian-430"><a href="#GWModuleBayesian-430"><span class="linenos">430</span></a><span class="sd">            x (`LatentsDomainGroupT`): the group of latent representation.</span>
+</span><span id="GWModuleBayesian-431"><a href="#GWModuleBayesian-431"><span class="linenos">431</span></a><span class="sd">            selection_score (`Mapping[str, torch.Tensor]`): attention scores to</span>
+</span><span id="GWModuleBayesian-432"><a href="#GWModuleBayesian-432"><span class="linenos">432</span></a><span class="sd">                use to encode the reprensetation.</span>
+</span><span id="GWModuleBayesian-433"><a href="#GWModuleBayesian-433"><span class="linenos">433</span></a><span class="sd">        Returns:</span>
+</span><span id="GWModuleBayesian-434"><a href="#GWModuleBayesian-434"><span class="linenos">434</span></a><span class="sd">            `torch.Tensor`: The merged representation.</span>
+</span><span id="GWModuleBayesian-435"><a href="#GWModuleBayesian-435"><span class="linenos">435</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="GWModuleBayesian-436"><a href="#GWModuleBayesian-436"><span class="linenos">436</span></a>        <span class="n">scores</span><span class="p">:</span> <span class="nb">list</span><span class="p">[</span><span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]</span> <span class="o">=</span> <span class="p">[]</span>
+</span><span id="GWModuleBayesian-437"><a href="#GWModuleBayesian-437"><span class="linenos">437</span></a>        <span class="n">precisions</span><span class="p">:</span> <span class="nb">list</span><span class="p">[</span><span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]</span> <span class="o">=</span> <span class="p">[]</span>
+</span><span id="GWModuleBayesian-438"><a href="#GWModuleBayesian-438"><span class="linenos">438</span></a>        <span class="n">domains</span><span class="p">:</span> <span class="nb">list</span><span class="p">[</span><span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]</span> <span class="o">=</span> <span class="p">[]</span>
+</span><span id="GWModuleBayesian-439"><a href="#GWModuleBayesian-439"><span class="linenos">439</span></a>        <span class="k">for</span> <span class="n">domain</span><span class="p">,</span> <span class="n">score</span> <span class="ow">in</span> <span class="n">selection_scores</span><span class="o">.</span><span class="n">items</span><span class="p">():</span>
+</span><span id="GWModuleBayesian-440"><a href="#GWModuleBayesian-440"><span class="linenos">440</span></a>            <span class="n">scores</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">score</span><span class="p">)</span>
+</span><span id="GWModuleBayesian-441"><a href="#GWModuleBayesian-441"><span class="linenos">441</span></a>            <span class="n">precisions</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">get_precision</span><span class="p">(</span><span class="n">domain</span><span class="p">,</span> <span class="n">x</span><span class="p">[</span><span class="n">domain</span><span class="p">]))</span>
+</span><span id="GWModuleBayesian-442"><a href="#GWModuleBayesian-442"><span class="linenos">442</span></a>            <span class="n">domains</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">x</span><span class="p">[</span><span class="n">domain</span><span class="p">])</span>
+</span><span id="GWModuleBayesian-443"><a href="#GWModuleBayesian-443"><span class="linenos">443</span></a>        <span class="n">combined_scores</span> <span class="o">=</span> <span class="n">compute_fusion_scores</span><span class="p">(</span>
+</span><span id="GWModuleBayesian-444"><a href="#GWModuleBayesian-444"><span class="linenos">444</span></a>            <span class="n">torch</span><span class="o">.</span><span class="n">stack</span><span class="p">(</span><span class="n">scores</span><span class="p">)</span><span class="o">.</span><span class="n">unsqueeze</span><span class="p">(</span><span class="o">-</span><span class="mi">1</span><span class="p">),</span>
+</span><span id="GWModuleBayesian-445"><a href="#GWModuleBayesian-445"><span class="linenos">445</span></a>            <span class="n">torch</span><span class="o">.</span><span class="n">softmax</span><span class="p">(</span>
+</span><span id="GWModuleBayesian-446"><a href="#GWModuleBayesian-446"><span class="linenos">446</span></a>                <span class="n">torch</span><span class="o">.</span><span class="n">tanh</span><span class="p">(</span><span class="n">torch</span><span class="o">.</span><span class="n">stack</span><span class="p">(</span><span class="n">precisions</span><span class="p">))</span> <span class="o">*</span> <span class="bp">self</span><span class="o">.</span><span class="n">precision_softmax_temp</span><span class="p">,</span> <span class="n">dim</span><span class="o">=</span><span class="mi">0</span>
+</span><span id="GWModuleBayesian-447"><a href="#GWModuleBayesian-447"><span class="linenos">447</span></a>            <span class="p">),</span>
+</span><span id="GWModuleBayesian-448"><a href="#GWModuleBayesian-448"><span class="linenos">448</span></a>            <span class="bp">self</span><span class="o">.</span><span class="n">sensitivity_selection</span><span class="p">,</span>
+</span><span id="GWModuleBayesian-449"><a href="#GWModuleBayesian-449"><span class="linenos">449</span></a>            <span class="bp">self</span><span class="o">.</span><span class="n">sensitivity_precision</span><span class="p">,</span>
+</span><span id="GWModuleBayesian-450"><a href="#GWModuleBayesian-450"><span class="linenos">450</span></a>        <span class="p">)</span>
+</span><span id="GWModuleBayesian-451"><a href="#GWModuleBayesian-451"><span class="linenos">451</span></a>        <span class="k">return</span> <span class="n">torch</span><span class="o">.</span><span class="n">tanh</span><span class="p">(</span>
+</span><span id="GWModuleBayesian-452"><a href="#GWModuleBayesian-452"><span class="linenos">452</span></a>            <span class="n">torch</span><span class="o">.</span><span class="n">sum</span><span class="p">(</span>
+</span><span id="GWModuleBayesian-453"><a href="#GWModuleBayesian-453"><span class="linenos">453</span></a>                <span class="n">combined_scores</span> <span class="o">*</span> <span class="n">torch</span><span class="o">.</span><span class="n">stack</span><span class="p">(</span><span class="n">domains</span><span class="p">),</span>
+</span><span id="GWModuleBayesian-454"><a href="#GWModuleBayesian-454"><span class="linenos">454</span></a>                <span class="n">dim</span><span class="o">=</span><span class="mi">0</span><span class="p">,</span>
+</span><span id="GWModuleBayesian-455"><a href="#GWModuleBayesian-455"><span class="linenos">455</span></a>            <span class="p">)</span>
+</span><span id="GWModuleBayesian-456"><a href="#GWModuleBayesian-456"><span class="linenos">456</span></a>        <span class="p">)</span>
+</span></pre></div>
+
+
+            <div class="docstring"><p><code><a href="#GWModule">GWModule</a></code> with a Bayesian based uncertainty prediction.</p>
+</div>
+
+
+                            <div id="GWModuleBayesian.__init__" class="classattr">
+                                        <input id="GWModuleBayesian.__init__-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
+<div class="attr function">
+            
+        <span class="name">GWModuleBayesian</span><span class="signature pdoc-code multiline">(<span class="param">	<span class="n">domain_modules</span><span class="p">:</span> <span class="n">collections</span><span class="o">.</span><span class="n">abc</span><span class="o">.</span><span class="n">Mapping</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n"><a href="domain.html#DomainModule">shimmer.modules.domain.DomainModule</a></span><span class="p">]</span>,</span><span class="param">	<span class="n">workspace_dim</span><span class="p">:</span> <span class="nb">int</span>,</span><span class="param">	<span class="n">gw_encoders</span><span class="p">:</span> <span class="n">collections</span><span class="o">.</span><span class="n">abc</span><span class="o">.</span><span class="n">Mapping</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">nn</span><span class="o">.</span><span class="n">modules</span><span class="o">.</span><span class="n">module</span><span class="o">.</span><span class="n">Module</span><span class="p">]</span>,</span><span class="param">	<span class="n">gw_decoders</span><span class="p">:</span> <span class="n">collections</span><span class="o">.</span><span class="n">abc</span><span class="o">.</span><span class="n">Mapping</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">nn</span><span class="o">.</span><span class="n">modules</span><span class="o">.</span><span class="n">module</span><span class="o">.</span><span class="n">Module</span><span class="p">]</span>,</span><span class="param">	<span class="n">sensitivity_selection</span><span class="p">:</span> <span class="nb">float</span> <span class="o">=</span> <span class="mi">1</span>,</span><span class="param">	<span class="n">sensitivity_precision</span><span class="p">:</span> <span class="nb">float</span> <span class="o">=</span> <span class="mi">1</span>,</span><span class="param">	<span class="n">precision_softmax_temp</span><span class="p">:</span> <span class="nb">float</span> <span class="o">=</span> <span class="mf">0.01</span></span>)</span>
+
+                <label class="view-source-button" for="GWModuleBayesian.__init__-view-source"><span>View Source</span></label>
+
+    </div>
+    <a class="headerlink" href="#GWModuleBayesian.__init__"></a>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="GWModuleBayesian.__init__-334"><a href="#GWModuleBayesian.__init__-334"><span class="linenos">334</span></a>    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span>
+</span><span id="GWModuleBayesian.__init__-335"><a href="#GWModuleBayesian.__init__-335"><span class="linenos">335</span></a>        <span class="bp">self</span><span class="p">,</span>
+</span><span id="GWModuleBayesian.__init__-336"><a href="#GWModuleBayesian.__init__-336"><span class="linenos">336</span></a>        <span class="n">domain_modules</span><span class="p">:</span> <span class="n">Mapping</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">DomainModule</span><span class="p">],</span>
+</span><span id="GWModuleBayesian.__init__-337"><a href="#GWModuleBayesian.__init__-337"><span class="linenos">337</span></a>        <span class="n">workspace_dim</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span>
+</span><span id="GWModuleBayesian.__init__-338"><a href="#GWModuleBayesian.__init__-338"><span class="linenos">338</span></a>        <span class="n">gw_encoders</span><span class="p">:</span> <span class="n">Mapping</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">nn</span><span class="o">.</span><span class="n">Module</span><span class="p">],</span>
+</span><span id="GWModuleBayesian.__init__-339"><a href="#GWModuleBayesian.__init__-339"><span class="linenos">339</span></a>        <span class="n">gw_decoders</span><span class="p">:</span> <span class="n">Mapping</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">nn</span><span class="o">.</span><span class="n">Module</span><span class="p">],</span>
+</span><span id="GWModuleBayesian.__init__-340"><a href="#GWModuleBayesian.__init__-340"><span class="linenos">340</span></a>        <span class="n">sensitivity_selection</span><span class="p">:</span> <span class="nb">float</span> <span class="o">=</span> <span class="mi">1</span><span class="p">,</span>
+</span><span id="GWModuleBayesian.__init__-341"><a href="#GWModuleBayesian.__init__-341"><span class="linenos">341</span></a>        <span class="n">sensitivity_precision</span><span class="p">:</span> <span class="nb">float</span> <span class="o">=</span> <span class="mi">1</span><span class="p">,</span>
+</span><span id="GWModuleBayesian.__init__-342"><a href="#GWModuleBayesian.__init__-342"><span class="linenos">342</span></a>        <span class="n">precision_softmax_temp</span><span class="p">:</span> <span class="nb">float</span> <span class="o">=</span> <span class="mf">0.01</span><span class="p">,</span>
+</span><span id="GWModuleBayesian.__init__-343"><a href="#GWModuleBayesian.__init__-343"><span class="linenos">343</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="GWModuleBayesian.__init__-344"><a href="#GWModuleBayesian.__init__-344"><span class="linenos">344</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="GWModuleBayesian.__init__-345"><a href="#GWModuleBayesian.__init__-345"><span class="linenos">345</span></a><span class="sd">        Initializes the GWModuleBayesian.</span>
+</span><span id="GWModuleBayesian.__init__-346"><a href="#GWModuleBayesian.__init__-346"><span class="linenos">346</span></a>
+</span><span id="GWModuleBayesian.__init__-347"><a href="#GWModuleBayesian.__init__-347"><span class="linenos">347</span></a><span class="sd">        Args:</span>
+</span><span id="GWModuleBayesian.__init__-348"><a href="#GWModuleBayesian.__init__-348"><span class="linenos">348</span></a><span class="sd">            domain_modules (`Mapping[str, DomainModule]`): the domain modules.</span>
+</span><span id="GWModuleBayesian.__init__-349"><a href="#GWModuleBayesian.__init__-349"><span class="linenos">349</span></a><span class="sd">            workspace_dim (`int`): dimension of the GW.</span>
+</span><span id="GWModuleBayesian.__init__-350"><a href="#GWModuleBayesian.__init__-350"><span class="linenos">350</span></a><span class="sd">            gw_encoders (`Mapping[str, torch.nn.Module]`): mapping for each domain</span>
+</span><span id="GWModuleBayesian.__init__-351"><a href="#GWModuleBayesian.__init__-351"><span class="linenos">351</span></a><span class="sd">                name to a an torch.nn.Module class that encodes a</span>
+</span><span id="GWModuleBayesian.__init__-352"><a href="#GWModuleBayesian.__init__-352"><span class="linenos">352</span></a><span class="sd">                unimodal latent representations into a GW representation (pre fusion).</span>
+</span><span id="GWModuleBayesian.__init__-353"><a href="#GWModuleBayesian.__init__-353"><span class="linenos">353</span></a><span class="sd">            gw_decoders (`Mapping[str, torch.nn.Module]`): mapping for each domain</span>
+</span><span id="GWModuleBayesian.__init__-354"><a href="#GWModuleBayesian.__init__-354"><span class="linenos">354</span></a><span class="sd">                name to a an torch.nn.Module class that decodes a</span>
+</span><span id="GWModuleBayesian.__init__-355"><a href="#GWModuleBayesian.__init__-355"><span class="linenos">355</span></a><span class="sd">                 GW representation to a unimodal latent representation.</span>
+</span><span id="GWModuleBayesian.__init__-356"><a href="#GWModuleBayesian.__init__-356"><span class="linenos">356</span></a><span class="sd">            sensitivity_selection (`float`): sensivity coef $c&#39;_1$</span>
+</span><span id="GWModuleBayesian.__init__-357"><a href="#GWModuleBayesian.__init__-357"><span class="linenos">357</span></a><span class="sd">            sensitivity_precision (`float`): sensitivity coef $c&#39;_2$</span>
+</span><span id="GWModuleBayesian.__init__-358"><a href="#GWModuleBayesian.__init__-358"><span class="linenos">358</span></a><span class="sd">            precision_softmax_temp (`float`): temperature to use in softmax of</span>
+</span><span id="GWModuleBayesian.__init__-359"><a href="#GWModuleBayesian.__init__-359"><span class="linenos">359</span></a><span class="sd">                precision</span>
+</span><span id="GWModuleBayesian.__init__-360"><a href="#GWModuleBayesian.__init__-360"><span class="linenos">360</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="GWModuleBayesian.__init__-361"><a href="#GWModuleBayesian.__init__-361"><span class="linenos">361</span></a>        <span class="nb">super</span><span class="p">()</span><span class="o">.</span><span class="fm">__init__</span><span class="p">(</span><span class="n">domain_modules</span><span class="p">,</span> <span class="n">workspace_dim</span><span class="p">,</span> <span class="n">gw_encoders</span><span class="p">,</span> <span class="n">gw_decoders</span><span class="p">)</span>
+</span><span id="GWModuleBayesian.__init__-362"><a href="#GWModuleBayesian.__init__-362"><span class="linenos">362</span></a>
+</span><span id="GWModuleBayesian.__init__-363"><a href="#GWModuleBayesian.__init__-363"><span class="linenos">363</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">precisions</span> <span class="o">=</span> <span class="n">cast</span><span class="p">(</span>
+</span><span id="GWModuleBayesian.__init__-364"><a href="#GWModuleBayesian.__init__-364"><span class="linenos">364</span></a>            <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">],</span>
+</span><span id="GWModuleBayesian.__init__-365"><a href="#GWModuleBayesian.__init__-365"><span class="linenos">365</span></a>            <span class="n">nn</span><span class="o">.</span><span class="n">ParameterDict</span><span class="p">(</span>
+</span><span id="GWModuleBayesian.__init__-366"><a href="#GWModuleBayesian.__init__-366"><span class="linenos">366</span></a>                <span class="p">{</span><span class="n">domain</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">randn</span><span class="p">(</span><span class="n">workspace_dim</span><span class="p">)</span> <span class="k">for</span> <span class="n">domain</span> <span class="ow">in</span> <span class="n">gw_encoders</span><span class="p">}</span>
+</span><span id="GWModuleBayesian.__init__-367"><a href="#GWModuleBayesian.__init__-367"><span class="linenos">367</span></a>            <span class="p">),</span>
+</span><span id="GWModuleBayesian.__init__-368"><a href="#GWModuleBayesian.__init__-368"><span class="linenos">368</span></a>        <span class="p">)</span>
+</span><span id="GWModuleBayesian.__init__-369"><a href="#GWModuleBayesian.__init__-369"><span class="linenos">369</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;Precision at the neuron level for every domain.&quot;&quot;&quot;</span>
+</span><span id="GWModuleBayesian.__init__-370"><a href="#GWModuleBayesian.__init__-370"><span class="linenos">370</span></a>
+</span><span id="GWModuleBayesian.__init__-371"><a href="#GWModuleBayesian.__init__-371"><span class="linenos">371</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">sensitivity_selection</span> <span class="o">=</span> <span class="n">sensitivity_selection</span>
+</span><span id="GWModuleBayesian.__init__-372"><a href="#GWModuleBayesian.__init__-372"><span class="linenos">372</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">sensitivity_precision</span> <span class="o">=</span> <span class="n">sensitivity_precision</span>
+</span><span id="GWModuleBayesian.__init__-373"><a href="#GWModuleBayesian.__init__-373"><span class="linenos">373</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">precision_softmax_temp</span> <span class="o">=</span> <span class="n">precision_softmax_temp</span>
+</span></pre></div>
+
+
+            <div class="docstring"><p>Initializes the GWModuleBayesian.</p>
+
+<h6 id="arguments">Arguments:</h6>
+
+<ul>
+<li><strong>domain_modules (<code>Mapping[str, DomainModule]</code>):</strong>  the domain modules.</li>
+<li><strong>workspace_dim (<code>int</code>):</strong>  dimension of the GW.</li>
+<li><strong>gw_encoders (<code>Mapping[str, torch.nn.Module]</code>):</strong>  mapping for each domain
+name to a an torch.nn.Module class that encodes a
+unimodal latent representations into a GW representation (pre fusion).</li>
+<li><strong>gw_decoders (<code>Mapping[str, torch.nn.Module]</code>):</strong>  mapping for each domain
+name to a an torch.nn.Module class that decodes a
+ GW representation to a unimodal latent representation.</li>
+<li><strong>sensitivity_selection (<code><a href="#GWModuleBayesian.float">float</a></code>):</strong>  sensivity coef $c'_1$</li>
+<li><strong>sensitivity_precision (<code><a href="#GWModuleBayesian.float">float</a></code>):</strong>  sensitivity coef $c'_2$</li>
+<li><strong>precision_softmax_temp (<code><a href="#GWModuleBayesian.float">float</a></code>):</strong>  temperature to use in softmax of
+precision</li>
+</ul>
+</div>
+
+
+                            </div>
+                            <div id="GWModuleBayesian.precisions" class="classattr">
+                                <div class="attr variable">
+            <span class="name">precisions</span>
+
+        
+    </div>
+    <a class="headerlink" href="#GWModuleBayesian.precisions"></a>
+    
+            <div class="docstring"><p>Precision at the neuron level for every domain.</p>
+</div>
+
+
+                            </div>
+                            <div id="GWModuleBayesian.sensitivity_selection" class="classattr">
+                                <div class="attr variable">
+            <span class="name">sensitivity_selection</span>
+
+        
+    </div>
+    <a class="headerlink" href="#GWModuleBayesian.sensitivity_selection"></a>
+    
+    
+
+                            </div>
+                            <div id="GWModuleBayesian.sensitivity_precision" class="classattr">
+                                <div class="attr variable">
+            <span class="name">sensitivity_precision</span>
+
+        
+    </div>
+    <a class="headerlink" href="#GWModuleBayesian.sensitivity_precision"></a>
+    
+    
+
+                            </div>
+                            <div id="GWModuleBayesian.precision_softmax_temp" class="classattr">
+                                <div class="attr variable">
+            <span class="name">precision_softmax_temp</span>
+
+        
+    </div>
+    <a class="headerlink" href="#GWModuleBayesian.precision_softmax_temp"></a>
+    
+    
+
+                            </div>
+                            <div id="GWModuleBayesian.get_precision" class="classattr">
+                                        <input id="GWModuleBayesian.get_precision-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
+<div class="attr function">
+            
+        <span class="def">def</span>
+        <span class="name">get_precision</span><span class="signature pdoc-code condensed">(<span class="param"><span class="bp">self</span>, </span><span class="param"><span class="n">domain</span><span class="p">:</span> <span class="nb">str</span>, </span><span class="param"><span class="n">x</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span></span><span class="return-annotation">) -> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span>:</span></span>
+
+                <label class="view-source-button" for="GWModuleBayesian.get_precision-view-source"><span>View Source</span></label>
+
+    </div>
+    <a class="headerlink" href="#GWModuleBayesian.get_precision"></a>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="GWModuleBayesian.get_precision-375"><a href="#GWModuleBayesian.get_precision-375"><span class="linenos">375</span></a>    <span class="k">def</span> <span class="nf">get_precision</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">domain</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span> <span class="n">x</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">:</span>
+</span><span id="GWModuleBayesian.get_precision-376"><a href="#GWModuleBayesian.get_precision-376"><span class="linenos">376</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="GWModuleBayesian.get_precision-377"><a href="#GWModuleBayesian.get_precision-377"><span class="linenos">377</span></a><span class="sd">        Get the precision vector of given domain and batch</span>
+</span><span id="GWModuleBayesian.get_precision-378"><a href="#GWModuleBayesian.get_precision-378"><span class="linenos">378</span></a>
+</span><span id="GWModuleBayesian.get_precision-379"><a href="#GWModuleBayesian.get_precision-379"><span class="linenos">379</span></a><span class="sd">        Args:</span>
+</span><span id="GWModuleBayesian.get_precision-380"><a href="#GWModuleBayesian.get_precision-380"><span class="linenos">380</span></a><span class="sd">            domain (`str`):</span>
+</span><span id="GWModuleBayesian.get_precision-381"><a href="#GWModuleBayesian.get_precision-381"><span class="linenos">381</span></a><span class="sd">            x (`torch.Tensor`): batch of inputs</span>
+</span><span id="GWModuleBayesian.get_precision-382"><a href="#GWModuleBayesian.get_precision-382"><span class="linenos">382</span></a>
+</span><span id="GWModuleBayesian.get_precision-383"><a href="#GWModuleBayesian.get_precision-383"><span class="linenos">383</span></a><span class="sd">        Returns:</span>
+</span><span id="GWModuleBayesian.get_precision-384"><a href="#GWModuleBayesian.get_precision-384"><span class="linenos">384</span></a><span class="sd">            `torch.Tensor`: batch of precision</span>
+</span><span id="GWModuleBayesian.get_precision-385"><a href="#GWModuleBayesian.get_precision-385"><span class="linenos">385</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="GWModuleBayesian.get_precision-386"><a href="#GWModuleBayesian.get_precision-386"><span class="linenos">386</span></a>        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">precisions</span><span class="p">[</span><span class="n">domain</span><span class="p">]</span><span class="o">.</span><span class="n">unsqueeze</span><span class="p">(</span><span class="mi">0</span><span class="p">)</span><span class="o">.</span><span class="n">expand</span><span class="p">(</span><span class="n">x</span><span class="o">.</span><span class="n">size</span><span class="p">(</span><span class="mi">0</span><span class="p">),</span> <span class="o">-</span><span class="mi">1</span><span class="p">)</span>
+</span></pre></div>
+
+
+            <div class="docstring"><p>Get the precision vector of given domain and batch</p>
+
+<h6 id="arguments">Arguments:</h6>
+
+<ul>
+<li><strong>domain (<code>str</code>):</strong> </li>
+<li><strong>x (<code>torch.Tensor</code>):</strong>  batch of inputs</li>
+</ul>
+
+<h6 id="returns">Returns:</h6>
+
+<blockquote>
+  <p><code>torch.Tensor</code>: batch of precision</p>
+</blockquote>
+</div>
+
+
+                            </div>
+                            <div id="GWModuleBayesian.fuse" class="classattr">
+                                        <input id="GWModuleBayesian.fuse-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
+<div class="attr function">
+            
+        <span class="def">def</span>
+        <span class="name">fuse</span><span class="signature pdoc-code multiline">(<span class="param">	<span class="bp">self</span>,</span><span class="param">	<span class="n">x</span><span class="p">:</span> <span class="n">collections</span><span class="o">.</span><span class="n">abc</span><span class="o">.</span><span class="n">Mapping</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]</span>,</span><span class="param">	<span class="n">selection_scores</span><span class="p">:</span> <span class="n">collections</span><span class="o">.</span><span class="n">abc</span><span class="o">.</span><span class="n">Mapping</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]</span></span><span class="return-annotation">) -> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span>:</span></span>
+
+                <label class="view-source-button" for="GWModuleBayesian.fuse-view-source"><span>View Source</span></label>
+
+    </div>
+    <a class="headerlink" href="#GWModuleBayesian.fuse"></a>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="GWModuleBayesian.fuse-388"><a href="#GWModuleBayesian.fuse-388"><span class="linenos">388</span></a>    <span class="k">def</span> <span class="nf">fuse</span><span class="p">(</span>
+</span><span id="GWModuleBayesian.fuse-389"><a href="#GWModuleBayesian.fuse-389"><span class="linenos">389</span></a>        <span class="bp">self</span><span class="p">,</span>
+</span><span id="GWModuleBayesian.fuse-390"><a href="#GWModuleBayesian.fuse-390"><span class="linenos">390</span></a>        <span class="n">x</span><span class="p">:</span> <span class="n">LatentsDomainGroupT</span><span class="p">,</span>
+</span><span id="GWModuleBayesian.fuse-391"><a href="#GWModuleBayesian.fuse-391"><span class="linenos">391</span></a>        <span class="n">selection_scores</span><span class="p">:</span> <span class="n">Mapping</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">],</span>
+</span><span id="GWModuleBayesian.fuse-392"><a href="#GWModuleBayesian.fuse-392"><span class="linenos">392</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">:</span>
+</span><span id="GWModuleBayesian.fuse-393"><a href="#GWModuleBayesian.fuse-393"><span class="linenos">393</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="GWModuleBayesian.fuse-394"><a href="#GWModuleBayesian.fuse-394"><span class="linenos">394</span></a><span class="sd">        Merge function used to combine domains.</span>
+</span><span id="GWModuleBayesian.fuse-395"><a href="#GWModuleBayesian.fuse-395"><span class="linenos">395</span></a>
+</span><span id="GWModuleBayesian.fuse-396"><a href="#GWModuleBayesian.fuse-396"><span class="linenos">396</span></a><span class="sd">        In the following, $D$ is the number of domains, $N$ the batch size, and $d$ the</span>
+</span><span id="GWModuleBayesian.fuse-397"><a href="#GWModuleBayesian.fuse-397"><span class="linenos">397</span></a><span class="sd">        dimension of the Global Workspace.</span>
+</span><span id="GWModuleBayesian.fuse-398"><a href="#GWModuleBayesian.fuse-398"><span class="linenos">398</span></a>
+</span><span id="GWModuleBayesian.fuse-399"><a href="#GWModuleBayesian.fuse-399"><span class="linenos">399</span></a><span class="sd">        This function needs to merge two kind of scores:</span>
+</span><span id="GWModuleBayesian.fuse-400"><a href="#GWModuleBayesian.fuse-400"><span class="linenos">400</span></a><span class="sd">        * the selection scores $a\\in [0,1]^{D\\times N}$;</span>
+</span><span id="GWModuleBayesian.fuse-401"><a href="#GWModuleBayesian.fuse-401"><span class="linenos">401</span></a><span class="sd">        * the precision scores $b \\in [0,1]^{D\\times N \\times d}$.</span>
+</span><span id="GWModuleBayesian.fuse-402"><a href="#GWModuleBayesian.fuse-402"><span class="linenos">402</span></a>
+</span><span id="GWModuleBayesian.fuse-403"><a href="#GWModuleBayesian.fuse-403"><span class="linenos">403</span></a><span class="sd">        .. note::</span>
+</span><span id="GWModuleBayesian.fuse-404"><a href="#GWModuleBayesian.fuse-404"><span class="linenos">404</span></a><span class="sd">            The precision score is obtained by predicting logits and using a softmax</span>
+</span><span id="GWModuleBayesian.fuse-405"><a href="#GWModuleBayesian.fuse-405"><span class="linenos">405</span></a>
+</span><span id="GWModuleBayesian.fuse-406"><a href="#GWModuleBayesian.fuse-406"><span class="linenos">406</span></a><span class="sd">        We can obtain associated uncertainties to the scores by introducing a std</span>
+</span><span id="GWModuleBayesian.fuse-407"><a href="#GWModuleBayesian.fuse-407"><span class="linenos">407</span></a><span class="sd">        variable and using bayesian integration:</span>
+</span><span id="GWModuleBayesian.fuse-408"><a href="#GWModuleBayesian.fuse-408"><span class="linenos">408</span></a>
+</span><span id="GWModuleBayesian.fuse-409"><a href="#GWModuleBayesian.fuse-409"><span class="linenos">409</span></a><span class="sd">        $$a_k = \\frac{M_1}{\\sigma_k^2}$$</span>
+</span><span id="GWModuleBayesian.fuse-410"><a href="#GWModuleBayesian.fuse-410"><span class="linenos">410</span></a><span class="sd">        where $M_1 = \\frac{1}{\\sum_{i=1}^D \\frac{1}{\\sigma_i^2}}$.</span>
+</span><span id="GWModuleBayesian.fuse-411"><a href="#GWModuleBayesian.fuse-411"><span class="linenos">411</span></a>
+</span><span id="GWModuleBayesian.fuse-412"><a href="#GWModuleBayesian.fuse-412"><span class="linenos">412</span></a><span class="sd">        Similarly,</span>
+</span><span id="GWModuleBayesian.fuse-413"><a href="#GWModuleBayesian.fuse-413"><span class="linenos">413</span></a><span class="sd">        $$b_k = \\frac{M_2}{\\mu_k^2}$$</span>
+</span><span id="GWModuleBayesian.fuse-414"><a href="#GWModuleBayesian.fuse-414"><span class="linenos">414</span></a><span class="sd">        where $M_2 = \\frac{1}{\\sum_{i=1}^D \\frac{1}{\\mu_i^2}}$.</span>
+</span><span id="GWModuleBayesian.fuse-415"><a href="#GWModuleBayesian.fuse-415"><span class="linenos">415</span></a>
+</span><span id="GWModuleBayesian.fuse-416"><a href="#GWModuleBayesian.fuse-416"><span class="linenos">416</span></a><span class="sd">        The we can sum the variances to obtain the final uncertainty (squared) $\\xi$:</span>
+</span><span id="GWModuleBayesian.fuse-417"><a href="#GWModuleBayesian.fuse-417"><span class="linenos">417</span></a><span class="sd">        $$\\xi_k^2 = c_1 \\sigma_k^2 + c_2 \\mu_k^2$$</span>
+</span><span id="GWModuleBayesian.fuse-418"><a href="#GWModuleBayesian.fuse-418"><span class="linenos">418</span></a>
+</span><span id="GWModuleBayesian.fuse-419"><a href="#GWModuleBayesian.fuse-419"><span class="linenos">419</span></a><span class="sd">        which, in terms of $a_k$ and $b_k$ yields:</span>
+</span><span id="GWModuleBayesian.fuse-420"><a href="#GWModuleBayesian.fuse-420"><span class="linenos">420</span></a><span class="sd">        $$\\xi_k^2 = \\frac{c&#39;_1}{a_k} + \\frac{c&#39;_2}{b_k}$$</span>
+</span><span id="GWModuleBayesian.fuse-421"><a href="#GWModuleBayesian.fuse-421"><span class="linenos">421</span></a><span class="sd">        where $c&#39;_1 = c_1 \\cdot M_1$ and $c&#39;_2 = c_2 \\cdot M_2$.</span>
+</span><span id="GWModuleBayesian.fuse-422"><a href="#GWModuleBayesian.fuse-422"><span class="linenos">422</span></a>
+</span><span id="GWModuleBayesian.fuse-423"><a href="#GWModuleBayesian.fuse-423"><span class="linenos">423</span></a><span class="sd">        Finally, the finale combined coefficient is</span>
+</span><span id="GWModuleBayesian.fuse-424"><a href="#GWModuleBayesian.fuse-424"><span class="linenos">424</span></a><span class="sd">        $$\\lambda_k = \\frac{M_3}{\\frac{c&#39;_1}{a_k} + \\frac{c&#39;_2}{b_k}}$$</span>
+</span><span id="GWModuleBayesian.fuse-425"><a href="#GWModuleBayesian.fuse-425"><span class="linenos">425</span></a><span class="sd">        where</span>
+</span><span id="GWModuleBayesian.fuse-426"><a href="#GWModuleBayesian.fuse-426"><span class="linenos">426</span></a><span class="sd">        $$M_3 = \\frac{1}{\\sum_{i=1}^D</span>
+</span><span id="GWModuleBayesian.fuse-427"><a href="#GWModuleBayesian.fuse-427"><span class="linenos">427</span></a><span class="sd">            \\frac{1}{\\frac{c&#39;_1}{a_i} + \\frac{c&#39;_2}{b_i}}}$$</span>
+</span><span id="GWModuleBayesian.fuse-428"><a href="#GWModuleBayesian.fuse-428"><span class="linenos">428</span></a>
+</span><span id="GWModuleBayesian.fuse-429"><a href="#GWModuleBayesian.fuse-429"><span class="linenos">429</span></a><span class="sd">        Args:</span>
+</span><span id="GWModuleBayesian.fuse-430"><a href="#GWModuleBayesian.fuse-430"><span class="linenos">430</span></a><span class="sd">            x (`LatentsDomainGroupT`): the group of latent representation.</span>
+</span><span id="GWModuleBayesian.fuse-431"><a href="#GWModuleBayesian.fuse-431"><span class="linenos">431</span></a><span class="sd">            selection_score (`Mapping[str, torch.Tensor]`): attention scores to</span>
+</span><span id="GWModuleBayesian.fuse-432"><a href="#GWModuleBayesian.fuse-432"><span class="linenos">432</span></a><span class="sd">                use to encode the reprensetation.</span>
+</span><span id="GWModuleBayesian.fuse-433"><a href="#GWModuleBayesian.fuse-433"><span class="linenos">433</span></a><span class="sd">        Returns:</span>
+</span><span id="GWModuleBayesian.fuse-434"><a href="#GWModuleBayesian.fuse-434"><span class="linenos">434</span></a><span class="sd">            `torch.Tensor`: The merged representation.</span>
+</span><span id="GWModuleBayesian.fuse-435"><a href="#GWModuleBayesian.fuse-435"><span class="linenos">435</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="GWModuleBayesian.fuse-436"><a href="#GWModuleBayesian.fuse-436"><span class="linenos">436</span></a>        <span class="n">scores</span><span class="p">:</span> <span class="nb">list</span><span class="p">[</span><span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]</span> <span class="o">=</span> <span class="p">[]</span>
+</span><span id="GWModuleBayesian.fuse-437"><a href="#GWModuleBayesian.fuse-437"><span class="linenos">437</span></a>        <span class="n">precisions</span><span class="p">:</span> <span class="nb">list</span><span class="p">[</span><span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]</span> <span class="o">=</span> <span class="p">[]</span>
+</span><span id="GWModuleBayesian.fuse-438"><a href="#GWModuleBayesian.fuse-438"><span class="linenos">438</span></a>        <span class="n">domains</span><span class="p">:</span> <span class="nb">list</span><span class="p">[</span><span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]</span> <span class="o">=</span> <span class="p">[]</span>
+</span><span id="GWModuleBayesian.fuse-439"><a href="#GWModuleBayesian.fuse-439"><span class="linenos">439</span></a>        <span class="k">for</span> <span class="n">domain</span><span class="p">,</span> <span class="n">score</span> <span class="ow">in</span> <span class="n">selection_scores</span><span class="o">.</span><span class="n">items</span><span class="p">():</span>
+</span><span id="GWModuleBayesian.fuse-440"><a href="#GWModuleBayesian.fuse-440"><span class="linenos">440</span></a>            <span class="n">scores</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">score</span><span class="p">)</span>
+</span><span id="GWModuleBayesian.fuse-441"><a href="#GWModuleBayesian.fuse-441"><span class="linenos">441</span></a>            <span class="n">precisions</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">get_precision</span><span class="p">(</span><span class="n">domain</span><span class="p">,</span> <span class="n">x</span><span class="p">[</span><span class="n">domain</span><span class="p">]))</span>
+</span><span id="GWModuleBayesian.fuse-442"><a href="#GWModuleBayesian.fuse-442"><span class="linenos">442</span></a>            <span class="n">domains</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">x</span><span class="p">[</span><span class="n">domain</span><span class="p">])</span>
+</span><span id="GWModuleBayesian.fuse-443"><a href="#GWModuleBayesian.fuse-443"><span class="linenos">443</span></a>        <span class="n">combined_scores</span> <span class="o">=</span> <span class="n">compute_fusion_scores</span><span class="p">(</span>
+</span><span id="GWModuleBayesian.fuse-444"><a href="#GWModuleBayesian.fuse-444"><span class="linenos">444</span></a>            <span class="n">torch</span><span class="o">.</span><span class="n">stack</span><span class="p">(</span><span class="n">scores</span><span class="p">)</span><span class="o">.</span><span class="n">unsqueeze</span><span class="p">(</span><span class="o">-</span><span class="mi">1</span><span class="p">),</span>
+</span><span id="GWModuleBayesian.fuse-445"><a href="#GWModuleBayesian.fuse-445"><span class="linenos">445</span></a>            <span class="n">torch</span><span class="o">.</span><span class="n">softmax</span><span class="p">(</span>
+</span><span id="GWModuleBayesian.fuse-446"><a href="#GWModuleBayesian.fuse-446"><span class="linenos">446</span></a>                <span class="n">torch</span><span class="o">.</span><span class="n">tanh</span><span class="p">(</span><span class="n">torch</span><span class="o">.</span><span class="n">stack</span><span class="p">(</span><span class="n">precisions</span><span class="p">))</span> <span class="o">*</span> <span class="bp">self</span><span class="o">.</span><span class="n">precision_softmax_temp</span><span class="p">,</span> <span class="n">dim</span><span class="o">=</span><span class="mi">0</span>
+</span><span id="GWModuleBayesian.fuse-447"><a href="#GWModuleBayesian.fuse-447"><span class="linenos">447</span></a>            <span class="p">),</span>
+</span><span id="GWModuleBayesian.fuse-448"><a href="#GWModuleBayesian.fuse-448"><span class="linenos">448</span></a>            <span class="bp">self</span><span class="o">.</span><span class="n">sensitivity_selection</span><span class="p">,</span>
+</span><span id="GWModuleBayesian.fuse-449"><a href="#GWModuleBayesian.fuse-449"><span class="linenos">449</span></a>            <span class="bp">self</span><span class="o">.</span><span class="n">sensitivity_precision</span><span class="p">,</span>
+</span><span id="GWModuleBayesian.fuse-450"><a href="#GWModuleBayesian.fuse-450"><span class="linenos">450</span></a>        <span class="p">)</span>
+</span><span id="GWModuleBayesian.fuse-451"><a href="#GWModuleBayesian.fuse-451"><span class="linenos">451</span></a>        <span class="k">return</span> <span class="n">torch</span><span class="o">.</span><span class="n">tanh</span><span class="p">(</span>
+</span><span id="GWModuleBayesian.fuse-452"><a href="#GWModuleBayesian.fuse-452"><span class="linenos">452</span></a>            <span class="n">torch</span><span class="o">.</span><span class="n">sum</span><span class="p">(</span>
+</span><span id="GWModuleBayesian.fuse-453"><a href="#GWModuleBayesian.fuse-453"><span class="linenos">453</span></a>                <span class="n">combined_scores</span> <span class="o">*</span> <span class="n">torch</span><span class="o">.</span><span class="n">stack</span><span class="p">(</span><span class="n">domains</span><span class="p">),</span>
+</span><span id="GWModuleBayesian.fuse-454"><a href="#GWModuleBayesian.fuse-454"><span class="linenos">454</span></a>                <span class="n">dim</span><span class="o">=</span><span class="mi">0</span><span class="p">,</span>
+</span><span id="GWModuleBayesian.fuse-455"><a href="#GWModuleBayesian.fuse-455"><span class="linenos">455</span></a>            <span class="p">)</span>
+</span><span id="GWModuleBayesian.fuse-456"><a href="#GWModuleBayesian.fuse-456"><span class="linenos">456</span></a>        <span class="p">)</span>
+</span></pre></div>
+
+
+            <div class="docstring"><p>Merge function used to combine domains.</p>
+
+<p>In the following, $D$ is the number of domains, $N$ the batch size, and $d$ the
+dimension of the Global Workspace.</p>
+
+<p>This function needs to merge two kind of scores:</p>
+
+<ul>
+<li>the selection scores $a\in [0,1]^{D\times N}$;</li>
+<li>the precision scores $b \in [0,1]^{D\times N \times d}$.</li>
+</ul>
+
+<div class="pdoc-alert pdoc-alert-note">
+
+<p>The precision score is obtained by predicting logits and using a softmax</p>
+
+</div>
+
+<p>We can obtain associated uncertainties to the scores by introducing a std
+variable and using bayesian integration:</p>
+
+<p>$$a_k = \frac{M_1}{\sigma_k^2}$$
+where $M_1 = \frac{1}{\sum_{i=1}^D \frac{1}{\sigma_i^2}}$.</p>
+
+<p>Similarly,
+$$b_k = \frac{M_2}{\mu_k^2}$$
+where $M_2 = \frac{1}{\sum_{i=1}^D \frac{1}{\mu_i^2}}$.</p>
+
+<p>The we can sum the variances to obtain the final uncertainty (squared) $\xi$:
+$$\xi_k^2 = c_1 \sigma_k^2 + c_2 \mu_k^2$$</p>
+
+<p>which, in terms of $a_k$ and $b_k$ yields:
+$$\xi_k^2 = \frac{c'_1}{a_k} + \frac{c'_2}{b_k}$$
+where $c'_1 = c_1 \cdot M_1$ and $c'_2 = c_2 \cdot M_2$.</p>
+
+<p>Finally, the finale combined coefficient is
+$$\lambda_k = \frac{M_3}{\frac{c'_1}{a_k} + \frac{c'_2}{b_k}}$$
+where
+$$M_3 = \frac{1}{\sum_{i=1}^D
+    \frac{1}{\frac{c'_1}{a_i} + \frac{c'_2}{b_i}}}$$</p>
+
+<h6 id="arguments">Arguments:</h6>
+
+<ul>
+<li><strong>x (<code>LatentsDomainGroupT</code>):</strong>  the group of latent representation.</li>
+<li><strong>selection_score (<code>Mapping[str, torch.Tensor]</code>):</strong>  attention scores to
+use to encode the reprensetation.</li>
+</ul>
+
+<h6 id="returns">Returns:</h6>
+
+<blockquote>
+  <p><code>torch.Tensor</code>: The merged representation.</p>
+</blockquote>
+</div>
+
+
+                            </div>
+                            <div class="inherited">
+                                <h5>Inherited Members</h5>
+                                <dl>
+                                    <div><dt><a href="#GWModule">GWModule</a></dt>
+                                <dd id="GWModuleBayesian.gw_encoders" class="variable"><a href="#GWModule.gw_encoders">gw_encoders</a></dd>
+                <dd id="GWModuleBayesian.gw_decoders" class="variable"><a href="#GWModule.gw_decoders">gw_decoders</a></dd>
+                <dd id="GWModuleBayesian.encode" class="function"><a href="#GWModule.encode">encode</a></dd>
+                <dd id="GWModuleBayesian.decode" class="function"><a href="#GWModule.decode">decode</a></dd>
+
+            </div>
+            <div><dt><a href="#GWModuleBase">GWModuleBase</a></dt>
+                                <dd id="GWModuleBayesian.domain_mods" class="variable"><a href="#GWModuleBase.domain_mods">domain_mods</a></dd>
+                <dd id="GWModuleBayesian.workspace_dim" class="variable"><a href="#GWModuleBase.workspace_dim">workspace_dim</a></dd>
+                <dd id="GWModuleBayesian.encode_and_fuse" class="function"><a href="#GWModuleBase.encode_and_fuse">encode_and_fuse</a></dd>
+
+            </div>
+            <div><dt>torch.nn.modules.module.Module</dt>
+                                <dd id="GWModuleBayesian.dump_patches" class="variable">dump_patches</dd>
+                <dd id="GWModuleBayesian.training" class="variable">training</dd>
+                <dd id="GWModuleBayesian.call_super_init" class="variable">call_super_init</dd>
+                <dd id="GWModuleBayesian.forward" class="function">forward</dd>
+                <dd id="GWModuleBayesian.register_buffer" class="function">register_buffer</dd>
+                <dd id="GWModuleBayesian.register_parameter" class="function">register_parameter</dd>
+                <dd id="GWModuleBayesian.add_module" class="function">add_module</dd>
+                <dd id="GWModuleBayesian.register_module" class="function">register_module</dd>
+                <dd id="GWModuleBayesian.get_submodule" class="function">get_submodule</dd>
+                <dd id="GWModuleBayesian.get_parameter" class="function">get_parameter</dd>
+                <dd id="GWModuleBayesian.get_buffer" class="function">get_buffer</dd>
+                <dd id="GWModuleBayesian.get_extra_state" class="function">get_extra_state</dd>
+                <dd id="GWModuleBayesian.set_extra_state" class="function">set_extra_state</dd>
+                <dd id="GWModuleBayesian.apply" class="function">apply</dd>
+                <dd id="GWModuleBayesian.cuda" class="function">cuda</dd>
+                <dd id="GWModuleBayesian.ipu" class="function">ipu</dd>
+                <dd id="GWModuleBayesian.xpu" class="function">xpu</dd>
+                <dd id="GWModuleBayesian.cpu" class="function">cpu</dd>
+                <dd id="GWModuleBayesian.type" class="function">type</dd>
+                <dd id="GWModuleBayesian.float" class="function">float</dd>
+                <dd id="GWModuleBayesian.double" class="function">double</dd>
+                <dd id="GWModuleBayesian.half" class="function">half</dd>
+                <dd id="GWModuleBayesian.bfloat16" class="function">bfloat16</dd>
+                <dd id="GWModuleBayesian.to_empty" class="function">to_empty</dd>
+                <dd id="GWModuleBayesian.to" class="function">to</dd>
+                <dd id="GWModuleBayesian.register_full_backward_pre_hook" class="function">register_full_backward_pre_hook</dd>
+                <dd id="GWModuleBayesian.register_backward_hook" class="function">register_backward_hook</dd>
+                <dd id="GWModuleBayesian.register_full_backward_hook" class="function">register_full_backward_hook</dd>
+                <dd id="GWModuleBayesian.register_forward_pre_hook" class="function">register_forward_pre_hook</dd>
+                <dd id="GWModuleBayesian.register_forward_hook" class="function">register_forward_hook</dd>
+                <dd id="GWModuleBayesian.register_state_dict_pre_hook" class="function">register_state_dict_pre_hook</dd>
+                <dd id="GWModuleBayesian.state_dict" class="function">state_dict</dd>
+                <dd id="GWModuleBayesian.register_load_state_dict_post_hook" class="function">register_load_state_dict_post_hook</dd>
+                <dd id="GWModuleBayesian.load_state_dict" class="function">load_state_dict</dd>
+                <dd id="GWModuleBayesian.parameters" class="function">parameters</dd>
+                <dd id="GWModuleBayesian.named_parameters" class="function">named_parameters</dd>
+                <dd id="GWModuleBayesian.buffers" class="function">buffers</dd>
+                <dd id="GWModuleBayesian.named_buffers" class="function">named_buffers</dd>
+                <dd id="GWModuleBayesian.children" class="function">children</dd>
+                <dd id="GWModuleBayesian.named_children" class="function">named_children</dd>
+                <dd id="GWModuleBayesian.modules" class="function">modules</dd>
+                <dd id="GWModuleBayesian.named_modules" class="function">named_modules</dd>
+                <dd id="GWModuleBayesian.train" class="function">train</dd>
+                <dd id="GWModuleBayesian.eval" class="function">eval</dd>
+                <dd id="GWModuleBayesian.requires_grad_" class="function">requires_grad_</dd>
+                <dd id="GWModuleBayesian.zero_grad" class="function">zero_grad</dd>
+                <dd id="GWModuleBayesian.share_memory" class="function">share_memory</dd>
+                <dd id="GWModuleBayesian.extra_repr" class="function">extra_repr</dd>
+                <dd id="GWModuleBayesian.compile" class="function">compile</dd>
+
+            </div>
+                                </dl>
+                            </div>
+                </section>
+    </main>
+<script>
+    function escapeHTML(html) {
+        return document.createElement('div').appendChild(document.createTextNode(html)).parentNode.innerHTML;
+    }
+
+    const originalContent = document.querySelector("main.pdoc");
+    let currentContent = originalContent;
+
+    function setContent(innerHTML) {
+        let elem;
+        if (innerHTML) {
+            elem = document.createElement("main");
+            elem.classList.add("pdoc");
+            elem.innerHTML = innerHTML;
+        } else {
+            elem = originalContent;
+        }
+        if (currentContent !== elem) {
+            currentContent.replaceWith(elem);
+            currentContent = elem;
+        }
+    }
+
+    function getSearchTerm() {
+        return (new URL(window.location)).searchParams.get("search");
+    }
+
+    const searchBox = document.querySelector(".pdoc input[type=search]");
+    searchBox.addEventListener("input", function () {
+        let url = new URL(window.location);
+        if (searchBox.value.trim()) {
+            url.hash = "";
+            url.searchParams.set("search", searchBox.value);
+        } else {
+            url.searchParams.delete("search");
+        }
+        history.replaceState("", "", url.toString());
+        onInput();
+    });
+    window.addEventListener("popstate", onInput);
+
+
+    let search, searchErr;
+
+    async function initialize() {
+        try {
+            search = await new Promise((resolve, reject) => {
+                const script = document.createElement("script");
+                script.type = "text/javascript";
+                script.async = true;
+                script.onload = () => resolve(window.pdocSearch);
+                script.onerror = (e) => reject(e);
+                script.src = "../../search.js";
+                document.getElementsByTagName("head")[0].appendChild(script);
+            });
+        } catch (e) {
+            console.error("Cannot fetch pdoc search index");
+            searchErr = "Cannot fetch search index.";
+        }
+        onInput();
+
+        document.querySelector("nav.pdoc").addEventListener("click", e => {
+            if (e.target.hash) {
+                searchBox.value = "";
+                searchBox.dispatchEvent(new Event("input"));
+            }
+        });
+    }
+
+    function onInput() {
+        setContent((() => {
+            const term = getSearchTerm();
+            if (!term) {
+                return null
+            }
+            if (searchErr) {
+                return `<h3>Error: ${searchErr}</h3>`
+            }
+            if (!search) {
+                return "<h3>Searching...</h3>"
+            }
+
+            window.scrollTo({top: 0, left: 0, behavior: 'auto'});
+
+            const results = search(term);
+
+            let html;
+            if (results.length === 0) {
+                html = `No search results for '${escapeHTML(term)}'.`
+            } else {
+                html = `<h4>${results.length} search result${results.length > 1 ? "s" : ""} for '${escapeHTML(term)}'.</h4>`;
+            }
+            for (let result of results.slice(0, 10)) {
+                let doc = result.doc;
+                let url = `../../${doc.modulename.replaceAll(".", "/")}.html`;
+                if (doc.qualname) {
+                    url += `#${doc.qualname}`;
+                }
+
+                let heading;
+                switch (result.doc.kind) {
+                    case "function":
+                        if (doc.fullname.endsWith(".__init__")) {
+                            heading = `<span class="name">${doc.fullname.replace(/\.__init__$/, "")}</span>${doc.signature}`;
+                        } else {
+                            heading = `<span class="def">${doc.funcdef}</span> <span class="name">${doc.fullname}</span>${doc.signature}`;
+                        }
+                        break;
+                    case "class":
+                        heading = `<span class="def">class</span> <span class="name">${doc.fullname}</span>`;
+                        if (doc.bases)
+                            heading += `<wbr>(<span class="base">${doc.bases}</span>)`;
+                        heading += `:`;
+                        break;
+                    case "variable":
+                        heading = `<span class="name">${doc.fullname}</span>`;
+                        if (doc.annotation)
+                            heading += `<span class="annotation">${doc.annotation}</span>`;
+                        if (doc.default_value)
+                            heading += `<span class="default_value"> = ${doc.default_value}</span>`;
+                        break;
+                    default:
+                        heading = `<span class="name">${doc.fullname}</span>`;
+                        break;
+                }
+                html += `
+                        <section class="search-result">
+                        <a href="${url}" class="attr ${doc.kind}">${heading}</a>
+                        <div class="docstring">${doc.doc}</div>
+                        </section>
+                    `;
+
+            }
+            return html;
+        })());
+    }
+
+    if (getSearchTerm()) {
+        initialize();
+        searchBox.value = getSearchTerm();
+        onInput();
+    } else {
+        searchBox.addEventListener("focus", initialize, {once: true});
+    }
+
+    searchBox.addEventListener("keydown", e => {
+        if (["ArrowDown", "ArrowUp", "Enter"].includes(e.key)) {
+            let focused = currentContent.querySelector(".search-result.focused");
+            if (!focused) {
+                currentContent.querySelector(".search-result").classList.add("focused");
+            } else if (
+                e.key === "ArrowDown"
+                && focused.nextElementSibling
+                && focused.nextElementSibling.classList.contains("search-result")
+            ) {
+                focused.classList.remove("focused");
+                focused.nextElementSibling.classList.add("focused");
+                focused.nextElementSibling.scrollIntoView({
+                    behavior: "smooth",
+                    block: "nearest",
+                    inline: "nearest"
+                });
+            } else if (
+                e.key === "ArrowUp"
+                && focused.previousElementSibling
+                && focused.previousElementSibling.classList.contains("search-result")
+            ) {
+                focused.classList.remove("focused");
+                focused.previousElementSibling.classList.add("focused");
+                focused.previousElementSibling.scrollIntoView({
+                    behavior: "smooth",
+                    block: "nearest",
+                    inline: "nearest"
+                });
+            } else if (
+                e.key === "Enter"
+            ) {
+                focused.querySelector("a").click();
+            }
+        }
+    });
+</script></body>
+</html>
\ No newline at end of file
diff --git a/docs/api/v0.5.1/shimmer/modules/losses.html b/docs/api/v0.5.1/shimmer/modules/losses.html
new file mode 100644
index 00000000..4d306516
--- /dev/null
+++ b/docs/api/v0.5.1/shimmer/modules/losses.html
@@ -0,0 +1,3888 @@
+<!doctype html>
+<html lang="en">
+<head>
+    <meta charset="utf-8">
+    <meta name="viewport" content="width=device-width, initial-scale=1">
+    <meta name="generator" content="pdoc 14.4.0"/>
+    <title>shimmer.modules.losses API documentation</title>
+
+    <style>/*! * Bootstrap Reboot v5.0.0 (https://getbootstrap.com/) * Copyright 2011-2021 The Bootstrap Authors * Copyright 2011-2021 Twitter, Inc. * Licensed under MIT (https://github.com/twbs/bootstrap/blob/main/LICENSE) * Forked from Normalize.css, licensed MIT (https://github.com/necolas/normalize.css/blob/master/LICENSE.md) */*,::after,::before{box-sizing:border-box}@media (prefers-reduced-motion:no-preference){:root{scroll-behavior:smooth}}body{margin:0;font-family:system-ui,-apple-system,"Segoe UI",Roboto,"Helvetica Neue",Arial,"Noto Sans","Liberation Sans",sans-serif,"Apple Color Emoji","Segoe UI Emoji","Segoe UI Symbol","Noto Color Emoji";font-size:1rem;font-weight:400;line-height:1.5;color:#212529;background-color:#fff;-webkit-text-size-adjust:100%;-webkit-tap-highlight-color:transparent}hr{margin:1rem 0;color:inherit;background-color:currentColor;border:0;opacity:.25}hr:not([size]){height:1px}h1,h2,h3,h4,h5,h6{margin-top:0;margin-bottom:.5rem;font-weight:500;line-height:1.2}h1{font-size:calc(1.375rem + 1.5vw)}@media (min-width:1200px){h1{font-size:2.5rem}}h2{font-size:calc(1.325rem + .9vw)}@media (min-width:1200px){h2{font-size:2rem}}h3{font-size:calc(1.3rem + .6vw)}@media (min-width:1200px){h3{font-size:1.75rem}}h4{font-size:calc(1.275rem + .3vw)}@media (min-width:1200px){h4{font-size:1.5rem}}h5{font-size:1.25rem}h6{font-size:1rem}p{margin-top:0;margin-bottom:1rem}abbr[data-bs-original-title],abbr[title]{-webkit-text-decoration:underline dotted;text-decoration:underline dotted;cursor:help;-webkit-text-decoration-skip-ink:none;text-decoration-skip-ink:none}address{margin-bottom:1rem;font-style:normal;line-height:inherit}ol,ul{padding-left:2rem}dl,ol,ul{margin-top:0;margin-bottom:1rem}ol ol,ol ul,ul ol,ul ul{margin-bottom:0}dt{font-weight:700}dd{margin-bottom:.5rem;margin-left:0}blockquote{margin:0 0 1rem}b,strong{font-weight:bolder}small{font-size:.875em}mark{padding:.2em;background-color:#fcf8e3}sub,sup{position:relative;font-size:.75em;line-height:0;vertical-align:baseline}sub{bottom:-.25em}sup{top:-.5em}a{color:#0d6efd;text-decoration:underline}a:hover{color:#0a58ca}a:not([href]):not([class]),a:not([href]):not([class]):hover{color:inherit;text-decoration:none}code,kbd,pre,samp{font-family:SFMono-Regular,Menlo,Monaco,Consolas,"Liberation Mono","Courier New",monospace;font-size:1em;direction:ltr;unicode-bidi:bidi-override}pre{display:block;margin-top:0;margin-bottom:1rem;overflow:auto;font-size:.875em}pre code{font-size:inherit;color:inherit;word-break:normal}code{font-size:.875em;color:#d63384;word-wrap:break-word}a>code{color:inherit}kbd{padding:.2rem .4rem;font-size:.875em;color:#fff;background-color:#212529;border-radius:.2rem}kbd kbd{padding:0;font-size:1em;font-weight:700}figure{margin:0 0 1rem}img,svg{vertical-align:middle}table{caption-side:bottom;border-collapse:collapse}caption{padding-top:.5rem;padding-bottom:.5rem;color:#6c757d;text-align:left}th{text-align:inherit;text-align:-webkit-match-parent}tbody,td,tfoot,th,thead,tr{border-color:inherit;border-style:solid;border-width:0}label{display:inline-block}button{border-radius:0}button:focus:not(:focus-visible){outline:0}button,input,optgroup,select,textarea{margin:0;font-family:inherit;font-size:inherit;line-height:inherit}button,select{text-transform:none}[role=button]{cursor:pointer}select{word-wrap:normal}select:disabled{opacity:1}[list]::-webkit-calendar-picker-indicator{display:none}[type=button],[type=reset],[type=submit],button{-webkit-appearance:button}[type=button]:not(:disabled),[type=reset]:not(:disabled),[type=submit]:not(:disabled),button:not(:disabled){cursor:pointer}::-moz-focus-inner{padding:0;border-style:none}textarea{resize:vertical}fieldset{min-width:0;padding:0;margin:0;border:0}legend{float:left;width:100%;padding:0;margin-bottom:.5rem;font-size:calc(1.275rem + .3vw);line-height:inherit}@media (min-width:1200px){legend{font-size:1.5rem}}legend+*{clear:left}::-webkit-datetime-edit-day-field,::-webkit-datetime-edit-fields-wrapper,::-webkit-datetime-edit-hour-field,::-webkit-datetime-edit-minute,::-webkit-datetime-edit-month-field,::-webkit-datetime-edit-text,::-webkit-datetime-edit-year-field{padding:0}::-webkit-inner-spin-button{height:auto}[type=search]{outline-offset:-2px;-webkit-appearance:textfield}::-webkit-search-decoration{-webkit-appearance:none}::-webkit-color-swatch-wrapper{padding:0}::file-selector-button{font:inherit}::-webkit-file-upload-button{font:inherit;-webkit-appearance:button}output{display:inline-block}iframe{border:0}summary{display:list-item;cursor:pointer}progress{vertical-align:baseline}[hidden]{display:none!important}</style>
+    <style>/*! syntax-highlighting.css */pre{line-height:125%;}span.linenos{color:inherit; background-color:transparent; padding-left:5px; padding-right:20px;}.pdoc-code .hll{background-color:#ffffcc}.pdoc-code{background:#f8f8f8;}.pdoc-code .c{color:#3D7B7B; font-style:italic}.pdoc-code .err{border:1px solid #FF0000}.pdoc-code .k{color:#008000; font-weight:bold}.pdoc-code .o{color:#666666}.pdoc-code .ch{color:#3D7B7B; font-style:italic}.pdoc-code .cm{color:#3D7B7B; font-style:italic}.pdoc-code .cp{color:#9C6500}.pdoc-code .cpf{color:#3D7B7B; font-style:italic}.pdoc-code .c1{color:#3D7B7B; font-style:italic}.pdoc-code .cs{color:#3D7B7B; font-style:italic}.pdoc-code .gd{color:#A00000}.pdoc-code .ge{font-style:italic}.pdoc-code .gr{color:#E40000}.pdoc-code .gh{color:#000080; font-weight:bold}.pdoc-code .gi{color:#008400}.pdoc-code .go{color:#717171}.pdoc-code .gp{color:#000080; font-weight:bold}.pdoc-code .gs{font-weight:bold}.pdoc-code .gu{color:#800080; font-weight:bold}.pdoc-code .gt{color:#0044DD}.pdoc-code .kc{color:#008000; font-weight:bold}.pdoc-code .kd{color:#008000; font-weight:bold}.pdoc-code .kn{color:#008000; font-weight:bold}.pdoc-code .kp{color:#008000}.pdoc-code .kr{color:#008000; font-weight:bold}.pdoc-code .kt{color:#B00040}.pdoc-code .m{color:#666666}.pdoc-code .s{color:#BA2121}.pdoc-code .na{color:#687822}.pdoc-code .nb{color:#008000}.pdoc-code .nc{color:#0000FF; font-weight:bold}.pdoc-code .no{color:#880000}.pdoc-code .nd{color:#AA22FF}.pdoc-code .ni{color:#717171; font-weight:bold}.pdoc-code .ne{color:#CB3F38; font-weight:bold}.pdoc-code .nf{color:#0000FF}.pdoc-code .nl{color:#767600}.pdoc-code .nn{color:#0000FF; font-weight:bold}.pdoc-code .nt{color:#008000; font-weight:bold}.pdoc-code .nv{color:#19177C}.pdoc-code .ow{color:#AA22FF; font-weight:bold}.pdoc-code .w{color:#bbbbbb}.pdoc-code .mb{color:#666666}.pdoc-code .mf{color:#666666}.pdoc-code .mh{color:#666666}.pdoc-code .mi{color:#666666}.pdoc-code .mo{color:#666666}.pdoc-code .sa{color:#BA2121}.pdoc-code .sb{color:#BA2121}.pdoc-code .sc{color:#BA2121}.pdoc-code .dl{color:#BA2121}.pdoc-code .sd{color:#BA2121; font-style:italic}.pdoc-code .s2{color:#BA2121}.pdoc-code .se{color:#AA5D1F; font-weight:bold}.pdoc-code .sh{color:#BA2121}.pdoc-code .si{color:#A45A77; font-weight:bold}.pdoc-code .sx{color:#008000}.pdoc-code .sr{color:#A45A77}.pdoc-code .s1{color:#BA2121}.pdoc-code .ss{color:#19177C}.pdoc-code .bp{color:#008000}.pdoc-code .fm{color:#0000FF}.pdoc-code .vc{color:#19177C}.pdoc-code .vg{color:#19177C}.pdoc-code .vi{color:#19177C}.pdoc-code .vm{color:#19177C}.pdoc-code .il{color:#666666}</style>
+    <style>/*! theme.css */:root{--pdoc-background:#fff;}.pdoc{--text:#212529;--muted:#6c757d;--link:#3660a5;--link-hover:#1659c5;--code:#f8f8f8;--active:#fff598;--accent:#eee;--accent2:#c1c1c1;--nav-hover:rgba(255, 255, 255, 0.5);--name:#0066BB;--def:#008800;--annotation:#007020;}</style>
+    <style>/*! layout.css */html, body{width:100%;height:100%;}html, main{scroll-behavior:smooth;}body{background-color:var(--pdoc-background);}@media (max-width:769px){#navtoggle{cursor:pointer;position:absolute;width:50px;height:40px;top:1rem;right:1rem;border-color:var(--text);color:var(--text);display:flex;opacity:0.8;z-index:999;}#navtoggle:hover{opacity:1;}#togglestate + div{display:none;}#togglestate:checked + div{display:inherit;}main, header{padding:2rem 3vw;}header + main{margin-top:-3rem;}.git-button{display:none !important;}nav input[type="search"]{max-width:77%;}nav input[type="search"]:first-child{margin-top:-6px;}nav input[type="search"]:valid ~ *{display:none !important;}}@media (min-width:770px){:root{--sidebar-width:clamp(12.5rem, 28vw, 22rem);}nav{position:fixed;overflow:auto;height:100vh;width:var(--sidebar-width);}main, header{padding:3rem 2rem 3rem calc(var(--sidebar-width) + 3rem);width:calc(54rem + var(--sidebar-width));max-width:100%;}header + main{margin-top:-4rem;}#navtoggle{display:none;}}#togglestate{position:absolute;height:0;opacity:0;}nav.pdoc{--pad:clamp(0.5rem, 2vw, 1.75rem);--indent:1.5rem;background-color:var(--accent);border-right:1px solid var(--accent2);box-shadow:0 0 20px rgba(50, 50, 50, .2) inset;padding:0 0 0 var(--pad);overflow-wrap:anywhere;scrollbar-width:thin; scrollbar-color:var(--accent2) transparent; z-index:1}nav.pdoc::-webkit-scrollbar{width:.4rem; }nav.pdoc::-webkit-scrollbar-thumb{background-color:var(--accent2); }nav.pdoc > div{padding:var(--pad) 0;}nav.pdoc .module-list-button{display:inline-flex;align-items:center;color:var(--text);border-color:var(--muted);margin-bottom:1rem;}nav.pdoc .module-list-button:hover{border-color:var(--text);}nav.pdoc input[type=search]{display:block;outline-offset:0;width:calc(100% - var(--pad));}nav.pdoc .logo{max-width:calc(100% - var(--pad));max-height:35vh;display:block;margin:0 auto 1rem;transform:translate(calc(-.5 * var(--pad)), 0);}nav.pdoc ul{list-style:none;padding-left:0;}nav.pdoc > div > ul{margin-left:calc(0px - var(--pad));}nav.pdoc li a{padding:.2rem 0 .2rem calc(var(--pad) + var(--indent));}nav.pdoc > div > ul > li > a{padding-left:var(--pad);}nav.pdoc li{transition:all 100ms;}nav.pdoc li:hover{background-color:var(--nav-hover);}nav.pdoc a, nav.pdoc a:hover{color:var(--text);}nav.pdoc a{display:block;}nav.pdoc > h2:first-of-type{margin-top:1.5rem;}nav.pdoc .class:before{content:"class ";color:var(--muted);}nav.pdoc .function:after{content:"()";color:var(--muted);}nav.pdoc footer:before{content:"";display:block;width:calc(100% - var(--pad));border-top:solid var(--accent2) 1px;margin-top:1.5rem;padding-top:.5rem;}nav.pdoc footer{font-size:small;}</style>
+    <style>/*! content.css */.pdoc{color:var(--text);box-sizing:border-box;line-height:1.5;background:none;}.pdoc .pdoc-button{cursor:pointer;display:inline-block;border:solid black 1px;border-radius:2px;font-size:.75rem;padding:calc(0.5em - 1px) 1em;transition:100ms all;}.pdoc .pdoc-alert{padding:1rem 1rem 1rem calc(1.5rem + 24px);border:1px solid transparent;border-radius:.25rem;background-repeat:no-repeat;background-position:1rem center;margin-bottom:1rem;}.pdoc .pdoc-alert > *:last-child{margin-bottom:0;}.pdoc .pdoc-alert-note {color:#084298;background-color:#cfe2ff;border-color:#b6d4fe;background-image:url("data:image/svg+xml,%3Csvg%20xmlns%3D%22http%3A//www.w3.org/2000/svg%22%20width%3D%2224%22%20height%3D%2224%22%20fill%3D%22%23084298%22%20viewBox%3D%220%200%2016%2016%22%3E%3Cpath%20d%3D%22M8%2016A8%208%200%201%200%208%200a8%208%200%200%200%200%2016zm.93-9.412-1%204.705c-.07.34.029.533.304.533.194%200%20.487-.07.686-.246l-.088.416c-.287.346-.92.598-1.465.598-.703%200-1.002-.422-.808-1.319l.738-3.468c.064-.293.006-.399-.287-.47l-.451-.081.082-.381%202.29-.287zM8%205.5a1%201%200%201%201%200-2%201%201%200%200%201%200%202z%22/%3E%3C/svg%3E");}.pdoc .pdoc-alert-warning{color:#664d03;background-color:#fff3cd;border-color:#ffecb5;background-image:url("data:image/svg+xml,%3Csvg%20xmlns%3D%22http%3A//www.w3.org/2000/svg%22%20width%3D%2224%22%20height%3D%2224%22%20fill%3D%22%23664d03%22%20viewBox%3D%220%200%2016%2016%22%3E%3Cpath%20d%3D%22M8.982%201.566a1.13%201.13%200%200%200-1.96%200L.165%2013.233c-.457.778.091%201.767.98%201.767h13.713c.889%200%201.438-.99.98-1.767L8.982%201.566zM8%205c.535%200%20.954.462.9.995l-.35%203.507a.552.552%200%200%201-1.1%200L7.1%205.995A.905.905%200%200%201%208%205zm.002%206a1%201%200%201%201%200%202%201%201%200%200%201%200-2z%22/%3E%3C/svg%3E");}.pdoc .pdoc-alert-danger{color:#842029;background-color:#f8d7da;border-color:#f5c2c7;background-image:url("data:image/svg+xml,%3Csvg%20xmlns%3D%22http%3A//www.w3.org/2000/svg%22%20width%3D%2224%22%20height%3D%2224%22%20fill%3D%22%23842029%22%20viewBox%3D%220%200%2016%2016%22%3E%3Cpath%20d%3D%22M5.52.359A.5.5%200%200%201%206%200h4a.5.5%200%200%201%20.474.658L8.694%206H12.5a.5.5%200%200%201%20.395.807l-7%209a.5.5%200%200%201-.873-.454L6.823%209.5H3.5a.5.5%200%200%201-.48-.641l2.5-8.5z%22/%3E%3C/svg%3E");}.pdoc .visually-hidden{position:absolute !important;width:1px !important;height:1px !important;padding:0 !important;margin:-1px !important;overflow:hidden !important;clip:rect(0, 0, 0, 0) !important;white-space:nowrap !important;border:0 !important;}.pdoc h1, .pdoc h2, .pdoc h3{font-weight:300;margin:.3em 0;padding:.2em 0;}.pdoc > section:not(.module-info) h1{font-size:1.5rem;font-weight:500;}.pdoc > section:not(.module-info) h2{font-size:1.4rem;font-weight:500;}.pdoc > section:not(.module-info) h3{font-size:1.3rem;font-weight:500;}.pdoc > section:not(.module-info) h4{font-size:1.2rem;}.pdoc > section:not(.module-info) h5{font-size:1.1rem;}.pdoc a{text-decoration:none;color:var(--link);}.pdoc a:hover{color:var(--link-hover);}.pdoc blockquote{margin-left:2rem;}.pdoc pre{border-top:1px solid var(--accent2);border-bottom:1px solid var(--accent2);margin-top:0;margin-bottom:1em;padding:.5rem 0 .5rem .5rem;overflow-x:auto;background-color:var(--code);}.pdoc code{color:var(--text);padding:.2em .4em;margin:0;font-size:85%;background-color:var(--accent);border-radius:6px;}.pdoc a > code{color:inherit;}.pdoc pre > code{display:inline-block;font-size:inherit;background:none;border:none;padding:0;}.pdoc > section:not(.module-info){margin-bottom:1.5rem;}.pdoc .modulename{margin-top:0;font-weight:bold;}.pdoc .modulename a{color:var(--link);transition:100ms all;}.pdoc .git-button{float:right;border:solid var(--link) 1px;}.pdoc .git-button:hover{background-color:var(--link);color:var(--pdoc-background);}.view-source-toggle-state,.view-source-toggle-state ~ .pdoc-code{display:none;}.view-source-toggle-state:checked ~ .pdoc-code{display:block;}.view-source-button{display:inline-block;float:right;font-size:.75rem;line-height:1.5rem;color:var(--muted);padding:0 .4rem 0 1.3rem;cursor:pointer;text-indent:-2px;}.view-source-button > span{visibility:hidden;}.module-info .view-source-button{float:none;display:flex;justify-content:flex-end;margin:-1.2rem .4rem -.2rem 0;}.view-source-button::before{position:absolute;content:"View Source";display:list-item;list-style-type:disclosure-closed;}.view-source-toggle-state:checked ~ .attr .view-source-button::before,.view-source-toggle-state:checked ~ .view-source-button::before{list-style-type:disclosure-open;}.pdoc .docstring{margin-bottom:1.5rem;}.pdoc section:not(.module-info) .docstring{margin-left:clamp(0rem, 5vw - 2rem, 1rem);}.pdoc .docstring .pdoc-code{margin-left:1em;margin-right:1em;}.pdoc h1:target,.pdoc h2:target,.pdoc h3:target,.pdoc h4:target,.pdoc h5:target,.pdoc h6:target,.pdoc .pdoc-code > pre > span:target{background-color:var(--active);box-shadow:-1rem 0 0 0 var(--active);}.pdoc .pdoc-code > pre > span:target{display:block;}.pdoc div:target > .attr,.pdoc section:target > .attr,.pdoc dd:target > a{background-color:var(--active);}.pdoc *{scroll-margin:2rem;}.pdoc .pdoc-code .linenos{user-select:none;}.pdoc .attr:hover{filter:contrast(0.95);}.pdoc section, .pdoc .classattr{position:relative;}.pdoc .headerlink{--width:clamp(1rem, 3vw, 2rem);position:absolute;top:0;left:calc(0rem - var(--width));transition:all 100ms ease-in-out;opacity:0;}.pdoc .headerlink::before{content:"#";display:block;text-align:center;width:var(--width);height:2.3rem;line-height:2.3rem;font-size:1.5rem;}.pdoc .attr:hover ~ .headerlink,.pdoc *:target > .headerlink,.pdoc .headerlink:hover{opacity:1;}.pdoc .attr{display:block;margin:.5rem 0 .5rem;padding:.4rem .4rem .4rem 1rem;background-color:var(--accent);overflow-x:auto;}.pdoc .classattr{margin-left:2rem;}.pdoc .name{color:var(--name);font-weight:bold;}.pdoc .def{color:var(--def);font-weight:bold;}.pdoc .signature{background-color:transparent;}.pdoc .param, .pdoc .return-annotation{white-space:pre;}.pdoc .signature.multiline .param{display:block;}.pdoc .signature.condensed .param{display:inline-block;}.pdoc .annotation{color:var(--annotation);}.pdoc .view-value-toggle-state,.pdoc .view-value-toggle-state ~ .default_value{display:none;}.pdoc .view-value-toggle-state:checked ~ .default_value{display:inherit;}.pdoc .view-value-button{font-size:.5rem;vertical-align:middle;border-style:dashed;margin-top:-0.1rem;}.pdoc .view-value-button:hover{background:white;}.pdoc .view-value-button::before{content:"show";text-align:center;width:2.2em;display:inline-block;}.pdoc .view-value-toggle-state:checked ~ .view-value-button::before{content:"hide";}.pdoc .inherited{margin-left:2rem;}.pdoc .inherited dt{font-weight:700;}.pdoc .inherited dt, .pdoc .inherited dd{display:inline;margin-left:0;margin-bottom:.5rem;}.pdoc .inherited dd:not(:last-child):after{content:", ";}.pdoc .inherited .class:before{content:"class ";}.pdoc .inherited .function a:after{content:"()";}.pdoc .search-result .docstring{overflow:auto;max-height:25vh;}.pdoc .search-result.focused > .attr{background-color:var(--active);}.pdoc .attribution{margin-top:2rem;display:block;opacity:0.5;transition:all 200ms;filter:grayscale(100%);}.pdoc .attribution:hover{opacity:1;filter:grayscale(0%);}.pdoc .attribution img{margin-left:5px;height:35px;vertical-align:middle;width:70px;transition:all 200ms;}.pdoc table{display:block;width:max-content;max-width:100%;overflow:auto;margin-bottom:1rem;}.pdoc table th{font-weight:600;}.pdoc table th, .pdoc table td{padding:6px 13px;border:1px solid var(--accent2);}</style>
+    <style>/*! custom.css */</style><script>
+    window.MathJax = {
+        tex: {
+            inlineMath: [['$', '$'], ['\\(', '\\)']]
+        }
+    };
+</script>
+<script src="https://polyfill.io/v3/polyfill.min.js?features=es6"></script>
+<script id="MathJax-script" async src="https://cdn.jsdelivr.net/npm/mathjax@3/es5/tex-mml-chtml.js"></script>
+<script>
+    /* Re-invoke MathJax when DOM content changes, for example during search. */
+    document.addEventListener("DOMContentLoaded", () => {
+        new MutationObserver(() => MathJax.typeset()).observe(
+            document.querySelector("main.pdoc").parentNode,
+            {childList: true}
+        );
+    })
+</script>
+<style>
+    mjx-container {
+        overflow-x: auto;
+    }
+</style></head>
+<body>
+    <nav class="pdoc">
+        <label id="navtoggle" for="togglestate" class="pdoc-button"><svg xmlns='http://www.w3.org/2000/svg' viewBox='0 0 30 30'><path stroke-linecap='round' stroke="currentColor" stroke-miterlimit='10' stroke-width='2' d='M4 7h22M4 15h22M4 23h22'/></svg></label>
+        <input id="togglestate" type="checkbox" aria-hidden="true" tabindex="-1">
+        <div>            <a class="pdoc-button module-list-button" href="../../index.html">
+<svg xmlns="http://www.w3.org/2000/svg" width="16" height="16" fill="currentColor" class="bi bi-box-arrow-in-left" viewBox="0 0 16 16">
+  <path fill-rule="evenodd" d="M10 3.5a.5.5 0 0 0-.5-.5h-8a.5.5 0 0 0-.5.5v9a.5.5 0 0 0 .5.5h8a.5.5 0 0 0 .5-.5v-2a.5.5 0 0 1 1 0v2A1.5 1.5 0 0 1 9.5 14h-8A1.5 1.5 0 0 1 0 12.5v-9A1.5 1.5 0 0 1 1.5 2h8A1.5 1.5 0 0 1 11 3.5v2a.5.5 0 0 1-1 0v-2z"/>
+  <path fill-rule="evenodd" d="M4.146 8.354a.5.5 0 0 1 0-.708l3-3a.5.5 0 1 1 .708.708L5.707 7.5H14.5a.5.5 0 0 1 0 1H5.707l2.147 2.146a.5.5 0 0 1-.708.708l-3-3z"/>
+</svg>                &nbsp;
+                Module Index
+            </a>
+
+
+            <input type="search" placeholder="Search..." role="searchbox" aria-label="search"
+                   pattern=".+" required>
+
+
+
+            <h2>API Documentation</h2>
+                <ul class="memberlist">
+            <li>
+                    <a class="class" href="#GWLossesBase">GWLossesBase</a>
+                            <ul class="memberlist">
+                        <li>
+                                <a class="function" href="#GWLossesBase.step">step</a>
+                        </li>
+                </ul>
+
+            </li>
+            <li>
+                    <a class="function" href="#demi_cycle_loss">demi_cycle_loss</a>
+            </li>
+            <li>
+                    <a class="function" href="#cycle_loss">cycle_loss</a>
+            </li>
+            <li>
+                    <a class="function" href="#translation_loss">translation_loss</a>
+            </li>
+            <li>
+                    <a class="function" href="#contrastive_loss">contrastive_loss</a>
+            </li>
+            <li>
+                    <a class="function" href="#contrastive_loss_bayesian">contrastive_loss_bayesian</a>
+            </li>
+            <li>
+                    <a class="class" href="#LossCoefs">LossCoefs</a>
+                            <ul class="memberlist">
+                        <li>
+                                <a class="variable" href="#LossCoefs.demi_cycles">demi_cycles</a>
+                        </li>
+                        <li>
+                                <a class="variable" href="#LossCoefs.cycles">cycles</a>
+                        </li>
+                        <li>
+                                <a class="variable" href="#LossCoefs.translations">translations</a>
+                        </li>
+                        <li>
+                                <a class="variable" href="#LossCoefs.contrastives">contrastives</a>
+                        </li>
+                </ul>
+
+            </li>
+            <li>
+                    <a class="class" href="#GWLosses2Domains">GWLosses2Domains</a>
+                            <ul class="memberlist">
+                        <li>
+                                <a class="function" href="#GWLosses2Domains.__init__">GWLosses2Domains</a>
+                        </li>
+                        <li>
+                                <a class="variable" href="#GWLosses2Domains.gw_mod">gw_mod</a>
+                        </li>
+                        <li>
+                                <a class="variable" href="#GWLosses2Domains.selection_mod">selection_mod</a>
+                        </li>
+                        <li>
+                                <a class="variable" href="#GWLosses2Domains.domain_mods">domain_mods</a>
+                        </li>
+                        <li>
+                                <a class="variable" href="#GWLosses2Domains.loss_coefs">loss_coefs</a>
+                        </li>
+                        <li>
+                                <a class="variable" href="#GWLosses2Domains.contrastive_fn">contrastive_fn</a>
+                        </li>
+                        <li>
+                                <a class="function" href="#GWLosses2Domains.demi_cycle_loss">demi_cycle_loss</a>
+                        </li>
+                        <li>
+                                <a class="function" href="#GWLosses2Domains.cycle_loss">cycle_loss</a>
+                        </li>
+                        <li>
+                                <a class="function" href="#GWLosses2Domains.translation_loss">translation_loss</a>
+                        </li>
+                        <li>
+                                <a class="function" href="#GWLosses2Domains.contrastive_loss">contrastive_loss</a>
+                        </li>
+                        <li>
+                                <a class="function" href="#GWLosses2Domains.step">step</a>
+                        </li>
+                </ul>
+
+            </li>
+            <li>
+                    <a class="function" href="#generate_partitions">generate_partitions</a>
+            </li>
+            <li>
+                    <a class="function" href="#broadcast_loss">broadcast_loss</a>
+            </li>
+            <li>
+                    <a class="class" href="#BroadcastLossCoefs">BroadcastLossCoefs</a>
+                            <ul class="memberlist">
+                        <li>
+                                <a class="variable" href="#BroadcastLossCoefs.contrastives">contrastives</a>
+                        </li>
+                        <li>
+                                <a class="variable" href="#BroadcastLossCoefs.fused">fused</a>
+                        </li>
+                        <li>
+                                <a class="variable" href="#BroadcastLossCoefs.demi_cycles">demi_cycles</a>
+                        </li>
+                        <li>
+                                <a class="variable" href="#BroadcastLossCoefs.cycles">cycles</a>
+                        </li>
+                        <li>
+                                <a class="variable" href="#BroadcastLossCoefs.translations">translations</a>
+                        </li>
+                </ul>
+
+            </li>
+            <li>
+                    <a class="class" href="#GWLosses">GWLosses</a>
+                            <ul class="memberlist">
+                        <li>
+                                <a class="function" href="#GWLosses.__init__">GWLosses</a>
+                        </li>
+                        <li>
+                                <a class="variable" href="#GWLosses.gw_mod">gw_mod</a>
+                        </li>
+                        <li>
+                                <a class="variable" href="#GWLosses.selection_mod">selection_mod</a>
+                        </li>
+                        <li>
+                                <a class="variable" href="#GWLosses.domain_mods">domain_mods</a>
+                        </li>
+                        <li>
+                                <a class="variable" href="#GWLosses.loss_coefs">loss_coefs</a>
+                        </li>
+                        <li>
+                                <a class="variable" href="#GWLosses.contrastive_fn">contrastive_fn</a>
+                        </li>
+                        <li>
+                                <a class="function" href="#GWLosses.contrastive_loss">contrastive_loss</a>
+                        </li>
+                        <li>
+                                <a class="function" href="#GWLosses.broadcast_loss">broadcast_loss</a>
+                        </li>
+                        <li>
+                                <a class="function" href="#GWLosses.step">step</a>
+                        </li>
+                </ul>
+
+            </li>
+            <li>
+                    <a class="class" href="#GWLossesBayesian">GWLossesBayesian</a>
+                            <ul class="memberlist">
+                        <li>
+                                <a class="function" href="#GWLossesBayesian.__init__">GWLossesBayesian</a>
+                        </li>
+                        <li>
+                                <a class="variable" href="#GWLossesBayesian.gw_mod">gw_mod</a>
+                        </li>
+                        <li>
+                                <a class="variable" href="#GWLossesBayesian.selection_mod">selection_mod</a>
+                        </li>
+                        <li>
+                                <a class="variable" href="#GWLossesBayesian.domain_mods">domain_mods</a>
+                        </li>
+                        <li>
+                                <a class="variable" href="#GWLossesBayesian.loss_coefs">loss_coefs</a>
+                        </li>
+                        <li>
+                                <a class="variable" href="#GWLossesBayesian.contrastive_fn">contrastive_fn</a>
+                        </li>
+                        <li>
+                                <a class="variable" href="#GWLossesBayesian.use_normalized_constrastive">use_normalized_constrastive</a>
+                        </li>
+                        <li>
+                                <a class="function" href="#GWLossesBayesian.contrastive_loss">contrastive_loss</a>
+                        </li>
+                        <li>
+                                <a class="function" href="#GWLossesBayesian.broadcast_loss">broadcast_loss</a>
+                        </li>
+                        <li>
+                                <a class="function" href="#GWLossesBayesian.step">step</a>
+                        </li>
+                </ul>
+
+            </li>
+    </ul>
+
+
+
+        <a class="attribution" title="pdoc: Python API documentation generator" href="https://pdoc.dev" target="_blank">
+            built with <span class="visually-hidden">pdoc</span><img
+                alt="pdoc logo"
+                src="data:image/svg+xml,%3Csvg%20xmlns%3D%22http%3A//www.w3.org/2000/svg%22%20role%3D%22img%22%20aria-label%3D%22pdoc%20logo%22%20width%3D%22300%22%20height%3D%22150%22%20viewBox%3D%22-1%200%2060%2030%22%3E%3Ctitle%3Epdoc%3C/title%3E%3Cpath%20d%3D%22M29.621%2021.293c-.011-.273-.214-.475-.511-.481a.5.5%200%200%200-.489.503l-.044%201.393c-.097.551-.695%201.215-1.566%201.704-.577.428-1.306.486-2.193.182-1.426-.617-2.467-1.654-3.304-2.487l-.173-.172a3.43%203.43%200%200%200-.365-.306.49.49%200%200%200-.286-.196c-1.718-1.06-4.931-1.47-7.353.191l-.219.15c-1.707%201.187-3.413%202.131-4.328%201.03-.02-.027-.49-.685-.141-1.763.233-.721.546-2.408.772-4.076.042-.09.067-.187.046-.288.166-1.347.277-2.625.241-3.351%201.378-1.008%202.271-2.586%202.271-4.362%200-.976-.272-1.935-.788-2.774-.057-.094-.122-.18-.184-.268.033-.167.052-.339.052-.516%200-1.477-1.202-2.679-2.679-2.679-.791%200-1.496.352-1.987.9a6.3%206.3%200%200%200-1.001.029c-.492-.564-1.207-.929-2.012-.929-1.477%200-2.679%201.202-2.679%202.679A2.65%202.65%200%200%200%20.97%206.554c-.383.747-.595%201.572-.595%202.41%200%202.311%201.507%204.29%203.635%205.107-.037.699-.147%202.27-.423%203.294l-.137.461c-.622%202.042-2.515%208.257%201.727%2010.643%201.614.908%203.06%201.248%204.317%201.248%202.665%200%204.492-1.524%205.322-2.401%201.476-1.559%202.886-1.854%206.491.82%201.877%201.393%203.514%201.753%204.861%201.068%202.223-1.713%202.811-3.867%203.399-6.374.077-.846.056-1.469.054-1.537zm-4.835%204.313c-.054.305-.156.586-.242.629-.034-.007-.131-.022-.307-.157-.145-.111-.314-.478-.456-.908.221.121.432.25.675.355.115.039.219.051.33.081zm-2.251-1.238c-.05.33-.158.648-.252.694-.022.001-.125-.018-.307-.157-.217-.166-.488-.906-.639-1.573.358.344.754.693%201.198%201.036zm-3.887-2.337c-.006-.116-.018-.231-.041-.342.635.145%201.189.368%201.599.625.097.231.166.481.174.642-.03.049-.055.101-.067.158-.046.013-.128.026-.298.004-.278-.037-.901-.57-1.367-1.087zm-1.127-.497c.116.306.176.625.12.71-.019.014-.117.045-.345.016-.206-.027-.604-.332-.986-.695.41-.051.816-.056%201.211-.031zm-4.535%201.535c.209.22.379.47.358.598-.006.041-.088.138-.351.234-.144.055-.539-.063-.979-.259a11.66%2011.66%200%200%200%20.972-.573zm.983-.664c.359-.237.738-.418%201.126-.554.25.237.479.548.457.694-.006.042-.087.138-.351.235-.174.064-.694-.105-1.232-.375zm-3.381%201.794c-.022.145-.061.29-.149.401-.133.166-.358.248-.69.251h-.002c-.133%200-.306-.26-.45-.621.417.091.854.07%201.291-.031zm-2.066-8.077a4.78%204.78%200%200%201-.775-.584c.172-.115.505-.254.88-.378l-.105.962zm-.331%202.302a10.32%2010.32%200%200%201-.828-.502c.202-.143.576-.328.984-.49l-.156.992zm-.45%202.157l-.701-.403c.214-.115.536-.249.891-.376a11.57%2011.57%200%200%201-.19.779zm-.181%201.716c.064.398.194.702.298.893-.194-.051-.435-.162-.736-.398.061-.119.224-.3.438-.495zM8.87%204.141c0%20.152-.123.276-.276.276s-.275-.124-.275-.276.123-.276.276-.276.275.124.275.276zm-.735-.389a1.15%201.15%200%200%200-.314.783%201.16%201.16%200%200%200%201.162%201.162c.457%200%20.842-.27%201.032-.653.026.117.042.238.042.362a1.68%201.68%200%200%201-1.679%201.679%201.68%201.68%200%200%201-1.679-1.679c0-.843.626-1.535%201.436-1.654zM5.059%205.406A1.68%201.68%200%200%201%203.38%207.085a1.68%201.68%200%200%201-1.679-1.679c0-.037.009-.072.011-.109.21.3.541.508.935.508a1.16%201.16%200%200%200%201.162-1.162%201.14%201.14%200%200%200-.474-.912c.015%200%20.03-.005.045-.005.926.001%201.679.754%201.679%201.68zM3.198%204.141c0%20.152-.123.276-.276.276s-.275-.124-.275-.276.123-.276.276-.276.275.124.275.276zM1.375%208.964c0-.52.103-1.035.288-1.52.466.394%201.06.64%201.717.64%201.144%200%202.116-.725%202.499-1.738.383%201.012%201.355%201.738%202.499%201.738.867%200%201.631-.421%202.121-1.062.307.605.478%201.267.478%201.942%200%202.486-2.153%204.51-4.801%204.51s-4.801-2.023-4.801-4.51zm24.342%2019.349c-.985.498-2.267.168-3.813-.979-3.073-2.281-5.453-3.199-7.813-.705-1.315%201.391-4.163%203.365-8.423.97-3.174-1.786-2.239-6.266-1.261-9.479l.146-.492c.276-1.02.395-2.457.444-3.268a6.11%206.11%200%200%200%201.18.115%206.01%206.01%200%200%200%202.536-.562l-.006.175c-.802.215-1.848.612-2.021%201.25-.079.295.021.601.274.837.219.203.415.364.598.501-.667.304-1.243.698-1.311%201.179-.02.144-.022.507.393.787.213.144.395.26.564.365-1.285.521-1.361.96-1.381%201.126-.018.142-.011.496.427.746l.854.489c-.473.389-.971.914-.999%201.429-.018.278.095.532.316.713.675.556%201.231.721%201.653.721.059%200%20.104-.014.158-.02.207.707.641%201.64%201.513%201.64h.013c.8-.008%201.236-.345%201.462-.626.173-.216.268-.457.325-.692.424.195.93.374%201.372.374.151%200%20.294-.021.423-.068.732-.27.944-.704.993-1.021.009-.061.003-.119.002-.179.266.086.538.147.789.147.15%200%20.294-.021.423-.069.542-.2.797-.489.914-.754.237.147.478.258.704.288.106.014.205.021.296.021.356%200%20.595-.101.767-.229.438.435%201.094.992%201.656%201.067.106.014.205.021.296.021a1.56%201.56%200%200%200%20.323-.035c.17.575.453%201.289.866%201.605.358.273.665.362.914.362a.99.99%200%200%200%20.421-.093%201.03%201.03%200%200%200%20.245-.164c.168.428.39.846.68%201.068.358.273.665.362.913.362a.99.99%200%200%200%20.421-.093c.317-.148.512-.448.639-.762.251.157.495.257.726.257.127%200%20.25-.024.37-.071.427-.17.706-.617.841-1.314.022-.015.047-.022.068-.038.067-.051.133-.104.196-.159-.443%201.486-1.107%202.761-2.086%203.257zM8.66%209.925a.5.5%200%201%200-1%200c0%20.653-.818%201.205-1.787%201.205s-1.787-.552-1.787-1.205a.5.5%200%201%200-1%200c0%201.216%201.25%202.205%202.787%202.205s2.787-.989%202.787-2.205zm4.4%2015.965l-.208.097c-2.661%201.258-4.708%201.436-6.086.527-1.542-1.017-1.88-3.19-1.844-4.198a.4.4%200%200%200-.385-.414c-.242-.029-.406.164-.414.385-.046%201.249.367%203.686%202.202%204.896.708.467%201.547.7%202.51.7%201.248%200%202.706-.392%204.362-1.174l.185-.086a.4.4%200%200%200%20.205-.527c-.089-.204-.326-.291-.527-.206zM9.547%202.292c.093.077.205.114.317.114a.5.5%200%200%200%20.318-.886L8.817.397a.5.5%200%200%200-.703.068.5.5%200%200%200%20.069.703l1.364%201.124zm-7.661-.065c.086%200%20.173-.022.253-.068l1.523-.893a.5.5%200%200%200-.506-.863l-1.523.892a.5.5%200%200%200-.179.685c.094.158.261.247.432.247z%22%20transform%3D%22matrix%28-1%200%200%201%2058%200%29%22%20fill%3D%22%233bb300%22/%3E%3Cpath%20d%3D%22M.3%2021.86V10.18q0-.46.02-.68.04-.22.18-.5.28-.54%201.34-.54%201.06%200%201.42.28.38.26.44.78.76-1.04%202.38-1.04%201.64%200%203.1%201.54%201.46%201.54%201.46%203.58%200%202.04-1.46%203.58-1.44%201.54-3.08%201.54-1.64%200-2.38-.92v4.04q0%20.46-.04.68-.02.22-.18.5-.14.3-.5.42-.36.12-.98.12-.62%200-1-.12-.36-.12-.52-.4-.14-.28-.18-.5-.02-.22-.02-.68zm3.96-9.42q-.46.54-.46%201.18%200%20.64.46%201.18.48.52%201.2.52.74%200%201.24-.52.52-.52.52-1.18%200-.66-.48-1.18-.48-.54-1.26-.54-.76%200-1.22.54zm14.741-8.36q.16-.3.54-.42.38-.12%201-.12.64%200%201.02.12.38.12.52.42.16.3.18.54.04.22.04.68v11.94q0%20.46-.04.7-.02.22-.18.5-.3.54-1.7.54-1.38%200-1.54-.98-.84.96-2.34.96-1.8%200-3.28-1.56-1.48-1.58-1.48-3.66%200-2.1%201.48-3.68%201.5-1.58%203.28-1.58%201.48%200%202.3%201v-4.2q0-.46.02-.68.04-.24.18-.52zm-3.24%2010.86q.52.54%201.26.54.74%200%201.22-.54.5-.54.5-1.18%200-.66-.48-1.22-.46-.56-1.26-.56-.8%200-1.28.56-.48.54-.48%201.2%200%20.66.52%201.2zm7.833-1.2q0-2.4%201.68-3.96%201.68-1.56%203.84-1.56%202.16%200%203.82%201.56%201.66%201.54%201.66%203.94%200%201.66-.86%202.96-.86%201.28-2.1%201.9-1.22.6-2.54.6-1.32%200-2.56-.64-1.24-.66-2.1-1.92-.84-1.28-.84-2.88zm4.18%201.44q.64.48%201.3.48.66%200%201.32-.5.66-.5.66-1.48%200-.98-.62-1.46-.62-.48-1.34-.48-.72%200-1.34.5-.62.5-.62%201.48%200%20.96.64%201.46zm11.412-1.44q0%20.84.56%201.32.56.46%201.18.46.64%200%201.18-.36.56-.38.9-.38.6%200%201.46%201.06.46.58.46%201.04%200%20.76-1.1%201.42-1.14.8-2.8.8-1.86%200-3.58-1.34-.82-.64-1.34-1.7-.52-1.08-.52-2.36%200-1.3.52-2.34.52-1.06%201.34-1.7%201.66-1.32%203.54-1.32.76%200%201.48.22.72.2%201.06.4l.32.2q.36.24.56.38.52.4.52.92%200%20.5-.42%201.14-.72%201.1-1.38%201.1-.38%200-1.08-.44-.36-.34-1.04-.34-.66%200-1.24.48-.58.48-.58%201.34z%22%20fill%3D%22green%22/%3E%3C/svg%3E"/>
+        </a>
+</div>
+    </nav>
+    <main class="pdoc">
+            <section class="module-info">
+                    <h1 class="modulename">
+shimmer<wbr>.modules<wbr>.losses    </h1>
+
+                
+                        <input id="mod-losses-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
+
+                        <label class="view-source-button" for="mod-losses-view-source"><span>View Source</span></label>
+
+                        <div class="pdoc-code codehilite"><pre><span></span><span id="L-1"><a href="#L-1"><span class="linenos">  1</span></a><span class="kn">from</span> <span class="nn">abc</span> <span class="kn">import</span> <span class="n">ABC</span><span class="p">,</span> <span class="n">abstractmethod</span>
+</span><span id="L-2"><a href="#L-2"><span class="linenos">  2</span></a><span class="kn">from</span> <span class="nn">collections.abc</span> <span class="kn">import</span> <span class="n">Generator</span><span class="p">,</span> <span class="n">Mapping</span>
+</span><span id="L-3"><a href="#L-3"><span class="linenos">  3</span></a><span class="kn">from</span> <span class="nn">itertools</span> <span class="kn">import</span> <span class="n">product</span>
+</span><span id="L-4"><a href="#L-4"><span class="linenos">  4</span></a><span class="kn">from</span> <span class="nn">typing</span> <span class="kn">import</span> <span class="n">TypedDict</span>
+</span><span id="L-5"><a href="#L-5"><span class="linenos">  5</span></a>
+</span><span id="L-6"><a href="#L-6"><span class="linenos">  6</span></a><span class="kn">import</span> <span class="nn">torch</span>
+</span><span id="L-7"><a href="#L-7"><span class="linenos">  7</span></a>
+</span><span id="L-8"><a href="#L-8"><span class="linenos">  8</span></a><span class="kn">from</span> <span class="nn">shimmer.modules.contrastive_loss</span> <span class="kn">import</span> <span class="n">ContrastiveLossType</span>
+</span><span id="L-9"><a href="#L-9"><span class="linenos">  9</span></a><span class="kn">from</span> <span class="nn">shimmer.modules.domain</span> <span class="kn">import</span> <span class="n">DomainModule</span><span class="p">,</span> <span class="n">LossOutput</span>
+</span><span id="L-10"><a href="#L-10"><span class="linenos"> 10</span></a><span class="kn">from</span> <span class="nn">shimmer.modules.gw_module</span> <span class="kn">import</span> <span class="p">(</span>
+</span><span id="L-11"><a href="#L-11"><span class="linenos"> 11</span></a>    <span class="n">GWModule</span><span class="p">,</span>
+</span><span id="L-12"><a href="#L-12"><span class="linenos"> 12</span></a>    <span class="n">GWModuleBase</span><span class="p">,</span>
+</span><span id="L-13"><a href="#L-13"><span class="linenos"> 13</span></a>    <span class="n">GWModuleBayesian</span><span class="p">,</span>
+</span><span id="L-14"><a href="#L-14"><span class="linenos"> 14</span></a><span class="p">)</span>
+</span><span id="L-15"><a href="#L-15"><span class="linenos"> 15</span></a><span class="kn">from</span> <span class="nn">shimmer.modules.selection</span> <span class="kn">import</span> <span class="n">SelectionBase</span>
+</span><span id="L-16"><a href="#L-16"><span class="linenos"> 16</span></a><span class="kn">from</span> <span class="nn">shimmer.types</span> <span class="kn">import</span> <span class="n">LatentsDomainGroupsT</span><span class="p">,</span> <span class="n">ModelModeT</span>
+</span><span id="L-17"><a href="#L-17"><span class="linenos"> 17</span></a>
+</span><span id="L-18"><a href="#L-18"><span class="linenos"> 18</span></a>
+</span><span id="L-19"><a href="#L-19"><span class="linenos"> 19</span></a><span class="k">class</span> <span class="nc">GWLossesBase</span><span class="p">(</span><span class="n">torch</span><span class="o">.</span><span class="n">nn</span><span class="o">.</span><span class="n">Module</span><span class="p">,</span> <span class="n">ABC</span><span class="p">):</span>
+</span><span id="L-20"><a href="#L-20"><span class="linenos"> 20</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="L-21"><a href="#L-21"><span class="linenos"> 21</span></a><span class="sd">    Base Abstract Class for Global Workspace (GW) losses. This module is used</span>
+</span><span id="L-22"><a href="#L-22"><span class="linenos"> 22</span></a><span class="sd">    to compute the different losses of the GW (typically translation, cycle,</span>
+</span><span id="L-23"><a href="#L-23"><span class="linenos"> 23</span></a><span class="sd">    demi-cycle, contrastive losses).</span>
+</span><span id="L-24"><a href="#L-24"><span class="linenos"> 24</span></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="L-25"><a href="#L-25"><span class="linenos"> 25</span></a>
+</span><span id="L-26"><a href="#L-26"><span class="linenos"> 26</span></a>    <span class="nd">@abstractmethod</span>
+</span><span id="L-27"><a href="#L-27"><span class="linenos"> 27</span></a>    <span class="k">def</span> <span class="nf">step</span><span class="p">(</span>
+</span><span id="L-28"><a href="#L-28"><span class="linenos"> 28</span></a>        <span class="bp">self</span><span class="p">,</span>
+</span><span id="L-29"><a href="#L-29"><span class="linenos"> 29</span></a>        <span class="n">domain_latents</span><span class="p">:</span> <span class="n">LatentsDomainGroupsT</span><span class="p">,</span>
+</span><span id="L-30"><a href="#L-30"><span class="linenos"> 30</span></a>        <span class="n">mode</span><span class="p">:</span> <span class="n">ModelModeT</span><span class="p">,</span>
+</span><span id="L-31"><a href="#L-31"><span class="linenos"> 31</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="n">LossOutput</span><span class="p">:</span>
+</span><span id="L-32"><a href="#L-32"><span class="linenos"> 32</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="L-33"><a href="#L-33"><span class="linenos"> 33</span></a><span class="sd">        Computes the losses.</span>
+</span><span id="L-34"><a href="#L-34"><span class="linenos"> 34</span></a>
+</span><span id="L-35"><a href="#L-35"><span class="linenos"> 35</span></a><span class="sd">        Args:</span>
+</span><span id="L-36"><a href="#L-36"><span class="linenos"> 36</span></a><span class="sd">            domain_latents (`LatentsDomainGroupsT`): All latent groups</span>
+</span><span id="L-37"><a href="#L-37"><span class="linenos"> 37</span></a><span class="sd">            mode (`Literal[&quot;train&quot;, &quot;val&quot;, &quot;test&quot;, &quot;val/ood&quot;, &quot;test/ood&quot;]`): model mode</span>
+</span><span id="L-38"><a href="#L-38"><span class="linenos"> 38</span></a><span class="sd">        Returns:</span>
+</span><span id="L-39"><a href="#L-39"><span class="linenos"> 39</span></a><span class="sd">            `LossOutput`: the losses</span>
+</span><span id="L-40"><a href="#L-40"><span class="linenos"> 40</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="L-41"><a href="#L-41"><span class="linenos"> 41</span></a>        <span class="o">...</span>
+</span><span id="L-42"><a href="#L-42"><span class="linenos"> 42</span></a>
+</span><span id="L-43"><a href="#L-43"><span class="linenos"> 43</span></a>
+</span><span id="L-44"><a href="#L-44"><span class="linenos"> 44</span></a><span class="k">def</span> <span class="nf">demi_cycle_loss</span><span class="p">(</span>
+</span><span id="L-45"><a href="#L-45"><span class="linenos"> 45</span></a>    <span class="n">gw_mod</span><span class="p">:</span> <span class="n">GWModuleBase</span><span class="p">,</span>
+</span><span id="L-46"><a href="#L-46"><span class="linenos"> 46</span></a>    <span class="n">selection_mod</span><span class="p">:</span> <span class="n">SelectionBase</span><span class="p">,</span>
+</span><span id="L-47"><a href="#L-47"><span class="linenos"> 47</span></a>    <span class="n">domain_mods</span><span class="p">:</span> <span class="n">Mapping</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">DomainModule</span><span class="p">],</span>
+</span><span id="L-48"><a href="#L-48"><span class="linenos"> 48</span></a>    <span class="n">latent_domains</span><span class="p">:</span> <span class="n">LatentsDomainGroupsT</span><span class="p">,</span>
+</span><span id="L-49"><a href="#L-49"><span class="linenos"> 49</span></a><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]:</span>
+</span><span id="L-50"><a href="#L-50"><span class="linenos"> 50</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="L-51"><a href="#L-51"><span class="linenos"> 51</span></a><span class="sd">    Computes the demi-cycle loss.</span>
+</span><span id="L-52"><a href="#L-52"><span class="linenos"> 52</span></a>
+</span><span id="L-53"><a href="#L-53"><span class="linenos"> 53</span></a><span class="sd">    This return multiple metrics:</span>
+</span><span id="L-54"><a href="#L-54"><span class="linenos"> 54</span></a><span class="sd">        * `demi_cycle_{domain_name}` with the demi-cycle of a particular domain;</span>
+</span><span id="L-55"><a href="#L-55"><span class="linenos"> 55</span></a><span class="sd">        * `demi_cycle_{domain_name}_{metric}` with additional metrics provided by</span>
+</span><span id="L-56"><a href="#L-56"><span class="linenos"> 56</span></a><span class="sd">            the domain_mod&#39;s `compute_dcy_loss` output;</span>
+</span><span id="L-57"><a href="#L-57"><span class="linenos"> 57</span></a><span class="sd">        * `demi_cycles` with the average value of all `demi_cycle_{domain_name}` values.</span>
+</span><span id="L-58"><a href="#L-58"><span class="linenos"> 58</span></a>
+</span><span id="L-59"><a href="#L-59"><span class="linenos"> 59</span></a><span class="sd">    Args:</span>
+</span><span id="L-60"><a href="#L-60"><span class="linenos"> 60</span></a><span class="sd">        gw_mod (`shimmer.modules.gw_module.GWModuleBase`): The GWModule to use</span>
+</span><span id="L-61"><a href="#L-61"><span class="linenos"> 61</span></a><span class="sd">        selection_mod (`shimmer.modules.selection.SelectionBase`): Selection mod to use</span>
+</span><span id="L-62"><a href="#L-62"><span class="linenos"> 62</span></a><span class="sd">        domain_mods (`Mapping[str, DomainModule]`): the domain modules</span>
+</span><span id="L-63"><a href="#L-63"><span class="linenos"> 63</span></a><span class="sd">        latent_domains (`shimmer.types.LatentsDomainGroupsT`): the latent unimodal</span>
+</span><span id="L-64"><a href="#L-64"><span class="linenos"> 64</span></a><span class="sd">            groups</span>
+</span><span id="L-65"><a href="#L-65"><span class="linenos"> 65</span></a>
+</span><span id="L-66"><a href="#L-66"><span class="linenos"> 66</span></a><span class="sd">    Returns:</span>
+</span><span id="L-67"><a href="#L-67"><span class="linenos"> 67</span></a><span class="sd">        `dict[str, torch.Tensor]`: a dict of metrics.</span>
+</span><span id="L-68"><a href="#L-68"><span class="linenos"> 68</span></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="L-69"><a href="#L-69"><span class="linenos"> 69</span></a>    <span class="n">losses</span><span class="p">:</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]</span> <span class="o">=</span> <span class="p">{}</span>
+</span><span id="L-70"><a href="#L-70"><span class="linenos"> 70</span></a>    <span class="n">metrics</span><span class="p">:</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]</span> <span class="o">=</span> <span class="p">{}</span>
+</span><span id="L-71"><a href="#L-71"><span class="linenos"> 71</span></a>    <span class="k">for</span> <span class="n">domains</span><span class="p">,</span> <span class="n">latents</span> <span class="ow">in</span> <span class="n">latent_domains</span><span class="o">.</span><span class="n">items</span><span class="p">():</span>
+</span><span id="L-72"><a href="#L-72"><span class="linenos"> 72</span></a>        <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">domains</span><span class="p">)</span> <span class="o">&gt;</span> <span class="mi">1</span><span class="p">:</span>
+</span><span id="L-73"><a href="#L-73"><span class="linenos"> 73</span></a>            <span class="k">continue</span>
+</span><span id="L-74"><a href="#L-74"><span class="linenos"> 74</span></a>        <span class="n">domain_name</span> <span class="o">=</span> <span class="nb">next</span><span class="p">(</span><span class="nb">iter</span><span class="p">(</span><span class="n">domains</span><span class="p">))</span>
+</span><span id="L-75"><a href="#L-75"><span class="linenos"> 75</span></a>
+</span><span id="L-76"><a href="#L-76"><span class="linenos"> 76</span></a>        <span class="n">domain_mod</span> <span class="o">=</span> <span class="n">domain_mods</span><span class="p">[</span><span class="n">domain_name</span><span class="p">]</span>
+</span><span id="L-77"><a href="#L-77"><span class="linenos"> 77</span></a>        <span class="n">x_recons</span> <span class="o">=</span> <span class="n">gw_mod</span><span class="o">.</span><span class="n">decode</span><span class="p">(</span>
+</span><span id="L-78"><a href="#L-78"><span class="linenos"> 78</span></a>            <span class="n">gw_mod</span><span class="o">.</span><span class="n">encode_and_fuse</span><span class="p">(</span><span class="n">latents</span><span class="p">,</span> <span class="n">selection_mod</span><span class="p">),</span> <span class="n">domains</span><span class="o">=</span><span class="p">{</span><span class="n">domain_name</span><span class="p">}</span>
+</span><span id="L-79"><a href="#L-79"><span class="linenos"> 79</span></a>        <span class="p">)[</span><span class="n">domain_name</span><span class="p">]</span>
+</span><span id="L-80"><a href="#L-80"><span class="linenos"> 80</span></a>        <span class="n">loss_output</span> <span class="o">=</span> <span class="n">domain_mod</span><span class="o">.</span><span class="n">compute_dcy_loss</span><span class="p">(</span><span class="n">x_recons</span><span class="p">,</span> <span class="n">latents</span><span class="p">[</span><span class="n">domain_name</span><span class="p">])</span>
+</span><span id="L-81"><a href="#L-81"><span class="linenos"> 81</span></a>        <span class="n">losses</span><span class="p">[</span><span class="sa">f</span><span class="s2">&quot;demi_cycle_</span><span class="si">{</span><span class="n">domain_name</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="n">loss_output</span><span class="o">.</span><span class="n">loss</span>
+</span><span id="L-82"><a href="#L-82"><span class="linenos"> 82</span></a>        <span class="n">metrics</span><span class="o">.</span><span class="n">update</span><span class="p">(</span>
+</span><span id="L-83"><a href="#L-83"><span class="linenos"> 83</span></a>            <span class="p">{</span><span class="sa">f</span><span class="s2">&quot;demi_cycle_</span><span class="si">{</span><span class="n">domain_name</span><span class="si">}</span><span class="s2">_</span><span class="si">{</span><span class="n">k</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">:</span> <span class="n">v</span> <span class="k">for</span> <span class="n">k</span><span class="p">,</span> <span class="n">v</span> <span class="ow">in</span> <span class="n">loss_output</span><span class="o">.</span><span class="n">metrics</span><span class="o">.</span><span class="n">items</span><span class="p">()}</span>
+</span><span id="L-84"><a href="#L-84"><span class="linenos"> 84</span></a>        <span class="p">)</span>
+</span><span id="L-85"><a href="#L-85"><span class="linenos"> 85</span></a>    <span class="n">losses</span><span class="p">[</span><span class="s2">&quot;demi_cycles&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">stack</span><span class="p">(</span><span class="nb">list</span><span class="p">(</span><span class="n">losses</span><span class="o">.</span><span class="n">values</span><span class="p">()),</span> <span class="n">dim</span><span class="o">=</span><span class="mi">0</span><span class="p">)</span><span class="o">.</span><span class="n">mean</span><span class="p">()</span>
+</span><span id="L-86"><a href="#L-86"><span class="linenos"> 86</span></a>    <span class="n">losses</span><span class="o">.</span><span class="n">update</span><span class="p">(</span><span class="n">metrics</span><span class="p">)</span>
+</span><span id="L-87"><a href="#L-87"><span class="linenos"> 87</span></a>    <span class="k">return</span> <span class="n">losses</span>
+</span><span id="L-88"><a href="#L-88"><span class="linenos"> 88</span></a>
+</span><span id="L-89"><a href="#L-89"><span class="linenos"> 89</span></a>
+</span><span id="L-90"><a href="#L-90"><span class="linenos"> 90</span></a><span class="k">def</span> <span class="nf">cycle_loss</span><span class="p">(</span>
+</span><span id="L-91"><a href="#L-91"><span class="linenos"> 91</span></a>    <span class="n">gw_mod</span><span class="p">:</span> <span class="n">GWModuleBase</span><span class="p">,</span>
+</span><span id="L-92"><a href="#L-92"><span class="linenos"> 92</span></a>    <span class="n">selection_mod</span><span class="p">:</span> <span class="n">SelectionBase</span><span class="p">,</span>
+</span><span id="L-93"><a href="#L-93"><span class="linenos"> 93</span></a>    <span class="n">domain_mods</span><span class="p">:</span> <span class="n">Mapping</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">DomainModule</span><span class="p">],</span>
+</span><span id="L-94"><a href="#L-94"><span class="linenos"> 94</span></a>    <span class="n">latent_domains</span><span class="p">:</span> <span class="n">LatentsDomainGroupsT</span><span class="p">,</span>
+</span><span id="L-95"><a href="#L-95"><span class="linenos"> 95</span></a><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]:</span>
+</span><span id="L-96"><a href="#L-96"><span class="linenos"> 96</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="L-97"><a href="#L-97"><span class="linenos"> 97</span></a><span class="sd">    Computes the cycle loss.</span>
+</span><span id="L-98"><a href="#L-98"><span class="linenos"> 98</span></a>
+</span><span id="L-99"><a href="#L-99"><span class="linenos"> 99</span></a><span class="sd">    This return multiple metrics:</span>
+</span><span id="L-100"><a href="#L-100"><span class="linenos">100</span></a><span class="sd">        * `cycle_{domain_source}_through_{domain_target}` with the cycle of</span>
+</span><span id="L-101"><a href="#L-101"><span class="linenos">101</span></a><span class="sd">            a particular domain;</span>
+</span><span id="L-102"><a href="#L-102"><span class="linenos">102</span></a><span class="sd">        * `cycle_{domain_source}_through_{domain_target}_{metric}` with additional</span>
+</span><span id="L-103"><a href="#L-103"><span class="linenos">103</span></a><span class="sd">            metrics provided by the domain_mod&#39;s `compute_cy_loss` output;</span>
+</span><span id="L-104"><a href="#L-104"><span class="linenos">104</span></a><span class="sd">        * `cycles` with the average value of all</span>
+</span><span id="L-105"><a href="#L-105"><span class="linenos">105</span></a><span class="sd">            `cycle_{domain_source}_through_{domain_target}` values.</span>
+</span><span id="L-106"><a href="#L-106"><span class="linenos">106</span></a>
+</span><span id="L-107"><a href="#L-107"><span class="linenos">107</span></a><span class="sd">    Args:</span>
+</span><span id="L-108"><a href="#L-108"><span class="linenos">108</span></a><span class="sd">        gw_mod (`GWModuleBase`): The GWModule to use</span>
+</span><span id="L-109"><a href="#L-109"><span class="linenos">109</span></a><span class="sd">        selection_mod (`shimmer.modules.selection.SelectionBase`): Selection mod to use</span>
+</span><span id="L-110"><a href="#L-110"><span class="linenos">110</span></a><span class="sd">        domain_mods (`Mapping[str, DomainModule]`): the domain modules</span>
+</span><span id="L-111"><a href="#L-111"><span class="linenos">111</span></a><span class="sd">        latent_domains (`LatentsDomainGroupsT`): the latent unimodal groups</span>
+</span><span id="L-112"><a href="#L-112"><span class="linenos">112</span></a>
+</span><span id="L-113"><a href="#L-113"><span class="linenos">113</span></a><span class="sd">    Returns:</span>
+</span><span id="L-114"><a href="#L-114"><span class="linenos">114</span></a><span class="sd">        `dict[str, torch.Tensor]`: a dict of metrics.</span>
+</span><span id="L-115"><a href="#L-115"><span class="linenos">115</span></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="L-116"><a href="#L-116"><span class="linenos">116</span></a>    <span class="n">losses</span><span class="p">:</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]</span> <span class="o">=</span> <span class="p">{}</span>
+</span><span id="L-117"><a href="#L-117"><span class="linenos">117</span></a>    <span class="n">metrics</span><span class="p">:</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]</span> <span class="o">=</span> <span class="p">{}</span>
+</span><span id="L-118"><a href="#L-118"><span class="linenos">118</span></a>    <span class="k">for</span> <span class="n">domains_source</span><span class="p">,</span> <span class="n">latents_source</span> <span class="ow">in</span> <span class="n">latent_domains</span><span class="o">.</span><span class="n">items</span><span class="p">():</span>
+</span><span id="L-119"><a href="#L-119"><span class="linenos">119</span></a>        <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">domains_source</span><span class="p">)</span> <span class="o">&gt;</span> <span class="mi">1</span><span class="p">:</span>
+</span><span id="L-120"><a href="#L-120"><span class="linenos">120</span></a>            <span class="k">continue</span>
+</span><span id="L-121"><a href="#L-121"><span class="linenos">121</span></a>        <span class="n">domain_name_source</span> <span class="o">=</span> <span class="nb">list</span><span class="p">(</span><span class="n">domains_source</span><span class="p">)[</span><span class="mi">0</span><span class="p">]</span>
+</span><span id="L-122"><a href="#L-122"><span class="linenos">122</span></a>
+</span><span id="L-123"><a href="#L-123"><span class="linenos">123</span></a>        <span class="n">domain_mod</span> <span class="o">=</span> <span class="n">domain_mods</span><span class="p">[</span><span class="n">domain_name_source</span><span class="p">]</span>
+</span><span id="L-124"><a href="#L-124"><span class="linenos">124</span></a>        <span class="n">z</span> <span class="o">=</span> <span class="n">gw_mod</span><span class="o">.</span><span class="n">encode_and_fuse</span><span class="p">(</span><span class="n">latents_source</span><span class="p">,</span> <span class="n">selection_mod</span><span class="p">)</span>
+</span><span id="L-125"><a href="#L-125"><span class="linenos">125</span></a>        <span class="k">for</span> <span class="n">domain_name_target</span> <span class="ow">in</span> <span class="n">domain_mods</span><span class="p">:</span>
+</span><span id="L-126"><a href="#L-126"><span class="linenos">126</span></a>            <span class="k">if</span> <span class="n">domain_name_target</span> <span class="o">==</span> <span class="n">domain_name_source</span><span class="p">:</span>
+</span><span id="L-127"><a href="#L-127"><span class="linenos">127</span></a>                <span class="k">continue</span>
+</span><span id="L-128"><a href="#L-128"><span class="linenos">128</span></a>
+</span><span id="L-129"><a href="#L-129"><span class="linenos">129</span></a>            <span class="n">x_pred</span> <span class="o">=</span> <span class="n">gw_mod</span><span class="o">.</span><span class="n">decode</span><span class="p">(</span><span class="n">z</span><span class="p">,</span> <span class="n">domains</span><span class="o">=</span><span class="p">{</span><span class="n">domain_name_target</span><span class="p">})</span>
+</span><span id="L-130"><a href="#L-130"><span class="linenos">130</span></a>
+</span><span id="L-131"><a href="#L-131"><span class="linenos">131</span></a>            <span class="n">x_recons</span> <span class="o">=</span> <span class="n">gw_mod</span><span class="o">.</span><span class="n">decode</span><span class="p">(</span>
+</span><span id="L-132"><a href="#L-132"><span class="linenos">132</span></a>                <span class="n">gw_mod</span><span class="o">.</span><span class="n">encode_and_fuse</span><span class="p">(</span><span class="n">x_pred</span><span class="p">,</span> <span class="n">selection_mod</span><span class="p">),</span>
+</span><span id="L-133"><a href="#L-133"><span class="linenos">133</span></a>                <span class="n">domains</span><span class="o">=</span><span class="p">{</span><span class="n">domain_name_source</span><span class="p">},</span>
+</span><span id="L-134"><a href="#L-134"><span class="linenos">134</span></a>            <span class="p">)</span>
+</span><span id="L-135"><a href="#L-135"><span class="linenos">135</span></a>
+</span><span id="L-136"><a href="#L-136"><span class="linenos">136</span></a>            <span class="n">loss_name</span> <span class="o">=</span> <span class="sa">f</span><span class="s2">&quot;</span><span class="si">{</span><span class="n">domain_name_source</span><span class="si">}</span><span class="s2">_through_</span><span class="si">{</span><span class="n">domain_name_target</span><span class="si">}</span><span class="s2">&quot;</span>
+</span><span id="L-137"><a href="#L-137"><span class="linenos">137</span></a>            <span class="n">loss_output</span> <span class="o">=</span> <span class="n">domain_mod</span><span class="o">.</span><span class="n">compute_cy_loss</span><span class="p">(</span>
+</span><span id="L-138"><a href="#L-138"><span class="linenos">138</span></a>                <span class="n">x_recons</span><span class="p">[</span><span class="n">domain_name_source</span><span class="p">],</span>
+</span><span id="L-139"><a href="#L-139"><span class="linenos">139</span></a>                <span class="n">latents_source</span><span class="p">[</span><span class="n">domain_name_source</span><span class="p">],</span>
+</span><span id="L-140"><a href="#L-140"><span class="linenos">140</span></a>            <span class="p">)</span>
+</span><span id="L-141"><a href="#L-141"><span class="linenos">141</span></a>            <span class="n">metrics</span><span class="o">.</span><span class="n">update</span><span class="p">(</span>
+</span><span id="L-142"><a href="#L-142"><span class="linenos">142</span></a>                <span class="p">{</span><span class="sa">f</span><span class="s2">&quot;cycle_</span><span class="si">{</span><span class="n">loss_name</span><span class="si">}</span><span class="s2">_</span><span class="si">{</span><span class="n">k</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">:</span> <span class="n">v</span> <span class="k">for</span> <span class="n">k</span><span class="p">,</span> <span class="n">v</span> <span class="ow">in</span> <span class="n">loss_output</span><span class="o">.</span><span class="n">metrics</span><span class="o">.</span><span class="n">items</span><span class="p">()}</span>
+</span><span id="L-143"><a href="#L-143"><span class="linenos">143</span></a>            <span class="p">)</span>
+</span><span id="L-144"><a href="#L-144"><span class="linenos">144</span></a>            <span class="n">losses</span><span class="p">[</span><span class="sa">f</span><span class="s2">&quot;cycle_</span><span class="si">{</span><span class="n">loss_name</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="n">loss_output</span><span class="o">.</span><span class="n">loss</span>
+</span><span id="L-145"><a href="#L-145"><span class="linenos">145</span></a>    <span class="n">losses</span><span class="p">[</span><span class="s2">&quot;cycles&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">stack</span><span class="p">(</span><span class="nb">list</span><span class="p">(</span><span class="n">losses</span><span class="o">.</span><span class="n">values</span><span class="p">()),</span> <span class="n">dim</span><span class="o">=</span><span class="mi">0</span><span class="p">)</span><span class="o">.</span><span class="n">mean</span><span class="p">()</span>
+</span><span id="L-146"><a href="#L-146"><span class="linenos">146</span></a>    <span class="n">losses</span><span class="o">.</span><span class="n">update</span><span class="p">(</span><span class="n">metrics</span><span class="p">)</span>
+</span><span id="L-147"><a href="#L-147"><span class="linenos">147</span></a>    <span class="k">return</span> <span class="n">losses</span>
+</span><span id="L-148"><a href="#L-148"><span class="linenos">148</span></a>
+</span><span id="L-149"><a href="#L-149"><span class="linenos">149</span></a>
+</span><span id="L-150"><a href="#L-150"><span class="linenos">150</span></a><span class="k">def</span> <span class="nf">translation_loss</span><span class="p">(</span>
+</span><span id="L-151"><a href="#L-151"><span class="linenos">151</span></a>    <span class="n">gw_mod</span><span class="p">:</span> <span class="n">GWModuleBase</span><span class="p">,</span>
+</span><span id="L-152"><a href="#L-152"><span class="linenos">152</span></a>    <span class="n">selection_mod</span><span class="p">:</span> <span class="n">SelectionBase</span><span class="p">,</span>
+</span><span id="L-153"><a href="#L-153"><span class="linenos">153</span></a>    <span class="n">domain_mods</span><span class="p">:</span> <span class="n">Mapping</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">DomainModule</span><span class="p">],</span>
+</span><span id="L-154"><a href="#L-154"><span class="linenos">154</span></a>    <span class="n">latent_domains</span><span class="p">:</span> <span class="n">LatentsDomainGroupsT</span><span class="p">,</span>
+</span><span id="L-155"><a href="#L-155"><span class="linenos">155</span></a><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]:</span>
+</span><span id="L-156"><a href="#L-156"><span class="linenos">156</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="L-157"><a href="#L-157"><span class="linenos">157</span></a><span class="sd">    Computes the translation loss.</span>
+</span><span id="L-158"><a href="#L-158"><span class="linenos">158</span></a>
+</span><span id="L-159"><a href="#L-159"><span class="linenos">159</span></a><span class="sd">    This return multiple metrics:</span>
+</span><span id="L-160"><a href="#L-160"><span class="linenos">160</span></a><span class="sd">        * `translation_{domain_source}_to_{domain_target}` with the translation</span>
+</span><span id="L-161"><a href="#L-161"><span class="linenos">161</span></a><span class="sd">            from a domain source to a domain target;</span>
+</span><span id="L-162"><a href="#L-162"><span class="linenos">162</span></a><span class="sd">        * `translation_{domain_source}_to_{domain_target}_{metric}` with</span>
+</span><span id="L-163"><a href="#L-163"><span class="linenos">163</span></a><span class="sd">            additional metrics provided by the domain_mod&#39;s</span>
+</span><span id="L-164"><a href="#L-164"><span class="linenos">164</span></a><span class="sd">            `compute_tr_loss` output;</span>
+</span><span id="L-165"><a href="#L-165"><span class="linenos">165</span></a><span class="sd">        * `translations` with the average value of all</span>
+</span><span id="L-166"><a href="#L-166"><span class="linenos">166</span></a><span class="sd">            `translation_{domain_source}_to_{domain_target}` values.</span>
+</span><span id="L-167"><a href="#L-167"><span class="linenos">167</span></a>
+</span><span id="L-168"><a href="#L-168"><span class="linenos">168</span></a><span class="sd">    Args:</span>
+</span><span id="L-169"><a href="#L-169"><span class="linenos">169</span></a><span class="sd">        gw_mod (`GWModuleBase`): The GWModule to use</span>
+</span><span id="L-170"><a href="#L-170"><span class="linenos">170</span></a><span class="sd">        domain_mods (`Mapping[str, DomainModule]`): the domain modules</span>
+</span><span id="L-171"><a href="#L-171"><span class="linenos">171</span></a><span class="sd">        latent_domains (`LatentsDomainGroupsT`): the latent unimodal groups</span>
+</span><span id="L-172"><a href="#L-172"><span class="linenos">172</span></a>
+</span><span id="L-173"><a href="#L-173"><span class="linenos">173</span></a><span class="sd">    Returns:</span>
+</span><span id="L-174"><a href="#L-174"><span class="linenos">174</span></a><span class="sd">        `dict[str, torch.Tensor]`: a dict of metrics.</span>
+</span><span id="L-175"><a href="#L-175"><span class="linenos">175</span></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="L-176"><a href="#L-176"><span class="linenos">176</span></a>    <span class="n">losses</span><span class="p">:</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]</span> <span class="o">=</span> <span class="p">{}</span>
+</span><span id="L-177"><a href="#L-177"><span class="linenos">177</span></a>    <span class="n">metrics</span><span class="p">:</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]</span> <span class="o">=</span> <span class="p">{}</span>
+</span><span id="L-178"><a href="#L-178"><span class="linenos">178</span></a>    <span class="k">for</span> <span class="n">domains</span><span class="p">,</span> <span class="n">latents</span> <span class="ow">in</span> <span class="n">latent_domains</span><span class="o">.</span><span class="n">items</span><span class="p">():</span>
+</span><span id="L-179"><a href="#L-179"><span class="linenos">179</span></a>        <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">domains</span><span class="p">)</span> <span class="o">&lt;</span> <span class="mi">2</span><span class="p">:</span>
+</span><span id="L-180"><a href="#L-180"><span class="linenos">180</span></a>            <span class="k">continue</span>
+</span><span id="L-181"><a href="#L-181"><span class="linenos">181</span></a>        <span class="k">for</span> <span class="n">domain_name_target</span> <span class="ow">in</span> <span class="n">domains</span><span class="p">:</span>
+</span><span id="L-182"><a href="#L-182"><span class="linenos">182</span></a>            <span class="n">domain_sources</span> <span class="o">=</span> <span class="p">{</span>
+</span><span id="L-183"><a href="#L-183"><span class="linenos">183</span></a>                <span class="n">domain</span><span class="p">:</span> <span class="n">latents</span><span class="p">[</span><span class="n">domain</span><span class="p">]</span>
+</span><span id="L-184"><a href="#L-184"><span class="linenos">184</span></a>                <span class="k">for</span> <span class="n">domain</span> <span class="ow">in</span> <span class="n">domains</span>
+</span><span id="L-185"><a href="#L-185"><span class="linenos">185</span></a>                <span class="k">if</span> <span class="n">domain</span> <span class="o">!=</span> <span class="n">domain_name_target</span>
+</span><span id="L-186"><a href="#L-186"><span class="linenos">186</span></a>            <span class="p">}</span>
+</span><span id="L-187"><a href="#L-187"><span class="linenos">187</span></a>
+</span><span id="L-188"><a href="#L-188"><span class="linenos">188</span></a>            <span class="n">z</span> <span class="o">=</span> <span class="n">gw_mod</span><span class="o">.</span><span class="n">encode_and_fuse</span><span class="p">(</span><span class="n">domain_sources</span><span class="p">,</span> <span class="n">selection_mod</span><span class="p">)</span>
+</span><span id="L-189"><a href="#L-189"><span class="linenos">189</span></a>            <span class="n">mod</span> <span class="o">=</span> <span class="n">domain_mods</span><span class="p">[</span><span class="n">domain_name_target</span><span class="p">]</span>
+</span><span id="L-190"><a href="#L-190"><span class="linenos">190</span></a>
+</span><span id="L-191"><a href="#L-191"><span class="linenos">191</span></a>            <span class="n">domain_source_names</span> <span class="o">=</span> <span class="s2">&quot;/&quot;</span><span class="o">.</span><span class="n">join</span><span class="p">(</span><span class="n">domain_sources</span><span class="o">.</span><span class="n">keys</span><span class="p">())</span>
+</span><span id="L-192"><a href="#L-192"><span class="linenos">192</span></a>            <span class="n">loss_name</span> <span class="o">=</span> <span class="sa">f</span><span class="s2">&quot;</span><span class="si">{</span><span class="n">domain_source_names</span><span class="si">}</span><span class="s2">_to_</span><span class="si">{</span><span class="n">domain_name_target</span><span class="si">}</span><span class="s2">&quot;</span>
+</span><span id="L-193"><a href="#L-193"><span class="linenos">193</span></a>            <span class="k">if</span> <span class="n">loss_name</span> <span class="ow">in</span> <span class="n">losses</span><span class="p">:</span>
+</span><span id="L-194"><a href="#L-194"><span class="linenos">194</span></a>                <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;</span><span class="si">{</span><span class="n">loss_name</span><span class="si">}</span><span class="s2"> is already computed.&quot;</span><span class="p">)</span>
+</span><span id="L-195"><a href="#L-195"><span class="linenos">195</span></a>
+</span><span id="L-196"><a href="#L-196"><span class="linenos">196</span></a>            <span class="n">prediction</span> <span class="o">=</span> <span class="n">gw_mod</span><span class="o">.</span><span class="n">decode</span><span class="p">(</span><span class="n">z</span><span class="p">,</span> <span class="n">domains</span><span class="o">=</span><span class="p">{</span><span class="n">domain_name_target</span><span class="p">})[</span>
+</span><span id="L-197"><a href="#L-197"><span class="linenos">197</span></a>                <span class="n">domain_name_target</span>
+</span><span id="L-198"><a href="#L-198"><span class="linenos">198</span></a>            <span class="p">]</span>
+</span><span id="L-199"><a href="#L-199"><span class="linenos">199</span></a>            <span class="n">loss_output</span> <span class="o">=</span> <span class="n">mod</span><span class="o">.</span><span class="n">compute_tr_loss</span><span class="p">(</span>
+</span><span id="L-200"><a href="#L-200"><span class="linenos">200</span></a>                <span class="n">prediction</span><span class="p">,</span>
+</span><span id="L-201"><a href="#L-201"><span class="linenos">201</span></a>                <span class="n">latents</span><span class="p">[</span><span class="n">domain_name_target</span><span class="p">],</span>
+</span><span id="L-202"><a href="#L-202"><span class="linenos">202</span></a>            <span class="p">)</span>
+</span><span id="L-203"><a href="#L-203"><span class="linenos">203</span></a>            <span class="n">losses</span><span class="p">[</span><span class="sa">f</span><span class="s2">&quot;translation_</span><span class="si">{</span><span class="n">loss_name</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="n">loss_output</span><span class="o">.</span><span class="n">loss</span>
+</span><span id="L-204"><a href="#L-204"><span class="linenos">204</span></a>            <span class="n">metrics</span><span class="o">.</span><span class="n">update</span><span class="p">(</span>
+</span><span id="L-205"><a href="#L-205"><span class="linenos">205</span></a>                <span class="p">{</span>
+</span><span id="L-206"><a href="#L-206"><span class="linenos">206</span></a>                    <span class="sa">f</span><span class="s2">&quot;translation_</span><span class="si">{</span><span class="n">loss_name</span><span class="si">}</span><span class="s2">_</span><span class="si">{</span><span class="n">k</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">:</span> <span class="n">v</span>
+</span><span id="L-207"><a href="#L-207"><span class="linenos">207</span></a>                    <span class="k">for</span> <span class="n">k</span><span class="p">,</span> <span class="n">v</span> <span class="ow">in</span> <span class="n">loss_output</span><span class="o">.</span><span class="n">metrics</span><span class="o">.</span><span class="n">items</span><span class="p">()</span>
+</span><span id="L-208"><a href="#L-208"><span class="linenos">208</span></a>                <span class="p">}</span>
+</span><span id="L-209"><a href="#L-209"><span class="linenos">209</span></a>            <span class="p">)</span>
+</span><span id="L-210"><a href="#L-210"><span class="linenos">210</span></a>    <span class="n">losses</span><span class="p">[</span><span class="s2">&quot;translations&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">stack</span><span class="p">(</span><span class="nb">list</span><span class="p">(</span><span class="n">losses</span><span class="o">.</span><span class="n">values</span><span class="p">()),</span> <span class="n">dim</span><span class="o">=</span><span class="mi">0</span><span class="p">)</span><span class="o">.</span><span class="n">mean</span><span class="p">()</span>
+</span><span id="L-211"><a href="#L-211"><span class="linenos">211</span></a>    <span class="n">losses</span><span class="o">.</span><span class="n">update</span><span class="p">(</span><span class="n">metrics</span><span class="p">)</span>
+</span><span id="L-212"><a href="#L-212"><span class="linenos">212</span></a>    <span class="k">return</span> <span class="n">losses</span>
+</span><span id="L-213"><a href="#L-213"><span class="linenos">213</span></a>
+</span><span id="L-214"><a href="#L-214"><span class="linenos">214</span></a>
+</span><span id="L-215"><a href="#L-215"><span class="linenos">215</span></a><span class="k">def</span> <span class="nf">contrastive_loss</span><span class="p">(</span>
+</span><span id="L-216"><a href="#L-216"><span class="linenos">216</span></a>    <span class="n">gw_mod</span><span class="p">:</span> <span class="n">GWModuleBase</span><span class="p">,</span>
+</span><span id="L-217"><a href="#L-217"><span class="linenos">217</span></a>    <span class="n">latent_domains</span><span class="p">:</span> <span class="n">LatentsDomainGroupsT</span><span class="p">,</span>
+</span><span id="L-218"><a href="#L-218"><span class="linenos">218</span></a>    <span class="n">contrastive_fn</span><span class="p">:</span> <span class="n">ContrastiveLossType</span><span class="p">,</span>
+</span><span id="L-219"><a href="#L-219"><span class="linenos">219</span></a><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]:</span>
+</span><span id="L-220"><a href="#L-220"><span class="linenos">220</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="L-221"><a href="#L-221"><span class="linenos">221</span></a><span class="sd">    Computes the contrastive loss.</span>
+</span><span id="L-222"><a href="#L-222"><span class="linenos">222</span></a>
+</span><span id="L-223"><a href="#L-223"><span class="linenos">223</span></a><span class="sd">    This return multiple metrics:</span>
+</span><span id="L-224"><a href="#L-224"><span class="linenos">224</span></a><span class="sd">        * `contrastive_{domain_1}_and_{domain_2}` with the contrastive</span>
+</span><span id="L-225"><a href="#L-225"><span class="linenos">225</span></a><span class="sd">            between 2 domains;</span>
+</span><span id="L-226"><a href="#L-226"><span class="linenos">226</span></a><span class="sd">        * `contrastive_{domain_1}_and_{domain_2}_{metric}` with</span>
+</span><span id="L-227"><a href="#L-227"><span class="linenos">227</span></a><span class="sd">            additional metrics provided by the domain_mod&#39;s</span>
+</span><span id="L-228"><a href="#L-228"><span class="linenos">228</span></a><span class="sd">            `compute_cont_loss` output;</span>
+</span><span id="L-229"><a href="#L-229"><span class="linenos">229</span></a><span class="sd">        * `contrastives` with the average value of all</span>
+</span><span id="L-230"><a href="#L-230"><span class="linenos">230</span></a><span class="sd">            `contrastive_{domain_1}_and_{domain_2}` values.</span>
+</span><span id="L-231"><a href="#L-231"><span class="linenos">231</span></a>
+</span><span id="L-232"><a href="#L-232"><span class="linenos">232</span></a><span class="sd">    Args:</span>
+</span><span id="L-233"><a href="#L-233"><span class="linenos">233</span></a><span class="sd">        gw_mod (`GWModuleBase`): The GWModule to use</span>
+</span><span id="L-234"><a href="#L-234"><span class="linenos">234</span></a><span class="sd">        latent_domains (`LatentsDomainGroupsT`): the latent unimodal groups</span>
+</span><span id="L-235"><a href="#L-235"><span class="linenos">235</span></a><span class="sd">        contrastive_fn (`ContrastiveLossType`): the contrastive function to apply</span>
+</span><span id="L-236"><a href="#L-236"><span class="linenos">236</span></a>
+</span><span id="L-237"><a href="#L-237"><span class="linenos">237</span></a><span class="sd">    Returns:</span>
+</span><span id="L-238"><a href="#L-238"><span class="linenos">238</span></a><span class="sd">        `dict[str, torch.Tensor]`: a dict of metrics.</span>
+</span><span id="L-239"><a href="#L-239"><span class="linenos">239</span></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="L-240"><a href="#L-240"><span class="linenos">240</span></a>    <span class="n">losses</span><span class="p">:</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]</span> <span class="o">=</span> <span class="p">{}</span>
+</span><span id="L-241"><a href="#L-241"><span class="linenos">241</span></a>    <span class="n">metrics</span><span class="p">:</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]</span> <span class="o">=</span> <span class="p">{}</span>
+</span><span id="L-242"><a href="#L-242"><span class="linenos">242</span></a>    <span class="n">keys</span><span class="p">:</span> <span class="nb">list</span><span class="p">[</span><span class="nb">set</span><span class="p">[</span><span class="nb">str</span><span class="p">]]</span> <span class="o">=</span> <span class="p">[]</span>
+</span><span id="L-243"><a href="#L-243"><span class="linenos">243</span></a>
+</span><span id="L-244"><a href="#L-244"><span class="linenos">244</span></a>    <span class="k">for</span> <span class="n">latents</span> <span class="ow">in</span> <span class="n">latent_domains</span><span class="o">.</span><span class="n">values</span><span class="p">():</span>
+</span><span id="L-245"><a href="#L-245"><span class="linenos">245</span></a>        <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">latents</span><span class="p">)</span> <span class="o">!=</span> <span class="mi">2</span><span class="p">:</span>
+</span><span id="L-246"><a href="#L-246"><span class="linenos">246</span></a>            <span class="k">continue</span>
+</span><span id="L-247"><a href="#L-247"><span class="linenos">247</span></a>
+</span><span id="L-248"><a href="#L-248"><span class="linenos">248</span></a>        <span class="n">cont_latents</span> <span class="o">=</span> <span class="n">gw_mod</span><span class="o">.</span><span class="n">encode</span><span class="p">(</span><span class="n">latents</span><span class="p">)</span>
+</span><span id="L-249"><a href="#L-249"><span class="linenos">249</span></a>        <span class="k">for</span> <span class="n">domain1</span><span class="p">,</span> <span class="n">z1</span> <span class="ow">in</span> <span class="n">cont_latents</span><span class="o">.</span><span class="n">items</span><span class="p">():</span>
+</span><span id="L-250"><a href="#L-250"><span class="linenos">250</span></a>            <span class="k">for</span> <span class="n">domain2</span><span class="p">,</span> <span class="n">z2</span> <span class="ow">in</span> <span class="n">cont_latents</span><span class="o">.</span><span class="n">items</span><span class="p">():</span>
+</span><span id="L-251"><a href="#L-251"><span class="linenos">251</span></a>                <span class="n">selected_domains</span> <span class="o">=</span> <span class="p">{</span><span class="n">domain1</span><span class="p">,</span> <span class="n">domain2</span><span class="p">}</span>
+</span><span id="L-252"><a href="#L-252"><span class="linenos">252</span></a>                <span class="k">if</span> <span class="n">domain1</span> <span class="o">==</span> <span class="n">domain2</span> <span class="ow">or</span> <span class="n">selected_domains</span> <span class="ow">in</span> <span class="n">keys</span><span class="p">:</span>
+</span><span id="L-253"><a href="#L-253"><span class="linenos">253</span></a>                    <span class="k">continue</span>
+</span><span id="L-254"><a href="#L-254"><span class="linenos">254</span></a>
+</span><span id="L-255"><a href="#L-255"><span class="linenos">255</span></a>                <span class="n">keys</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">selected_domains</span><span class="p">)</span>
+</span><span id="L-256"><a href="#L-256"><span class="linenos">256</span></a>
+</span><span id="L-257"><a href="#L-257"><span class="linenos">257</span></a>                <span class="n">loss_name</span> <span class="o">=</span> <span class="sa">f</span><span class="s2">&quot;contrastive_</span><span class="si">{</span><span class="n">domain1</span><span class="si">}</span><span class="s2">_and_</span><span class="si">{</span><span class="n">domain2</span><span class="si">}</span><span class="s2">&quot;</span>
+</span><span id="L-258"><a href="#L-258"><span class="linenos">258</span></a>                <span class="n">loss_output</span> <span class="o">=</span> <span class="n">contrastive_fn</span><span class="p">(</span><span class="n">z1</span><span class="p">,</span> <span class="n">z2</span><span class="p">)</span>
+</span><span id="L-259"><a href="#L-259"><span class="linenos">259</span></a>                <span class="n">losses</span><span class="p">[</span><span class="n">loss_name</span><span class="p">]</span> <span class="o">=</span> <span class="n">loss_output</span><span class="o">.</span><span class="n">loss</span>
+</span><span id="L-260"><a href="#L-260"><span class="linenos">260</span></a>                <span class="n">metrics</span><span class="o">.</span><span class="n">update</span><span class="p">(</span>
+</span><span id="L-261"><a href="#L-261"><span class="linenos">261</span></a>                    <span class="p">{</span><span class="sa">f</span><span class="s2">&quot;</span><span class="si">{</span><span class="n">loss_name</span><span class="si">}</span><span class="s2">_</span><span class="si">{</span><span class="n">k</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">:</span> <span class="n">v</span> <span class="k">for</span> <span class="n">k</span><span class="p">,</span> <span class="n">v</span> <span class="ow">in</span> <span class="n">loss_output</span><span class="o">.</span><span class="n">metrics</span><span class="o">.</span><span class="n">items</span><span class="p">()}</span>
+</span><span id="L-262"><a href="#L-262"><span class="linenos">262</span></a>                <span class="p">)</span>
+</span><span id="L-263"><a href="#L-263"><span class="linenos">263</span></a>
+</span><span id="L-264"><a href="#L-264"><span class="linenos">264</span></a>    <span class="n">losses</span><span class="p">[</span><span class="s2">&quot;contrastives&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">stack</span><span class="p">(</span><span class="nb">list</span><span class="p">(</span><span class="n">losses</span><span class="o">.</span><span class="n">values</span><span class="p">()),</span> <span class="n">dim</span><span class="o">=</span><span class="mi">0</span><span class="p">)</span><span class="o">.</span><span class="n">mean</span><span class="p">()</span>
+</span><span id="L-265"><a href="#L-265"><span class="linenos">265</span></a>    <span class="n">losses</span><span class="o">.</span><span class="n">update</span><span class="p">(</span><span class="n">metrics</span><span class="p">)</span>
+</span><span id="L-266"><a href="#L-266"><span class="linenos">266</span></a>    <span class="k">return</span> <span class="n">losses</span>
+</span><span id="L-267"><a href="#L-267"><span class="linenos">267</span></a>
+</span><span id="L-268"><a href="#L-268"><span class="linenos">268</span></a>
+</span><span id="L-269"><a href="#L-269"><span class="linenos">269</span></a><span class="k">def</span> <span class="nf">contrastive_loss_bayesian</span><span class="p">(</span>
+</span><span id="L-270"><a href="#L-270"><span class="linenos">270</span></a>    <span class="n">gw_mod</span><span class="p">:</span> <span class="n">GWModuleBayesian</span><span class="p">,</span>
+</span><span id="L-271"><a href="#L-271"><span class="linenos">271</span></a>    <span class="n">latent_domains</span><span class="p">:</span> <span class="n">LatentsDomainGroupsT</span><span class="p">,</span>
+</span><span id="L-272"><a href="#L-272"><span class="linenos">272</span></a>    <span class="n">contrastive_fn</span><span class="p">:</span> <span class="n">ContrastiveLossType</span><span class="p">,</span>
+</span><span id="L-273"><a href="#L-273"><span class="linenos">273</span></a><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]:</span>
+</span><span id="L-274"><a href="#L-274"><span class="linenos">274</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="L-275"><a href="#L-275"><span class="linenos">275</span></a><span class="sd">    Computes the contrastive loss with a Bayesian based uncertainty prediction.</span>
+</span><span id="L-276"><a href="#L-276"><span class="linenos">276</span></a>
+</span><span id="L-277"><a href="#L-277"><span class="linenos">277</span></a><span class="sd">    This return multiple metrics:</span>
+</span><span id="L-278"><a href="#L-278"><span class="linenos">278</span></a><span class="sd">        * `contrastive_{domain_1}_and_{domain_2}` with the contrastive</span>
+</span><span id="L-279"><a href="#L-279"><span class="linenos">279</span></a><span class="sd">            between 2 domains;</span>
+</span><span id="L-280"><a href="#L-280"><span class="linenos">280</span></a><span class="sd">        * `contrastive_{domain_1}_and_{domain_2}_{metric}` with</span>
+</span><span id="L-281"><a href="#L-281"><span class="linenos">281</span></a><span class="sd">            additional metrics provided by the domain_mod&#39;s</span>
+</span><span id="L-282"><a href="#L-282"><span class="linenos">282</span></a><span class="sd">            `compute_cont_loss` output;</span>
+</span><span id="L-283"><a href="#L-283"><span class="linenos">283</span></a><span class="sd">        * `contrastives` with the average value of all</span>
+</span><span id="L-284"><a href="#L-284"><span class="linenos">284</span></a><span class="sd">            `contrastive_{domain_1}_and_{domain_2}` values.</span>
+</span><span id="L-285"><a href="#L-285"><span class="linenos">285</span></a>
+</span><span id="L-286"><a href="#L-286"><span class="linenos">286</span></a><span class="sd">    Args:</span>
+</span><span id="L-287"><a href="#L-287"><span class="linenos">287</span></a><span class="sd">        gw_mod (`GWModuleBayesian`): The GWModule to use</span>
+</span><span id="L-288"><a href="#L-288"><span class="linenos">288</span></a><span class="sd">        latent_domains (`LatentsDomainGroupsT`): the latent unimodal groups</span>
+</span><span id="L-289"><a href="#L-289"><span class="linenos">289</span></a><span class="sd">        contrastive_fn (`ContrastiveLossBayesianType`): the contrastive function</span>
+</span><span id="L-290"><a href="#L-290"><span class="linenos">290</span></a><span class="sd">            to apply</span>
+</span><span id="L-291"><a href="#L-291"><span class="linenos">291</span></a>
+</span><span id="L-292"><a href="#L-292"><span class="linenos">292</span></a><span class="sd">    Returns:</span>
+</span><span id="L-293"><a href="#L-293"><span class="linenos">293</span></a><span class="sd">        `dict[str, torch.Tensor]`: a dict of metrics.</span>
+</span><span id="L-294"><a href="#L-294"><span class="linenos">294</span></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="L-295"><a href="#L-295"><span class="linenos">295</span></a>    <span class="n">losses</span><span class="p">:</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]</span> <span class="o">=</span> <span class="p">{}</span>
+</span><span id="L-296"><a href="#L-296"><span class="linenos">296</span></a>    <span class="n">metrics</span><span class="p">:</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]</span> <span class="o">=</span> <span class="p">{}</span>
+</span><span id="L-297"><a href="#L-297"><span class="linenos">297</span></a>    <span class="n">keys</span><span class="p">:</span> <span class="nb">list</span><span class="p">[</span><span class="nb">set</span><span class="p">[</span><span class="nb">str</span><span class="p">]]</span> <span class="o">=</span> <span class="p">[]</span>
+</span><span id="L-298"><a href="#L-298"><span class="linenos">298</span></a>
+</span><span id="L-299"><a href="#L-299"><span class="linenos">299</span></a>    <span class="k">for</span> <span class="n">latents</span> <span class="ow">in</span> <span class="n">latent_domains</span><span class="o">.</span><span class="n">values</span><span class="p">():</span>
+</span><span id="L-300"><a href="#L-300"><span class="linenos">300</span></a>        <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">latents</span><span class="p">)</span> <span class="o">&lt;</span> <span class="mi">2</span><span class="p">:</span>
+</span><span id="L-301"><a href="#L-301"><span class="linenos">301</span></a>            <span class="k">continue</span>
+</span><span id="L-302"><a href="#L-302"><span class="linenos">302</span></a>        <span class="k">for</span> <span class="n">domain1_name</span><span class="p">,</span> <span class="n">domain1</span> <span class="ow">in</span> <span class="n">latents</span><span class="o">.</span><span class="n">items</span><span class="p">():</span>
+</span><span id="L-303"><a href="#L-303"><span class="linenos">303</span></a>            <span class="n">z1</span> <span class="o">=</span> <span class="n">gw_mod</span><span class="o">.</span><span class="n">encode</span><span class="p">({</span><span class="n">domain1_name</span><span class="p">:</span> <span class="n">domain1</span><span class="p">})[</span><span class="n">domain1_name</span><span class="p">]</span>
+</span><span id="L-304"><a href="#L-304"><span class="linenos">304</span></a>            <span class="n">z1_precision</span> <span class="o">=</span> <span class="n">gw_mod</span><span class="o">.</span><span class="n">get_precision</span><span class="p">(</span><span class="n">domain1_name</span><span class="p">,</span> <span class="n">domain1</span><span class="p">)</span>
+</span><span id="L-305"><a href="#L-305"><span class="linenos">305</span></a>            <span class="k">for</span> <span class="n">domain2_name</span><span class="p">,</span> <span class="n">domain2</span> <span class="ow">in</span> <span class="n">latents</span><span class="o">.</span><span class="n">items</span><span class="p">():</span>
+</span><span id="L-306"><a href="#L-306"><span class="linenos">306</span></a>                <span class="n">selected_domains</span> <span class="o">=</span> <span class="p">{</span><span class="n">domain1_name</span><span class="p">,</span> <span class="n">domain2_name</span><span class="p">}</span>
+</span><span id="L-307"><a href="#L-307"><span class="linenos">307</span></a>                <span class="k">if</span> <span class="n">domain1_name</span> <span class="o">==</span> <span class="n">domain2_name</span> <span class="ow">or</span> <span class="n">selected_domains</span> <span class="ow">in</span> <span class="n">keys</span><span class="p">:</span>
+</span><span id="L-308"><a href="#L-308"><span class="linenos">308</span></a>                    <span class="k">continue</span>
+</span><span id="L-309"><a href="#L-309"><span class="linenos">309</span></a>
+</span><span id="L-310"><a href="#L-310"><span class="linenos">310</span></a>                <span class="n">keys</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">selected_domains</span><span class="p">)</span>
+</span><span id="L-311"><a href="#L-311"><span class="linenos">311</span></a>
+</span><span id="L-312"><a href="#L-312"><span class="linenos">312</span></a>                <span class="n">loss_name</span> <span class="o">=</span> <span class="sa">f</span><span class="s2">&quot;contrastive_</span><span class="si">{</span><span class="n">domain1_name</span><span class="si">}</span><span class="s2">_and_</span><span class="si">{</span><span class="n">domain2_name</span><span class="si">}</span><span class="s2">&quot;</span>
+</span><span id="L-313"><a href="#L-313"><span class="linenos">313</span></a>                <span class="n">z2</span> <span class="o">=</span> <span class="n">gw_mod</span><span class="o">.</span><span class="n">encode</span><span class="p">({</span><span class="n">domain2_name</span><span class="p">:</span> <span class="n">domain2</span><span class="p">})[</span><span class="n">domain2_name</span><span class="p">]</span>
+</span><span id="L-314"><a href="#L-314"><span class="linenos">314</span></a>                <span class="n">z2_precision</span> <span class="o">=</span> <span class="n">gw_mod</span><span class="o">.</span><span class="n">get_precision</span><span class="p">(</span><span class="n">domain2_name</span><span class="p">,</span> <span class="n">domain2</span><span class="p">)</span>
+</span><span id="L-315"><a href="#L-315"><span class="linenos">315</span></a>                <span class="n">coef</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">softmax</span><span class="p">(</span>
+</span><span id="L-316"><a href="#L-316"><span class="linenos">316</span></a>                    <span class="n">gw_mod</span><span class="o">.</span><span class="n">precision_softmax_temp</span>
+</span><span id="L-317"><a href="#L-317"><span class="linenos">317</span></a>                    <span class="o">*</span> <span class="n">torch</span><span class="o">.</span><span class="n">stack</span><span class="p">([</span><span class="n">z1_precision</span><span class="p">,</span> <span class="n">z2_precision</span><span class="p">]),</span>
+</span><span id="L-318"><a href="#L-318"><span class="linenos">318</span></a>                    <span class="n">dim</span><span class="o">=</span><span class="mi">0</span><span class="p">,</span>
+</span><span id="L-319"><a href="#L-319"><span class="linenos">319</span></a>                <span class="p">)</span>
+</span><span id="L-320"><a href="#L-320"><span class="linenos">320</span></a>                <span class="n">norm</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">sqrt</span><span class="p">(</span><span class="n">coef</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span> <span class="o">*</span> <span class="n">coef</span><span class="p">[</span><span class="mi">1</span><span class="p">])</span>
+</span><span id="L-321"><a href="#L-321"><span class="linenos">321</span></a>                <span class="n">loss_output</span> <span class="o">=</span> <span class="n">contrastive_fn</span><span class="p">(</span><span class="n">z1</span> <span class="o">*</span> <span class="n">norm</span><span class="p">,</span> <span class="n">z2</span> <span class="o">*</span> <span class="n">norm</span><span class="p">)</span>
+</span><span id="L-322"><a href="#L-322"><span class="linenos">322</span></a>                <span class="n">loss_output_no_norm</span> <span class="o">=</span> <span class="n">contrastive_fn</span><span class="p">(</span><span class="n">z1</span><span class="p">,</span> <span class="n">z2</span><span class="p">)</span>
+</span><span id="L-323"><a href="#L-323"><span class="linenos">323</span></a>                <span class="n">losses</span><span class="p">[</span><span class="n">loss_name</span><span class="p">]</span> <span class="o">=</span> <span class="n">loss_output</span><span class="o">.</span><span class="n">loss</span>
+</span><span id="L-324"><a href="#L-324"><span class="linenos">324</span></a>                <span class="n">metrics</span><span class="o">.</span><span class="n">update</span><span class="p">(</span>
+</span><span id="L-325"><a href="#L-325"><span class="linenos">325</span></a>                    <span class="p">{</span><span class="sa">f</span><span class="s2">&quot;</span><span class="si">{</span><span class="n">loss_name</span><span class="si">}</span><span class="s2">_</span><span class="si">{</span><span class="n">k</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">:</span> <span class="n">v</span> <span class="k">for</span> <span class="n">k</span><span class="p">,</span> <span class="n">v</span> <span class="ow">in</span> <span class="n">loss_output</span><span class="o">.</span><span class="n">metrics</span><span class="o">.</span><span class="n">items</span><span class="p">()}</span>
+</span><span id="L-326"><a href="#L-326"><span class="linenos">326</span></a>                <span class="p">)</span>
+</span><span id="L-327"><a href="#L-327"><span class="linenos">327</span></a>                <span class="n">metrics</span><span class="p">[</span><span class="sa">f</span><span class="s2">&quot;unnorm_</span><span class="si">{</span><span class="n">loss_name</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="n">loss_output_no_norm</span><span class="o">.</span><span class="n">loss</span>
+</span><span id="L-328"><a href="#L-328"><span class="linenos">328</span></a>
+</span><span id="L-329"><a href="#L-329"><span class="linenos">329</span></a>    <span class="n">losses</span><span class="p">[</span><span class="s2">&quot;contrastives&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">stack</span><span class="p">(</span><span class="nb">list</span><span class="p">(</span><span class="n">losses</span><span class="o">.</span><span class="n">values</span><span class="p">()),</span> <span class="n">dim</span><span class="o">=</span><span class="mi">0</span><span class="p">)</span><span class="o">.</span><span class="n">mean</span><span class="p">()</span>
+</span><span id="L-330"><a href="#L-330"><span class="linenos">330</span></a>    <span class="n">losses</span><span class="o">.</span><span class="n">update</span><span class="p">(</span><span class="n">metrics</span><span class="p">)</span>
+</span><span id="L-331"><a href="#L-331"><span class="linenos">331</span></a>    <span class="k">return</span> <span class="n">losses</span>
+</span><span id="L-332"><a href="#L-332"><span class="linenos">332</span></a>
+</span><span id="L-333"><a href="#L-333"><span class="linenos">333</span></a>
+</span><span id="L-334"><a href="#L-334"><span class="linenos">334</span></a><span class="k">class</span> <span class="nc">LossCoefs</span><span class="p">(</span><span class="n">TypedDict</span><span class="p">,</span> <span class="n">total</span><span class="o">=</span><span class="kc">False</span><span class="p">):</span>
+</span><span id="L-335"><a href="#L-335"><span class="linenos">335</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="L-336"><a href="#L-336"><span class="linenos">336</span></a><span class="sd">    Dict of loss coefficients used in the GWLosses.</span>
+</span><span id="L-337"><a href="#L-337"><span class="linenos">337</span></a>
+</span><span id="L-338"><a href="#L-338"><span class="linenos">338</span></a><span class="sd">    If one is not provided, the coefficient is assumed to be 0 and will not be logged.</span>
+</span><span id="L-339"><a href="#L-339"><span class="linenos">339</span></a><span class="sd">    If the loss is excplicitely set to 0, it will be logged, but not take part in</span>
+</span><span id="L-340"><a href="#L-340"><span class="linenos">340</span></a><span class="sd">    the total loss.</span>
+</span><span id="L-341"><a href="#L-341"><span class="linenos">341</span></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="L-342"><a href="#L-342"><span class="linenos">342</span></a>
+</span><span id="L-343"><a href="#L-343"><span class="linenos">343</span></a>    <span class="n">demi_cycles</span><span class="p">:</span> <span class="nb">float</span>
+</span><span id="L-344"><a href="#L-344"><span class="linenos">344</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Demi-cycle loss coefficient.&quot;&quot;&quot;</span>
+</span><span id="L-345"><a href="#L-345"><span class="linenos">345</span></a>
+</span><span id="L-346"><a href="#L-346"><span class="linenos">346</span></a>    <span class="n">cycles</span><span class="p">:</span> <span class="nb">float</span>
+</span><span id="L-347"><a href="#L-347"><span class="linenos">347</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Cycle loss coefficient.&quot;&quot;&quot;</span>
+</span><span id="L-348"><a href="#L-348"><span class="linenos">348</span></a>
+</span><span id="L-349"><a href="#L-349"><span class="linenos">349</span></a>    <span class="n">translations</span><span class="p">:</span> <span class="nb">float</span>
+</span><span id="L-350"><a href="#L-350"><span class="linenos">350</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Translation loss coefficient.&quot;&quot;&quot;</span>
+</span><span id="L-351"><a href="#L-351"><span class="linenos">351</span></a>
+</span><span id="L-352"><a href="#L-352"><span class="linenos">352</span></a>    <span class="n">contrastives</span><span class="p">:</span> <span class="nb">float</span>
+</span><span id="L-353"><a href="#L-353"><span class="linenos">353</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Contrastive loss coefficient.&quot;&quot;&quot;</span>
+</span><span id="L-354"><a href="#L-354"><span class="linenos">354</span></a>
+</span><span id="L-355"><a href="#L-355"><span class="linenos">355</span></a>
+</span><span id="L-356"><a href="#L-356"><span class="linenos">356</span></a><span class="k">class</span> <span class="nc">GWLosses2Domains</span><span class="p">(</span><span class="n">GWLossesBase</span><span class="p">):</span>
+</span><span id="L-357"><a href="#L-357"><span class="linenos">357</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="L-358"><a href="#L-358"><span class="linenos">358</span></a><span class="sd">    Implementation of `GWLossesBase` used for `GWModule`.</span>
+</span><span id="L-359"><a href="#L-359"><span class="linenos">359</span></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="L-360"><a href="#L-360"><span class="linenos">360</span></a>
+</span><span id="L-361"><a href="#L-361"><span class="linenos">361</span></a>    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span>
+</span><span id="L-362"><a href="#L-362"><span class="linenos">362</span></a>        <span class="bp">self</span><span class="p">,</span>
+</span><span id="L-363"><a href="#L-363"><span class="linenos">363</span></a>        <span class="n">gw_mod</span><span class="p">:</span> <span class="n">GWModule</span><span class="p">,</span>
+</span><span id="L-364"><a href="#L-364"><span class="linenos">364</span></a>        <span class="n">selection_mod</span><span class="p">:</span> <span class="n">SelectionBase</span><span class="p">,</span>
+</span><span id="L-365"><a href="#L-365"><span class="linenos">365</span></a>        <span class="n">domain_mods</span><span class="p">:</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">DomainModule</span><span class="p">],</span>
+</span><span id="L-366"><a href="#L-366"><span class="linenos">366</span></a>        <span class="n">loss_coefs</span><span class="p">:</span> <span class="n">LossCoefs</span><span class="p">,</span>
+</span><span id="L-367"><a href="#L-367"><span class="linenos">367</span></a>        <span class="n">contrastive_fn</span><span class="p">:</span> <span class="n">ContrastiveLossType</span><span class="p">,</span>
+</span><span id="L-368"><a href="#L-368"><span class="linenos">368</span></a>    <span class="p">):</span>
+</span><span id="L-369"><a href="#L-369"><span class="linenos">369</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="L-370"><a href="#L-370"><span class="linenos">370</span></a><span class="sd">        Main loss module to use with the GlobalWorkspace</span>
+</span><span id="L-371"><a href="#L-371"><span class="linenos">371</span></a>
+</span><span id="L-372"><a href="#L-372"><span class="linenos">372</span></a><span class="sd">        Args:</span>
+</span><span id="L-373"><a href="#L-373"><span class="linenos">373</span></a><span class="sd">            gw_mod (`GWModule`): the GWModule</span>
+</span><span id="L-374"><a href="#L-374"><span class="linenos">374</span></a><span class="sd">            selection_mod (`SelectionBase`): selection module</span>
+</span><span id="L-375"><a href="#L-375"><span class="linenos">375</span></a><span class="sd">            domain_mods (`dict[str, DomainModule]`): a dict where the key is the</span>
+</span><span id="L-376"><a href="#L-376"><span class="linenos">376</span></a><span class="sd">                domain name and value is the DomainModule</span>
+</span><span id="L-377"><a href="#L-377"><span class="linenos">377</span></a><span class="sd">            loss_coefs (`LossCoefs`): loss coefficients. LossCoefs object, or a</span>
+</span><span id="L-378"><a href="#L-378"><span class="linenos">378</span></a><span class="sd">                mapping to float with correct keys.</span>
+</span><span id="L-379"><a href="#L-379"><span class="linenos">379</span></a><span class="sd">            contrastive_fn (`ContrastiveLossType`): the contrastive function to use</span>
+</span><span id="L-380"><a href="#L-380"><span class="linenos">380</span></a><span class="sd">                in contrastive loss</span>
+</span><span id="L-381"><a href="#L-381"><span class="linenos">381</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="L-382"><a href="#L-382"><span class="linenos">382</span></a>
+</span><span id="L-383"><a href="#L-383"><span class="linenos">383</span></a>        <span class="nb">super</span><span class="p">()</span><span class="o">.</span><span class="fm">__init__</span><span class="p">()</span>
+</span><span id="L-384"><a href="#L-384"><span class="linenos">384</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">gw_mod</span> <span class="o">=</span> <span class="n">gw_mod</span>
+</span><span id="L-385"><a href="#L-385"><span class="linenos">385</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">selection_mod</span> <span class="o">=</span> <span class="n">selection_mod</span>
+</span><span id="L-386"><a href="#L-386"><span class="linenos">386</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">domain_mods</span> <span class="o">=</span> <span class="n">domain_mods</span>
+</span><span id="L-387"><a href="#L-387"><span class="linenos">387</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">loss_coefs</span> <span class="o">=</span> <span class="n">loss_coefs</span>
+</span><span id="L-388"><a href="#L-388"><span class="linenos">388</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">contrastive_fn</span> <span class="o">=</span> <span class="n">contrastive_fn</span>
+</span><span id="L-389"><a href="#L-389"><span class="linenos">389</span></a>
+</span><span id="L-390"><a href="#L-390"><span class="linenos">390</span></a>    <span class="k">def</span> <span class="nf">demi_cycle_loss</span><span class="p">(</span>
+</span><span id="L-391"><a href="#L-391"><span class="linenos">391</span></a>        <span class="bp">self</span><span class="p">,</span> <span class="n">latent_domains</span><span class="p">:</span> <span class="n">LatentsDomainGroupsT</span>
+</span><span id="L-392"><a href="#L-392"><span class="linenos">392</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]:</span>
+</span><span id="L-393"><a href="#L-393"><span class="linenos">393</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="L-394"><a href="#L-394"><span class="linenos">394</span></a><span class="sd">        Computes the demi-cycle loss.</span>
+</span><span id="L-395"><a href="#L-395"><span class="linenos">395</span></a>
+</span><span id="L-396"><a href="#L-396"><span class="linenos">396</span></a><span class="sd">        See `shimmer.modules.losses.demi_cycle_loss`.</span>
+</span><span id="L-397"><a href="#L-397"><span class="linenos">397</span></a>
+</span><span id="L-398"><a href="#L-398"><span class="linenos">398</span></a><span class="sd">        Args:</span>
+</span><span id="L-399"><a href="#L-399"><span class="linenos">399</span></a><span class="sd">            latent_domains (`LatentsDomainGroupsT`): the latent unimodal groups</span>
+</span><span id="L-400"><a href="#L-400"><span class="linenos">400</span></a>
+</span><span id="L-401"><a href="#L-401"><span class="linenos">401</span></a><span class="sd">        Returns:</span>
+</span><span id="L-402"><a href="#L-402"><span class="linenos">402</span></a><span class="sd">            `dict[str, torch.Tensor]`: a dict of metrics.</span>
+</span><span id="L-403"><a href="#L-403"><span class="linenos">403</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="L-404"><a href="#L-404"><span class="linenos">404</span></a>        <span class="k">return</span> <span class="n">demi_cycle_loss</span><span class="p">(</span>
+</span><span id="L-405"><a href="#L-405"><span class="linenos">405</span></a>            <span class="bp">self</span><span class="o">.</span><span class="n">gw_mod</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">selection_mod</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">domain_mods</span><span class="p">,</span> <span class="n">latent_domains</span>
+</span><span id="L-406"><a href="#L-406"><span class="linenos">406</span></a>        <span class="p">)</span>
+</span><span id="L-407"><a href="#L-407"><span class="linenos">407</span></a>
+</span><span id="L-408"><a href="#L-408"><span class="linenos">408</span></a>    <span class="k">def</span> <span class="nf">cycle_loss</span><span class="p">(</span>
+</span><span id="L-409"><a href="#L-409"><span class="linenos">409</span></a>        <span class="bp">self</span><span class="p">,</span> <span class="n">latent_domains</span><span class="p">:</span> <span class="n">LatentsDomainGroupsT</span>
+</span><span id="L-410"><a href="#L-410"><span class="linenos">410</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]:</span>
+</span><span id="L-411"><a href="#L-411"><span class="linenos">411</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="L-412"><a href="#L-412"><span class="linenos">412</span></a><span class="sd">        Computes the cycle loss.</span>
+</span><span id="L-413"><a href="#L-413"><span class="linenos">413</span></a>
+</span><span id="L-414"><a href="#L-414"><span class="linenos">414</span></a><span class="sd">        See `shimmer.modules.losses.cycle_loss`.</span>
+</span><span id="L-415"><a href="#L-415"><span class="linenos">415</span></a>
+</span><span id="L-416"><a href="#L-416"><span class="linenos">416</span></a><span class="sd">        Args:</span>
+</span><span id="L-417"><a href="#L-417"><span class="linenos">417</span></a><span class="sd">            latent_domains (`LatentsDomainGroupsT`): the latent unimodal groups</span>
+</span><span id="L-418"><a href="#L-418"><span class="linenos">418</span></a>
+</span><span id="L-419"><a href="#L-419"><span class="linenos">419</span></a><span class="sd">        Returns:</span>
+</span><span id="L-420"><a href="#L-420"><span class="linenos">420</span></a><span class="sd">            `dict[str, torch.Tensor]`: a dict of metrics.</span>
+</span><span id="L-421"><a href="#L-421"><span class="linenos">421</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="L-422"><a href="#L-422"><span class="linenos">422</span></a>        <span class="k">return</span> <span class="n">cycle_loss</span><span class="p">(</span>
+</span><span id="L-423"><a href="#L-423"><span class="linenos">423</span></a>            <span class="bp">self</span><span class="o">.</span><span class="n">gw_mod</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">selection_mod</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">domain_mods</span><span class="p">,</span> <span class="n">latent_domains</span>
+</span><span id="L-424"><a href="#L-424"><span class="linenos">424</span></a>        <span class="p">)</span>
+</span><span id="L-425"><a href="#L-425"><span class="linenos">425</span></a>
+</span><span id="L-426"><a href="#L-426"><span class="linenos">426</span></a>    <span class="k">def</span> <span class="nf">translation_loss</span><span class="p">(</span>
+</span><span id="L-427"><a href="#L-427"><span class="linenos">427</span></a>        <span class="bp">self</span><span class="p">,</span> <span class="n">latent_domains</span><span class="p">:</span> <span class="n">LatentsDomainGroupsT</span>
+</span><span id="L-428"><a href="#L-428"><span class="linenos">428</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]:</span>
+</span><span id="L-429"><a href="#L-429"><span class="linenos">429</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="L-430"><a href="#L-430"><span class="linenos">430</span></a><span class="sd">        Computes the translation loss.</span>
+</span><span id="L-431"><a href="#L-431"><span class="linenos">431</span></a>
+</span><span id="L-432"><a href="#L-432"><span class="linenos">432</span></a><span class="sd">        See `shimmer.modules.losses.translation_loss`.</span>
+</span><span id="L-433"><a href="#L-433"><span class="linenos">433</span></a>
+</span><span id="L-434"><a href="#L-434"><span class="linenos">434</span></a><span class="sd">        Args:</span>
+</span><span id="L-435"><a href="#L-435"><span class="linenos">435</span></a><span class="sd">            latent_domains (`LatentsDomainGroupsT`): the latent unimodal groups</span>
+</span><span id="L-436"><a href="#L-436"><span class="linenos">436</span></a>
+</span><span id="L-437"><a href="#L-437"><span class="linenos">437</span></a><span class="sd">        Returns:</span>
+</span><span id="L-438"><a href="#L-438"><span class="linenos">438</span></a><span class="sd">            `dict[str, torch.Tensor]`: a dict of metrics.</span>
+</span><span id="L-439"><a href="#L-439"><span class="linenos">439</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="L-440"><a href="#L-440"><span class="linenos">440</span></a>        <span class="k">return</span> <span class="n">translation_loss</span><span class="p">(</span>
+</span><span id="L-441"><a href="#L-441"><span class="linenos">441</span></a>            <span class="bp">self</span><span class="o">.</span><span class="n">gw_mod</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">selection_mod</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">domain_mods</span><span class="p">,</span> <span class="n">latent_domains</span>
+</span><span id="L-442"><a href="#L-442"><span class="linenos">442</span></a>        <span class="p">)</span>
+</span><span id="L-443"><a href="#L-443"><span class="linenos">443</span></a>
+</span><span id="L-444"><a href="#L-444"><span class="linenos">444</span></a>    <span class="k">def</span> <span class="nf">contrastive_loss</span><span class="p">(</span>
+</span><span id="L-445"><a href="#L-445"><span class="linenos">445</span></a>        <span class="bp">self</span><span class="p">,</span> <span class="n">latent_domains</span><span class="p">:</span> <span class="n">LatentsDomainGroupsT</span>
+</span><span id="L-446"><a href="#L-446"><span class="linenos">446</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]:</span>
+</span><span id="L-447"><a href="#L-447"><span class="linenos">447</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="L-448"><a href="#L-448"><span class="linenos">448</span></a><span class="sd">        Computes the contrastive loss.</span>
+</span><span id="L-449"><a href="#L-449"><span class="linenos">449</span></a>
+</span><span id="L-450"><a href="#L-450"><span class="linenos">450</span></a><span class="sd">        See `shimmer.modules.losses.contrastive_loss`.</span>
+</span><span id="L-451"><a href="#L-451"><span class="linenos">451</span></a>
+</span><span id="L-452"><a href="#L-452"><span class="linenos">452</span></a><span class="sd">        Args:</span>
+</span><span id="L-453"><a href="#L-453"><span class="linenos">453</span></a><span class="sd">            latent_domains (`LatentsDomainGroupsT`): the latent unimodal groups</span>
+</span><span id="L-454"><a href="#L-454"><span class="linenos">454</span></a>
+</span><span id="L-455"><a href="#L-455"><span class="linenos">455</span></a><span class="sd">        Returns:</span>
+</span><span id="L-456"><a href="#L-456"><span class="linenos">456</span></a><span class="sd">            `dict[str, torch.Tensor]`: a dict of metrics.</span>
+</span><span id="L-457"><a href="#L-457"><span class="linenos">457</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="L-458"><a href="#L-458"><span class="linenos">458</span></a>        <span class="k">return</span> <span class="n">contrastive_loss</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">gw_mod</span><span class="p">,</span> <span class="n">latent_domains</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">contrastive_fn</span><span class="p">)</span>
+</span><span id="L-459"><a href="#L-459"><span class="linenos">459</span></a>
+</span><span id="L-460"><a href="#L-460"><span class="linenos">460</span></a>    <span class="k">def</span> <span class="nf">step</span><span class="p">(</span>
+</span><span id="L-461"><a href="#L-461"><span class="linenos">461</span></a>        <span class="bp">self</span><span class="p">,</span> <span class="n">domain_latents</span><span class="p">:</span> <span class="n">LatentsDomainGroupsT</span><span class="p">,</span> <span class="n">mode</span><span class="p">:</span> <span class="n">ModelModeT</span>
+</span><span id="L-462"><a href="#L-462"><span class="linenos">462</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="n">LossOutput</span><span class="p">:</span>
+</span><span id="L-463"><a href="#L-463"><span class="linenos">463</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="L-464"><a href="#L-464"><span class="linenos">464</span></a><span class="sd">        Computes and returns the losses</span>
+</span><span id="L-465"><a href="#L-465"><span class="linenos">465</span></a>
+</span><span id="L-466"><a href="#L-466"><span class="linenos">466</span></a><span class="sd">        Contains:</span>
+</span><span id="L-467"><a href="#L-467"><span class="linenos">467</span></a><span class="sd">            - Demi-cycle metrics (see `GWLosses.demi_cycle_loss`)</span>
+</span><span id="L-468"><a href="#L-468"><span class="linenos">468</span></a><span class="sd">            - Cycle metrics (see `GWLosses.cycle_loss`)</span>
+</span><span id="L-469"><a href="#L-469"><span class="linenos">469</span></a><span class="sd">            - Translation metrics (see `GWLosses.translation_loss`)</span>
+</span><span id="L-470"><a href="#L-470"><span class="linenos">470</span></a><span class="sd">            - Contrastive metrics (see `GWLosses.contrastive_loss`)</span>
+</span><span id="L-471"><a href="#L-471"><span class="linenos">471</span></a>
+</span><span id="L-472"><a href="#L-472"><span class="linenos">472</span></a><span class="sd">        Args:</span>
+</span><span id="L-473"><a href="#L-473"><span class="linenos">473</span></a><span class="sd">            domain_latents (`LatentsDomainGroupsT`): All latent groups</span>
+</span><span id="L-474"><a href="#L-474"><span class="linenos">474</span></a><span class="sd">            mode (`ModelModeT`): model mode</span>
+</span><span id="L-475"><a href="#L-475"><span class="linenos">475</span></a><span class="sd">        Returns:</span>
+</span><span id="L-476"><a href="#L-476"><span class="linenos">476</span></a><span class="sd">            `LossOutput`: the losses</span>
+</span><span id="L-477"><a href="#L-477"><span class="linenos">477</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="L-478"><a href="#L-478"><span class="linenos">478</span></a>        <span class="n">metrics</span><span class="p">:</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]</span> <span class="o">=</span> <span class="p">{}</span>
+</span><span id="L-479"><a href="#L-479"><span class="linenos">479</span></a>
+</span><span id="L-480"><a href="#L-480"><span class="linenos">480</span></a>        <span class="n">metrics</span><span class="o">.</span><span class="n">update</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">demi_cycle_loss</span><span class="p">(</span><span class="n">domain_latents</span><span class="p">))</span>
+</span><span id="L-481"><a href="#L-481"><span class="linenos">481</span></a>        <span class="n">metrics</span><span class="o">.</span><span class="n">update</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">cycle_loss</span><span class="p">(</span><span class="n">domain_latents</span><span class="p">))</span>
+</span><span id="L-482"><a href="#L-482"><span class="linenos">482</span></a>        <span class="n">metrics</span><span class="o">.</span><span class="n">update</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">translation_loss</span><span class="p">(</span><span class="n">domain_latents</span><span class="p">))</span>
+</span><span id="L-483"><a href="#L-483"><span class="linenos">483</span></a>        <span class="n">metrics</span><span class="o">.</span><span class="n">update</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">contrastive_loss</span><span class="p">(</span><span class="n">domain_latents</span><span class="p">))</span>
+</span><span id="L-484"><a href="#L-484"><span class="linenos">484</span></a>
+</span><span id="L-485"><a href="#L-485"><span class="linenos">485</span></a>        <span class="n">loss</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">stack</span><span class="p">(</span>
+</span><span id="L-486"><a href="#L-486"><span class="linenos">486</span></a>            <span class="p">[</span>
+</span><span id="L-487"><a href="#L-487"><span class="linenos">487</span></a>                <span class="n">metrics</span><span class="p">[</span><span class="n">name</span><span class="p">]</span> <span class="o">*</span> <span class="n">coef</span>
+</span><span id="L-488"><a href="#L-488"><span class="linenos">488</span></a>                <span class="k">for</span> <span class="n">name</span><span class="p">,</span> <span class="n">coef</span> <span class="ow">in</span> <span class="bp">self</span><span class="o">.</span><span class="n">loss_coefs</span><span class="o">.</span><span class="n">items</span><span class="p">()</span>
+</span><span id="L-489"><a href="#L-489"><span class="linenos">489</span></a>                <span class="k">if</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">coef</span><span class="p">,</span> <span class="nb">float</span><span class="p">)</span> <span class="ow">and</span> <span class="n">coef</span> <span class="o">&gt;</span> <span class="mi">0</span>
+</span><span id="L-490"><a href="#L-490"><span class="linenos">490</span></a>            <span class="p">],</span>
+</span><span id="L-491"><a href="#L-491"><span class="linenos">491</span></a>            <span class="n">dim</span><span class="o">=</span><span class="mi">0</span><span class="p">,</span>
+</span><span id="L-492"><a href="#L-492"><span class="linenos">492</span></a>        <span class="p">)</span><span class="o">.</span><span class="n">mean</span><span class="p">()</span>
+</span><span id="L-493"><a href="#L-493"><span class="linenos">493</span></a>
+</span><span id="L-494"><a href="#L-494"><span class="linenos">494</span></a>        <span class="k">return</span> <span class="n">LossOutput</span><span class="p">(</span><span class="n">loss</span><span class="p">,</span> <span class="n">metrics</span><span class="p">)</span>
+</span><span id="L-495"><a href="#L-495"><span class="linenos">495</span></a>
+</span><span id="L-496"><a href="#L-496"><span class="linenos">496</span></a>
+</span><span id="L-497"><a href="#L-497"><span class="linenos">497</span></a><span class="k">def</span> <span class="nf">generate_partitions</span><span class="p">(</span><span class="n">n</span><span class="p">:</span> <span class="nb">int</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">Generator</span><span class="p">[</span><span class="nb">tuple</span><span class="p">[</span><span class="nb">int</span><span class="p">,</span> <span class="o">...</span><span class="p">],</span> <span class="kc">None</span><span class="p">,</span> <span class="kc">None</span><span class="p">]:</span>
+</span><span id="L-498"><a href="#L-498"><span class="linenos">498</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="L-499"><a href="#L-499"><span class="linenos">499</span></a><span class="sd">    Generates all possible partitions of zeros and ones for `n` elements,</span>
+</span><span id="L-500"><a href="#L-500"><span class="linenos">500</span></a><span class="sd">    excluding the all-zeros partition.</span>
+</span><span id="L-501"><a href="#L-501"><span class="linenos">501</span></a>
+</span><span id="L-502"><a href="#L-502"><span class="linenos">502</span></a><span class="sd">    Args:</span>
+</span><span id="L-503"><a href="#L-503"><span class="linenos">503</span></a><span class="sd">        n (`int`): The number of modalities to generate partitions for.</span>
+</span><span id="L-504"><a href="#L-504"><span class="linenos">504</span></a>
+</span><span id="L-505"><a href="#L-505"><span class="linenos">505</span></a><span class="sd">    Yields:</span>
+</span><span id="L-506"><a href="#L-506"><span class="linenos">506</span></a><span class="sd">        `tuple[int, ...]`: A partition of zeros and ones, excluding the</span>
+</span><span id="L-507"><a href="#L-507"><span class="linenos">507</span></a><span class="sd">        all-zeros partition.</span>
+</span><span id="L-508"><a href="#L-508"><span class="linenos">508</span></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="L-509"><a href="#L-509"><span class="linenos">509</span></a>    <span class="k">for</span> <span class="n">perm</span> <span class="ow">in</span> <span class="n">product</span><span class="p">([</span><span class="mi">0</span><span class="p">,</span> <span class="mi">1</span><span class="p">],</span> <span class="n">repeat</span><span class="o">=</span><span class="n">n</span><span class="p">):</span>
+</span><span id="L-510"><a href="#L-510"><span class="linenos">510</span></a>        <span class="k">if</span> <span class="nb">any</span><span class="p">(</span><span class="n">perm</span><span class="p">):</span>
+</span><span id="L-511"><a href="#L-511"><span class="linenos">511</span></a>            <span class="k">yield</span> <span class="n">perm</span>
+</span><span id="L-512"><a href="#L-512"><span class="linenos">512</span></a>
+</span><span id="L-513"><a href="#L-513"><span class="linenos">513</span></a>
+</span><span id="L-514"><a href="#L-514"><span class="linenos">514</span></a><span class="k">def</span> <span class="nf">broadcast_loss</span><span class="p">(</span>
+</span><span id="L-515"><a href="#L-515"><span class="linenos">515</span></a>    <span class="n">gw_mod</span><span class="p">:</span> <span class="n">GWModuleBase</span><span class="p">,</span>
+</span><span id="L-516"><a href="#L-516"><span class="linenos">516</span></a>    <span class="n">selection_mod</span><span class="p">:</span> <span class="n">SelectionBase</span><span class="p">,</span>
+</span><span id="L-517"><a href="#L-517"><span class="linenos">517</span></a>    <span class="n">domain_mods</span><span class="p">:</span> <span class="n">Mapping</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">DomainModule</span><span class="p">],</span>
+</span><span id="L-518"><a href="#L-518"><span class="linenos">518</span></a>    <span class="n">latent_domains</span><span class="p">:</span> <span class="n">LatentsDomainGroupsT</span><span class="p">,</span>
+</span><span id="L-519"><a href="#L-519"><span class="linenos">519</span></a><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]:</span>
+</span><span id="L-520"><a href="#L-520"><span class="linenos">520</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="L-521"><a href="#L-521"><span class="linenos">521</span></a><span class="sd">    Computes broadcast loss including demi-cycle, cycle, and translation losses.</span>
+</span><span id="L-522"><a href="#L-522"><span class="linenos">522</span></a>
+</span><span id="L-523"><a href="#L-523"><span class="linenos">523</span></a><span class="sd">    Args:</span>
+</span><span id="L-524"><a href="#L-524"><span class="linenos">524</span></a><span class="sd">        gw_mod (`shimmer.modules.gw_module.GWModuleBase`): The GWModule to use</span>
+</span><span id="L-525"><a href="#L-525"><span class="linenos">525</span></a><span class="sd">        selection_mod (`shimmer.modules.selection.SelectionBase`): Selection mod to use</span>
+</span><span id="L-526"><a href="#L-526"><span class="linenos">526</span></a><span class="sd">        domain_mods (`Mapping[str, DomainModule]`): the domain modules</span>
+</span><span id="L-527"><a href="#L-527"><span class="linenos">527</span></a><span class="sd">        latent_domains: The latent domain representations.</span>
+</span><span id="L-528"><a href="#L-528"><span class="linenos">528</span></a>
+</span><span id="L-529"><a href="#L-529"><span class="linenos">529</span></a><span class="sd">    Returns:</span>
+</span><span id="L-530"><a href="#L-530"><span class="linenos">530</span></a><span class="sd">        A dictionary with the total loss and additional metrics.</span>
+</span><span id="L-531"><a href="#L-531"><span class="linenos">531</span></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="L-532"><a href="#L-532"><span class="linenos">532</span></a>    <span class="n">losses</span><span class="p">:</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]</span> <span class="o">=</span> <span class="p">{}</span>
+</span><span id="L-533"><a href="#L-533"><span class="linenos">533</span></a>    <span class="n">metrics</span><span class="p">:</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]</span> <span class="o">=</span> <span class="p">{}</span>
+</span><span id="L-534"><a href="#L-534"><span class="linenos">534</span></a>
+</span><span id="L-535"><a href="#L-535"><span class="linenos">535</span></a>    <span class="n">demi_cycle_losses</span><span class="p">:</span> <span class="nb">list</span><span class="p">[</span><span class="nb">str</span><span class="p">]</span> <span class="o">=</span> <span class="p">[]</span>
+</span><span id="L-536"><a href="#L-536"><span class="linenos">536</span></a>    <span class="n">cycle_losses</span><span class="p">:</span> <span class="nb">list</span><span class="p">[</span><span class="nb">str</span><span class="p">]</span> <span class="o">=</span> <span class="p">[]</span>
+</span><span id="L-537"><a href="#L-537"><span class="linenos">537</span></a>    <span class="n">translation_losses</span><span class="p">:</span> <span class="nb">list</span><span class="p">[</span><span class="nb">str</span><span class="p">]</span> <span class="o">=</span> <span class="p">[]</span>
+</span><span id="L-538"><a href="#L-538"><span class="linenos">538</span></a>    <span class="n">fused_losses</span><span class="p">:</span> <span class="nb">list</span><span class="p">[</span><span class="nb">str</span><span class="p">]</span> <span class="o">=</span> <span class="p">[]</span>
+</span><span id="L-539"><a href="#L-539"><span class="linenos">539</span></a>
+</span><span id="L-540"><a href="#L-540"><span class="linenos">540</span></a>    <span class="k">for</span> <span class="n">group_domains</span><span class="p">,</span> <span class="n">latents</span> <span class="ow">in</span> <span class="n">latent_domains</span><span class="o">.</span><span class="n">items</span><span class="p">():</span>
+</span><span id="L-541"><a href="#L-541"><span class="linenos">541</span></a>        <span class="n">encoded_latents</span> <span class="o">=</span> <span class="n">gw_mod</span><span class="o">.</span><span class="n">encode</span><span class="p">(</span><span class="n">latents</span><span class="p">)</span>
+</span><span id="L-542"><a href="#L-542"><span class="linenos">542</span></a>        <span class="n">partitions</span> <span class="o">=</span> <span class="n">generate_partitions</span><span class="p">(</span><span class="nb">len</span><span class="p">(</span><span class="n">group_domains</span><span class="p">))</span>
+</span><span id="L-543"><a href="#L-543"><span class="linenos">543</span></a>        <span class="n">domain_names</span> <span class="o">=</span> <span class="nb">list</span><span class="p">(</span><span class="n">latents</span><span class="p">)</span>
+</span><span id="L-544"><a href="#L-544"><span class="linenos">544</span></a>        <span class="n">group_name</span> <span class="o">=</span> <span class="s2">&quot;-&quot;</span><span class="o">.</span><span class="n">join</span><span class="p">(</span><span class="n">group_domains</span><span class="p">)</span>
+</span><span id="L-545"><a href="#L-545"><span class="linenos">545</span></a>
+</span><span id="L-546"><a href="#L-546"><span class="linenos">546</span></a>        <span class="k">for</span> <span class="n">partition</span> <span class="ow">in</span> <span class="n">partitions</span><span class="p">:</span>
+</span><span id="L-547"><a href="#L-547"><span class="linenos">547</span></a>            <span class="n">selected_latents</span> <span class="o">=</span> <span class="p">{</span>
+</span><span id="L-548"><a href="#L-548"><span class="linenos">548</span></a>                <span class="n">domain</span><span class="p">:</span> <span class="n">latents</span><span class="p">[</span><span class="n">domain</span><span class="p">]</span>
+</span><span id="L-549"><a href="#L-549"><span class="linenos">549</span></a>                <span class="k">for</span> <span class="n">domain</span><span class="p">,</span> <span class="n">present</span> <span class="ow">in</span> <span class="nb">zip</span><span class="p">(</span><span class="n">domain_names</span><span class="p">,</span> <span class="n">partition</span><span class="p">,</span> <span class="n">strict</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
+</span><span id="L-550"><a href="#L-550"><span class="linenos">550</span></a>                <span class="k">if</span> <span class="n">present</span>
+</span><span id="L-551"><a href="#L-551"><span class="linenos">551</span></a>            <span class="p">}</span>
+</span><span id="L-552"><a href="#L-552"><span class="linenos">552</span></a>            <span class="n">selected_encoded_latents</span> <span class="o">=</span> <span class="p">{</span>
+</span><span id="L-553"><a href="#L-553"><span class="linenos">553</span></a>                <span class="n">domain</span><span class="p">:</span> <span class="n">encoded_latents</span><span class="p">[</span><span class="n">domain</span><span class="p">]</span> <span class="k">for</span> <span class="n">domain</span> <span class="ow">in</span> <span class="n">selected_latents</span>
+</span><span id="L-554"><a href="#L-554"><span class="linenos">554</span></a>            <span class="p">}</span>
+</span><span id="L-555"><a href="#L-555"><span class="linenos">555</span></a>            <span class="n">selected_group_label</span> <span class="o">=</span> <span class="s2">&quot;{&quot;</span> <span class="o">+</span> <span class="s2">&quot;, &quot;</span><span class="o">.</span><span class="n">join</span><span class="p">(</span><span class="nb">sorted</span><span class="p">(</span><span class="n">selected_latents</span><span class="p">))</span> <span class="o">+</span> <span class="s2">&quot;}&quot;</span>
+</span><span id="L-556"><a href="#L-556"><span class="linenos">556</span></a>
+</span><span id="L-557"><a href="#L-557"><span class="linenos">557</span></a>            <span class="n">selection_scores</span> <span class="o">=</span> <span class="n">selection_mod</span><span class="p">(</span><span class="n">selected_latents</span><span class="p">,</span> <span class="n">selected_encoded_latents</span><span class="p">)</span>
+</span><span id="L-558"><a href="#L-558"><span class="linenos">558</span></a>            <span class="n">fused_latents</span> <span class="o">=</span> <span class="n">gw_mod</span><span class="o">.</span><span class="n">fuse</span><span class="p">(</span><span class="n">selected_encoded_latents</span><span class="p">,</span> <span class="n">selection_scores</span><span class="p">)</span>
+</span><span id="L-559"><a href="#L-559"><span class="linenos">559</span></a>            <span class="n">decoded_latents</span> <span class="o">=</span> <span class="n">gw_mod</span><span class="o">.</span><span class="n">decode</span><span class="p">(</span><span class="n">fused_latents</span><span class="p">)</span>
+</span><span id="L-560"><a href="#L-560"><span class="linenos">560</span></a>
+</span><span id="L-561"><a href="#L-561"><span class="linenos">561</span></a>            <span class="n">num_active_domains</span> <span class="o">=</span> <span class="nb">sum</span><span class="p">(</span><span class="n">partition</span><span class="p">)</span>
+</span><span id="L-562"><a href="#L-562"><span class="linenos">562</span></a>            <span class="n">num_total_domains</span> <span class="o">=</span> <span class="nb">len</span><span class="p">(</span><span class="n">decoded_latents</span><span class="p">)</span>
+</span><span id="L-563"><a href="#L-563"><span class="linenos">563</span></a>
+</span><span id="L-564"><a href="#L-564"><span class="linenos">564</span></a>            <span class="k">for</span> <span class="n">domain</span><span class="p">,</span> <span class="n">pred</span> <span class="ow">in</span> <span class="n">decoded_latents</span><span class="o">.</span><span class="n">items</span><span class="p">():</span>
+</span><span id="L-565"><a href="#L-565"><span class="linenos">565</span></a>                <span class="k">if</span> <span class="n">domain</span> <span class="ow">not</span> <span class="ow">in</span> <span class="n">group_domains</span><span class="p">:</span>  <span class="c1"># if we don&#39;t have ground truth</span>
+</span><span id="L-566"><a href="#L-566"><span class="linenos">566</span></a>                    <span class="k">continue</span>
+</span><span id="L-567"><a href="#L-567"><span class="linenos">567</span></a>                <span class="n">ground_truth</span> <span class="o">=</span> <span class="n">latents</span><span class="p">[</span><span class="n">domain</span><span class="p">]</span>
+</span><span id="L-568"><a href="#L-568"><span class="linenos">568</span></a>                <span class="n">loss_output</span> <span class="o">=</span> <span class="n">domain_mods</span><span class="p">[</span><span class="n">domain</span><span class="p">]</span><span class="o">.</span><span class="n">compute_loss</span><span class="p">(</span><span class="n">pred</span><span class="p">,</span> <span class="n">ground_truth</span><span class="p">)</span>
+</span><span id="L-569"><a href="#L-569"><span class="linenos">569</span></a>                <span class="n">loss_label</span> <span class="o">=</span> <span class="sa">f</span><span class="s2">&quot;from_</span><span class="si">{</span><span class="n">selected_group_label</span><span class="si">}</span><span class="s2">_to_</span><span class="si">{</span><span class="n">domain</span><span class="si">}</span><span class="s2">&quot;</span>
+</span><span id="L-570"><a href="#L-570"><span class="linenos">570</span></a>                <span class="n">losses</span><span class="p">[</span><span class="n">loss_label</span> <span class="o">+</span> <span class="s2">&quot;_loss&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="n">loss_output</span><span class="o">.</span><span class="n">loss</span>
+</span><span id="L-571"><a href="#L-571"><span class="linenos">571</span></a>                <span class="n">metrics</span><span class="o">.</span><span class="n">update</span><span class="p">(</span>
+</span><span id="L-572"><a href="#L-572"><span class="linenos">572</span></a>                    <span class="p">{</span><span class="sa">f</span><span class="s2">&quot;</span><span class="si">{</span><span class="n">loss_label</span><span class="si">}</span><span class="s2">_</span><span class="si">{</span><span class="n">k</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">:</span> <span class="n">v</span> <span class="k">for</span> <span class="n">k</span><span class="p">,</span> <span class="n">v</span> <span class="ow">in</span> <span class="n">loss_output</span><span class="o">.</span><span class="n">metrics</span><span class="o">.</span><span class="n">items</span><span class="p">()}</span>
+</span><span id="L-573"><a href="#L-573"><span class="linenos">573</span></a>                <span class="p">)</span>
+</span><span id="L-574"><a href="#L-574"><span class="linenos">574</span></a>
+</span><span id="L-575"><a href="#L-575"><span class="linenos">575</span></a>                <span class="k">if</span> <span class="n">num_active_domains</span> <span class="o">==</span> <span class="mi">1</span> <span class="ow">and</span> <span class="n">domain</span> <span class="ow">in</span> <span class="n">selected_latents</span><span class="p">:</span>
+</span><span id="L-576"><a href="#L-576"><span class="linenos">576</span></a>                    <span class="n">demi_cycle_losses</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">loss_label</span> <span class="o">+</span> <span class="s2">&quot;_loss&quot;</span><span class="p">)</span>
+</span><span id="L-577"><a href="#L-577"><span class="linenos">577</span></a>                <span class="k">elif</span> <span class="n">domain</span> <span class="ow">not</span> <span class="ow">in</span> <span class="n">selected_latents</span><span class="p">:</span>
+</span><span id="L-578"><a href="#L-578"><span class="linenos">578</span></a>                    <span class="n">translation_losses</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">loss_label</span> <span class="o">+</span> <span class="s2">&quot;_loss&quot;</span><span class="p">)</span>
+</span><span id="L-579"><a href="#L-579"><span class="linenos">579</span></a>                <span class="k">else</span><span class="p">:</span>  <span class="c1"># fused loss</span>
+</span><span id="L-580"><a href="#L-580"><span class="linenos">580</span></a>                    <span class="n">fused_losses</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">loss_label</span> <span class="o">+</span> <span class="s2">&quot;_loss&quot;</span><span class="p">)</span>
+</span><span id="L-581"><a href="#L-581"><span class="linenos">581</span></a>
+</span><span id="L-582"><a href="#L-582"><span class="linenos">582</span></a>            <span class="k">if</span> <span class="n">num_active_domains</span> <span class="o">&lt;</span> <span class="n">num_total_domains</span><span class="p">:</span>
+</span><span id="L-583"><a href="#L-583"><span class="linenos">583</span></a>                <span class="n">inverse_selected_latents</span> <span class="o">=</span> <span class="p">{</span>
+</span><span id="L-584"><a href="#L-584"><span class="linenos">584</span></a>                    <span class="n">domain</span><span class="p">:</span> <span class="n">decoded_latents</span><span class="p">[</span><span class="n">domain</span><span class="p">]</span>
+</span><span id="L-585"><a href="#L-585"><span class="linenos">585</span></a>                    <span class="k">for</span> <span class="n">domain</span> <span class="ow">in</span> <span class="n">decoded_latents</span>
+</span><span id="L-586"><a href="#L-586"><span class="linenos">586</span></a>                    <span class="k">if</span> <span class="n">domain</span> <span class="ow">not</span> <span class="ow">in</span> <span class="n">selected_latents</span>
+</span><span id="L-587"><a href="#L-587"><span class="linenos">587</span></a>                <span class="p">}</span>
+</span><span id="L-588"><a href="#L-588"><span class="linenos">588</span></a>
+</span><span id="L-589"><a href="#L-589"><span class="linenos">589</span></a>                <span class="n">inverse_selected_group_label</span> <span class="o">=</span> <span class="p">(</span>
+</span><span id="L-590"><a href="#L-590"><span class="linenos">590</span></a>                    <span class="s2">&quot;{&quot;</span> <span class="o">+</span> <span class="s2">&quot;, &quot;</span><span class="o">.</span><span class="n">join</span><span class="p">(</span><span class="nb">sorted</span><span class="p">(</span><span class="n">inverse_selected_latents</span><span class="p">))</span> <span class="o">+</span> <span class="s2">&quot;}&quot;</span>
+</span><span id="L-591"><a href="#L-591"><span class="linenos">591</span></a>                <span class="p">)</span>
+</span><span id="L-592"><a href="#L-592"><span class="linenos">592</span></a>
+</span><span id="L-593"><a href="#L-593"><span class="linenos">593</span></a>                <span class="n">re_encoded_latents</span> <span class="o">=</span> <span class="n">gw_mod</span><span class="o">.</span><span class="n">encode</span><span class="p">(</span><span class="n">inverse_selected_latents</span><span class="p">)</span>
+</span><span id="L-594"><a href="#L-594"><span class="linenos">594</span></a>                <span class="n">re_selection_scores</span> <span class="o">=</span> <span class="n">selection_mod</span><span class="p">(</span>
+</span><span id="L-595"><a href="#L-595"><span class="linenos">595</span></a>                    <span class="n">inverse_selected_latents</span><span class="p">,</span> <span class="n">re_encoded_latents</span>
+</span><span id="L-596"><a href="#L-596"><span class="linenos">596</span></a>                <span class="p">)</span>
+</span><span id="L-597"><a href="#L-597"><span class="linenos">597</span></a>                <span class="n">re_fused_latents</span> <span class="o">=</span> <span class="n">gw_mod</span><span class="o">.</span><span class="n">fuse</span><span class="p">(</span><span class="n">re_encoded_latents</span><span class="p">,</span> <span class="n">re_selection_scores</span><span class="p">)</span>
+</span><span id="L-598"><a href="#L-598"><span class="linenos">598</span></a>                <span class="n">re_decoded_latents</span> <span class="o">=</span> <span class="n">gw_mod</span><span class="o">.</span><span class="n">decode</span><span class="p">(</span>
+</span><span id="L-599"><a href="#L-599"><span class="linenos">599</span></a>                    <span class="n">re_fused_latents</span><span class="p">,</span> <span class="n">domains</span><span class="o">=</span><span class="n">selected_latents</span><span class="o">.</span><span class="n">keys</span><span class="p">()</span>
+</span><span id="L-600"><a href="#L-600"><span class="linenos">600</span></a>                <span class="p">)</span>
+</span><span id="L-601"><a href="#L-601"><span class="linenos">601</span></a>
+</span><span id="L-602"><a href="#L-602"><span class="linenos">602</span></a>                <span class="k">for</span> <span class="n">domain</span> <span class="ow">in</span> <span class="n">selected_latents</span><span class="p">:</span>
+</span><span id="L-603"><a href="#L-603"><span class="linenos">603</span></a>                    <span class="n">re_ground_truth</span> <span class="o">=</span> <span class="n">latents</span><span class="p">[</span><span class="n">domain</span><span class="p">]</span>
+</span><span id="L-604"><a href="#L-604"><span class="linenos">604</span></a>                    <span class="n">re_loss_output</span> <span class="o">=</span> <span class="n">domain_mods</span><span class="p">[</span><span class="n">domain</span><span class="p">]</span><span class="o">.</span><span class="n">compute_loss</span><span class="p">(</span>
+</span><span id="L-605"><a href="#L-605"><span class="linenos">605</span></a>                        <span class="n">re_decoded_latents</span><span class="p">[</span><span class="n">domain</span><span class="p">],</span> <span class="n">re_ground_truth</span>
+</span><span id="L-606"><a href="#L-606"><span class="linenos">606</span></a>                    <span class="p">)</span>
+</span><span id="L-607"><a href="#L-607"><span class="linenos">607</span></a>                    <span class="n">loss_label</span> <span class="o">=</span> <span class="p">(</span>
+</span><span id="L-608"><a href="#L-608"><span class="linenos">608</span></a>                        <span class="sa">f</span><span class="s2">&quot;from_</span><span class="si">{</span><span class="n">selected_group_label</span><span class="si">}</span><span class="s2">_&quot;</span>
+</span><span id="L-609"><a href="#L-609"><span class="linenos">609</span></a>                        <span class="sa">f</span><span class="s2">&quot;through_</span><span class="si">{</span><span class="n">inverse_selected_group_label</span><span class="si">}</span><span class="s2">_to_</span><span class="si">{</span><span class="n">domain</span><span class="si">}</span><span class="s2">_&quot;</span>
+</span><span id="L-610"><a href="#L-610"><span class="linenos">610</span></a>                        <span class="sa">f</span><span class="s2">&quot;case_</span><span class="si">{</span><span class="n">group_name</span><span class="si">}</span><span class="s2">&quot;</span>
+</span><span id="L-611"><a href="#L-611"><span class="linenos">611</span></a>                    <span class="p">)</span>
+</span><span id="L-612"><a href="#L-612"><span class="linenos">612</span></a>                    <span class="n">losses</span><span class="p">[</span><span class="n">loss_label</span> <span class="o">+</span> <span class="s2">&quot;_loss&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="n">re_loss_output</span><span class="o">.</span><span class="n">loss</span>
+</span><span id="L-613"><a href="#L-613"><span class="linenos">613</span></a>                    <span class="n">metrics</span><span class="o">.</span><span class="n">update</span><span class="p">(</span>
+</span><span id="L-614"><a href="#L-614"><span class="linenos">614</span></a>                        <span class="p">{</span>
+</span><span id="L-615"><a href="#L-615"><span class="linenos">615</span></a>                            <span class="sa">f</span><span class="s2">&quot;</span><span class="si">{</span><span class="n">loss_label</span><span class="si">}</span><span class="s2">_</span><span class="si">{</span><span class="n">k</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">:</span> <span class="n">v</span>
+</span><span id="L-616"><a href="#L-616"><span class="linenos">616</span></a>                            <span class="k">for</span> <span class="n">k</span><span class="p">,</span> <span class="n">v</span> <span class="ow">in</span> <span class="n">re_loss_output</span><span class="o">.</span><span class="n">metrics</span><span class="o">.</span><span class="n">items</span><span class="p">()</span>
+</span><span id="L-617"><a href="#L-617"><span class="linenos">617</span></a>                        <span class="p">}</span>
+</span><span id="L-618"><a href="#L-618"><span class="linenos">618</span></a>                    <span class="p">)</span>
+</span><span id="L-619"><a href="#L-619"><span class="linenos">619</span></a>                    <span class="n">cycle_losses</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">loss_label</span> <span class="o">+</span> <span class="s2">&quot;_loss&quot;</span><span class="p">)</span>
+</span><span id="L-620"><a href="#L-620"><span class="linenos">620</span></a>
+</span><span id="L-621"><a href="#L-621"><span class="linenos">621</span></a>    <span class="k">if</span> <span class="n">demi_cycle_losses</span><span class="p">:</span>
+</span><span id="L-622"><a href="#L-622"><span class="linenos">622</span></a>        <span class="n">metrics</span><span class="p">[</span><span class="s2">&quot;demi_cycles&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">mean</span><span class="p">(</span>
+</span><span id="L-623"><a href="#L-623"><span class="linenos">623</span></a>            <span class="n">torch</span><span class="o">.</span><span class="n">stack</span><span class="p">([</span><span class="n">losses</span><span class="p">[</span><span class="n">loss_name</span><span class="p">]</span> <span class="k">for</span> <span class="n">loss_name</span> <span class="ow">in</span> <span class="n">demi_cycle_losses</span><span class="p">])</span>
+</span><span id="L-624"><a href="#L-624"><span class="linenos">624</span></a>        <span class="p">)</span>
+</span><span id="L-625"><a href="#L-625"><span class="linenos">625</span></a>    <span class="k">if</span> <span class="n">cycle_losses</span><span class="p">:</span>
+</span><span id="L-626"><a href="#L-626"><span class="linenos">626</span></a>        <span class="n">metrics</span><span class="p">[</span><span class="s2">&quot;cycles&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">mean</span><span class="p">(</span>
+</span><span id="L-627"><a href="#L-627"><span class="linenos">627</span></a>            <span class="n">torch</span><span class="o">.</span><span class="n">stack</span><span class="p">([</span><span class="n">losses</span><span class="p">[</span><span class="n">loss_name</span><span class="p">]</span> <span class="k">for</span> <span class="n">loss_name</span> <span class="ow">in</span> <span class="n">cycle_losses</span><span class="p">])</span>
+</span><span id="L-628"><a href="#L-628"><span class="linenos">628</span></a>        <span class="p">)</span>
+</span><span id="L-629"><a href="#L-629"><span class="linenos">629</span></a>    <span class="k">if</span> <span class="n">translation_losses</span><span class="p">:</span>
+</span><span id="L-630"><a href="#L-630"><span class="linenos">630</span></a>        <span class="n">metrics</span><span class="p">[</span><span class="s2">&quot;translations&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">mean</span><span class="p">(</span>
+</span><span id="L-631"><a href="#L-631"><span class="linenos">631</span></a>            <span class="n">torch</span><span class="o">.</span><span class="n">stack</span><span class="p">([</span><span class="n">losses</span><span class="p">[</span><span class="n">loss_name</span><span class="p">]</span> <span class="k">for</span> <span class="n">loss_name</span> <span class="ow">in</span> <span class="n">translation_losses</span><span class="p">])</span>
+</span><span id="L-632"><a href="#L-632"><span class="linenos">632</span></a>        <span class="p">)</span>
+</span><span id="L-633"><a href="#L-633"><span class="linenos">633</span></a>    <span class="k">if</span> <span class="n">fused_losses</span><span class="p">:</span>
+</span><span id="L-634"><a href="#L-634"><span class="linenos">634</span></a>        <span class="n">metrics</span><span class="p">[</span><span class="s2">&quot;fused&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">mean</span><span class="p">(</span>
+</span><span id="L-635"><a href="#L-635"><span class="linenos">635</span></a>            <span class="n">torch</span><span class="o">.</span><span class="n">stack</span><span class="p">([</span><span class="n">losses</span><span class="p">[</span><span class="n">loss_name</span><span class="p">]</span> <span class="k">for</span> <span class="n">loss_name</span> <span class="ow">in</span> <span class="n">fused_losses</span><span class="p">])</span>
+</span><span id="L-636"><a href="#L-636"><span class="linenos">636</span></a>        <span class="p">)</span>
+</span><span id="L-637"><a href="#L-637"><span class="linenos">637</span></a>
+</span><span id="L-638"><a href="#L-638"><span class="linenos">638</span></a>    <span class="n">metrics</span><span class="o">.</span><span class="n">update</span><span class="p">(</span><span class="n">losses</span><span class="p">)</span>
+</span><span id="L-639"><a href="#L-639"><span class="linenos">639</span></a>    <span class="k">return</span> <span class="n">metrics</span>
+</span><span id="L-640"><a href="#L-640"><span class="linenos">640</span></a>
+</span><span id="L-641"><a href="#L-641"><span class="linenos">641</span></a>
+</span><span id="L-642"><a href="#L-642"><span class="linenos">642</span></a><span class="k">class</span> <span class="nc">BroadcastLossCoefs</span><span class="p">(</span><span class="n">TypedDict</span><span class="p">,</span> <span class="n">total</span><span class="o">=</span><span class="kc">False</span><span class="p">):</span>
+</span><span id="L-643"><a href="#L-643"><span class="linenos">643</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="L-644"><a href="#L-644"><span class="linenos">644</span></a><span class="sd">    Dict of loss coefficients used in the GWLossesFusion.</span>
+</span><span id="L-645"><a href="#L-645"><span class="linenos">645</span></a>
+</span><span id="L-646"><a href="#L-646"><span class="linenos">646</span></a><span class="sd">    If one is not provided, the coefficient is assumed to be 0 and will not be logged.</span>
+</span><span id="L-647"><a href="#L-647"><span class="linenos">647</span></a><span class="sd">    If the loss is excplicitely set to 0, it will be logged, but not take part in</span>
+</span><span id="L-648"><a href="#L-648"><span class="linenos">648</span></a><span class="sd">    the total loss.</span>
+</span><span id="L-649"><a href="#L-649"><span class="linenos">649</span></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="L-650"><a href="#L-650"><span class="linenos">650</span></a>
+</span><span id="L-651"><a href="#L-651"><span class="linenos">651</span></a>    <span class="n">contrastives</span><span class="p">:</span> <span class="nb">float</span>
+</span><span id="L-652"><a href="#L-652"><span class="linenos">652</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Contrastive loss coefficient.&quot;&quot;&quot;</span>
+</span><span id="L-653"><a href="#L-653"><span class="linenos">653</span></a>
+</span><span id="L-654"><a href="#L-654"><span class="linenos">654</span></a>    <span class="n">fused</span><span class="p">:</span> <span class="nb">float</span>
+</span><span id="L-655"><a href="#L-655"><span class="linenos">655</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;fused loss coefficient (encode multiple domains and decode to one of them).&quot;&quot;&quot;</span>
+</span><span id="L-656"><a href="#L-656"><span class="linenos">656</span></a>
+</span><span id="L-657"><a href="#L-657"><span class="linenos">657</span></a>    <span class="n">demi_cycles</span><span class="p">:</span> <span class="nb">float</span>
+</span><span id="L-658"><a href="#L-658"><span class="linenos">658</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;demi_cycles loss coefficient. Demi-cycles are always one-to-one&quot;&quot;&quot;</span>
+</span><span id="L-659"><a href="#L-659"><span class="linenos">659</span></a>
+</span><span id="L-660"><a href="#L-660"><span class="linenos">660</span></a>    <span class="n">cycles</span><span class="p">:</span> <span class="nb">float</span>
+</span><span id="L-661"><a href="#L-661"><span class="linenos">661</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;cycles loss coefficient. Cycles can be many-to-one&quot;&quot;&quot;</span>
+</span><span id="L-662"><a href="#L-662"><span class="linenos">662</span></a>
+</span><span id="L-663"><a href="#L-663"><span class="linenos">663</span></a>    <span class="n">translations</span><span class="p">:</span> <span class="nb">float</span>
+</span><span id="L-664"><a href="#L-664"><span class="linenos">664</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;translation loss coefficient. Translation, like cycles, can be many-to-one.&quot;&quot;&quot;</span>
+</span><span id="L-665"><a href="#L-665"><span class="linenos">665</span></a>
+</span><span id="L-666"><a href="#L-666"><span class="linenos">666</span></a>
+</span><span id="L-667"><a href="#L-667"><span class="linenos">667</span></a><span class="k">class</span> <span class="nc">GWLosses</span><span class="p">(</span><span class="n">GWLossesBase</span><span class="p">):</span>
+</span><span id="L-668"><a href="#L-668"><span class="linenos">668</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="L-669"><a href="#L-669"><span class="linenos">669</span></a><span class="sd">    Implementation of `GWLossesBase` for fusion-based models.</span>
+</span><span id="L-670"><a href="#L-670"><span class="linenos">670</span></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="L-671"><a href="#L-671"><span class="linenos">671</span></a>
+</span><span id="L-672"><a href="#L-672"><span class="linenos">672</span></a>    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span>
+</span><span id="L-673"><a href="#L-673"><span class="linenos">673</span></a>        <span class="bp">self</span><span class="p">,</span>
+</span><span id="L-674"><a href="#L-674"><span class="linenos">674</span></a>        <span class="n">gw_mod</span><span class="p">:</span> <span class="n">GWModule</span><span class="p">,</span>
+</span><span id="L-675"><a href="#L-675"><span class="linenos">675</span></a>        <span class="n">selection_mod</span><span class="p">:</span> <span class="n">SelectionBase</span><span class="p">,</span>
+</span><span id="L-676"><a href="#L-676"><span class="linenos">676</span></a>        <span class="n">domain_mods</span><span class="p">:</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">DomainModule</span><span class="p">],</span>
+</span><span id="L-677"><a href="#L-677"><span class="linenos">677</span></a>        <span class="n">loss_coefs</span><span class="p">:</span> <span class="n">BroadcastLossCoefs</span><span class="p">,</span>
+</span><span id="L-678"><a href="#L-678"><span class="linenos">678</span></a>        <span class="n">contrastive_fn</span><span class="p">:</span> <span class="n">ContrastiveLossType</span><span class="p">,</span>
+</span><span id="L-679"><a href="#L-679"><span class="linenos">679</span></a>    <span class="p">):</span>
+</span><span id="L-680"><a href="#L-680"><span class="linenos">680</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="L-681"><a href="#L-681"><span class="linenos">681</span></a><span class="sd">        Initializes the loss computation module for a Global Workspace Fusion model.</span>
+</span><span id="L-682"><a href="#L-682"><span class="linenos">682</span></a>
+</span><span id="L-683"><a href="#L-683"><span class="linenos">683</span></a><span class="sd">        Args:</span>
+</span><span id="L-684"><a href="#L-684"><span class="linenos">684</span></a><span class="sd">            gw_mod: The GWModule for the global workspace.</span>
+</span><span id="L-685"><a href="#L-685"><span class="linenos">685</span></a><span class="sd">            selection_mod: The selection mechanism for the model.</span>
+</span><span id="L-686"><a href="#L-686"><span class="linenos">686</span></a><span class="sd">            domain_mods: A mapping of domain names to their respective DomainModule.</span>
+</span><span id="L-687"><a href="#L-687"><span class="linenos">687</span></a><span class="sd">            loss_coefs (`BroadcastLossCoefs`): coefs for the losses</span>
+</span><span id="L-688"><a href="#L-688"><span class="linenos">688</span></a><span class="sd">            contrastive_fn: The function used for computing contrastive loss.</span>
+</span><span id="L-689"><a href="#L-689"><span class="linenos">689</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="L-690"><a href="#L-690"><span class="linenos">690</span></a>        <span class="nb">super</span><span class="p">()</span><span class="o">.</span><span class="fm">__init__</span><span class="p">()</span>
+</span><span id="L-691"><a href="#L-691"><span class="linenos">691</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">gw_mod</span> <span class="o">=</span> <span class="n">gw_mod</span>
+</span><span id="L-692"><a href="#L-692"><span class="linenos">692</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">selection_mod</span> <span class="o">=</span> <span class="n">selection_mod</span>
+</span><span id="L-693"><a href="#L-693"><span class="linenos">693</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">domain_mods</span> <span class="o">=</span> <span class="n">domain_mods</span>
+</span><span id="L-694"><a href="#L-694"><span class="linenos">694</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">loss_coefs</span> <span class="o">=</span> <span class="n">loss_coefs</span>
+</span><span id="L-695"><a href="#L-695"><span class="linenos">695</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">contrastive_fn</span> <span class="o">=</span> <span class="n">contrastive_fn</span>
+</span><span id="L-696"><a href="#L-696"><span class="linenos">696</span></a>
+</span><span id="L-697"><a href="#L-697"><span class="linenos">697</span></a>    <span class="k">def</span> <span class="nf">contrastive_loss</span><span class="p">(</span>
+</span><span id="L-698"><a href="#L-698"><span class="linenos">698</span></a>        <span class="bp">self</span><span class="p">,</span> <span class="n">latent_domains</span><span class="p">:</span> <span class="n">LatentsDomainGroupsT</span>
+</span><span id="L-699"><a href="#L-699"><span class="linenos">699</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]:</span>
+</span><span id="L-700"><a href="#L-700"><span class="linenos">700</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="L-701"><a href="#L-701"><span class="linenos">701</span></a><span class="sd">        Computes the contrastive loss for the given latent domains.</span>
+</span><span id="L-702"><a href="#L-702"><span class="linenos">702</span></a>
+</span><span id="L-703"><a href="#L-703"><span class="linenos">703</span></a><span class="sd">        Args:</span>
+</span><span id="L-704"><a href="#L-704"><span class="linenos">704</span></a><span class="sd">            latent_domains: The latent domain representations.</span>
+</span><span id="L-705"><a href="#L-705"><span class="linenos">705</span></a>
+</span><span id="L-706"><a href="#L-706"><span class="linenos">706</span></a><span class="sd">        Returns:</span>
+</span><span id="L-707"><a href="#L-707"><span class="linenos">707</span></a><span class="sd">            A dictionary of contrastive loss metrics.</span>
+</span><span id="L-708"><a href="#L-708"><span class="linenos">708</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="L-709"><a href="#L-709"><span class="linenos">709</span></a>
+</span><span id="L-710"><a href="#L-710"><span class="linenos">710</span></a>        <span class="k">return</span> <span class="n">contrastive_loss</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">gw_mod</span><span class="p">,</span> <span class="n">latent_domains</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">contrastive_fn</span><span class="p">)</span>
+</span><span id="L-711"><a href="#L-711"><span class="linenos">711</span></a>
+</span><span id="L-712"><a href="#L-712"><span class="linenos">712</span></a>    <span class="k">def</span> <span class="nf">broadcast_loss</span><span class="p">(</span>
+</span><span id="L-713"><a href="#L-713"><span class="linenos">713</span></a>        <span class="bp">self</span><span class="p">,</span> <span class="n">latent_domains</span><span class="p">:</span> <span class="n">LatentsDomainGroupsT</span>
+</span><span id="L-714"><a href="#L-714"><span class="linenos">714</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]:</span>
+</span><span id="L-715"><a href="#L-715"><span class="linenos">715</span></a>        <span class="k">return</span> <span class="n">broadcast_loss</span><span class="p">(</span>
+</span><span id="L-716"><a href="#L-716"><span class="linenos">716</span></a>            <span class="bp">self</span><span class="o">.</span><span class="n">gw_mod</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">selection_mod</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">domain_mods</span><span class="p">,</span> <span class="n">latent_domains</span>
+</span><span id="L-717"><a href="#L-717"><span class="linenos">717</span></a>        <span class="p">)</span>
+</span><span id="L-718"><a href="#L-718"><span class="linenos">718</span></a>
+</span><span id="L-719"><a href="#L-719"><span class="linenos">719</span></a>    <span class="k">def</span> <span class="nf">step</span><span class="p">(</span>
+</span><span id="L-720"><a href="#L-720"><span class="linenos">720</span></a>        <span class="bp">self</span><span class="p">,</span> <span class="n">domain_latents</span><span class="p">:</span> <span class="n">LatentsDomainGroupsT</span><span class="p">,</span> <span class="n">mode</span><span class="p">:</span> <span class="n">ModelModeT</span>
+</span><span id="L-721"><a href="#L-721"><span class="linenos">721</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="n">LossOutput</span><span class="p">:</span>
+</span><span id="L-722"><a href="#L-722"><span class="linenos">722</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="L-723"><a href="#L-723"><span class="linenos">723</span></a><span class="sd">        Performs a step of loss computation.</span>
+</span><span id="L-724"><a href="#L-724"><span class="linenos">724</span></a>
+</span><span id="L-725"><a href="#L-725"><span class="linenos">725</span></a><span class="sd">        Args:</span>
+</span><span id="L-726"><a href="#L-726"><span class="linenos">726</span></a><span class="sd">            domain_latents: Latent representations for all domains.</span>
+</span><span id="L-727"><a href="#L-727"><span class="linenos">727</span></a><span class="sd">            mode: The mode in which the model is currently operating.</span>
+</span><span id="L-728"><a href="#L-728"><span class="linenos">728</span></a>
+</span><span id="L-729"><a href="#L-729"><span class="linenos">729</span></a><span class="sd">        Returns:</span>
+</span><span id="L-730"><a href="#L-730"><span class="linenos">730</span></a><span class="sd">            A LossOutput object containing the loss and metrics for this step.</span>
+</span><span id="L-731"><a href="#L-731"><span class="linenos">731</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="L-732"><a href="#L-732"><span class="linenos">732</span></a>
+</span><span id="L-733"><a href="#L-733"><span class="linenos">733</span></a>        <span class="n">metrics</span><span class="p">:</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]</span> <span class="o">=</span> <span class="p">{}</span>
+</span><span id="L-734"><a href="#L-734"><span class="linenos">734</span></a>
+</span><span id="L-735"><a href="#L-735"><span class="linenos">735</span></a>        <span class="n">metrics</span><span class="o">.</span><span class="n">update</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">contrastive_loss</span><span class="p">(</span><span class="n">domain_latents</span><span class="p">))</span>
+</span><span id="L-736"><a href="#L-736"><span class="linenos">736</span></a>        <span class="n">metrics</span><span class="o">.</span><span class="n">update</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">broadcast_loss</span><span class="p">(</span><span class="n">domain_latents</span><span class="p">))</span>
+</span><span id="L-737"><a href="#L-737"><span class="linenos">737</span></a>
+</span><span id="L-738"><a href="#L-738"><span class="linenos">738</span></a>        <span class="n">loss</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">stack</span><span class="p">(</span>
+</span><span id="L-739"><a href="#L-739"><span class="linenos">739</span></a>            <span class="p">[</span>
+</span><span id="L-740"><a href="#L-740"><span class="linenos">740</span></a>                <span class="n">metrics</span><span class="p">[</span><span class="n">name</span><span class="p">]</span> <span class="o">*</span> <span class="n">coef</span>
+</span><span id="L-741"><a href="#L-741"><span class="linenos">741</span></a>                <span class="k">for</span> <span class="n">name</span><span class="p">,</span> <span class="n">coef</span> <span class="ow">in</span> <span class="bp">self</span><span class="o">.</span><span class="n">loss_coefs</span><span class="o">.</span><span class="n">items</span><span class="p">()</span>
+</span><span id="L-742"><a href="#L-742"><span class="linenos">742</span></a>                <span class="k">if</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">coef</span><span class="p">,</span> <span class="nb">float</span><span class="p">)</span> <span class="ow">and</span> <span class="n">coef</span> <span class="o">&gt;</span> <span class="mi">0</span>
+</span><span id="L-743"><a href="#L-743"><span class="linenos">743</span></a>            <span class="p">],</span>
+</span><span id="L-744"><a href="#L-744"><span class="linenos">744</span></a>            <span class="n">dim</span><span class="o">=</span><span class="mi">0</span><span class="p">,</span>
+</span><span id="L-745"><a href="#L-745"><span class="linenos">745</span></a>        <span class="p">)</span><span class="o">.</span><span class="n">mean</span><span class="p">()</span>
+</span><span id="L-746"><a href="#L-746"><span class="linenos">746</span></a>
+</span><span id="L-747"><a href="#L-747"><span class="linenos">747</span></a>        <span class="n">metrics</span><span class="p">[</span><span class="s2">&quot;broadcast_loss&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">stack</span><span class="p">(</span>
+</span><span id="L-748"><a href="#L-748"><span class="linenos">748</span></a>            <span class="p">[</span>
+</span><span id="L-749"><a href="#L-749"><span class="linenos">749</span></a>                <span class="n">metrics</span><span class="p">[</span><span class="n">name</span><span class="p">]</span>
+</span><span id="L-750"><a href="#L-750"><span class="linenos">750</span></a>                <span class="k">for</span> <span class="n">name</span><span class="p">,</span> <span class="n">coef</span> <span class="ow">in</span> <span class="bp">self</span><span class="o">.</span><span class="n">loss_coefs</span><span class="o">.</span><span class="n">items</span><span class="p">()</span>
+</span><span id="L-751"><a href="#L-751"><span class="linenos">751</span></a>                <span class="k">if</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">coef</span><span class="p">,</span> <span class="nb">float</span><span class="p">)</span> <span class="ow">and</span> <span class="n">coef</span> <span class="o">&gt;</span> <span class="mi">0</span> <span class="ow">and</span> <span class="n">name</span> <span class="o">!=</span> <span class="s2">&quot;contrastives&quot;</span>
+</span><span id="L-752"><a href="#L-752"><span class="linenos">752</span></a>            <span class="p">],</span>
+</span><span id="L-753"><a href="#L-753"><span class="linenos">753</span></a>            <span class="n">dim</span><span class="o">=</span><span class="mi">0</span><span class="p">,</span>
+</span><span id="L-754"><a href="#L-754"><span class="linenos">754</span></a>        <span class="p">)</span><span class="o">.</span><span class="n">mean</span><span class="p">()</span>
+</span><span id="L-755"><a href="#L-755"><span class="linenos">755</span></a>
+</span><span id="L-756"><a href="#L-756"><span class="linenos">756</span></a>        <span class="k">return</span> <span class="n">LossOutput</span><span class="p">(</span><span class="n">loss</span><span class="p">,</span> <span class="n">metrics</span><span class="p">)</span>
+</span><span id="L-757"><a href="#L-757"><span class="linenos">757</span></a>
+</span><span id="L-758"><a href="#L-758"><span class="linenos">758</span></a>
+</span><span id="L-759"><a href="#L-759"><span class="linenos">759</span></a><span class="k">class</span> <span class="nc">GWLossesBayesian</span><span class="p">(</span><span class="n">GWLossesBase</span><span class="p">):</span>
+</span><span id="L-760"><a href="#L-760"><span class="linenos">760</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="L-761"><a href="#L-761"><span class="linenos">761</span></a><span class="sd">    Implementation of `GWLossesBase` used for `GWModuleBayesian`.</span>
+</span><span id="L-762"><a href="#L-762"><span class="linenos">762</span></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="L-763"><a href="#L-763"><span class="linenos">763</span></a>
+</span><span id="L-764"><a href="#L-764"><span class="linenos">764</span></a>    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span>
+</span><span id="L-765"><a href="#L-765"><span class="linenos">765</span></a>        <span class="bp">self</span><span class="p">,</span>
+</span><span id="L-766"><a href="#L-766"><span class="linenos">766</span></a>        <span class="n">gw_mod</span><span class="p">:</span> <span class="n">GWModuleBayesian</span><span class="p">,</span>
+</span><span id="L-767"><a href="#L-767"><span class="linenos">767</span></a>        <span class="n">selection_mod</span><span class="p">:</span> <span class="n">SelectionBase</span><span class="p">,</span>
+</span><span id="L-768"><a href="#L-768"><span class="linenos">768</span></a>        <span class="n">domain_mods</span><span class="p">:</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">DomainModule</span><span class="p">],</span>
+</span><span id="L-769"><a href="#L-769"><span class="linenos">769</span></a>        <span class="n">loss_coefs</span><span class="p">:</span> <span class="n">BroadcastLossCoefs</span><span class="p">,</span>
+</span><span id="L-770"><a href="#L-770"><span class="linenos">770</span></a>        <span class="n">contrastive_fn</span><span class="p">:</span> <span class="n">ContrastiveLossType</span><span class="p">,</span>
+</span><span id="L-771"><a href="#L-771"><span class="linenos">771</span></a>        <span class="n">use_normalized_constrastive</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">True</span><span class="p">,</span>
+</span><span id="L-772"><a href="#L-772"><span class="linenos">772</span></a>    <span class="p">):</span>
+</span><span id="L-773"><a href="#L-773"><span class="linenos">773</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="L-774"><a href="#L-774"><span class="linenos">774</span></a><span class="sd">        Loss module with uncertainty prediction to use with the GlobalWorkspaceBayesian</span>
+</span><span id="L-775"><a href="#L-775"><span class="linenos">775</span></a>
+</span><span id="L-776"><a href="#L-776"><span class="linenos">776</span></a><span class="sd">        Args:</span>
+</span><span id="L-777"><a href="#L-777"><span class="linenos">777</span></a><span class="sd">            gw_mod (`GWModuleBayesian`): the GWModule</span>
+</span><span id="L-778"><a href="#L-778"><span class="linenos">778</span></a><span class="sd">            selection_mod (`SelectionBase`): selection module</span>
+</span><span id="L-779"><a href="#L-779"><span class="linenos">779</span></a><span class="sd">            domain_mods (`dict[str, DomainModule]`): a dict where the key is the</span>
+</span><span id="L-780"><a href="#L-780"><span class="linenos">780</span></a><span class="sd">                domain name and value is the DomainModule</span>
+</span><span id="L-781"><a href="#L-781"><span class="linenos">781</span></a><span class="sd">            loss_coefs (`BroadcastLossCoefs`): loss coefficients</span>
+</span><span id="L-782"><a href="#L-782"><span class="linenos">782</span></a><span class="sd">            contrastive_fn (`ContrastiveLossType`): the contrastive function</span>
+</span><span id="L-783"><a href="#L-783"><span class="linenos">783</span></a><span class="sd">                to use in contrastive loss</span>
+</span><span id="L-784"><a href="#L-784"><span class="linenos">784</span></a><span class="sd">            use_normalized_constrastive (`bool`): whether to use the normalized cont</span>
+</span><span id="L-785"><a href="#L-785"><span class="linenos">785</span></a><span class="sd">                loss by the precision coefs</span>
+</span><span id="L-786"><a href="#L-786"><span class="linenos">786</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="L-787"><a href="#L-787"><span class="linenos">787</span></a>        <span class="nb">super</span><span class="p">()</span><span class="o">.</span><span class="fm">__init__</span><span class="p">()</span>
+</span><span id="L-788"><a href="#L-788"><span class="linenos">788</span></a>
+</span><span id="L-789"><a href="#L-789"><span class="linenos">789</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">gw_mod</span> <span class="o">=</span> <span class="n">gw_mod</span>
+</span><span id="L-790"><a href="#L-790"><span class="linenos">790</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;The GWModule.&quot;&quot;&quot;</span>
+</span><span id="L-791"><a href="#L-791"><span class="linenos">791</span></a>
+</span><span id="L-792"><a href="#L-792"><span class="linenos">792</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">selection_mod</span> <span class="o">=</span> <span class="n">selection_mod</span>
+</span><span id="L-793"><a href="#L-793"><span class="linenos">793</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;Selection module&quot;&quot;&quot;</span>
+</span><span id="L-794"><a href="#L-794"><span class="linenos">794</span></a>
+</span><span id="L-795"><a href="#L-795"><span class="linenos">795</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">domain_mods</span> <span class="o">=</span> <span class="n">domain_mods</span>
+</span><span id="L-796"><a href="#L-796"><span class="linenos">796</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;Domain modules linked to the GW.&quot;&quot;&quot;</span>
+</span><span id="L-797"><a href="#L-797"><span class="linenos">797</span></a>
+</span><span id="L-798"><a href="#L-798"><span class="linenos">798</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">loss_coefs</span> <span class="o">=</span> <span class="n">loss_coefs</span>
+</span><span id="L-799"><a href="#L-799"><span class="linenos">799</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;The loss coefficients.&quot;&quot;&quot;</span>
+</span><span id="L-800"><a href="#L-800"><span class="linenos">800</span></a>
+</span><span id="L-801"><a href="#L-801"><span class="linenos">801</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">contrastive_fn</span> <span class="o">=</span> <span class="n">contrastive_fn</span>
+</span><span id="L-802"><a href="#L-802"><span class="linenos">802</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="L-803"><a href="#L-803"><span class="linenos">803</span></a><span class="sd">        Contrastive loss to use.</span>
+</span><span id="L-804"><a href="#L-804"><span class="linenos">804</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="L-805"><a href="#L-805"><span class="linenos">805</span></a>
+</span><span id="L-806"><a href="#L-806"><span class="linenos">806</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">use_normalized_constrastive</span> <span class="o">=</span> <span class="n">use_normalized_constrastive</span>
+</span><span id="L-807"><a href="#L-807"><span class="linenos">807</span></a>
+</span><span id="L-808"><a href="#L-808"><span class="linenos">808</span></a>    <span class="k">def</span> <span class="nf">contrastive_loss</span><span class="p">(</span>
+</span><span id="L-809"><a href="#L-809"><span class="linenos">809</span></a>        <span class="bp">self</span><span class="p">,</span> <span class="n">latent_domains</span><span class="p">:</span> <span class="n">LatentsDomainGroupsT</span>
+</span><span id="L-810"><a href="#L-810"><span class="linenos">810</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]:</span>
+</span><span id="L-811"><a href="#L-811"><span class="linenos">811</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="L-812"><a href="#L-812"><span class="linenos">812</span></a><span class="sd">        Contrastive loss.</span>
+</span><span id="L-813"><a href="#L-813"><span class="linenos">813</span></a>
+</span><span id="L-814"><a href="#L-814"><span class="linenos">814</span></a><span class="sd">        Args:</span>
+</span><span id="L-815"><a href="#L-815"><span class="linenos">815</span></a><span class="sd">            latent_domains (`LatentsDomainGroupsT`): the latent unimodal groups</span>
+</span><span id="L-816"><a href="#L-816"><span class="linenos">816</span></a>
+</span><span id="L-817"><a href="#L-817"><span class="linenos">817</span></a><span class="sd">        Returns:</span>
+</span><span id="L-818"><a href="#L-818"><span class="linenos">818</span></a><span class="sd">            `dict[str, torch.Tensor]`: a dict of metrics.</span>
+</span><span id="L-819"><a href="#L-819"><span class="linenos">819</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="L-820"><a href="#L-820"><span class="linenos">820</span></a>        <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">use_normalized_constrastive</span><span class="p">:</span>
+</span><span id="L-821"><a href="#L-821"><span class="linenos">821</span></a>            <span class="k">return</span> <span class="n">contrastive_loss_bayesian</span><span class="p">(</span>
+</span><span id="L-822"><a href="#L-822"><span class="linenos">822</span></a>                <span class="bp">self</span><span class="o">.</span><span class="n">gw_mod</span><span class="p">,</span> <span class="n">latent_domains</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">contrastive_fn</span>
+</span><span id="L-823"><a href="#L-823"><span class="linenos">823</span></a>            <span class="p">)</span>
+</span><span id="L-824"><a href="#L-824"><span class="linenos">824</span></a>        <span class="k">return</span> <span class="n">contrastive_loss</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">gw_mod</span><span class="p">,</span> <span class="n">latent_domains</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">contrastive_fn</span><span class="p">)</span>
+</span><span id="L-825"><a href="#L-825"><span class="linenos">825</span></a>
+</span><span id="L-826"><a href="#L-826"><span class="linenos">826</span></a>    <span class="k">def</span> <span class="nf">broadcast_loss</span><span class="p">(</span>
+</span><span id="L-827"><a href="#L-827"><span class="linenos">827</span></a>        <span class="bp">self</span><span class="p">,</span> <span class="n">latent_domains</span><span class="p">:</span> <span class="n">LatentsDomainGroupsT</span>
+</span><span id="L-828"><a href="#L-828"><span class="linenos">828</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]:</span>
+</span><span id="L-829"><a href="#L-829"><span class="linenos">829</span></a>        <span class="k">return</span> <span class="n">broadcast_loss</span><span class="p">(</span>
+</span><span id="L-830"><a href="#L-830"><span class="linenos">830</span></a>            <span class="bp">self</span><span class="o">.</span><span class="n">gw_mod</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">selection_mod</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">domain_mods</span><span class="p">,</span> <span class="n">latent_domains</span>
+</span><span id="L-831"><a href="#L-831"><span class="linenos">831</span></a>        <span class="p">)</span>
+</span><span id="L-832"><a href="#L-832"><span class="linenos">832</span></a>
+</span><span id="L-833"><a href="#L-833"><span class="linenos">833</span></a>    <span class="k">def</span> <span class="nf">step</span><span class="p">(</span>
+</span><span id="L-834"><a href="#L-834"><span class="linenos">834</span></a>        <span class="bp">self</span><span class="p">,</span> <span class="n">domain_latents</span><span class="p">:</span> <span class="n">LatentsDomainGroupsT</span><span class="p">,</span> <span class="n">mode</span><span class="p">:</span> <span class="n">ModelModeT</span>
+</span><span id="L-835"><a href="#L-835"><span class="linenos">835</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="n">LossOutput</span><span class="p">:</span>
+</span><span id="L-836"><a href="#L-836"><span class="linenos">836</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="L-837"><a href="#L-837"><span class="linenos">837</span></a><span class="sd">        Performs a step of loss computation.</span>
+</span><span id="L-838"><a href="#L-838"><span class="linenos">838</span></a>
+</span><span id="L-839"><a href="#L-839"><span class="linenos">839</span></a><span class="sd">        Args:</span>
+</span><span id="L-840"><a href="#L-840"><span class="linenos">840</span></a><span class="sd">            domain_latents: Latent representations for all domains.</span>
+</span><span id="L-841"><a href="#L-841"><span class="linenos">841</span></a><span class="sd">            mode: The mode in which the model is currently operating.</span>
+</span><span id="L-842"><a href="#L-842"><span class="linenos">842</span></a>
+</span><span id="L-843"><a href="#L-843"><span class="linenos">843</span></a><span class="sd">        Returns:</span>
+</span><span id="L-844"><a href="#L-844"><span class="linenos">844</span></a><span class="sd">            A LossOutput object containing the loss and metrics for this step.</span>
+</span><span id="L-845"><a href="#L-845"><span class="linenos">845</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="L-846"><a href="#L-846"><span class="linenos">846</span></a>
+</span><span id="L-847"><a href="#L-847"><span class="linenos">847</span></a>        <span class="n">metrics</span><span class="p">:</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]</span> <span class="o">=</span> <span class="p">{}</span>
+</span><span id="L-848"><a href="#L-848"><span class="linenos">848</span></a>
+</span><span id="L-849"><a href="#L-849"><span class="linenos">849</span></a>        <span class="n">metrics</span><span class="o">.</span><span class="n">update</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">contrastive_loss</span><span class="p">(</span><span class="n">domain_latents</span><span class="p">))</span>
+</span><span id="L-850"><a href="#L-850"><span class="linenos">850</span></a>        <span class="n">metrics</span><span class="o">.</span><span class="n">update</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">broadcast_loss</span><span class="p">(</span><span class="n">domain_latents</span><span class="p">))</span>
+</span><span id="L-851"><a href="#L-851"><span class="linenos">851</span></a>
+</span><span id="L-852"><a href="#L-852"><span class="linenos">852</span></a>        <span class="n">loss</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">stack</span><span class="p">(</span>
+</span><span id="L-853"><a href="#L-853"><span class="linenos">853</span></a>            <span class="p">[</span>
+</span><span id="L-854"><a href="#L-854"><span class="linenos">854</span></a>                <span class="n">metrics</span><span class="p">[</span><span class="n">name</span><span class="p">]</span> <span class="o">*</span> <span class="n">coef</span>
+</span><span id="L-855"><a href="#L-855"><span class="linenos">855</span></a>                <span class="k">for</span> <span class="n">name</span><span class="p">,</span> <span class="n">coef</span> <span class="ow">in</span> <span class="bp">self</span><span class="o">.</span><span class="n">loss_coefs</span><span class="o">.</span><span class="n">items</span><span class="p">()</span>
+</span><span id="L-856"><a href="#L-856"><span class="linenos">856</span></a>                <span class="k">if</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">coef</span><span class="p">,</span> <span class="nb">float</span><span class="p">)</span> <span class="ow">and</span> <span class="n">coef</span> <span class="o">&gt;</span> <span class="mi">0</span>
+</span><span id="L-857"><a href="#L-857"><span class="linenos">857</span></a>            <span class="p">],</span>
+</span><span id="L-858"><a href="#L-858"><span class="linenos">858</span></a>            <span class="n">dim</span><span class="o">=</span><span class="mi">0</span><span class="p">,</span>
+</span><span id="L-859"><a href="#L-859"><span class="linenos">859</span></a>        <span class="p">)</span><span class="o">.</span><span class="n">mean</span><span class="p">()</span>
+</span><span id="L-860"><a href="#L-860"><span class="linenos">860</span></a>
+</span><span id="L-861"><a href="#L-861"><span class="linenos">861</span></a>        <span class="n">metrics</span><span class="p">[</span><span class="s2">&quot;broadcast_loss&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">stack</span><span class="p">(</span>
+</span><span id="L-862"><a href="#L-862"><span class="linenos">862</span></a>            <span class="p">[</span>
+</span><span id="L-863"><a href="#L-863"><span class="linenos">863</span></a>                <span class="n">metrics</span><span class="p">[</span><span class="n">name</span><span class="p">]</span>
+</span><span id="L-864"><a href="#L-864"><span class="linenos">864</span></a>                <span class="k">for</span> <span class="n">name</span><span class="p">,</span> <span class="n">coef</span> <span class="ow">in</span> <span class="bp">self</span><span class="o">.</span><span class="n">loss_coefs</span><span class="o">.</span><span class="n">items</span><span class="p">()</span>
+</span><span id="L-865"><a href="#L-865"><span class="linenos">865</span></a>                <span class="k">if</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">coef</span><span class="p">,</span> <span class="nb">float</span><span class="p">)</span> <span class="ow">and</span> <span class="n">coef</span> <span class="o">&gt;</span> <span class="mi">0</span> <span class="ow">and</span> <span class="n">name</span> <span class="o">!=</span> <span class="s2">&quot;contrastives&quot;</span>
+</span><span id="L-866"><a href="#L-866"><span class="linenos">866</span></a>            <span class="p">],</span>
+</span><span id="L-867"><a href="#L-867"><span class="linenos">867</span></a>            <span class="n">dim</span><span class="o">=</span><span class="mi">0</span><span class="p">,</span>
+</span><span id="L-868"><a href="#L-868"><span class="linenos">868</span></a>        <span class="p">)</span><span class="o">.</span><span class="n">mean</span><span class="p">()</span>
+</span><span id="L-869"><a href="#L-869"><span class="linenos">869</span></a>
+</span><span id="L-870"><a href="#L-870"><span class="linenos">870</span></a>        <span class="k">return</span> <span class="n">LossOutput</span><span class="p">(</span><span class="n">loss</span><span class="p">,</span> <span class="n">metrics</span><span class="p">)</span>
+</span></pre></div>
+
+
+            </section>
+                <section id="GWLossesBase">
+                            <input id="GWLossesBase-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
+<div class="attr class">
+            
+    <span class="def">class</span>
+    <span class="name">GWLossesBase</span><wbr>(<span class="base">torch.nn.modules.module.Module</span>, <span class="base">abc.ABC</span>):
+
+                <label class="view-source-button" for="GWLossesBase-view-source"><span>View Source</span></label>
+
+    </div>
+    <a class="headerlink" href="#GWLossesBase"></a>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="GWLossesBase-20"><a href="#GWLossesBase-20"><span class="linenos">20</span></a><span class="k">class</span> <span class="nc">GWLossesBase</span><span class="p">(</span><span class="n">torch</span><span class="o">.</span><span class="n">nn</span><span class="o">.</span><span class="n">Module</span><span class="p">,</span> <span class="n">ABC</span><span class="p">):</span>
+</span><span id="GWLossesBase-21"><a href="#GWLossesBase-21"><span class="linenos">21</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="GWLossesBase-22"><a href="#GWLossesBase-22"><span class="linenos">22</span></a><span class="sd">    Base Abstract Class for Global Workspace (GW) losses. This module is used</span>
+</span><span id="GWLossesBase-23"><a href="#GWLossesBase-23"><span class="linenos">23</span></a><span class="sd">    to compute the different losses of the GW (typically translation, cycle,</span>
+</span><span id="GWLossesBase-24"><a href="#GWLossesBase-24"><span class="linenos">24</span></a><span class="sd">    demi-cycle, contrastive losses).</span>
+</span><span id="GWLossesBase-25"><a href="#GWLossesBase-25"><span class="linenos">25</span></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="GWLossesBase-26"><a href="#GWLossesBase-26"><span class="linenos">26</span></a>
+</span><span id="GWLossesBase-27"><a href="#GWLossesBase-27"><span class="linenos">27</span></a>    <span class="nd">@abstractmethod</span>
+</span><span id="GWLossesBase-28"><a href="#GWLossesBase-28"><span class="linenos">28</span></a>    <span class="k">def</span> <span class="nf">step</span><span class="p">(</span>
+</span><span id="GWLossesBase-29"><a href="#GWLossesBase-29"><span class="linenos">29</span></a>        <span class="bp">self</span><span class="p">,</span>
+</span><span id="GWLossesBase-30"><a href="#GWLossesBase-30"><span class="linenos">30</span></a>        <span class="n">domain_latents</span><span class="p">:</span> <span class="n">LatentsDomainGroupsT</span><span class="p">,</span>
+</span><span id="GWLossesBase-31"><a href="#GWLossesBase-31"><span class="linenos">31</span></a>        <span class="n">mode</span><span class="p">:</span> <span class="n">ModelModeT</span><span class="p">,</span>
+</span><span id="GWLossesBase-32"><a href="#GWLossesBase-32"><span class="linenos">32</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="n">LossOutput</span><span class="p">:</span>
+</span><span id="GWLossesBase-33"><a href="#GWLossesBase-33"><span class="linenos">33</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="GWLossesBase-34"><a href="#GWLossesBase-34"><span class="linenos">34</span></a><span class="sd">        Computes the losses.</span>
+</span><span id="GWLossesBase-35"><a href="#GWLossesBase-35"><span class="linenos">35</span></a>
+</span><span id="GWLossesBase-36"><a href="#GWLossesBase-36"><span class="linenos">36</span></a><span class="sd">        Args:</span>
+</span><span id="GWLossesBase-37"><a href="#GWLossesBase-37"><span class="linenos">37</span></a><span class="sd">            domain_latents (`LatentsDomainGroupsT`): All latent groups</span>
+</span><span id="GWLossesBase-38"><a href="#GWLossesBase-38"><span class="linenos">38</span></a><span class="sd">            mode (`Literal[&quot;train&quot;, &quot;val&quot;, &quot;test&quot;, &quot;val/ood&quot;, &quot;test/ood&quot;]`): model mode</span>
+</span><span id="GWLossesBase-39"><a href="#GWLossesBase-39"><span class="linenos">39</span></a><span class="sd">        Returns:</span>
+</span><span id="GWLossesBase-40"><a href="#GWLossesBase-40"><span class="linenos">40</span></a><span class="sd">            `LossOutput`: the losses</span>
+</span><span id="GWLossesBase-41"><a href="#GWLossesBase-41"><span class="linenos">41</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="GWLossesBase-42"><a href="#GWLossesBase-42"><span class="linenos">42</span></a>        <span class="o">...</span>
+</span></pre></div>
+
+
+            <div class="docstring"><p>Base Abstract Class for Global Workspace (GW) losses. This module is used
+to compute the different losses of the GW (typically translation, cycle,
+demi-cycle, contrastive losses).</p>
+</div>
+
+
+                            <div id="GWLossesBase.step" class="classattr">
+                                        <input id="GWLossesBase.step-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
+<div class="attr function">
+                    <div class="decorator">@abstractmethod</div>
+
+        <span class="def">def</span>
+        <span class="name">step</span><span class="signature pdoc-code multiline">(<span class="param">	<span class="bp">self</span>,</span><span class="param">	<span class="n">domain_latents</span><span class="p">:</span> <span class="n">collections</span><span class="o">.</span><span class="n">abc</span><span class="o">.</span><span class="n">Mapping</span><span class="p">[</span><span class="nb">frozenset</span><span class="p">[</span><span class="nb">str</span><span class="p">],</span> <span class="n">collections</span><span class="o">.</span><span class="n">abc</span><span class="o">.</span><span class="n">Mapping</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]]</span>,</span><span class="param">	<span class="n">mode</span><span class="p">:</span> <span class="n">Literal</span><span class="p">[</span><span class="s1">&#39;train&#39;</span><span class="p">,</span> <span class="s1">&#39;val&#39;</span><span class="p">,</span> <span class="s1">&#39;test&#39;</span><span class="p">,</span> <span class="s1">&#39;val/ood&#39;</span><span class="p">,</span> <span class="s1">&#39;test/ood&#39;</span><span class="p">]</span></span><span class="return-annotation">) -> <span class="n"><a href="domain.html#LossOutput">shimmer.modules.domain.LossOutput</a></span>:</span></span>
+
+                <label class="view-source-button" for="GWLossesBase.step-view-source"><span>View Source</span></label>
+
+    </div>
+    <a class="headerlink" href="#GWLossesBase.step"></a>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="GWLossesBase.step-27"><a href="#GWLossesBase.step-27"><span class="linenos">27</span></a>    <span class="nd">@abstractmethod</span>
+</span><span id="GWLossesBase.step-28"><a href="#GWLossesBase.step-28"><span class="linenos">28</span></a>    <span class="k">def</span> <span class="nf">step</span><span class="p">(</span>
+</span><span id="GWLossesBase.step-29"><a href="#GWLossesBase.step-29"><span class="linenos">29</span></a>        <span class="bp">self</span><span class="p">,</span>
+</span><span id="GWLossesBase.step-30"><a href="#GWLossesBase.step-30"><span class="linenos">30</span></a>        <span class="n">domain_latents</span><span class="p">:</span> <span class="n">LatentsDomainGroupsT</span><span class="p">,</span>
+</span><span id="GWLossesBase.step-31"><a href="#GWLossesBase.step-31"><span class="linenos">31</span></a>        <span class="n">mode</span><span class="p">:</span> <span class="n">ModelModeT</span><span class="p">,</span>
+</span><span id="GWLossesBase.step-32"><a href="#GWLossesBase.step-32"><span class="linenos">32</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="n">LossOutput</span><span class="p">:</span>
+</span><span id="GWLossesBase.step-33"><a href="#GWLossesBase.step-33"><span class="linenos">33</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="GWLossesBase.step-34"><a href="#GWLossesBase.step-34"><span class="linenos">34</span></a><span class="sd">        Computes the losses.</span>
+</span><span id="GWLossesBase.step-35"><a href="#GWLossesBase.step-35"><span class="linenos">35</span></a>
+</span><span id="GWLossesBase.step-36"><a href="#GWLossesBase.step-36"><span class="linenos">36</span></a><span class="sd">        Args:</span>
+</span><span id="GWLossesBase.step-37"><a href="#GWLossesBase.step-37"><span class="linenos">37</span></a><span class="sd">            domain_latents (`LatentsDomainGroupsT`): All latent groups</span>
+</span><span id="GWLossesBase.step-38"><a href="#GWLossesBase.step-38"><span class="linenos">38</span></a><span class="sd">            mode (`Literal[&quot;train&quot;, &quot;val&quot;, &quot;test&quot;, &quot;val/ood&quot;, &quot;test/ood&quot;]`): model mode</span>
+</span><span id="GWLossesBase.step-39"><a href="#GWLossesBase.step-39"><span class="linenos">39</span></a><span class="sd">        Returns:</span>
+</span><span id="GWLossesBase.step-40"><a href="#GWLossesBase.step-40"><span class="linenos">40</span></a><span class="sd">            `LossOutput`: the losses</span>
+</span><span id="GWLossesBase.step-41"><a href="#GWLossesBase.step-41"><span class="linenos">41</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="GWLossesBase.step-42"><a href="#GWLossesBase.step-42"><span class="linenos">42</span></a>        <span class="o">...</span>
+</span></pre></div>
+
+
+            <div class="docstring"><p>Computes the losses.</p>
+
+<h6 id="arguments">Arguments:</h6>
+
+<ul>
+<li><strong>domain_latents (<code>LatentsDomainGroupsT</code>):</strong>  All latent groups</li>
+<li><strong>mode (<code>Literal["train", "val", "test", "val/ood", "test/ood"]</code>):</strong>  model mode</li>
+</ul>
+
+<h6 id="returns">Returns:</h6>
+
+<blockquote>
+  <p><code>LossOutput</code>: the losses</p>
+</blockquote>
+</div>
+
+
+                            </div>
+                            <div class="inherited">
+                                <h5>Inherited Members</h5>
+                                <dl>
+                                    <div><dt>torch.nn.modules.module.Module</dt>
+                                <dd id="GWLossesBase.__init__" class="function">Module</dd>
+                <dd id="GWLossesBase.dump_patches" class="variable">dump_patches</dd>
+                <dd id="GWLossesBase.training" class="variable">training</dd>
+                <dd id="GWLossesBase.call_super_init" class="variable">call_super_init</dd>
+                <dd id="GWLossesBase.forward" class="function">forward</dd>
+                <dd id="GWLossesBase.register_buffer" class="function">register_buffer</dd>
+                <dd id="GWLossesBase.register_parameter" class="function">register_parameter</dd>
+                <dd id="GWLossesBase.add_module" class="function">add_module</dd>
+                <dd id="GWLossesBase.register_module" class="function">register_module</dd>
+                <dd id="GWLossesBase.get_submodule" class="function">get_submodule</dd>
+                <dd id="GWLossesBase.get_parameter" class="function">get_parameter</dd>
+                <dd id="GWLossesBase.get_buffer" class="function">get_buffer</dd>
+                <dd id="GWLossesBase.get_extra_state" class="function">get_extra_state</dd>
+                <dd id="GWLossesBase.set_extra_state" class="function">set_extra_state</dd>
+                <dd id="GWLossesBase.apply" class="function">apply</dd>
+                <dd id="GWLossesBase.cuda" class="function">cuda</dd>
+                <dd id="GWLossesBase.ipu" class="function">ipu</dd>
+                <dd id="GWLossesBase.xpu" class="function">xpu</dd>
+                <dd id="GWLossesBase.cpu" class="function">cpu</dd>
+                <dd id="GWLossesBase.type" class="function">type</dd>
+                <dd id="GWLossesBase.float" class="function">float</dd>
+                <dd id="GWLossesBase.double" class="function">double</dd>
+                <dd id="GWLossesBase.half" class="function">half</dd>
+                <dd id="GWLossesBase.bfloat16" class="function">bfloat16</dd>
+                <dd id="GWLossesBase.to_empty" class="function">to_empty</dd>
+                <dd id="GWLossesBase.to" class="function">to</dd>
+                <dd id="GWLossesBase.register_full_backward_pre_hook" class="function">register_full_backward_pre_hook</dd>
+                <dd id="GWLossesBase.register_backward_hook" class="function">register_backward_hook</dd>
+                <dd id="GWLossesBase.register_full_backward_hook" class="function">register_full_backward_hook</dd>
+                <dd id="GWLossesBase.register_forward_pre_hook" class="function">register_forward_pre_hook</dd>
+                <dd id="GWLossesBase.register_forward_hook" class="function">register_forward_hook</dd>
+                <dd id="GWLossesBase.register_state_dict_pre_hook" class="function">register_state_dict_pre_hook</dd>
+                <dd id="GWLossesBase.state_dict" class="function">state_dict</dd>
+                <dd id="GWLossesBase.register_load_state_dict_post_hook" class="function">register_load_state_dict_post_hook</dd>
+                <dd id="GWLossesBase.load_state_dict" class="function">load_state_dict</dd>
+                <dd id="GWLossesBase.parameters" class="function">parameters</dd>
+                <dd id="GWLossesBase.named_parameters" class="function">named_parameters</dd>
+                <dd id="GWLossesBase.buffers" class="function">buffers</dd>
+                <dd id="GWLossesBase.named_buffers" class="function">named_buffers</dd>
+                <dd id="GWLossesBase.children" class="function">children</dd>
+                <dd id="GWLossesBase.named_children" class="function">named_children</dd>
+                <dd id="GWLossesBase.modules" class="function">modules</dd>
+                <dd id="GWLossesBase.named_modules" class="function">named_modules</dd>
+                <dd id="GWLossesBase.train" class="function">train</dd>
+                <dd id="GWLossesBase.eval" class="function">eval</dd>
+                <dd id="GWLossesBase.requires_grad_" class="function">requires_grad_</dd>
+                <dd id="GWLossesBase.zero_grad" class="function">zero_grad</dd>
+                <dd id="GWLossesBase.share_memory" class="function">share_memory</dd>
+                <dd id="GWLossesBase.extra_repr" class="function">extra_repr</dd>
+                <dd id="GWLossesBase.compile" class="function">compile</dd>
+
+            </div>
+                                </dl>
+                            </div>
+                </section>
+                <section id="demi_cycle_loss">
+                            <input id="demi_cycle_loss-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
+<div class="attr function">
+            
+        <span class="def">def</span>
+        <span class="name">demi_cycle_loss</span><span class="signature pdoc-code multiline">(<span class="param">	<span class="n">gw_mod</span><span class="p">:</span> <span class="n"><a href="gw_module.html#GWModuleBase">shimmer.modules.gw_module.GWModuleBase</a></span>,</span><span class="param">	<span class="n">selection_mod</span><span class="p">:</span> <span class="n"><a href="selection.html#SelectionBase">shimmer.modules.selection.SelectionBase</a></span>,</span><span class="param">	<span class="n">domain_mods</span><span class="p">:</span> <span class="n">collections</span><span class="o">.</span><span class="n">abc</span><span class="o">.</span><span class="n">Mapping</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n"><a href="domain.html#DomainModule">shimmer.modules.domain.DomainModule</a></span><span class="p">]</span>,</span><span class="param">	<span class="n">latent_domains</span><span class="p">:</span> <span class="n">collections</span><span class="o">.</span><span class="n">abc</span><span class="o">.</span><span class="n">Mapping</span><span class="p">[</span><span class="nb">frozenset</span><span class="p">[</span><span class="nb">str</span><span class="p">],</span> <span class="n">collections</span><span class="o">.</span><span class="n">abc</span><span class="o">.</span><span class="n">Mapping</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]]</span></span><span class="return-annotation">) -> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]</span>:</span></span>
+
+                <label class="view-source-button" for="demi_cycle_loss-view-source"><span>View Source</span></label>
+
+    </div>
+    <a class="headerlink" href="#demi_cycle_loss"></a>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="demi_cycle_loss-45"><a href="#demi_cycle_loss-45"><span class="linenos">45</span></a><span class="k">def</span> <span class="nf">demi_cycle_loss</span><span class="p">(</span>
+</span><span id="demi_cycle_loss-46"><a href="#demi_cycle_loss-46"><span class="linenos">46</span></a>    <span class="n">gw_mod</span><span class="p">:</span> <span class="n">GWModuleBase</span><span class="p">,</span>
+</span><span id="demi_cycle_loss-47"><a href="#demi_cycle_loss-47"><span class="linenos">47</span></a>    <span class="n">selection_mod</span><span class="p">:</span> <span class="n">SelectionBase</span><span class="p">,</span>
+</span><span id="demi_cycle_loss-48"><a href="#demi_cycle_loss-48"><span class="linenos">48</span></a>    <span class="n">domain_mods</span><span class="p">:</span> <span class="n">Mapping</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">DomainModule</span><span class="p">],</span>
+</span><span id="demi_cycle_loss-49"><a href="#demi_cycle_loss-49"><span class="linenos">49</span></a>    <span class="n">latent_domains</span><span class="p">:</span> <span class="n">LatentsDomainGroupsT</span><span class="p">,</span>
+</span><span id="demi_cycle_loss-50"><a href="#demi_cycle_loss-50"><span class="linenos">50</span></a><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]:</span>
+</span><span id="demi_cycle_loss-51"><a href="#demi_cycle_loss-51"><span class="linenos">51</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="demi_cycle_loss-52"><a href="#demi_cycle_loss-52"><span class="linenos">52</span></a><span class="sd">    Computes the demi-cycle loss.</span>
+</span><span id="demi_cycle_loss-53"><a href="#demi_cycle_loss-53"><span class="linenos">53</span></a>
+</span><span id="demi_cycle_loss-54"><a href="#demi_cycle_loss-54"><span class="linenos">54</span></a><span class="sd">    This return multiple metrics:</span>
+</span><span id="demi_cycle_loss-55"><a href="#demi_cycle_loss-55"><span class="linenos">55</span></a><span class="sd">        * `demi_cycle_{domain_name}` with the demi-cycle of a particular domain;</span>
+</span><span id="demi_cycle_loss-56"><a href="#demi_cycle_loss-56"><span class="linenos">56</span></a><span class="sd">        * `demi_cycle_{domain_name}_{metric}` with additional metrics provided by</span>
+</span><span id="demi_cycle_loss-57"><a href="#demi_cycle_loss-57"><span class="linenos">57</span></a><span class="sd">            the domain_mod&#39;s `compute_dcy_loss` output;</span>
+</span><span id="demi_cycle_loss-58"><a href="#demi_cycle_loss-58"><span class="linenos">58</span></a><span class="sd">        * `demi_cycles` with the average value of all `demi_cycle_{domain_name}` values.</span>
+</span><span id="demi_cycle_loss-59"><a href="#demi_cycle_loss-59"><span class="linenos">59</span></a>
+</span><span id="demi_cycle_loss-60"><a href="#demi_cycle_loss-60"><span class="linenos">60</span></a><span class="sd">    Args:</span>
+</span><span id="demi_cycle_loss-61"><a href="#demi_cycle_loss-61"><span class="linenos">61</span></a><span class="sd">        gw_mod (`shimmer.modules.gw_module.GWModuleBase`): The GWModule to use</span>
+</span><span id="demi_cycle_loss-62"><a href="#demi_cycle_loss-62"><span class="linenos">62</span></a><span class="sd">        selection_mod (`shimmer.modules.selection.SelectionBase`): Selection mod to use</span>
+</span><span id="demi_cycle_loss-63"><a href="#demi_cycle_loss-63"><span class="linenos">63</span></a><span class="sd">        domain_mods (`Mapping[str, DomainModule]`): the domain modules</span>
+</span><span id="demi_cycle_loss-64"><a href="#demi_cycle_loss-64"><span class="linenos">64</span></a><span class="sd">        latent_domains (`shimmer.types.LatentsDomainGroupsT`): the latent unimodal</span>
+</span><span id="demi_cycle_loss-65"><a href="#demi_cycle_loss-65"><span class="linenos">65</span></a><span class="sd">            groups</span>
+</span><span id="demi_cycle_loss-66"><a href="#demi_cycle_loss-66"><span class="linenos">66</span></a>
+</span><span id="demi_cycle_loss-67"><a href="#demi_cycle_loss-67"><span class="linenos">67</span></a><span class="sd">    Returns:</span>
+</span><span id="demi_cycle_loss-68"><a href="#demi_cycle_loss-68"><span class="linenos">68</span></a><span class="sd">        `dict[str, torch.Tensor]`: a dict of metrics.</span>
+</span><span id="demi_cycle_loss-69"><a href="#demi_cycle_loss-69"><span class="linenos">69</span></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="demi_cycle_loss-70"><a href="#demi_cycle_loss-70"><span class="linenos">70</span></a>    <span class="n">losses</span><span class="p">:</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]</span> <span class="o">=</span> <span class="p">{}</span>
+</span><span id="demi_cycle_loss-71"><a href="#demi_cycle_loss-71"><span class="linenos">71</span></a>    <span class="n">metrics</span><span class="p">:</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]</span> <span class="o">=</span> <span class="p">{}</span>
+</span><span id="demi_cycle_loss-72"><a href="#demi_cycle_loss-72"><span class="linenos">72</span></a>    <span class="k">for</span> <span class="n">domains</span><span class="p">,</span> <span class="n">latents</span> <span class="ow">in</span> <span class="n">latent_domains</span><span class="o">.</span><span class="n">items</span><span class="p">():</span>
+</span><span id="demi_cycle_loss-73"><a href="#demi_cycle_loss-73"><span class="linenos">73</span></a>        <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">domains</span><span class="p">)</span> <span class="o">&gt;</span> <span class="mi">1</span><span class="p">:</span>
+</span><span id="demi_cycle_loss-74"><a href="#demi_cycle_loss-74"><span class="linenos">74</span></a>            <span class="k">continue</span>
+</span><span id="demi_cycle_loss-75"><a href="#demi_cycle_loss-75"><span class="linenos">75</span></a>        <span class="n">domain_name</span> <span class="o">=</span> <span class="nb">next</span><span class="p">(</span><span class="nb">iter</span><span class="p">(</span><span class="n">domains</span><span class="p">))</span>
+</span><span id="demi_cycle_loss-76"><a href="#demi_cycle_loss-76"><span class="linenos">76</span></a>
+</span><span id="demi_cycle_loss-77"><a href="#demi_cycle_loss-77"><span class="linenos">77</span></a>        <span class="n">domain_mod</span> <span class="o">=</span> <span class="n">domain_mods</span><span class="p">[</span><span class="n">domain_name</span><span class="p">]</span>
+</span><span id="demi_cycle_loss-78"><a href="#demi_cycle_loss-78"><span class="linenos">78</span></a>        <span class="n">x_recons</span> <span class="o">=</span> <span class="n">gw_mod</span><span class="o">.</span><span class="n">decode</span><span class="p">(</span>
+</span><span id="demi_cycle_loss-79"><a href="#demi_cycle_loss-79"><span class="linenos">79</span></a>            <span class="n">gw_mod</span><span class="o">.</span><span class="n">encode_and_fuse</span><span class="p">(</span><span class="n">latents</span><span class="p">,</span> <span class="n">selection_mod</span><span class="p">),</span> <span class="n">domains</span><span class="o">=</span><span class="p">{</span><span class="n">domain_name</span><span class="p">}</span>
+</span><span id="demi_cycle_loss-80"><a href="#demi_cycle_loss-80"><span class="linenos">80</span></a>        <span class="p">)[</span><span class="n">domain_name</span><span class="p">]</span>
+</span><span id="demi_cycle_loss-81"><a href="#demi_cycle_loss-81"><span class="linenos">81</span></a>        <span class="n">loss_output</span> <span class="o">=</span> <span class="n">domain_mod</span><span class="o">.</span><span class="n">compute_dcy_loss</span><span class="p">(</span><span class="n">x_recons</span><span class="p">,</span> <span class="n">latents</span><span class="p">[</span><span class="n">domain_name</span><span class="p">])</span>
+</span><span id="demi_cycle_loss-82"><a href="#demi_cycle_loss-82"><span class="linenos">82</span></a>        <span class="n">losses</span><span class="p">[</span><span class="sa">f</span><span class="s2">&quot;demi_cycle_</span><span class="si">{</span><span class="n">domain_name</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="n">loss_output</span><span class="o">.</span><span class="n">loss</span>
+</span><span id="demi_cycle_loss-83"><a href="#demi_cycle_loss-83"><span class="linenos">83</span></a>        <span class="n">metrics</span><span class="o">.</span><span class="n">update</span><span class="p">(</span>
+</span><span id="demi_cycle_loss-84"><a href="#demi_cycle_loss-84"><span class="linenos">84</span></a>            <span class="p">{</span><span class="sa">f</span><span class="s2">&quot;demi_cycle_</span><span class="si">{</span><span class="n">domain_name</span><span class="si">}</span><span class="s2">_</span><span class="si">{</span><span class="n">k</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">:</span> <span class="n">v</span> <span class="k">for</span> <span class="n">k</span><span class="p">,</span> <span class="n">v</span> <span class="ow">in</span> <span class="n">loss_output</span><span class="o">.</span><span class="n">metrics</span><span class="o">.</span><span class="n">items</span><span class="p">()}</span>
+</span><span id="demi_cycle_loss-85"><a href="#demi_cycle_loss-85"><span class="linenos">85</span></a>        <span class="p">)</span>
+</span><span id="demi_cycle_loss-86"><a href="#demi_cycle_loss-86"><span class="linenos">86</span></a>    <span class="n">losses</span><span class="p">[</span><span class="s2">&quot;demi_cycles&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">stack</span><span class="p">(</span><span class="nb">list</span><span class="p">(</span><span class="n">losses</span><span class="o">.</span><span class="n">values</span><span class="p">()),</span> <span class="n">dim</span><span class="o">=</span><span class="mi">0</span><span class="p">)</span><span class="o">.</span><span class="n">mean</span><span class="p">()</span>
+</span><span id="demi_cycle_loss-87"><a href="#demi_cycle_loss-87"><span class="linenos">87</span></a>    <span class="n">losses</span><span class="o">.</span><span class="n">update</span><span class="p">(</span><span class="n">metrics</span><span class="p">)</span>
+</span><span id="demi_cycle_loss-88"><a href="#demi_cycle_loss-88"><span class="linenos">88</span></a>    <span class="k">return</span> <span class="n">losses</span>
+</span></pre></div>
+
+
+            <div class="docstring"><p>Computes the demi-cycle loss.</p>
+
+<h6 id="this-return-multiple-metrics">This return multiple metrics:</h6>
+
+<blockquote>
+  <ul>
+  <li><code>demi_cycle_{domain_name}</code> with the demi-cycle of a particular domain;</li>
+  <li><code>demi_cycle_{domain_name}_{metric}</code> with additional metrics provided by
+  the domain_mod's <code>compute_dcy_loss</code> output;</li>
+  <li><code>demi_cycles</code> with the average value of all <code>demi_cycle_{domain_name}</code> values.</li>
+  </ul>
+</blockquote>
+
+<h6 id="arguments">Arguments:</h6>
+
+<ul>
+<li><strong>gw_mod (<code><a href="gw_module.html#GWModuleBase">shimmer.modules.gw_module.GWModuleBase</a></code>):</strong>  The GWModule to use</li>
+<li><strong>selection_mod (<code><a href="selection.html#SelectionBase">shimmer.modules.selection.SelectionBase</a></code>):</strong>  Selection mod to use</li>
+<li><strong>domain_mods (<code>Mapping[str, DomainModule]</code>):</strong>  the domain modules</li>
+<li><strong>latent_domains (<code><a href="../types.html#LatentsDomainGroupsT">shimmer.types.LatentsDomainGroupsT</a></code>):</strong>  the latent unimodal
+groups</li>
+</ul>
+
+<h6 id="returns">Returns:</h6>
+
+<blockquote>
+  <p><code>dict[str, torch.Tensor]</code>: a dict of metrics.</p>
+</blockquote>
+</div>
+
+
+                </section>
+                <section id="cycle_loss">
+                            <input id="cycle_loss-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
+<div class="attr function">
+            
+        <span class="def">def</span>
+        <span class="name">cycle_loss</span><span class="signature pdoc-code multiline">(<span class="param">	<span class="n">gw_mod</span><span class="p">:</span> <span class="n"><a href="gw_module.html#GWModuleBase">shimmer.modules.gw_module.GWModuleBase</a></span>,</span><span class="param">	<span class="n">selection_mod</span><span class="p">:</span> <span class="n"><a href="selection.html#SelectionBase">shimmer.modules.selection.SelectionBase</a></span>,</span><span class="param">	<span class="n">domain_mods</span><span class="p">:</span> <span class="n">collections</span><span class="o">.</span><span class="n">abc</span><span class="o">.</span><span class="n">Mapping</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n"><a href="domain.html#DomainModule">shimmer.modules.domain.DomainModule</a></span><span class="p">]</span>,</span><span class="param">	<span class="n">latent_domains</span><span class="p">:</span> <span class="n">collections</span><span class="o">.</span><span class="n">abc</span><span class="o">.</span><span class="n">Mapping</span><span class="p">[</span><span class="nb">frozenset</span><span class="p">[</span><span class="nb">str</span><span class="p">],</span> <span class="n">collections</span><span class="o">.</span><span class="n">abc</span><span class="o">.</span><span class="n">Mapping</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]]</span></span><span class="return-annotation">) -> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]</span>:</span></span>
+
+                <label class="view-source-button" for="cycle_loss-view-source"><span>View Source</span></label>
+
+    </div>
+    <a class="headerlink" href="#cycle_loss"></a>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="cycle_loss-91"><a href="#cycle_loss-91"><span class="linenos"> 91</span></a><span class="k">def</span> <span class="nf">cycle_loss</span><span class="p">(</span>
+</span><span id="cycle_loss-92"><a href="#cycle_loss-92"><span class="linenos"> 92</span></a>    <span class="n">gw_mod</span><span class="p">:</span> <span class="n">GWModuleBase</span><span class="p">,</span>
+</span><span id="cycle_loss-93"><a href="#cycle_loss-93"><span class="linenos"> 93</span></a>    <span class="n">selection_mod</span><span class="p">:</span> <span class="n">SelectionBase</span><span class="p">,</span>
+</span><span id="cycle_loss-94"><a href="#cycle_loss-94"><span class="linenos"> 94</span></a>    <span class="n">domain_mods</span><span class="p">:</span> <span class="n">Mapping</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">DomainModule</span><span class="p">],</span>
+</span><span id="cycle_loss-95"><a href="#cycle_loss-95"><span class="linenos"> 95</span></a>    <span class="n">latent_domains</span><span class="p">:</span> <span class="n">LatentsDomainGroupsT</span><span class="p">,</span>
+</span><span id="cycle_loss-96"><a href="#cycle_loss-96"><span class="linenos"> 96</span></a><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]:</span>
+</span><span id="cycle_loss-97"><a href="#cycle_loss-97"><span class="linenos"> 97</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="cycle_loss-98"><a href="#cycle_loss-98"><span class="linenos"> 98</span></a><span class="sd">    Computes the cycle loss.</span>
+</span><span id="cycle_loss-99"><a href="#cycle_loss-99"><span class="linenos"> 99</span></a>
+</span><span id="cycle_loss-100"><a href="#cycle_loss-100"><span class="linenos">100</span></a><span class="sd">    This return multiple metrics:</span>
+</span><span id="cycle_loss-101"><a href="#cycle_loss-101"><span class="linenos">101</span></a><span class="sd">        * `cycle_{domain_source}_through_{domain_target}` with the cycle of</span>
+</span><span id="cycle_loss-102"><a href="#cycle_loss-102"><span class="linenos">102</span></a><span class="sd">            a particular domain;</span>
+</span><span id="cycle_loss-103"><a href="#cycle_loss-103"><span class="linenos">103</span></a><span class="sd">        * `cycle_{domain_source}_through_{domain_target}_{metric}` with additional</span>
+</span><span id="cycle_loss-104"><a href="#cycle_loss-104"><span class="linenos">104</span></a><span class="sd">            metrics provided by the domain_mod&#39;s `compute_cy_loss` output;</span>
+</span><span id="cycle_loss-105"><a href="#cycle_loss-105"><span class="linenos">105</span></a><span class="sd">        * `cycles` with the average value of all</span>
+</span><span id="cycle_loss-106"><a href="#cycle_loss-106"><span class="linenos">106</span></a><span class="sd">            `cycle_{domain_source}_through_{domain_target}` values.</span>
+</span><span id="cycle_loss-107"><a href="#cycle_loss-107"><span class="linenos">107</span></a>
+</span><span id="cycle_loss-108"><a href="#cycle_loss-108"><span class="linenos">108</span></a><span class="sd">    Args:</span>
+</span><span id="cycle_loss-109"><a href="#cycle_loss-109"><span class="linenos">109</span></a><span class="sd">        gw_mod (`GWModuleBase`): The GWModule to use</span>
+</span><span id="cycle_loss-110"><a href="#cycle_loss-110"><span class="linenos">110</span></a><span class="sd">        selection_mod (`shimmer.modules.selection.SelectionBase`): Selection mod to use</span>
+</span><span id="cycle_loss-111"><a href="#cycle_loss-111"><span class="linenos">111</span></a><span class="sd">        domain_mods (`Mapping[str, DomainModule]`): the domain modules</span>
+</span><span id="cycle_loss-112"><a href="#cycle_loss-112"><span class="linenos">112</span></a><span class="sd">        latent_domains (`LatentsDomainGroupsT`): the latent unimodal groups</span>
+</span><span id="cycle_loss-113"><a href="#cycle_loss-113"><span class="linenos">113</span></a>
+</span><span id="cycle_loss-114"><a href="#cycle_loss-114"><span class="linenos">114</span></a><span class="sd">    Returns:</span>
+</span><span id="cycle_loss-115"><a href="#cycle_loss-115"><span class="linenos">115</span></a><span class="sd">        `dict[str, torch.Tensor]`: a dict of metrics.</span>
+</span><span id="cycle_loss-116"><a href="#cycle_loss-116"><span class="linenos">116</span></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="cycle_loss-117"><a href="#cycle_loss-117"><span class="linenos">117</span></a>    <span class="n">losses</span><span class="p">:</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]</span> <span class="o">=</span> <span class="p">{}</span>
+</span><span id="cycle_loss-118"><a href="#cycle_loss-118"><span class="linenos">118</span></a>    <span class="n">metrics</span><span class="p">:</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]</span> <span class="o">=</span> <span class="p">{}</span>
+</span><span id="cycle_loss-119"><a href="#cycle_loss-119"><span class="linenos">119</span></a>    <span class="k">for</span> <span class="n">domains_source</span><span class="p">,</span> <span class="n">latents_source</span> <span class="ow">in</span> <span class="n">latent_domains</span><span class="o">.</span><span class="n">items</span><span class="p">():</span>
+</span><span id="cycle_loss-120"><a href="#cycle_loss-120"><span class="linenos">120</span></a>        <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">domains_source</span><span class="p">)</span> <span class="o">&gt;</span> <span class="mi">1</span><span class="p">:</span>
+</span><span id="cycle_loss-121"><a href="#cycle_loss-121"><span class="linenos">121</span></a>            <span class="k">continue</span>
+</span><span id="cycle_loss-122"><a href="#cycle_loss-122"><span class="linenos">122</span></a>        <span class="n">domain_name_source</span> <span class="o">=</span> <span class="nb">list</span><span class="p">(</span><span class="n">domains_source</span><span class="p">)[</span><span class="mi">0</span><span class="p">]</span>
+</span><span id="cycle_loss-123"><a href="#cycle_loss-123"><span class="linenos">123</span></a>
+</span><span id="cycle_loss-124"><a href="#cycle_loss-124"><span class="linenos">124</span></a>        <span class="n">domain_mod</span> <span class="o">=</span> <span class="n">domain_mods</span><span class="p">[</span><span class="n">domain_name_source</span><span class="p">]</span>
+</span><span id="cycle_loss-125"><a href="#cycle_loss-125"><span class="linenos">125</span></a>        <span class="n">z</span> <span class="o">=</span> <span class="n">gw_mod</span><span class="o">.</span><span class="n">encode_and_fuse</span><span class="p">(</span><span class="n">latents_source</span><span class="p">,</span> <span class="n">selection_mod</span><span class="p">)</span>
+</span><span id="cycle_loss-126"><a href="#cycle_loss-126"><span class="linenos">126</span></a>        <span class="k">for</span> <span class="n">domain_name_target</span> <span class="ow">in</span> <span class="n">domain_mods</span><span class="p">:</span>
+</span><span id="cycle_loss-127"><a href="#cycle_loss-127"><span class="linenos">127</span></a>            <span class="k">if</span> <span class="n">domain_name_target</span> <span class="o">==</span> <span class="n">domain_name_source</span><span class="p">:</span>
+</span><span id="cycle_loss-128"><a href="#cycle_loss-128"><span class="linenos">128</span></a>                <span class="k">continue</span>
+</span><span id="cycle_loss-129"><a href="#cycle_loss-129"><span class="linenos">129</span></a>
+</span><span id="cycle_loss-130"><a href="#cycle_loss-130"><span class="linenos">130</span></a>            <span class="n">x_pred</span> <span class="o">=</span> <span class="n">gw_mod</span><span class="o">.</span><span class="n">decode</span><span class="p">(</span><span class="n">z</span><span class="p">,</span> <span class="n">domains</span><span class="o">=</span><span class="p">{</span><span class="n">domain_name_target</span><span class="p">})</span>
+</span><span id="cycle_loss-131"><a href="#cycle_loss-131"><span class="linenos">131</span></a>
+</span><span id="cycle_loss-132"><a href="#cycle_loss-132"><span class="linenos">132</span></a>            <span class="n">x_recons</span> <span class="o">=</span> <span class="n">gw_mod</span><span class="o">.</span><span class="n">decode</span><span class="p">(</span>
+</span><span id="cycle_loss-133"><a href="#cycle_loss-133"><span class="linenos">133</span></a>                <span class="n">gw_mod</span><span class="o">.</span><span class="n">encode_and_fuse</span><span class="p">(</span><span class="n">x_pred</span><span class="p">,</span> <span class="n">selection_mod</span><span class="p">),</span>
+</span><span id="cycle_loss-134"><a href="#cycle_loss-134"><span class="linenos">134</span></a>                <span class="n">domains</span><span class="o">=</span><span class="p">{</span><span class="n">domain_name_source</span><span class="p">},</span>
+</span><span id="cycle_loss-135"><a href="#cycle_loss-135"><span class="linenos">135</span></a>            <span class="p">)</span>
+</span><span id="cycle_loss-136"><a href="#cycle_loss-136"><span class="linenos">136</span></a>
+</span><span id="cycle_loss-137"><a href="#cycle_loss-137"><span class="linenos">137</span></a>            <span class="n">loss_name</span> <span class="o">=</span> <span class="sa">f</span><span class="s2">&quot;</span><span class="si">{</span><span class="n">domain_name_source</span><span class="si">}</span><span class="s2">_through_</span><span class="si">{</span><span class="n">domain_name_target</span><span class="si">}</span><span class="s2">&quot;</span>
+</span><span id="cycle_loss-138"><a href="#cycle_loss-138"><span class="linenos">138</span></a>            <span class="n">loss_output</span> <span class="o">=</span> <span class="n">domain_mod</span><span class="o">.</span><span class="n">compute_cy_loss</span><span class="p">(</span>
+</span><span id="cycle_loss-139"><a href="#cycle_loss-139"><span class="linenos">139</span></a>                <span class="n">x_recons</span><span class="p">[</span><span class="n">domain_name_source</span><span class="p">],</span>
+</span><span id="cycle_loss-140"><a href="#cycle_loss-140"><span class="linenos">140</span></a>                <span class="n">latents_source</span><span class="p">[</span><span class="n">domain_name_source</span><span class="p">],</span>
+</span><span id="cycle_loss-141"><a href="#cycle_loss-141"><span class="linenos">141</span></a>            <span class="p">)</span>
+</span><span id="cycle_loss-142"><a href="#cycle_loss-142"><span class="linenos">142</span></a>            <span class="n">metrics</span><span class="o">.</span><span class="n">update</span><span class="p">(</span>
+</span><span id="cycle_loss-143"><a href="#cycle_loss-143"><span class="linenos">143</span></a>                <span class="p">{</span><span class="sa">f</span><span class="s2">&quot;cycle_</span><span class="si">{</span><span class="n">loss_name</span><span class="si">}</span><span class="s2">_</span><span class="si">{</span><span class="n">k</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">:</span> <span class="n">v</span> <span class="k">for</span> <span class="n">k</span><span class="p">,</span> <span class="n">v</span> <span class="ow">in</span> <span class="n">loss_output</span><span class="o">.</span><span class="n">metrics</span><span class="o">.</span><span class="n">items</span><span class="p">()}</span>
+</span><span id="cycle_loss-144"><a href="#cycle_loss-144"><span class="linenos">144</span></a>            <span class="p">)</span>
+</span><span id="cycle_loss-145"><a href="#cycle_loss-145"><span class="linenos">145</span></a>            <span class="n">losses</span><span class="p">[</span><span class="sa">f</span><span class="s2">&quot;cycle_</span><span class="si">{</span><span class="n">loss_name</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="n">loss_output</span><span class="o">.</span><span class="n">loss</span>
+</span><span id="cycle_loss-146"><a href="#cycle_loss-146"><span class="linenos">146</span></a>    <span class="n">losses</span><span class="p">[</span><span class="s2">&quot;cycles&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">stack</span><span class="p">(</span><span class="nb">list</span><span class="p">(</span><span class="n">losses</span><span class="o">.</span><span class="n">values</span><span class="p">()),</span> <span class="n">dim</span><span class="o">=</span><span class="mi">0</span><span class="p">)</span><span class="o">.</span><span class="n">mean</span><span class="p">()</span>
+</span><span id="cycle_loss-147"><a href="#cycle_loss-147"><span class="linenos">147</span></a>    <span class="n">losses</span><span class="o">.</span><span class="n">update</span><span class="p">(</span><span class="n">metrics</span><span class="p">)</span>
+</span><span id="cycle_loss-148"><a href="#cycle_loss-148"><span class="linenos">148</span></a>    <span class="k">return</span> <span class="n">losses</span>
+</span></pre></div>
+
+
+            <div class="docstring"><p>Computes the cycle loss.</p>
+
+<h6 id="this-return-multiple-metrics">This return multiple metrics:</h6>
+
+<blockquote>
+  <ul>
+  <li><code>cycle_{domain_source}_through_{domain_target}</code> with the cycle of
+  a particular domain;</li>
+  <li><code>cycle_{domain_source}_through_{domain_target}_{metric}</code> with additional
+  metrics provided by the domain_mod's <code>compute_cy_loss</code> output;</li>
+  <li><code>cycles</code> with the average value of all
+  <code>cycle_{domain_source}_through_{domain_target}</code> values.</li>
+  </ul>
+</blockquote>
+
+<h6 id="arguments">Arguments:</h6>
+
+<ul>
+<li><strong>gw_mod (<code>GWModuleBase</code>):</strong>  The GWModule to use</li>
+<li><strong>selection_mod (<code><a href="selection.html#SelectionBase">shimmer.modules.selection.SelectionBase</a></code>):</strong>  Selection mod to use</li>
+<li><strong>domain_mods (<code>Mapping[str, DomainModule]</code>):</strong>  the domain modules</li>
+<li><strong>latent_domains (<code>LatentsDomainGroupsT</code>):</strong>  the latent unimodal groups</li>
+</ul>
+
+<h6 id="returns">Returns:</h6>
+
+<blockquote>
+  <p><code>dict[str, torch.Tensor]</code>: a dict of metrics.</p>
+</blockquote>
+</div>
+
+
+                </section>
+                <section id="translation_loss">
+                            <input id="translation_loss-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
+<div class="attr function">
+            
+        <span class="def">def</span>
+        <span class="name">translation_loss</span><span class="signature pdoc-code multiline">(<span class="param">	<span class="n">gw_mod</span><span class="p">:</span> <span class="n"><a href="gw_module.html#GWModuleBase">shimmer.modules.gw_module.GWModuleBase</a></span>,</span><span class="param">	<span class="n">selection_mod</span><span class="p">:</span> <span class="n"><a href="selection.html#SelectionBase">shimmer.modules.selection.SelectionBase</a></span>,</span><span class="param">	<span class="n">domain_mods</span><span class="p">:</span> <span class="n">collections</span><span class="o">.</span><span class="n">abc</span><span class="o">.</span><span class="n">Mapping</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n"><a href="domain.html#DomainModule">shimmer.modules.domain.DomainModule</a></span><span class="p">]</span>,</span><span class="param">	<span class="n">latent_domains</span><span class="p">:</span> <span class="n">collections</span><span class="o">.</span><span class="n">abc</span><span class="o">.</span><span class="n">Mapping</span><span class="p">[</span><span class="nb">frozenset</span><span class="p">[</span><span class="nb">str</span><span class="p">],</span> <span class="n">collections</span><span class="o">.</span><span class="n">abc</span><span class="o">.</span><span class="n">Mapping</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]]</span></span><span class="return-annotation">) -> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]</span>:</span></span>
+
+                <label class="view-source-button" for="translation_loss-view-source"><span>View Source</span></label>
+
+    </div>
+    <a class="headerlink" href="#translation_loss"></a>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="translation_loss-151"><a href="#translation_loss-151"><span class="linenos">151</span></a><span class="k">def</span> <span class="nf">translation_loss</span><span class="p">(</span>
+</span><span id="translation_loss-152"><a href="#translation_loss-152"><span class="linenos">152</span></a>    <span class="n">gw_mod</span><span class="p">:</span> <span class="n">GWModuleBase</span><span class="p">,</span>
+</span><span id="translation_loss-153"><a href="#translation_loss-153"><span class="linenos">153</span></a>    <span class="n">selection_mod</span><span class="p">:</span> <span class="n">SelectionBase</span><span class="p">,</span>
+</span><span id="translation_loss-154"><a href="#translation_loss-154"><span class="linenos">154</span></a>    <span class="n">domain_mods</span><span class="p">:</span> <span class="n">Mapping</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">DomainModule</span><span class="p">],</span>
+</span><span id="translation_loss-155"><a href="#translation_loss-155"><span class="linenos">155</span></a>    <span class="n">latent_domains</span><span class="p">:</span> <span class="n">LatentsDomainGroupsT</span><span class="p">,</span>
+</span><span id="translation_loss-156"><a href="#translation_loss-156"><span class="linenos">156</span></a><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]:</span>
+</span><span id="translation_loss-157"><a href="#translation_loss-157"><span class="linenos">157</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="translation_loss-158"><a href="#translation_loss-158"><span class="linenos">158</span></a><span class="sd">    Computes the translation loss.</span>
+</span><span id="translation_loss-159"><a href="#translation_loss-159"><span class="linenos">159</span></a>
+</span><span id="translation_loss-160"><a href="#translation_loss-160"><span class="linenos">160</span></a><span class="sd">    This return multiple metrics:</span>
+</span><span id="translation_loss-161"><a href="#translation_loss-161"><span class="linenos">161</span></a><span class="sd">        * `translation_{domain_source}_to_{domain_target}` with the translation</span>
+</span><span id="translation_loss-162"><a href="#translation_loss-162"><span class="linenos">162</span></a><span class="sd">            from a domain source to a domain target;</span>
+</span><span id="translation_loss-163"><a href="#translation_loss-163"><span class="linenos">163</span></a><span class="sd">        * `translation_{domain_source}_to_{domain_target}_{metric}` with</span>
+</span><span id="translation_loss-164"><a href="#translation_loss-164"><span class="linenos">164</span></a><span class="sd">            additional metrics provided by the domain_mod&#39;s</span>
+</span><span id="translation_loss-165"><a href="#translation_loss-165"><span class="linenos">165</span></a><span class="sd">            `compute_tr_loss` output;</span>
+</span><span id="translation_loss-166"><a href="#translation_loss-166"><span class="linenos">166</span></a><span class="sd">        * `translations` with the average value of all</span>
+</span><span id="translation_loss-167"><a href="#translation_loss-167"><span class="linenos">167</span></a><span class="sd">            `translation_{domain_source}_to_{domain_target}` values.</span>
+</span><span id="translation_loss-168"><a href="#translation_loss-168"><span class="linenos">168</span></a>
+</span><span id="translation_loss-169"><a href="#translation_loss-169"><span class="linenos">169</span></a><span class="sd">    Args:</span>
+</span><span id="translation_loss-170"><a href="#translation_loss-170"><span class="linenos">170</span></a><span class="sd">        gw_mod (`GWModuleBase`): The GWModule to use</span>
+</span><span id="translation_loss-171"><a href="#translation_loss-171"><span class="linenos">171</span></a><span class="sd">        domain_mods (`Mapping[str, DomainModule]`): the domain modules</span>
+</span><span id="translation_loss-172"><a href="#translation_loss-172"><span class="linenos">172</span></a><span class="sd">        latent_domains (`LatentsDomainGroupsT`): the latent unimodal groups</span>
+</span><span id="translation_loss-173"><a href="#translation_loss-173"><span class="linenos">173</span></a>
+</span><span id="translation_loss-174"><a href="#translation_loss-174"><span class="linenos">174</span></a><span class="sd">    Returns:</span>
+</span><span id="translation_loss-175"><a href="#translation_loss-175"><span class="linenos">175</span></a><span class="sd">        `dict[str, torch.Tensor]`: a dict of metrics.</span>
+</span><span id="translation_loss-176"><a href="#translation_loss-176"><span class="linenos">176</span></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="translation_loss-177"><a href="#translation_loss-177"><span class="linenos">177</span></a>    <span class="n">losses</span><span class="p">:</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]</span> <span class="o">=</span> <span class="p">{}</span>
+</span><span id="translation_loss-178"><a href="#translation_loss-178"><span class="linenos">178</span></a>    <span class="n">metrics</span><span class="p">:</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]</span> <span class="o">=</span> <span class="p">{}</span>
+</span><span id="translation_loss-179"><a href="#translation_loss-179"><span class="linenos">179</span></a>    <span class="k">for</span> <span class="n">domains</span><span class="p">,</span> <span class="n">latents</span> <span class="ow">in</span> <span class="n">latent_domains</span><span class="o">.</span><span class="n">items</span><span class="p">():</span>
+</span><span id="translation_loss-180"><a href="#translation_loss-180"><span class="linenos">180</span></a>        <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">domains</span><span class="p">)</span> <span class="o">&lt;</span> <span class="mi">2</span><span class="p">:</span>
+</span><span id="translation_loss-181"><a href="#translation_loss-181"><span class="linenos">181</span></a>            <span class="k">continue</span>
+</span><span id="translation_loss-182"><a href="#translation_loss-182"><span class="linenos">182</span></a>        <span class="k">for</span> <span class="n">domain_name_target</span> <span class="ow">in</span> <span class="n">domains</span><span class="p">:</span>
+</span><span id="translation_loss-183"><a href="#translation_loss-183"><span class="linenos">183</span></a>            <span class="n">domain_sources</span> <span class="o">=</span> <span class="p">{</span>
+</span><span id="translation_loss-184"><a href="#translation_loss-184"><span class="linenos">184</span></a>                <span class="n">domain</span><span class="p">:</span> <span class="n">latents</span><span class="p">[</span><span class="n">domain</span><span class="p">]</span>
+</span><span id="translation_loss-185"><a href="#translation_loss-185"><span class="linenos">185</span></a>                <span class="k">for</span> <span class="n">domain</span> <span class="ow">in</span> <span class="n">domains</span>
+</span><span id="translation_loss-186"><a href="#translation_loss-186"><span class="linenos">186</span></a>                <span class="k">if</span> <span class="n">domain</span> <span class="o">!=</span> <span class="n">domain_name_target</span>
+</span><span id="translation_loss-187"><a href="#translation_loss-187"><span class="linenos">187</span></a>            <span class="p">}</span>
+</span><span id="translation_loss-188"><a href="#translation_loss-188"><span class="linenos">188</span></a>
+</span><span id="translation_loss-189"><a href="#translation_loss-189"><span class="linenos">189</span></a>            <span class="n">z</span> <span class="o">=</span> <span class="n">gw_mod</span><span class="o">.</span><span class="n">encode_and_fuse</span><span class="p">(</span><span class="n">domain_sources</span><span class="p">,</span> <span class="n">selection_mod</span><span class="p">)</span>
+</span><span id="translation_loss-190"><a href="#translation_loss-190"><span class="linenos">190</span></a>            <span class="n">mod</span> <span class="o">=</span> <span class="n">domain_mods</span><span class="p">[</span><span class="n">domain_name_target</span><span class="p">]</span>
+</span><span id="translation_loss-191"><a href="#translation_loss-191"><span class="linenos">191</span></a>
+</span><span id="translation_loss-192"><a href="#translation_loss-192"><span class="linenos">192</span></a>            <span class="n">domain_source_names</span> <span class="o">=</span> <span class="s2">&quot;/&quot;</span><span class="o">.</span><span class="n">join</span><span class="p">(</span><span class="n">domain_sources</span><span class="o">.</span><span class="n">keys</span><span class="p">())</span>
+</span><span id="translation_loss-193"><a href="#translation_loss-193"><span class="linenos">193</span></a>            <span class="n">loss_name</span> <span class="o">=</span> <span class="sa">f</span><span class="s2">&quot;</span><span class="si">{</span><span class="n">domain_source_names</span><span class="si">}</span><span class="s2">_to_</span><span class="si">{</span><span class="n">domain_name_target</span><span class="si">}</span><span class="s2">&quot;</span>
+</span><span id="translation_loss-194"><a href="#translation_loss-194"><span class="linenos">194</span></a>            <span class="k">if</span> <span class="n">loss_name</span> <span class="ow">in</span> <span class="n">losses</span><span class="p">:</span>
+</span><span id="translation_loss-195"><a href="#translation_loss-195"><span class="linenos">195</span></a>                <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;</span><span class="si">{</span><span class="n">loss_name</span><span class="si">}</span><span class="s2"> is already computed.&quot;</span><span class="p">)</span>
+</span><span id="translation_loss-196"><a href="#translation_loss-196"><span class="linenos">196</span></a>
+</span><span id="translation_loss-197"><a href="#translation_loss-197"><span class="linenos">197</span></a>            <span class="n">prediction</span> <span class="o">=</span> <span class="n">gw_mod</span><span class="o">.</span><span class="n">decode</span><span class="p">(</span><span class="n">z</span><span class="p">,</span> <span class="n">domains</span><span class="o">=</span><span class="p">{</span><span class="n">domain_name_target</span><span class="p">})[</span>
+</span><span id="translation_loss-198"><a href="#translation_loss-198"><span class="linenos">198</span></a>                <span class="n">domain_name_target</span>
+</span><span id="translation_loss-199"><a href="#translation_loss-199"><span class="linenos">199</span></a>            <span class="p">]</span>
+</span><span id="translation_loss-200"><a href="#translation_loss-200"><span class="linenos">200</span></a>            <span class="n">loss_output</span> <span class="o">=</span> <span class="n">mod</span><span class="o">.</span><span class="n">compute_tr_loss</span><span class="p">(</span>
+</span><span id="translation_loss-201"><a href="#translation_loss-201"><span class="linenos">201</span></a>                <span class="n">prediction</span><span class="p">,</span>
+</span><span id="translation_loss-202"><a href="#translation_loss-202"><span class="linenos">202</span></a>                <span class="n">latents</span><span class="p">[</span><span class="n">domain_name_target</span><span class="p">],</span>
+</span><span id="translation_loss-203"><a href="#translation_loss-203"><span class="linenos">203</span></a>            <span class="p">)</span>
+</span><span id="translation_loss-204"><a href="#translation_loss-204"><span class="linenos">204</span></a>            <span class="n">losses</span><span class="p">[</span><span class="sa">f</span><span class="s2">&quot;translation_</span><span class="si">{</span><span class="n">loss_name</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="n">loss_output</span><span class="o">.</span><span class="n">loss</span>
+</span><span id="translation_loss-205"><a href="#translation_loss-205"><span class="linenos">205</span></a>            <span class="n">metrics</span><span class="o">.</span><span class="n">update</span><span class="p">(</span>
+</span><span id="translation_loss-206"><a href="#translation_loss-206"><span class="linenos">206</span></a>                <span class="p">{</span>
+</span><span id="translation_loss-207"><a href="#translation_loss-207"><span class="linenos">207</span></a>                    <span class="sa">f</span><span class="s2">&quot;translation_</span><span class="si">{</span><span class="n">loss_name</span><span class="si">}</span><span class="s2">_</span><span class="si">{</span><span class="n">k</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">:</span> <span class="n">v</span>
+</span><span id="translation_loss-208"><a href="#translation_loss-208"><span class="linenos">208</span></a>                    <span class="k">for</span> <span class="n">k</span><span class="p">,</span> <span class="n">v</span> <span class="ow">in</span> <span class="n">loss_output</span><span class="o">.</span><span class="n">metrics</span><span class="o">.</span><span class="n">items</span><span class="p">()</span>
+</span><span id="translation_loss-209"><a href="#translation_loss-209"><span class="linenos">209</span></a>                <span class="p">}</span>
+</span><span id="translation_loss-210"><a href="#translation_loss-210"><span class="linenos">210</span></a>            <span class="p">)</span>
+</span><span id="translation_loss-211"><a href="#translation_loss-211"><span class="linenos">211</span></a>    <span class="n">losses</span><span class="p">[</span><span class="s2">&quot;translations&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">stack</span><span class="p">(</span><span class="nb">list</span><span class="p">(</span><span class="n">losses</span><span class="o">.</span><span class="n">values</span><span class="p">()),</span> <span class="n">dim</span><span class="o">=</span><span class="mi">0</span><span class="p">)</span><span class="o">.</span><span class="n">mean</span><span class="p">()</span>
+</span><span id="translation_loss-212"><a href="#translation_loss-212"><span class="linenos">212</span></a>    <span class="n">losses</span><span class="o">.</span><span class="n">update</span><span class="p">(</span><span class="n">metrics</span><span class="p">)</span>
+</span><span id="translation_loss-213"><a href="#translation_loss-213"><span class="linenos">213</span></a>    <span class="k">return</span> <span class="n">losses</span>
+</span></pre></div>
+
+
+            <div class="docstring"><p>Computes the translation loss.</p>
+
+<h6 id="this-return-multiple-metrics">This return multiple metrics:</h6>
+
+<blockquote>
+  <ul>
+  <li><code>translation_{domain_source}_to_{domain_target}</code> with the translation
+  from a domain source to a domain target;</li>
+  <li><code>translation_{domain_source}_to_{domain_target}_{metric}</code> with
+  additional metrics provided by the domain_mod's
+  <code>compute_tr_loss</code> output;</li>
+  <li><code>translations</code> with the average value of all
+  <code>translation_{domain_source}_to_{domain_target}</code> values.</li>
+  </ul>
+</blockquote>
+
+<h6 id="arguments">Arguments:</h6>
+
+<ul>
+<li><strong>gw_mod (<code>GWModuleBase</code>):</strong>  The GWModule to use</li>
+<li><strong>domain_mods (<code>Mapping[str, DomainModule]</code>):</strong>  the domain modules</li>
+<li><strong>latent_domains (<code>LatentsDomainGroupsT</code>):</strong>  the latent unimodal groups</li>
+</ul>
+
+<h6 id="returns">Returns:</h6>
+
+<blockquote>
+  <p><code>dict[str, torch.Tensor]</code>: a dict of metrics.</p>
+</blockquote>
+</div>
+
+
+                </section>
+                <section id="contrastive_loss">
+                            <input id="contrastive_loss-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
+<div class="attr function">
+            
+        <span class="def">def</span>
+        <span class="name">contrastive_loss</span><span class="signature pdoc-code multiline">(<span class="param">	<span class="n">gw_mod</span><span class="p">:</span> <span class="n"><a href="gw_module.html#GWModuleBase">shimmer.modules.gw_module.GWModuleBase</a></span>,</span><span class="param">	<span class="n">latent_domains</span><span class="p">:</span> <span class="n">collections</span><span class="o">.</span><span class="n">abc</span><span class="o">.</span><span class="n">Mapping</span><span class="p">[</span><span class="nb">frozenset</span><span class="p">[</span><span class="nb">str</span><span class="p">],</span> <span class="n">collections</span><span class="o">.</span><span class="n">abc</span><span class="o">.</span><span class="n">Mapping</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]]</span>,</span><span class="param">	<span class="n">contrastive_fn</span><span class="p">:</span> <span class="n">collections</span><span class="o">.</span><span class="n">abc</span><span class="o">.</span><span class="n">Callable</span><span class="p">[[</span><span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">],</span> <span class="n"><a href="domain.html#LossOutput">shimmer.modules.domain.LossOutput</a></span><span class="p">]</span></span><span class="return-annotation">) -> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]</span>:</span></span>
+
+                <label class="view-source-button" for="contrastive_loss-view-source"><span>View Source</span></label>
+
+    </div>
+    <a class="headerlink" href="#contrastive_loss"></a>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="contrastive_loss-216"><a href="#contrastive_loss-216"><span class="linenos">216</span></a><span class="k">def</span> <span class="nf">contrastive_loss</span><span class="p">(</span>
+</span><span id="contrastive_loss-217"><a href="#contrastive_loss-217"><span class="linenos">217</span></a>    <span class="n">gw_mod</span><span class="p">:</span> <span class="n">GWModuleBase</span><span class="p">,</span>
+</span><span id="contrastive_loss-218"><a href="#contrastive_loss-218"><span class="linenos">218</span></a>    <span class="n">latent_domains</span><span class="p">:</span> <span class="n">LatentsDomainGroupsT</span><span class="p">,</span>
+</span><span id="contrastive_loss-219"><a href="#contrastive_loss-219"><span class="linenos">219</span></a>    <span class="n">contrastive_fn</span><span class="p">:</span> <span class="n">ContrastiveLossType</span><span class="p">,</span>
+</span><span id="contrastive_loss-220"><a href="#contrastive_loss-220"><span class="linenos">220</span></a><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]:</span>
+</span><span id="contrastive_loss-221"><a href="#contrastive_loss-221"><span class="linenos">221</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="contrastive_loss-222"><a href="#contrastive_loss-222"><span class="linenos">222</span></a><span class="sd">    Computes the contrastive loss.</span>
+</span><span id="contrastive_loss-223"><a href="#contrastive_loss-223"><span class="linenos">223</span></a>
+</span><span id="contrastive_loss-224"><a href="#contrastive_loss-224"><span class="linenos">224</span></a><span class="sd">    This return multiple metrics:</span>
+</span><span id="contrastive_loss-225"><a href="#contrastive_loss-225"><span class="linenos">225</span></a><span class="sd">        * `contrastive_{domain_1}_and_{domain_2}` with the contrastive</span>
+</span><span id="contrastive_loss-226"><a href="#contrastive_loss-226"><span class="linenos">226</span></a><span class="sd">            between 2 domains;</span>
+</span><span id="contrastive_loss-227"><a href="#contrastive_loss-227"><span class="linenos">227</span></a><span class="sd">        * `contrastive_{domain_1}_and_{domain_2}_{metric}` with</span>
+</span><span id="contrastive_loss-228"><a href="#contrastive_loss-228"><span class="linenos">228</span></a><span class="sd">            additional metrics provided by the domain_mod&#39;s</span>
+</span><span id="contrastive_loss-229"><a href="#contrastive_loss-229"><span class="linenos">229</span></a><span class="sd">            `compute_cont_loss` output;</span>
+</span><span id="contrastive_loss-230"><a href="#contrastive_loss-230"><span class="linenos">230</span></a><span class="sd">        * `contrastives` with the average value of all</span>
+</span><span id="contrastive_loss-231"><a href="#contrastive_loss-231"><span class="linenos">231</span></a><span class="sd">            `contrastive_{domain_1}_and_{domain_2}` values.</span>
+</span><span id="contrastive_loss-232"><a href="#contrastive_loss-232"><span class="linenos">232</span></a>
+</span><span id="contrastive_loss-233"><a href="#contrastive_loss-233"><span class="linenos">233</span></a><span class="sd">    Args:</span>
+</span><span id="contrastive_loss-234"><a href="#contrastive_loss-234"><span class="linenos">234</span></a><span class="sd">        gw_mod (`GWModuleBase`): The GWModule to use</span>
+</span><span id="contrastive_loss-235"><a href="#contrastive_loss-235"><span class="linenos">235</span></a><span class="sd">        latent_domains (`LatentsDomainGroupsT`): the latent unimodal groups</span>
+</span><span id="contrastive_loss-236"><a href="#contrastive_loss-236"><span class="linenos">236</span></a><span class="sd">        contrastive_fn (`ContrastiveLossType`): the contrastive function to apply</span>
+</span><span id="contrastive_loss-237"><a href="#contrastive_loss-237"><span class="linenos">237</span></a>
+</span><span id="contrastive_loss-238"><a href="#contrastive_loss-238"><span class="linenos">238</span></a><span class="sd">    Returns:</span>
+</span><span id="contrastive_loss-239"><a href="#contrastive_loss-239"><span class="linenos">239</span></a><span class="sd">        `dict[str, torch.Tensor]`: a dict of metrics.</span>
+</span><span id="contrastive_loss-240"><a href="#contrastive_loss-240"><span class="linenos">240</span></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="contrastive_loss-241"><a href="#contrastive_loss-241"><span class="linenos">241</span></a>    <span class="n">losses</span><span class="p">:</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]</span> <span class="o">=</span> <span class="p">{}</span>
+</span><span id="contrastive_loss-242"><a href="#contrastive_loss-242"><span class="linenos">242</span></a>    <span class="n">metrics</span><span class="p">:</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]</span> <span class="o">=</span> <span class="p">{}</span>
+</span><span id="contrastive_loss-243"><a href="#contrastive_loss-243"><span class="linenos">243</span></a>    <span class="n">keys</span><span class="p">:</span> <span class="nb">list</span><span class="p">[</span><span class="nb">set</span><span class="p">[</span><span class="nb">str</span><span class="p">]]</span> <span class="o">=</span> <span class="p">[]</span>
+</span><span id="contrastive_loss-244"><a href="#contrastive_loss-244"><span class="linenos">244</span></a>
+</span><span id="contrastive_loss-245"><a href="#contrastive_loss-245"><span class="linenos">245</span></a>    <span class="k">for</span> <span class="n">latents</span> <span class="ow">in</span> <span class="n">latent_domains</span><span class="o">.</span><span class="n">values</span><span class="p">():</span>
+</span><span id="contrastive_loss-246"><a href="#contrastive_loss-246"><span class="linenos">246</span></a>        <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">latents</span><span class="p">)</span> <span class="o">!=</span> <span class="mi">2</span><span class="p">:</span>
+</span><span id="contrastive_loss-247"><a href="#contrastive_loss-247"><span class="linenos">247</span></a>            <span class="k">continue</span>
+</span><span id="contrastive_loss-248"><a href="#contrastive_loss-248"><span class="linenos">248</span></a>
+</span><span id="contrastive_loss-249"><a href="#contrastive_loss-249"><span class="linenos">249</span></a>        <span class="n">cont_latents</span> <span class="o">=</span> <span class="n">gw_mod</span><span class="o">.</span><span class="n">encode</span><span class="p">(</span><span class="n">latents</span><span class="p">)</span>
+</span><span id="contrastive_loss-250"><a href="#contrastive_loss-250"><span class="linenos">250</span></a>        <span class="k">for</span> <span class="n">domain1</span><span class="p">,</span> <span class="n">z1</span> <span class="ow">in</span> <span class="n">cont_latents</span><span class="o">.</span><span class="n">items</span><span class="p">():</span>
+</span><span id="contrastive_loss-251"><a href="#contrastive_loss-251"><span class="linenos">251</span></a>            <span class="k">for</span> <span class="n">domain2</span><span class="p">,</span> <span class="n">z2</span> <span class="ow">in</span> <span class="n">cont_latents</span><span class="o">.</span><span class="n">items</span><span class="p">():</span>
+</span><span id="contrastive_loss-252"><a href="#contrastive_loss-252"><span class="linenos">252</span></a>                <span class="n">selected_domains</span> <span class="o">=</span> <span class="p">{</span><span class="n">domain1</span><span class="p">,</span> <span class="n">domain2</span><span class="p">}</span>
+</span><span id="contrastive_loss-253"><a href="#contrastive_loss-253"><span class="linenos">253</span></a>                <span class="k">if</span> <span class="n">domain1</span> <span class="o">==</span> <span class="n">domain2</span> <span class="ow">or</span> <span class="n">selected_domains</span> <span class="ow">in</span> <span class="n">keys</span><span class="p">:</span>
+</span><span id="contrastive_loss-254"><a href="#contrastive_loss-254"><span class="linenos">254</span></a>                    <span class="k">continue</span>
+</span><span id="contrastive_loss-255"><a href="#contrastive_loss-255"><span class="linenos">255</span></a>
+</span><span id="contrastive_loss-256"><a href="#contrastive_loss-256"><span class="linenos">256</span></a>                <span class="n">keys</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">selected_domains</span><span class="p">)</span>
+</span><span id="contrastive_loss-257"><a href="#contrastive_loss-257"><span class="linenos">257</span></a>
+</span><span id="contrastive_loss-258"><a href="#contrastive_loss-258"><span class="linenos">258</span></a>                <span class="n">loss_name</span> <span class="o">=</span> <span class="sa">f</span><span class="s2">&quot;contrastive_</span><span class="si">{</span><span class="n">domain1</span><span class="si">}</span><span class="s2">_and_</span><span class="si">{</span><span class="n">domain2</span><span class="si">}</span><span class="s2">&quot;</span>
+</span><span id="contrastive_loss-259"><a href="#contrastive_loss-259"><span class="linenos">259</span></a>                <span class="n">loss_output</span> <span class="o">=</span> <span class="n">contrastive_fn</span><span class="p">(</span><span class="n">z1</span><span class="p">,</span> <span class="n">z2</span><span class="p">)</span>
+</span><span id="contrastive_loss-260"><a href="#contrastive_loss-260"><span class="linenos">260</span></a>                <span class="n">losses</span><span class="p">[</span><span class="n">loss_name</span><span class="p">]</span> <span class="o">=</span> <span class="n">loss_output</span><span class="o">.</span><span class="n">loss</span>
+</span><span id="contrastive_loss-261"><a href="#contrastive_loss-261"><span class="linenos">261</span></a>                <span class="n">metrics</span><span class="o">.</span><span class="n">update</span><span class="p">(</span>
+</span><span id="contrastive_loss-262"><a href="#contrastive_loss-262"><span class="linenos">262</span></a>                    <span class="p">{</span><span class="sa">f</span><span class="s2">&quot;</span><span class="si">{</span><span class="n">loss_name</span><span class="si">}</span><span class="s2">_</span><span class="si">{</span><span class="n">k</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">:</span> <span class="n">v</span> <span class="k">for</span> <span class="n">k</span><span class="p">,</span> <span class="n">v</span> <span class="ow">in</span> <span class="n">loss_output</span><span class="o">.</span><span class="n">metrics</span><span class="o">.</span><span class="n">items</span><span class="p">()}</span>
+</span><span id="contrastive_loss-263"><a href="#contrastive_loss-263"><span class="linenos">263</span></a>                <span class="p">)</span>
+</span><span id="contrastive_loss-264"><a href="#contrastive_loss-264"><span class="linenos">264</span></a>
+</span><span id="contrastive_loss-265"><a href="#contrastive_loss-265"><span class="linenos">265</span></a>    <span class="n">losses</span><span class="p">[</span><span class="s2">&quot;contrastives&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">stack</span><span class="p">(</span><span class="nb">list</span><span class="p">(</span><span class="n">losses</span><span class="o">.</span><span class="n">values</span><span class="p">()),</span> <span class="n">dim</span><span class="o">=</span><span class="mi">0</span><span class="p">)</span><span class="o">.</span><span class="n">mean</span><span class="p">()</span>
+</span><span id="contrastive_loss-266"><a href="#contrastive_loss-266"><span class="linenos">266</span></a>    <span class="n">losses</span><span class="o">.</span><span class="n">update</span><span class="p">(</span><span class="n">metrics</span><span class="p">)</span>
+</span><span id="contrastive_loss-267"><a href="#contrastive_loss-267"><span class="linenos">267</span></a>    <span class="k">return</span> <span class="n">losses</span>
+</span></pre></div>
+
+
+            <div class="docstring"><p>Computes the contrastive loss.</p>
+
+<h6 id="this-return-multiple-metrics">This return multiple metrics:</h6>
+
+<blockquote>
+  <ul>
+  <li><code>contrastive_{domain_1}_and_{domain_2}</code> with the contrastive
+  between 2 domains;</li>
+  <li><code>contrastive_{domain_1}_and_{domain_2}_{metric}</code> with
+  additional metrics provided by the domain_mod's
+  <code>compute_cont_loss</code> output;</li>
+  <li><code>contrastives</code> with the average value of all
+  <code>contrastive_{domain_1}_and_{domain_2}</code> values.</li>
+  </ul>
+</blockquote>
+
+<h6 id="arguments">Arguments:</h6>
+
+<ul>
+<li><strong>gw_mod (<code>GWModuleBase</code>):</strong>  The GWModule to use</li>
+<li><strong>latent_domains (<code>LatentsDomainGroupsT</code>):</strong>  the latent unimodal groups</li>
+<li><strong>contrastive_fn (<code>ContrastiveLossType</code>):</strong>  the contrastive function to apply</li>
+</ul>
+
+<h6 id="returns">Returns:</h6>
+
+<blockquote>
+  <p><code>dict[str, torch.Tensor]</code>: a dict of metrics.</p>
+</blockquote>
+</div>
+
+
+                </section>
+                <section id="contrastive_loss_bayesian">
+                            <input id="contrastive_loss_bayesian-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
+<div class="attr function">
+            
+        <span class="def">def</span>
+        <span class="name">contrastive_loss_bayesian</span><span class="signature pdoc-code multiline">(<span class="param">	<span class="n">gw_mod</span><span class="p">:</span> <span class="n"><a href="gw_module.html#GWModuleBayesian">shimmer.modules.gw_module.GWModuleBayesian</a></span>,</span><span class="param">	<span class="n">latent_domains</span><span class="p">:</span> <span class="n">collections</span><span class="o">.</span><span class="n">abc</span><span class="o">.</span><span class="n">Mapping</span><span class="p">[</span><span class="nb">frozenset</span><span class="p">[</span><span class="nb">str</span><span class="p">],</span> <span class="n">collections</span><span class="o">.</span><span class="n">abc</span><span class="o">.</span><span class="n">Mapping</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]]</span>,</span><span class="param">	<span class="n">contrastive_fn</span><span class="p">:</span> <span class="n">collections</span><span class="o">.</span><span class="n">abc</span><span class="o">.</span><span class="n">Callable</span><span class="p">[[</span><span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">],</span> <span class="n"><a href="domain.html#LossOutput">shimmer.modules.domain.LossOutput</a></span><span class="p">]</span></span><span class="return-annotation">) -> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]</span>:</span></span>
+
+                <label class="view-source-button" for="contrastive_loss_bayesian-view-source"><span>View Source</span></label>
+
+    </div>
+    <a class="headerlink" href="#contrastive_loss_bayesian"></a>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="contrastive_loss_bayesian-270"><a href="#contrastive_loss_bayesian-270"><span class="linenos">270</span></a><span class="k">def</span> <span class="nf">contrastive_loss_bayesian</span><span class="p">(</span>
+</span><span id="contrastive_loss_bayesian-271"><a href="#contrastive_loss_bayesian-271"><span class="linenos">271</span></a>    <span class="n">gw_mod</span><span class="p">:</span> <span class="n">GWModuleBayesian</span><span class="p">,</span>
+</span><span id="contrastive_loss_bayesian-272"><a href="#contrastive_loss_bayesian-272"><span class="linenos">272</span></a>    <span class="n">latent_domains</span><span class="p">:</span> <span class="n">LatentsDomainGroupsT</span><span class="p">,</span>
+</span><span id="contrastive_loss_bayesian-273"><a href="#contrastive_loss_bayesian-273"><span class="linenos">273</span></a>    <span class="n">contrastive_fn</span><span class="p">:</span> <span class="n">ContrastiveLossType</span><span class="p">,</span>
+</span><span id="contrastive_loss_bayesian-274"><a href="#contrastive_loss_bayesian-274"><span class="linenos">274</span></a><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]:</span>
+</span><span id="contrastive_loss_bayesian-275"><a href="#contrastive_loss_bayesian-275"><span class="linenos">275</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="contrastive_loss_bayesian-276"><a href="#contrastive_loss_bayesian-276"><span class="linenos">276</span></a><span class="sd">    Computes the contrastive loss with a Bayesian based uncertainty prediction.</span>
+</span><span id="contrastive_loss_bayesian-277"><a href="#contrastive_loss_bayesian-277"><span class="linenos">277</span></a>
+</span><span id="contrastive_loss_bayesian-278"><a href="#contrastive_loss_bayesian-278"><span class="linenos">278</span></a><span class="sd">    This return multiple metrics:</span>
+</span><span id="contrastive_loss_bayesian-279"><a href="#contrastive_loss_bayesian-279"><span class="linenos">279</span></a><span class="sd">        * `contrastive_{domain_1}_and_{domain_2}` with the contrastive</span>
+</span><span id="contrastive_loss_bayesian-280"><a href="#contrastive_loss_bayesian-280"><span class="linenos">280</span></a><span class="sd">            between 2 domains;</span>
+</span><span id="contrastive_loss_bayesian-281"><a href="#contrastive_loss_bayesian-281"><span class="linenos">281</span></a><span class="sd">        * `contrastive_{domain_1}_and_{domain_2}_{metric}` with</span>
+</span><span id="contrastive_loss_bayesian-282"><a href="#contrastive_loss_bayesian-282"><span class="linenos">282</span></a><span class="sd">            additional metrics provided by the domain_mod&#39;s</span>
+</span><span id="contrastive_loss_bayesian-283"><a href="#contrastive_loss_bayesian-283"><span class="linenos">283</span></a><span class="sd">            `compute_cont_loss` output;</span>
+</span><span id="contrastive_loss_bayesian-284"><a href="#contrastive_loss_bayesian-284"><span class="linenos">284</span></a><span class="sd">        * `contrastives` with the average value of all</span>
+</span><span id="contrastive_loss_bayesian-285"><a href="#contrastive_loss_bayesian-285"><span class="linenos">285</span></a><span class="sd">            `contrastive_{domain_1}_and_{domain_2}` values.</span>
+</span><span id="contrastive_loss_bayesian-286"><a href="#contrastive_loss_bayesian-286"><span class="linenos">286</span></a>
+</span><span id="contrastive_loss_bayesian-287"><a href="#contrastive_loss_bayesian-287"><span class="linenos">287</span></a><span class="sd">    Args:</span>
+</span><span id="contrastive_loss_bayesian-288"><a href="#contrastive_loss_bayesian-288"><span class="linenos">288</span></a><span class="sd">        gw_mod (`GWModuleBayesian`): The GWModule to use</span>
+</span><span id="contrastive_loss_bayesian-289"><a href="#contrastive_loss_bayesian-289"><span class="linenos">289</span></a><span class="sd">        latent_domains (`LatentsDomainGroupsT`): the latent unimodal groups</span>
+</span><span id="contrastive_loss_bayesian-290"><a href="#contrastive_loss_bayesian-290"><span class="linenos">290</span></a><span class="sd">        contrastive_fn (`ContrastiveLossBayesianType`): the contrastive function</span>
+</span><span id="contrastive_loss_bayesian-291"><a href="#contrastive_loss_bayesian-291"><span class="linenos">291</span></a><span class="sd">            to apply</span>
+</span><span id="contrastive_loss_bayesian-292"><a href="#contrastive_loss_bayesian-292"><span class="linenos">292</span></a>
+</span><span id="contrastive_loss_bayesian-293"><a href="#contrastive_loss_bayesian-293"><span class="linenos">293</span></a><span class="sd">    Returns:</span>
+</span><span id="contrastive_loss_bayesian-294"><a href="#contrastive_loss_bayesian-294"><span class="linenos">294</span></a><span class="sd">        `dict[str, torch.Tensor]`: a dict of metrics.</span>
+</span><span id="contrastive_loss_bayesian-295"><a href="#contrastive_loss_bayesian-295"><span class="linenos">295</span></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="contrastive_loss_bayesian-296"><a href="#contrastive_loss_bayesian-296"><span class="linenos">296</span></a>    <span class="n">losses</span><span class="p">:</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]</span> <span class="o">=</span> <span class="p">{}</span>
+</span><span id="contrastive_loss_bayesian-297"><a href="#contrastive_loss_bayesian-297"><span class="linenos">297</span></a>    <span class="n">metrics</span><span class="p">:</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]</span> <span class="o">=</span> <span class="p">{}</span>
+</span><span id="contrastive_loss_bayesian-298"><a href="#contrastive_loss_bayesian-298"><span class="linenos">298</span></a>    <span class="n">keys</span><span class="p">:</span> <span class="nb">list</span><span class="p">[</span><span class="nb">set</span><span class="p">[</span><span class="nb">str</span><span class="p">]]</span> <span class="o">=</span> <span class="p">[]</span>
+</span><span id="contrastive_loss_bayesian-299"><a href="#contrastive_loss_bayesian-299"><span class="linenos">299</span></a>
+</span><span id="contrastive_loss_bayesian-300"><a href="#contrastive_loss_bayesian-300"><span class="linenos">300</span></a>    <span class="k">for</span> <span class="n">latents</span> <span class="ow">in</span> <span class="n">latent_domains</span><span class="o">.</span><span class="n">values</span><span class="p">():</span>
+</span><span id="contrastive_loss_bayesian-301"><a href="#contrastive_loss_bayesian-301"><span class="linenos">301</span></a>        <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">latents</span><span class="p">)</span> <span class="o">&lt;</span> <span class="mi">2</span><span class="p">:</span>
+</span><span id="contrastive_loss_bayesian-302"><a href="#contrastive_loss_bayesian-302"><span class="linenos">302</span></a>            <span class="k">continue</span>
+</span><span id="contrastive_loss_bayesian-303"><a href="#contrastive_loss_bayesian-303"><span class="linenos">303</span></a>        <span class="k">for</span> <span class="n">domain1_name</span><span class="p">,</span> <span class="n">domain1</span> <span class="ow">in</span> <span class="n">latents</span><span class="o">.</span><span class="n">items</span><span class="p">():</span>
+</span><span id="contrastive_loss_bayesian-304"><a href="#contrastive_loss_bayesian-304"><span class="linenos">304</span></a>            <span class="n">z1</span> <span class="o">=</span> <span class="n">gw_mod</span><span class="o">.</span><span class="n">encode</span><span class="p">({</span><span class="n">domain1_name</span><span class="p">:</span> <span class="n">domain1</span><span class="p">})[</span><span class="n">domain1_name</span><span class="p">]</span>
+</span><span id="contrastive_loss_bayesian-305"><a href="#contrastive_loss_bayesian-305"><span class="linenos">305</span></a>            <span class="n">z1_precision</span> <span class="o">=</span> <span class="n">gw_mod</span><span class="o">.</span><span class="n">get_precision</span><span class="p">(</span><span class="n">domain1_name</span><span class="p">,</span> <span class="n">domain1</span><span class="p">)</span>
+</span><span id="contrastive_loss_bayesian-306"><a href="#contrastive_loss_bayesian-306"><span class="linenos">306</span></a>            <span class="k">for</span> <span class="n">domain2_name</span><span class="p">,</span> <span class="n">domain2</span> <span class="ow">in</span> <span class="n">latents</span><span class="o">.</span><span class="n">items</span><span class="p">():</span>
+</span><span id="contrastive_loss_bayesian-307"><a href="#contrastive_loss_bayesian-307"><span class="linenos">307</span></a>                <span class="n">selected_domains</span> <span class="o">=</span> <span class="p">{</span><span class="n">domain1_name</span><span class="p">,</span> <span class="n">domain2_name</span><span class="p">}</span>
+</span><span id="contrastive_loss_bayesian-308"><a href="#contrastive_loss_bayesian-308"><span class="linenos">308</span></a>                <span class="k">if</span> <span class="n">domain1_name</span> <span class="o">==</span> <span class="n">domain2_name</span> <span class="ow">or</span> <span class="n">selected_domains</span> <span class="ow">in</span> <span class="n">keys</span><span class="p">:</span>
+</span><span id="contrastive_loss_bayesian-309"><a href="#contrastive_loss_bayesian-309"><span class="linenos">309</span></a>                    <span class="k">continue</span>
+</span><span id="contrastive_loss_bayesian-310"><a href="#contrastive_loss_bayesian-310"><span class="linenos">310</span></a>
+</span><span id="contrastive_loss_bayesian-311"><a href="#contrastive_loss_bayesian-311"><span class="linenos">311</span></a>                <span class="n">keys</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">selected_domains</span><span class="p">)</span>
+</span><span id="contrastive_loss_bayesian-312"><a href="#contrastive_loss_bayesian-312"><span class="linenos">312</span></a>
+</span><span id="contrastive_loss_bayesian-313"><a href="#contrastive_loss_bayesian-313"><span class="linenos">313</span></a>                <span class="n">loss_name</span> <span class="o">=</span> <span class="sa">f</span><span class="s2">&quot;contrastive_</span><span class="si">{</span><span class="n">domain1_name</span><span class="si">}</span><span class="s2">_and_</span><span class="si">{</span><span class="n">domain2_name</span><span class="si">}</span><span class="s2">&quot;</span>
+</span><span id="contrastive_loss_bayesian-314"><a href="#contrastive_loss_bayesian-314"><span class="linenos">314</span></a>                <span class="n">z2</span> <span class="o">=</span> <span class="n">gw_mod</span><span class="o">.</span><span class="n">encode</span><span class="p">({</span><span class="n">domain2_name</span><span class="p">:</span> <span class="n">domain2</span><span class="p">})[</span><span class="n">domain2_name</span><span class="p">]</span>
+</span><span id="contrastive_loss_bayesian-315"><a href="#contrastive_loss_bayesian-315"><span class="linenos">315</span></a>                <span class="n">z2_precision</span> <span class="o">=</span> <span class="n">gw_mod</span><span class="o">.</span><span class="n">get_precision</span><span class="p">(</span><span class="n">domain2_name</span><span class="p">,</span> <span class="n">domain2</span><span class="p">)</span>
+</span><span id="contrastive_loss_bayesian-316"><a href="#contrastive_loss_bayesian-316"><span class="linenos">316</span></a>                <span class="n">coef</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">softmax</span><span class="p">(</span>
+</span><span id="contrastive_loss_bayesian-317"><a href="#contrastive_loss_bayesian-317"><span class="linenos">317</span></a>                    <span class="n">gw_mod</span><span class="o">.</span><span class="n">precision_softmax_temp</span>
+</span><span id="contrastive_loss_bayesian-318"><a href="#contrastive_loss_bayesian-318"><span class="linenos">318</span></a>                    <span class="o">*</span> <span class="n">torch</span><span class="o">.</span><span class="n">stack</span><span class="p">([</span><span class="n">z1_precision</span><span class="p">,</span> <span class="n">z2_precision</span><span class="p">]),</span>
+</span><span id="contrastive_loss_bayesian-319"><a href="#contrastive_loss_bayesian-319"><span class="linenos">319</span></a>                    <span class="n">dim</span><span class="o">=</span><span class="mi">0</span><span class="p">,</span>
+</span><span id="contrastive_loss_bayesian-320"><a href="#contrastive_loss_bayesian-320"><span class="linenos">320</span></a>                <span class="p">)</span>
+</span><span id="contrastive_loss_bayesian-321"><a href="#contrastive_loss_bayesian-321"><span class="linenos">321</span></a>                <span class="n">norm</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">sqrt</span><span class="p">(</span><span class="n">coef</span><span class="p">[</span><span class="mi">0</span><span class="p">]</span> <span class="o">*</span> <span class="n">coef</span><span class="p">[</span><span class="mi">1</span><span class="p">])</span>
+</span><span id="contrastive_loss_bayesian-322"><a href="#contrastive_loss_bayesian-322"><span class="linenos">322</span></a>                <span class="n">loss_output</span> <span class="o">=</span> <span class="n">contrastive_fn</span><span class="p">(</span><span class="n">z1</span> <span class="o">*</span> <span class="n">norm</span><span class="p">,</span> <span class="n">z2</span> <span class="o">*</span> <span class="n">norm</span><span class="p">)</span>
+</span><span id="contrastive_loss_bayesian-323"><a href="#contrastive_loss_bayesian-323"><span class="linenos">323</span></a>                <span class="n">loss_output_no_norm</span> <span class="o">=</span> <span class="n">contrastive_fn</span><span class="p">(</span><span class="n">z1</span><span class="p">,</span> <span class="n">z2</span><span class="p">)</span>
+</span><span id="contrastive_loss_bayesian-324"><a href="#contrastive_loss_bayesian-324"><span class="linenos">324</span></a>                <span class="n">losses</span><span class="p">[</span><span class="n">loss_name</span><span class="p">]</span> <span class="o">=</span> <span class="n">loss_output</span><span class="o">.</span><span class="n">loss</span>
+</span><span id="contrastive_loss_bayesian-325"><a href="#contrastive_loss_bayesian-325"><span class="linenos">325</span></a>                <span class="n">metrics</span><span class="o">.</span><span class="n">update</span><span class="p">(</span>
+</span><span id="contrastive_loss_bayesian-326"><a href="#contrastive_loss_bayesian-326"><span class="linenos">326</span></a>                    <span class="p">{</span><span class="sa">f</span><span class="s2">&quot;</span><span class="si">{</span><span class="n">loss_name</span><span class="si">}</span><span class="s2">_</span><span class="si">{</span><span class="n">k</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">:</span> <span class="n">v</span> <span class="k">for</span> <span class="n">k</span><span class="p">,</span> <span class="n">v</span> <span class="ow">in</span> <span class="n">loss_output</span><span class="o">.</span><span class="n">metrics</span><span class="o">.</span><span class="n">items</span><span class="p">()}</span>
+</span><span id="contrastive_loss_bayesian-327"><a href="#contrastive_loss_bayesian-327"><span class="linenos">327</span></a>                <span class="p">)</span>
+</span><span id="contrastive_loss_bayesian-328"><a href="#contrastive_loss_bayesian-328"><span class="linenos">328</span></a>                <span class="n">metrics</span><span class="p">[</span><span class="sa">f</span><span class="s2">&quot;unnorm_</span><span class="si">{</span><span class="n">loss_name</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="n">loss_output_no_norm</span><span class="o">.</span><span class="n">loss</span>
+</span><span id="contrastive_loss_bayesian-329"><a href="#contrastive_loss_bayesian-329"><span class="linenos">329</span></a>
+</span><span id="contrastive_loss_bayesian-330"><a href="#contrastive_loss_bayesian-330"><span class="linenos">330</span></a>    <span class="n">losses</span><span class="p">[</span><span class="s2">&quot;contrastives&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">stack</span><span class="p">(</span><span class="nb">list</span><span class="p">(</span><span class="n">losses</span><span class="o">.</span><span class="n">values</span><span class="p">()),</span> <span class="n">dim</span><span class="o">=</span><span class="mi">0</span><span class="p">)</span><span class="o">.</span><span class="n">mean</span><span class="p">()</span>
+</span><span id="contrastive_loss_bayesian-331"><a href="#contrastive_loss_bayesian-331"><span class="linenos">331</span></a>    <span class="n">losses</span><span class="o">.</span><span class="n">update</span><span class="p">(</span><span class="n">metrics</span><span class="p">)</span>
+</span><span id="contrastive_loss_bayesian-332"><a href="#contrastive_loss_bayesian-332"><span class="linenos">332</span></a>    <span class="k">return</span> <span class="n">losses</span>
+</span></pre></div>
+
+
+            <div class="docstring"><p>Computes the contrastive loss with a Bayesian based uncertainty prediction.</p>
+
+<h6 id="this-return-multiple-metrics">This return multiple metrics:</h6>
+
+<blockquote>
+  <ul>
+  <li><code>contrastive_{domain_1}_and_{domain_2}</code> with the contrastive
+  between 2 domains;</li>
+  <li><code>contrastive_{domain_1}_and_{domain_2}_{metric}</code> with
+  additional metrics provided by the domain_mod's
+  <code>compute_cont_loss</code> output;</li>
+  <li><code>contrastives</code> with the average value of all
+  <code>contrastive_{domain_1}_and_{domain_2}</code> values.</li>
+  </ul>
+</blockquote>
+
+<h6 id="arguments">Arguments:</h6>
+
+<ul>
+<li><strong>gw_mod (<code>GWModuleBayesian</code>):</strong>  The GWModule to use</li>
+<li><strong>latent_domains (<code>LatentsDomainGroupsT</code>):</strong>  the latent unimodal groups</li>
+<li><strong>contrastive_fn (<code>ContrastiveLossBayesianType</code>):</strong>  the contrastive function
+to apply</li>
+</ul>
+
+<h6 id="returns">Returns:</h6>
+
+<blockquote>
+  <p><code>dict[str, torch.Tensor]</code>: a dict of metrics.</p>
+</blockquote>
+</div>
+
+
+                </section>
+                <section id="LossCoefs">
+                            <input id="LossCoefs-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
+<div class="attr class">
+            
+    <span class="def">class</span>
+    <span class="name">LossCoefs</span><wbr>(<span class="base">typing.TypedDict</span>):
+
+                <label class="view-source-button" for="LossCoefs-view-source"><span>View Source</span></label>
+
+    </div>
+    <a class="headerlink" href="#LossCoefs"></a>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="LossCoefs-335"><a href="#LossCoefs-335"><span class="linenos">335</span></a><span class="k">class</span> <span class="nc">LossCoefs</span><span class="p">(</span><span class="n">TypedDict</span><span class="p">,</span> <span class="n">total</span><span class="o">=</span><span class="kc">False</span><span class="p">):</span>
+</span><span id="LossCoefs-336"><a href="#LossCoefs-336"><span class="linenos">336</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="LossCoefs-337"><a href="#LossCoefs-337"><span class="linenos">337</span></a><span class="sd">    Dict of loss coefficients used in the GWLosses.</span>
+</span><span id="LossCoefs-338"><a href="#LossCoefs-338"><span class="linenos">338</span></a>
+</span><span id="LossCoefs-339"><a href="#LossCoefs-339"><span class="linenos">339</span></a><span class="sd">    If one is not provided, the coefficient is assumed to be 0 and will not be logged.</span>
+</span><span id="LossCoefs-340"><a href="#LossCoefs-340"><span class="linenos">340</span></a><span class="sd">    If the loss is excplicitely set to 0, it will be logged, but not take part in</span>
+</span><span id="LossCoefs-341"><a href="#LossCoefs-341"><span class="linenos">341</span></a><span class="sd">    the total loss.</span>
+</span><span id="LossCoefs-342"><a href="#LossCoefs-342"><span class="linenos">342</span></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="LossCoefs-343"><a href="#LossCoefs-343"><span class="linenos">343</span></a>
+</span><span id="LossCoefs-344"><a href="#LossCoefs-344"><span class="linenos">344</span></a>    <span class="n">demi_cycles</span><span class="p">:</span> <span class="nb">float</span>
+</span><span id="LossCoefs-345"><a href="#LossCoefs-345"><span class="linenos">345</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Demi-cycle loss coefficient.&quot;&quot;&quot;</span>
+</span><span id="LossCoefs-346"><a href="#LossCoefs-346"><span class="linenos">346</span></a>
+</span><span id="LossCoefs-347"><a href="#LossCoefs-347"><span class="linenos">347</span></a>    <span class="n">cycles</span><span class="p">:</span> <span class="nb">float</span>
+</span><span id="LossCoefs-348"><a href="#LossCoefs-348"><span class="linenos">348</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Cycle loss coefficient.&quot;&quot;&quot;</span>
+</span><span id="LossCoefs-349"><a href="#LossCoefs-349"><span class="linenos">349</span></a>
+</span><span id="LossCoefs-350"><a href="#LossCoefs-350"><span class="linenos">350</span></a>    <span class="n">translations</span><span class="p">:</span> <span class="nb">float</span>
+</span><span id="LossCoefs-351"><a href="#LossCoefs-351"><span class="linenos">351</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Translation loss coefficient.&quot;&quot;&quot;</span>
+</span><span id="LossCoefs-352"><a href="#LossCoefs-352"><span class="linenos">352</span></a>
+</span><span id="LossCoefs-353"><a href="#LossCoefs-353"><span class="linenos">353</span></a>    <span class="n">contrastives</span><span class="p">:</span> <span class="nb">float</span>
+</span><span id="LossCoefs-354"><a href="#LossCoefs-354"><span class="linenos">354</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Contrastive loss coefficient.&quot;&quot;&quot;</span>
+</span></pre></div>
+
+
+            <div class="docstring"><p>Dict of loss coefficients used in the GWLosses.</p>
+
+<p>If one is not provided, the coefficient is assumed to be 0 and will not be logged.
+If the loss is excplicitely set to 0, it will be logged, but not take part in
+the total loss.</p>
+</div>
+
+
+                            <div id="LossCoefs.demi_cycles" class="classattr">
+                                <div class="attr variable">
+            <span class="name">demi_cycles</span><span class="annotation">: float</span>
+
+        
+    </div>
+    <a class="headerlink" href="#LossCoefs.demi_cycles"></a>
+    
+            <div class="docstring"><p>Demi-cycle loss coefficient.</p>
+</div>
+
+
+                            </div>
+                            <div id="LossCoefs.cycles" class="classattr">
+                                <div class="attr variable">
+            <span class="name">cycles</span><span class="annotation">: float</span>
+
+        
+    </div>
+    <a class="headerlink" href="#LossCoefs.cycles"></a>
+    
+            <div class="docstring"><p>Cycle loss coefficient.</p>
+</div>
+
+
+                            </div>
+                            <div id="LossCoefs.translations" class="classattr">
+                                <div class="attr variable">
+            <span class="name">translations</span><span class="annotation">: float</span>
+
+        
+    </div>
+    <a class="headerlink" href="#LossCoefs.translations"></a>
+    
+            <div class="docstring"><p>Translation loss coefficient.</p>
+</div>
+
+
+                            </div>
+                            <div id="LossCoefs.contrastives" class="classattr">
+                                <div class="attr variable">
+            <span class="name">contrastives</span><span class="annotation">: float</span>
+
+        
+    </div>
+    <a class="headerlink" href="#LossCoefs.contrastives"></a>
+    
+            <div class="docstring"><p>Contrastive loss coefficient.</p>
+</div>
+
+
+                            </div>
+                </section>
+                <section id="GWLosses2Domains">
+                            <input id="GWLosses2Domains-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
+<div class="attr class">
+            
+    <span class="def">class</span>
+    <span class="name">GWLosses2Domains</span><wbr>(<span class="base"><a href="#GWLossesBase">GWLossesBase</a></span>):
+
+                <label class="view-source-button" for="GWLosses2Domains-view-source"><span>View Source</span></label>
+
+    </div>
+    <a class="headerlink" href="#GWLosses2Domains"></a>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="GWLosses2Domains-357"><a href="#GWLosses2Domains-357"><span class="linenos">357</span></a><span class="k">class</span> <span class="nc">GWLosses2Domains</span><span class="p">(</span><span class="n">GWLossesBase</span><span class="p">):</span>
+</span><span id="GWLosses2Domains-358"><a href="#GWLosses2Domains-358"><span class="linenos">358</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="GWLosses2Domains-359"><a href="#GWLosses2Domains-359"><span class="linenos">359</span></a><span class="sd">    Implementation of `GWLossesBase` used for `GWModule`.</span>
+</span><span id="GWLosses2Domains-360"><a href="#GWLosses2Domains-360"><span class="linenos">360</span></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="GWLosses2Domains-361"><a href="#GWLosses2Domains-361"><span class="linenos">361</span></a>
+</span><span id="GWLosses2Domains-362"><a href="#GWLosses2Domains-362"><span class="linenos">362</span></a>    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span>
+</span><span id="GWLosses2Domains-363"><a href="#GWLosses2Domains-363"><span class="linenos">363</span></a>        <span class="bp">self</span><span class="p">,</span>
+</span><span id="GWLosses2Domains-364"><a href="#GWLosses2Domains-364"><span class="linenos">364</span></a>        <span class="n">gw_mod</span><span class="p">:</span> <span class="n">GWModule</span><span class="p">,</span>
+</span><span id="GWLosses2Domains-365"><a href="#GWLosses2Domains-365"><span class="linenos">365</span></a>        <span class="n">selection_mod</span><span class="p">:</span> <span class="n">SelectionBase</span><span class="p">,</span>
+</span><span id="GWLosses2Domains-366"><a href="#GWLosses2Domains-366"><span class="linenos">366</span></a>        <span class="n">domain_mods</span><span class="p">:</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">DomainModule</span><span class="p">],</span>
+</span><span id="GWLosses2Domains-367"><a href="#GWLosses2Domains-367"><span class="linenos">367</span></a>        <span class="n">loss_coefs</span><span class="p">:</span> <span class="n">LossCoefs</span><span class="p">,</span>
+</span><span id="GWLosses2Domains-368"><a href="#GWLosses2Domains-368"><span class="linenos">368</span></a>        <span class="n">contrastive_fn</span><span class="p">:</span> <span class="n">ContrastiveLossType</span><span class="p">,</span>
+</span><span id="GWLosses2Domains-369"><a href="#GWLosses2Domains-369"><span class="linenos">369</span></a>    <span class="p">):</span>
+</span><span id="GWLosses2Domains-370"><a href="#GWLosses2Domains-370"><span class="linenos">370</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="GWLosses2Domains-371"><a href="#GWLosses2Domains-371"><span class="linenos">371</span></a><span class="sd">        Main loss module to use with the GlobalWorkspace</span>
+</span><span id="GWLosses2Domains-372"><a href="#GWLosses2Domains-372"><span class="linenos">372</span></a>
+</span><span id="GWLosses2Domains-373"><a href="#GWLosses2Domains-373"><span class="linenos">373</span></a><span class="sd">        Args:</span>
+</span><span id="GWLosses2Domains-374"><a href="#GWLosses2Domains-374"><span class="linenos">374</span></a><span class="sd">            gw_mod (`GWModule`): the GWModule</span>
+</span><span id="GWLosses2Domains-375"><a href="#GWLosses2Domains-375"><span class="linenos">375</span></a><span class="sd">            selection_mod (`SelectionBase`): selection module</span>
+</span><span id="GWLosses2Domains-376"><a href="#GWLosses2Domains-376"><span class="linenos">376</span></a><span class="sd">            domain_mods (`dict[str, DomainModule]`): a dict where the key is the</span>
+</span><span id="GWLosses2Domains-377"><a href="#GWLosses2Domains-377"><span class="linenos">377</span></a><span class="sd">                domain name and value is the DomainModule</span>
+</span><span id="GWLosses2Domains-378"><a href="#GWLosses2Domains-378"><span class="linenos">378</span></a><span class="sd">            loss_coefs (`LossCoefs`): loss coefficients. LossCoefs object, or a</span>
+</span><span id="GWLosses2Domains-379"><a href="#GWLosses2Domains-379"><span class="linenos">379</span></a><span class="sd">                mapping to float with correct keys.</span>
+</span><span id="GWLosses2Domains-380"><a href="#GWLosses2Domains-380"><span class="linenos">380</span></a><span class="sd">            contrastive_fn (`ContrastiveLossType`): the contrastive function to use</span>
+</span><span id="GWLosses2Domains-381"><a href="#GWLosses2Domains-381"><span class="linenos">381</span></a><span class="sd">                in contrastive loss</span>
+</span><span id="GWLosses2Domains-382"><a href="#GWLosses2Domains-382"><span class="linenos">382</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="GWLosses2Domains-383"><a href="#GWLosses2Domains-383"><span class="linenos">383</span></a>
+</span><span id="GWLosses2Domains-384"><a href="#GWLosses2Domains-384"><span class="linenos">384</span></a>        <span class="nb">super</span><span class="p">()</span><span class="o">.</span><span class="fm">__init__</span><span class="p">()</span>
+</span><span id="GWLosses2Domains-385"><a href="#GWLosses2Domains-385"><span class="linenos">385</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">gw_mod</span> <span class="o">=</span> <span class="n">gw_mod</span>
+</span><span id="GWLosses2Domains-386"><a href="#GWLosses2Domains-386"><span class="linenos">386</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">selection_mod</span> <span class="o">=</span> <span class="n">selection_mod</span>
+</span><span id="GWLosses2Domains-387"><a href="#GWLosses2Domains-387"><span class="linenos">387</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">domain_mods</span> <span class="o">=</span> <span class="n">domain_mods</span>
+</span><span id="GWLosses2Domains-388"><a href="#GWLosses2Domains-388"><span class="linenos">388</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">loss_coefs</span> <span class="o">=</span> <span class="n">loss_coefs</span>
+</span><span id="GWLosses2Domains-389"><a href="#GWLosses2Domains-389"><span class="linenos">389</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">contrastive_fn</span> <span class="o">=</span> <span class="n">contrastive_fn</span>
+</span><span id="GWLosses2Domains-390"><a href="#GWLosses2Domains-390"><span class="linenos">390</span></a>
+</span><span id="GWLosses2Domains-391"><a href="#GWLosses2Domains-391"><span class="linenos">391</span></a>    <span class="k">def</span> <span class="nf">demi_cycle_loss</span><span class="p">(</span>
+</span><span id="GWLosses2Domains-392"><a href="#GWLosses2Domains-392"><span class="linenos">392</span></a>        <span class="bp">self</span><span class="p">,</span> <span class="n">latent_domains</span><span class="p">:</span> <span class="n">LatentsDomainGroupsT</span>
+</span><span id="GWLosses2Domains-393"><a href="#GWLosses2Domains-393"><span class="linenos">393</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]:</span>
+</span><span id="GWLosses2Domains-394"><a href="#GWLosses2Domains-394"><span class="linenos">394</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="GWLosses2Domains-395"><a href="#GWLosses2Domains-395"><span class="linenos">395</span></a><span class="sd">        Computes the demi-cycle loss.</span>
+</span><span id="GWLosses2Domains-396"><a href="#GWLosses2Domains-396"><span class="linenos">396</span></a>
+</span><span id="GWLosses2Domains-397"><a href="#GWLosses2Domains-397"><span class="linenos">397</span></a><span class="sd">        See `shimmer.modules.losses.demi_cycle_loss`.</span>
+</span><span id="GWLosses2Domains-398"><a href="#GWLosses2Domains-398"><span class="linenos">398</span></a>
+</span><span id="GWLosses2Domains-399"><a href="#GWLosses2Domains-399"><span class="linenos">399</span></a><span class="sd">        Args:</span>
+</span><span id="GWLosses2Domains-400"><a href="#GWLosses2Domains-400"><span class="linenos">400</span></a><span class="sd">            latent_domains (`LatentsDomainGroupsT`): the latent unimodal groups</span>
+</span><span id="GWLosses2Domains-401"><a href="#GWLosses2Domains-401"><span class="linenos">401</span></a>
+</span><span id="GWLosses2Domains-402"><a href="#GWLosses2Domains-402"><span class="linenos">402</span></a><span class="sd">        Returns:</span>
+</span><span id="GWLosses2Domains-403"><a href="#GWLosses2Domains-403"><span class="linenos">403</span></a><span class="sd">            `dict[str, torch.Tensor]`: a dict of metrics.</span>
+</span><span id="GWLosses2Domains-404"><a href="#GWLosses2Domains-404"><span class="linenos">404</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="GWLosses2Domains-405"><a href="#GWLosses2Domains-405"><span class="linenos">405</span></a>        <span class="k">return</span> <span class="n">demi_cycle_loss</span><span class="p">(</span>
+</span><span id="GWLosses2Domains-406"><a href="#GWLosses2Domains-406"><span class="linenos">406</span></a>            <span class="bp">self</span><span class="o">.</span><span class="n">gw_mod</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">selection_mod</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">domain_mods</span><span class="p">,</span> <span class="n">latent_domains</span>
+</span><span id="GWLosses2Domains-407"><a href="#GWLosses2Domains-407"><span class="linenos">407</span></a>        <span class="p">)</span>
+</span><span id="GWLosses2Domains-408"><a href="#GWLosses2Domains-408"><span class="linenos">408</span></a>
+</span><span id="GWLosses2Domains-409"><a href="#GWLosses2Domains-409"><span class="linenos">409</span></a>    <span class="k">def</span> <span class="nf">cycle_loss</span><span class="p">(</span>
+</span><span id="GWLosses2Domains-410"><a href="#GWLosses2Domains-410"><span class="linenos">410</span></a>        <span class="bp">self</span><span class="p">,</span> <span class="n">latent_domains</span><span class="p">:</span> <span class="n">LatentsDomainGroupsT</span>
+</span><span id="GWLosses2Domains-411"><a href="#GWLosses2Domains-411"><span class="linenos">411</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]:</span>
+</span><span id="GWLosses2Domains-412"><a href="#GWLosses2Domains-412"><span class="linenos">412</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="GWLosses2Domains-413"><a href="#GWLosses2Domains-413"><span class="linenos">413</span></a><span class="sd">        Computes the cycle loss.</span>
+</span><span id="GWLosses2Domains-414"><a href="#GWLosses2Domains-414"><span class="linenos">414</span></a>
+</span><span id="GWLosses2Domains-415"><a href="#GWLosses2Domains-415"><span class="linenos">415</span></a><span class="sd">        See `shimmer.modules.losses.cycle_loss`.</span>
+</span><span id="GWLosses2Domains-416"><a href="#GWLosses2Domains-416"><span class="linenos">416</span></a>
+</span><span id="GWLosses2Domains-417"><a href="#GWLosses2Domains-417"><span class="linenos">417</span></a><span class="sd">        Args:</span>
+</span><span id="GWLosses2Domains-418"><a href="#GWLosses2Domains-418"><span class="linenos">418</span></a><span class="sd">            latent_domains (`LatentsDomainGroupsT`): the latent unimodal groups</span>
+</span><span id="GWLosses2Domains-419"><a href="#GWLosses2Domains-419"><span class="linenos">419</span></a>
+</span><span id="GWLosses2Domains-420"><a href="#GWLosses2Domains-420"><span class="linenos">420</span></a><span class="sd">        Returns:</span>
+</span><span id="GWLosses2Domains-421"><a href="#GWLosses2Domains-421"><span class="linenos">421</span></a><span class="sd">            `dict[str, torch.Tensor]`: a dict of metrics.</span>
+</span><span id="GWLosses2Domains-422"><a href="#GWLosses2Domains-422"><span class="linenos">422</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="GWLosses2Domains-423"><a href="#GWLosses2Domains-423"><span class="linenos">423</span></a>        <span class="k">return</span> <span class="n">cycle_loss</span><span class="p">(</span>
+</span><span id="GWLosses2Domains-424"><a href="#GWLosses2Domains-424"><span class="linenos">424</span></a>            <span class="bp">self</span><span class="o">.</span><span class="n">gw_mod</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">selection_mod</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">domain_mods</span><span class="p">,</span> <span class="n">latent_domains</span>
+</span><span id="GWLosses2Domains-425"><a href="#GWLosses2Domains-425"><span class="linenos">425</span></a>        <span class="p">)</span>
+</span><span id="GWLosses2Domains-426"><a href="#GWLosses2Domains-426"><span class="linenos">426</span></a>
+</span><span id="GWLosses2Domains-427"><a href="#GWLosses2Domains-427"><span class="linenos">427</span></a>    <span class="k">def</span> <span class="nf">translation_loss</span><span class="p">(</span>
+</span><span id="GWLosses2Domains-428"><a href="#GWLosses2Domains-428"><span class="linenos">428</span></a>        <span class="bp">self</span><span class="p">,</span> <span class="n">latent_domains</span><span class="p">:</span> <span class="n">LatentsDomainGroupsT</span>
+</span><span id="GWLosses2Domains-429"><a href="#GWLosses2Domains-429"><span class="linenos">429</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]:</span>
+</span><span id="GWLosses2Domains-430"><a href="#GWLosses2Domains-430"><span class="linenos">430</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="GWLosses2Domains-431"><a href="#GWLosses2Domains-431"><span class="linenos">431</span></a><span class="sd">        Computes the translation loss.</span>
+</span><span id="GWLosses2Domains-432"><a href="#GWLosses2Domains-432"><span class="linenos">432</span></a>
+</span><span id="GWLosses2Domains-433"><a href="#GWLosses2Domains-433"><span class="linenos">433</span></a><span class="sd">        See `shimmer.modules.losses.translation_loss`.</span>
+</span><span id="GWLosses2Domains-434"><a href="#GWLosses2Domains-434"><span class="linenos">434</span></a>
+</span><span id="GWLosses2Domains-435"><a href="#GWLosses2Domains-435"><span class="linenos">435</span></a><span class="sd">        Args:</span>
+</span><span id="GWLosses2Domains-436"><a href="#GWLosses2Domains-436"><span class="linenos">436</span></a><span class="sd">            latent_domains (`LatentsDomainGroupsT`): the latent unimodal groups</span>
+</span><span id="GWLosses2Domains-437"><a href="#GWLosses2Domains-437"><span class="linenos">437</span></a>
+</span><span id="GWLosses2Domains-438"><a href="#GWLosses2Domains-438"><span class="linenos">438</span></a><span class="sd">        Returns:</span>
+</span><span id="GWLosses2Domains-439"><a href="#GWLosses2Domains-439"><span class="linenos">439</span></a><span class="sd">            `dict[str, torch.Tensor]`: a dict of metrics.</span>
+</span><span id="GWLosses2Domains-440"><a href="#GWLosses2Domains-440"><span class="linenos">440</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="GWLosses2Domains-441"><a href="#GWLosses2Domains-441"><span class="linenos">441</span></a>        <span class="k">return</span> <span class="n">translation_loss</span><span class="p">(</span>
+</span><span id="GWLosses2Domains-442"><a href="#GWLosses2Domains-442"><span class="linenos">442</span></a>            <span class="bp">self</span><span class="o">.</span><span class="n">gw_mod</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">selection_mod</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">domain_mods</span><span class="p">,</span> <span class="n">latent_domains</span>
+</span><span id="GWLosses2Domains-443"><a href="#GWLosses2Domains-443"><span class="linenos">443</span></a>        <span class="p">)</span>
+</span><span id="GWLosses2Domains-444"><a href="#GWLosses2Domains-444"><span class="linenos">444</span></a>
+</span><span id="GWLosses2Domains-445"><a href="#GWLosses2Domains-445"><span class="linenos">445</span></a>    <span class="k">def</span> <span class="nf">contrastive_loss</span><span class="p">(</span>
+</span><span id="GWLosses2Domains-446"><a href="#GWLosses2Domains-446"><span class="linenos">446</span></a>        <span class="bp">self</span><span class="p">,</span> <span class="n">latent_domains</span><span class="p">:</span> <span class="n">LatentsDomainGroupsT</span>
+</span><span id="GWLosses2Domains-447"><a href="#GWLosses2Domains-447"><span class="linenos">447</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]:</span>
+</span><span id="GWLosses2Domains-448"><a href="#GWLosses2Domains-448"><span class="linenos">448</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="GWLosses2Domains-449"><a href="#GWLosses2Domains-449"><span class="linenos">449</span></a><span class="sd">        Computes the contrastive loss.</span>
+</span><span id="GWLosses2Domains-450"><a href="#GWLosses2Domains-450"><span class="linenos">450</span></a>
+</span><span id="GWLosses2Domains-451"><a href="#GWLosses2Domains-451"><span class="linenos">451</span></a><span class="sd">        See `shimmer.modules.losses.contrastive_loss`.</span>
+</span><span id="GWLosses2Domains-452"><a href="#GWLosses2Domains-452"><span class="linenos">452</span></a>
+</span><span id="GWLosses2Domains-453"><a href="#GWLosses2Domains-453"><span class="linenos">453</span></a><span class="sd">        Args:</span>
+</span><span id="GWLosses2Domains-454"><a href="#GWLosses2Domains-454"><span class="linenos">454</span></a><span class="sd">            latent_domains (`LatentsDomainGroupsT`): the latent unimodal groups</span>
+</span><span id="GWLosses2Domains-455"><a href="#GWLosses2Domains-455"><span class="linenos">455</span></a>
+</span><span id="GWLosses2Domains-456"><a href="#GWLosses2Domains-456"><span class="linenos">456</span></a><span class="sd">        Returns:</span>
+</span><span id="GWLosses2Domains-457"><a href="#GWLosses2Domains-457"><span class="linenos">457</span></a><span class="sd">            `dict[str, torch.Tensor]`: a dict of metrics.</span>
+</span><span id="GWLosses2Domains-458"><a href="#GWLosses2Domains-458"><span class="linenos">458</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="GWLosses2Domains-459"><a href="#GWLosses2Domains-459"><span class="linenos">459</span></a>        <span class="k">return</span> <span class="n">contrastive_loss</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">gw_mod</span><span class="p">,</span> <span class="n">latent_domains</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">contrastive_fn</span><span class="p">)</span>
+</span><span id="GWLosses2Domains-460"><a href="#GWLosses2Domains-460"><span class="linenos">460</span></a>
+</span><span id="GWLosses2Domains-461"><a href="#GWLosses2Domains-461"><span class="linenos">461</span></a>    <span class="k">def</span> <span class="nf">step</span><span class="p">(</span>
+</span><span id="GWLosses2Domains-462"><a href="#GWLosses2Domains-462"><span class="linenos">462</span></a>        <span class="bp">self</span><span class="p">,</span> <span class="n">domain_latents</span><span class="p">:</span> <span class="n">LatentsDomainGroupsT</span><span class="p">,</span> <span class="n">mode</span><span class="p">:</span> <span class="n">ModelModeT</span>
+</span><span id="GWLosses2Domains-463"><a href="#GWLosses2Domains-463"><span class="linenos">463</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="n">LossOutput</span><span class="p">:</span>
+</span><span id="GWLosses2Domains-464"><a href="#GWLosses2Domains-464"><span class="linenos">464</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="GWLosses2Domains-465"><a href="#GWLosses2Domains-465"><span class="linenos">465</span></a><span class="sd">        Computes and returns the losses</span>
+</span><span id="GWLosses2Domains-466"><a href="#GWLosses2Domains-466"><span class="linenos">466</span></a>
+</span><span id="GWLosses2Domains-467"><a href="#GWLosses2Domains-467"><span class="linenos">467</span></a><span class="sd">        Contains:</span>
+</span><span id="GWLosses2Domains-468"><a href="#GWLosses2Domains-468"><span class="linenos">468</span></a><span class="sd">            - Demi-cycle metrics (see `GWLosses.demi_cycle_loss`)</span>
+</span><span id="GWLosses2Domains-469"><a href="#GWLosses2Domains-469"><span class="linenos">469</span></a><span class="sd">            - Cycle metrics (see `GWLosses.cycle_loss`)</span>
+</span><span id="GWLosses2Domains-470"><a href="#GWLosses2Domains-470"><span class="linenos">470</span></a><span class="sd">            - Translation metrics (see `GWLosses.translation_loss`)</span>
+</span><span id="GWLosses2Domains-471"><a href="#GWLosses2Domains-471"><span class="linenos">471</span></a><span class="sd">            - Contrastive metrics (see `GWLosses.contrastive_loss`)</span>
+</span><span id="GWLosses2Domains-472"><a href="#GWLosses2Domains-472"><span class="linenos">472</span></a>
+</span><span id="GWLosses2Domains-473"><a href="#GWLosses2Domains-473"><span class="linenos">473</span></a><span class="sd">        Args:</span>
+</span><span id="GWLosses2Domains-474"><a href="#GWLosses2Domains-474"><span class="linenos">474</span></a><span class="sd">            domain_latents (`LatentsDomainGroupsT`): All latent groups</span>
+</span><span id="GWLosses2Domains-475"><a href="#GWLosses2Domains-475"><span class="linenos">475</span></a><span class="sd">            mode (`ModelModeT`): model mode</span>
+</span><span id="GWLosses2Domains-476"><a href="#GWLosses2Domains-476"><span class="linenos">476</span></a><span class="sd">        Returns:</span>
+</span><span id="GWLosses2Domains-477"><a href="#GWLosses2Domains-477"><span class="linenos">477</span></a><span class="sd">            `LossOutput`: the losses</span>
+</span><span id="GWLosses2Domains-478"><a href="#GWLosses2Domains-478"><span class="linenos">478</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="GWLosses2Domains-479"><a href="#GWLosses2Domains-479"><span class="linenos">479</span></a>        <span class="n">metrics</span><span class="p">:</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]</span> <span class="o">=</span> <span class="p">{}</span>
+</span><span id="GWLosses2Domains-480"><a href="#GWLosses2Domains-480"><span class="linenos">480</span></a>
+</span><span id="GWLosses2Domains-481"><a href="#GWLosses2Domains-481"><span class="linenos">481</span></a>        <span class="n">metrics</span><span class="o">.</span><span class="n">update</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">demi_cycle_loss</span><span class="p">(</span><span class="n">domain_latents</span><span class="p">))</span>
+</span><span id="GWLosses2Domains-482"><a href="#GWLosses2Domains-482"><span class="linenos">482</span></a>        <span class="n">metrics</span><span class="o">.</span><span class="n">update</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">cycle_loss</span><span class="p">(</span><span class="n">domain_latents</span><span class="p">))</span>
+</span><span id="GWLosses2Domains-483"><a href="#GWLosses2Domains-483"><span class="linenos">483</span></a>        <span class="n">metrics</span><span class="o">.</span><span class="n">update</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">translation_loss</span><span class="p">(</span><span class="n">domain_latents</span><span class="p">))</span>
+</span><span id="GWLosses2Domains-484"><a href="#GWLosses2Domains-484"><span class="linenos">484</span></a>        <span class="n">metrics</span><span class="o">.</span><span class="n">update</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">contrastive_loss</span><span class="p">(</span><span class="n">domain_latents</span><span class="p">))</span>
+</span><span id="GWLosses2Domains-485"><a href="#GWLosses2Domains-485"><span class="linenos">485</span></a>
+</span><span id="GWLosses2Domains-486"><a href="#GWLosses2Domains-486"><span class="linenos">486</span></a>        <span class="n">loss</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">stack</span><span class="p">(</span>
+</span><span id="GWLosses2Domains-487"><a href="#GWLosses2Domains-487"><span class="linenos">487</span></a>            <span class="p">[</span>
+</span><span id="GWLosses2Domains-488"><a href="#GWLosses2Domains-488"><span class="linenos">488</span></a>                <span class="n">metrics</span><span class="p">[</span><span class="n">name</span><span class="p">]</span> <span class="o">*</span> <span class="n">coef</span>
+</span><span id="GWLosses2Domains-489"><a href="#GWLosses2Domains-489"><span class="linenos">489</span></a>                <span class="k">for</span> <span class="n">name</span><span class="p">,</span> <span class="n">coef</span> <span class="ow">in</span> <span class="bp">self</span><span class="o">.</span><span class="n">loss_coefs</span><span class="o">.</span><span class="n">items</span><span class="p">()</span>
+</span><span id="GWLosses2Domains-490"><a href="#GWLosses2Domains-490"><span class="linenos">490</span></a>                <span class="k">if</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">coef</span><span class="p">,</span> <span class="nb">float</span><span class="p">)</span> <span class="ow">and</span> <span class="n">coef</span> <span class="o">&gt;</span> <span class="mi">0</span>
+</span><span id="GWLosses2Domains-491"><a href="#GWLosses2Domains-491"><span class="linenos">491</span></a>            <span class="p">],</span>
+</span><span id="GWLosses2Domains-492"><a href="#GWLosses2Domains-492"><span class="linenos">492</span></a>            <span class="n">dim</span><span class="o">=</span><span class="mi">0</span><span class="p">,</span>
+</span><span id="GWLosses2Domains-493"><a href="#GWLosses2Domains-493"><span class="linenos">493</span></a>        <span class="p">)</span><span class="o">.</span><span class="n">mean</span><span class="p">()</span>
+</span><span id="GWLosses2Domains-494"><a href="#GWLosses2Domains-494"><span class="linenos">494</span></a>
+</span><span id="GWLosses2Domains-495"><a href="#GWLosses2Domains-495"><span class="linenos">495</span></a>        <span class="k">return</span> <span class="n">LossOutput</span><span class="p">(</span><span class="n">loss</span><span class="p">,</span> <span class="n">metrics</span><span class="p">)</span>
+</span></pre></div>
+
+
+            <div class="docstring"><p>Implementation of <code><a href="#GWLossesBase">GWLossesBase</a></code> used for <code>GWModule</code>.</p>
+</div>
+
+
+                            <div id="GWLosses2Domains.__init__" class="classattr">
+                                        <input id="GWLosses2Domains.__init__-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
+<div class="attr function">
+            
+        <span class="name">GWLosses2Domains</span><span class="signature pdoc-code multiline">(<span class="param">	<span class="n">gw_mod</span><span class="p">:</span> <span class="n"><a href="gw_module.html#GWModule">shimmer.modules.gw_module.GWModule</a></span>,</span><span class="param">	<span class="n">selection_mod</span><span class="p">:</span> <span class="n"><a href="selection.html#SelectionBase">shimmer.modules.selection.SelectionBase</a></span>,</span><span class="param">	<span class="n">domain_mods</span><span class="p">:</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n"><a href="domain.html#DomainModule">shimmer.modules.domain.DomainModule</a></span><span class="p">]</span>,</span><span class="param">	<span class="n">loss_coefs</span><span class="p">:</span> <span class="n"><a href="#LossCoefs">LossCoefs</a></span>,</span><span class="param">	<span class="n">contrastive_fn</span><span class="p">:</span> <span class="n">collections</span><span class="o">.</span><span class="n">abc</span><span class="o">.</span><span class="n">Callable</span><span class="p">[[</span><span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">],</span> <span class="n"><a href="domain.html#LossOutput">shimmer.modules.domain.LossOutput</a></span><span class="p">]</span></span>)</span>
+
+                <label class="view-source-button" for="GWLosses2Domains.__init__-view-source"><span>View Source</span></label>
+
+    </div>
+    <a class="headerlink" href="#GWLosses2Domains.__init__"></a>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="GWLosses2Domains.__init__-362"><a href="#GWLosses2Domains.__init__-362"><span class="linenos">362</span></a>    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span>
+</span><span id="GWLosses2Domains.__init__-363"><a href="#GWLosses2Domains.__init__-363"><span class="linenos">363</span></a>        <span class="bp">self</span><span class="p">,</span>
+</span><span id="GWLosses2Domains.__init__-364"><a href="#GWLosses2Domains.__init__-364"><span class="linenos">364</span></a>        <span class="n">gw_mod</span><span class="p">:</span> <span class="n">GWModule</span><span class="p">,</span>
+</span><span id="GWLosses2Domains.__init__-365"><a href="#GWLosses2Domains.__init__-365"><span class="linenos">365</span></a>        <span class="n">selection_mod</span><span class="p">:</span> <span class="n">SelectionBase</span><span class="p">,</span>
+</span><span id="GWLosses2Domains.__init__-366"><a href="#GWLosses2Domains.__init__-366"><span class="linenos">366</span></a>        <span class="n">domain_mods</span><span class="p">:</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">DomainModule</span><span class="p">],</span>
+</span><span id="GWLosses2Domains.__init__-367"><a href="#GWLosses2Domains.__init__-367"><span class="linenos">367</span></a>        <span class="n">loss_coefs</span><span class="p">:</span> <span class="n">LossCoefs</span><span class="p">,</span>
+</span><span id="GWLosses2Domains.__init__-368"><a href="#GWLosses2Domains.__init__-368"><span class="linenos">368</span></a>        <span class="n">contrastive_fn</span><span class="p">:</span> <span class="n">ContrastiveLossType</span><span class="p">,</span>
+</span><span id="GWLosses2Domains.__init__-369"><a href="#GWLosses2Domains.__init__-369"><span class="linenos">369</span></a>    <span class="p">):</span>
+</span><span id="GWLosses2Domains.__init__-370"><a href="#GWLosses2Domains.__init__-370"><span class="linenos">370</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="GWLosses2Domains.__init__-371"><a href="#GWLosses2Domains.__init__-371"><span class="linenos">371</span></a><span class="sd">        Main loss module to use with the GlobalWorkspace</span>
+</span><span id="GWLosses2Domains.__init__-372"><a href="#GWLosses2Domains.__init__-372"><span class="linenos">372</span></a>
+</span><span id="GWLosses2Domains.__init__-373"><a href="#GWLosses2Domains.__init__-373"><span class="linenos">373</span></a><span class="sd">        Args:</span>
+</span><span id="GWLosses2Domains.__init__-374"><a href="#GWLosses2Domains.__init__-374"><span class="linenos">374</span></a><span class="sd">            gw_mod (`GWModule`): the GWModule</span>
+</span><span id="GWLosses2Domains.__init__-375"><a href="#GWLosses2Domains.__init__-375"><span class="linenos">375</span></a><span class="sd">            selection_mod (`SelectionBase`): selection module</span>
+</span><span id="GWLosses2Domains.__init__-376"><a href="#GWLosses2Domains.__init__-376"><span class="linenos">376</span></a><span class="sd">            domain_mods (`dict[str, DomainModule]`): a dict where the key is the</span>
+</span><span id="GWLosses2Domains.__init__-377"><a href="#GWLosses2Domains.__init__-377"><span class="linenos">377</span></a><span class="sd">                domain name and value is the DomainModule</span>
+</span><span id="GWLosses2Domains.__init__-378"><a href="#GWLosses2Domains.__init__-378"><span class="linenos">378</span></a><span class="sd">            loss_coefs (`LossCoefs`): loss coefficients. LossCoefs object, or a</span>
+</span><span id="GWLosses2Domains.__init__-379"><a href="#GWLosses2Domains.__init__-379"><span class="linenos">379</span></a><span class="sd">                mapping to float with correct keys.</span>
+</span><span id="GWLosses2Domains.__init__-380"><a href="#GWLosses2Domains.__init__-380"><span class="linenos">380</span></a><span class="sd">            contrastive_fn (`ContrastiveLossType`): the contrastive function to use</span>
+</span><span id="GWLosses2Domains.__init__-381"><a href="#GWLosses2Domains.__init__-381"><span class="linenos">381</span></a><span class="sd">                in contrastive loss</span>
+</span><span id="GWLosses2Domains.__init__-382"><a href="#GWLosses2Domains.__init__-382"><span class="linenos">382</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="GWLosses2Domains.__init__-383"><a href="#GWLosses2Domains.__init__-383"><span class="linenos">383</span></a>
+</span><span id="GWLosses2Domains.__init__-384"><a href="#GWLosses2Domains.__init__-384"><span class="linenos">384</span></a>        <span class="nb">super</span><span class="p">()</span><span class="o">.</span><span class="fm">__init__</span><span class="p">()</span>
+</span><span id="GWLosses2Domains.__init__-385"><a href="#GWLosses2Domains.__init__-385"><span class="linenos">385</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">gw_mod</span> <span class="o">=</span> <span class="n">gw_mod</span>
+</span><span id="GWLosses2Domains.__init__-386"><a href="#GWLosses2Domains.__init__-386"><span class="linenos">386</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">selection_mod</span> <span class="o">=</span> <span class="n">selection_mod</span>
+</span><span id="GWLosses2Domains.__init__-387"><a href="#GWLosses2Domains.__init__-387"><span class="linenos">387</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">domain_mods</span> <span class="o">=</span> <span class="n">domain_mods</span>
+</span><span id="GWLosses2Domains.__init__-388"><a href="#GWLosses2Domains.__init__-388"><span class="linenos">388</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">loss_coefs</span> <span class="o">=</span> <span class="n">loss_coefs</span>
+</span><span id="GWLosses2Domains.__init__-389"><a href="#GWLosses2Domains.__init__-389"><span class="linenos">389</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">contrastive_fn</span> <span class="o">=</span> <span class="n">contrastive_fn</span>
+</span></pre></div>
+
+
+            <div class="docstring"><p>Main loss module to use with the GlobalWorkspace</p>
+
+<h6 id="arguments">Arguments:</h6>
+
+<ul>
+<li><strong>gw_mod (<code>GWModule</code>):</strong>  the GWModule</li>
+<li><strong>selection_mod (<code>SelectionBase</code>):</strong>  selection module</li>
+<li><strong>domain_mods (<code>dict[str, DomainModule]</code>):</strong>  a dict where the key is the
+domain name and value is the DomainModule</li>
+<li><strong>loss_coefs (<code><a href="#LossCoefs">LossCoefs</a></code>):</strong>  loss coefficients. LossCoefs object, or a
+mapping to float with correct keys.</li>
+<li><strong>contrastive_fn (<code>ContrastiveLossType</code>):</strong>  the contrastive function to use
+in contrastive loss</li>
+</ul>
+</div>
+
+
+                            </div>
+                            <div id="GWLosses2Domains.gw_mod" class="classattr">
+                                <div class="attr variable">
+            <span class="name">gw_mod</span>
+
+        
+    </div>
+    <a class="headerlink" href="#GWLosses2Domains.gw_mod"></a>
+    
+    
+
+                            </div>
+                            <div id="GWLosses2Domains.selection_mod" class="classattr">
+                                <div class="attr variable">
+            <span class="name">selection_mod</span>
+
+        
+    </div>
+    <a class="headerlink" href="#GWLosses2Domains.selection_mod"></a>
+    
+    
+
+                            </div>
+                            <div id="GWLosses2Domains.domain_mods" class="classattr">
+                                <div class="attr variable">
+            <span class="name">domain_mods</span>
+
+        
+    </div>
+    <a class="headerlink" href="#GWLosses2Domains.domain_mods"></a>
+    
+    
+
+                            </div>
+                            <div id="GWLosses2Domains.loss_coefs" class="classattr">
+                                <div class="attr variable">
+            <span class="name">loss_coefs</span>
+
+        
+    </div>
+    <a class="headerlink" href="#GWLosses2Domains.loss_coefs"></a>
+    
+    
+
+                            </div>
+                            <div id="GWLosses2Domains.contrastive_fn" class="classattr">
+                                <div class="attr variable">
+            <span class="name">contrastive_fn</span>
+
+        
+    </div>
+    <a class="headerlink" href="#GWLosses2Domains.contrastive_fn"></a>
+    
+    
+
+                            </div>
+                            <div id="GWLosses2Domains.demi_cycle_loss" class="classattr">
+                                        <input id="GWLosses2Domains.demi_cycle_loss-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
+<div class="attr function">
+            
+        <span class="def">def</span>
+        <span class="name">demi_cycle_loss</span><span class="signature pdoc-code multiline">(<span class="param">	<span class="bp">self</span>,</span><span class="param">	<span class="n">latent_domains</span><span class="p">:</span> <span class="n">collections</span><span class="o">.</span><span class="n">abc</span><span class="o">.</span><span class="n">Mapping</span><span class="p">[</span><span class="nb">frozenset</span><span class="p">[</span><span class="nb">str</span><span class="p">],</span> <span class="n">collections</span><span class="o">.</span><span class="n">abc</span><span class="o">.</span><span class="n">Mapping</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]]</span></span><span class="return-annotation">) -> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]</span>:</span></span>
+
+                <label class="view-source-button" for="GWLosses2Domains.demi_cycle_loss-view-source"><span>View Source</span></label>
+
+    </div>
+    <a class="headerlink" href="#GWLosses2Domains.demi_cycle_loss"></a>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="GWLosses2Domains.demi_cycle_loss-391"><a href="#GWLosses2Domains.demi_cycle_loss-391"><span class="linenos">391</span></a>    <span class="k">def</span> <span class="nf">demi_cycle_loss</span><span class="p">(</span>
+</span><span id="GWLosses2Domains.demi_cycle_loss-392"><a href="#GWLosses2Domains.demi_cycle_loss-392"><span class="linenos">392</span></a>        <span class="bp">self</span><span class="p">,</span> <span class="n">latent_domains</span><span class="p">:</span> <span class="n">LatentsDomainGroupsT</span>
+</span><span id="GWLosses2Domains.demi_cycle_loss-393"><a href="#GWLosses2Domains.demi_cycle_loss-393"><span class="linenos">393</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]:</span>
+</span><span id="GWLosses2Domains.demi_cycle_loss-394"><a href="#GWLosses2Domains.demi_cycle_loss-394"><span class="linenos">394</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="GWLosses2Domains.demi_cycle_loss-395"><a href="#GWLosses2Domains.demi_cycle_loss-395"><span class="linenos">395</span></a><span class="sd">        Computes the demi-cycle loss.</span>
+</span><span id="GWLosses2Domains.demi_cycle_loss-396"><a href="#GWLosses2Domains.demi_cycle_loss-396"><span class="linenos">396</span></a>
+</span><span id="GWLosses2Domains.demi_cycle_loss-397"><a href="#GWLosses2Domains.demi_cycle_loss-397"><span class="linenos">397</span></a><span class="sd">        See `shimmer.modules.losses.demi_cycle_loss`.</span>
+</span><span id="GWLosses2Domains.demi_cycle_loss-398"><a href="#GWLosses2Domains.demi_cycle_loss-398"><span class="linenos">398</span></a>
+</span><span id="GWLosses2Domains.demi_cycle_loss-399"><a href="#GWLosses2Domains.demi_cycle_loss-399"><span class="linenos">399</span></a><span class="sd">        Args:</span>
+</span><span id="GWLosses2Domains.demi_cycle_loss-400"><a href="#GWLosses2Domains.demi_cycle_loss-400"><span class="linenos">400</span></a><span class="sd">            latent_domains (`LatentsDomainGroupsT`): the latent unimodal groups</span>
+</span><span id="GWLosses2Domains.demi_cycle_loss-401"><a href="#GWLosses2Domains.demi_cycle_loss-401"><span class="linenos">401</span></a>
+</span><span id="GWLosses2Domains.demi_cycle_loss-402"><a href="#GWLosses2Domains.demi_cycle_loss-402"><span class="linenos">402</span></a><span class="sd">        Returns:</span>
+</span><span id="GWLosses2Domains.demi_cycle_loss-403"><a href="#GWLosses2Domains.demi_cycle_loss-403"><span class="linenos">403</span></a><span class="sd">            `dict[str, torch.Tensor]`: a dict of metrics.</span>
+</span><span id="GWLosses2Domains.demi_cycle_loss-404"><a href="#GWLosses2Domains.demi_cycle_loss-404"><span class="linenos">404</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="GWLosses2Domains.demi_cycle_loss-405"><a href="#GWLosses2Domains.demi_cycle_loss-405"><span class="linenos">405</span></a>        <span class="k">return</span> <span class="n">demi_cycle_loss</span><span class="p">(</span>
+</span><span id="GWLosses2Domains.demi_cycle_loss-406"><a href="#GWLosses2Domains.demi_cycle_loss-406"><span class="linenos">406</span></a>            <span class="bp">self</span><span class="o">.</span><span class="n">gw_mod</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">selection_mod</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">domain_mods</span><span class="p">,</span> <span class="n">latent_domains</span>
+</span><span id="GWLosses2Domains.demi_cycle_loss-407"><a href="#GWLosses2Domains.demi_cycle_loss-407"><span class="linenos">407</span></a>        <span class="p">)</span>
+</span></pre></div>
+
+
+            <div class="docstring"><p>Computes the demi-cycle loss.</p>
+
+<p>See <code><a href="#demi_cycle_loss">demi_cycle_loss</a></code>.</p>
+
+<h6 id="arguments">Arguments:</h6>
+
+<ul>
+<li><strong>latent_domains (<code>LatentsDomainGroupsT</code>):</strong>  the latent unimodal groups</li>
+</ul>
+
+<h6 id="returns">Returns:</h6>
+
+<blockquote>
+  <p><code>dict[str, torch.Tensor]</code>: a dict of metrics.</p>
+</blockquote>
+</div>
+
+
+                            </div>
+                            <div id="GWLosses2Domains.cycle_loss" class="classattr">
+                                        <input id="GWLosses2Domains.cycle_loss-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
+<div class="attr function">
+            
+        <span class="def">def</span>
+        <span class="name">cycle_loss</span><span class="signature pdoc-code multiline">(<span class="param">	<span class="bp">self</span>,</span><span class="param">	<span class="n">latent_domains</span><span class="p">:</span> <span class="n">collections</span><span class="o">.</span><span class="n">abc</span><span class="o">.</span><span class="n">Mapping</span><span class="p">[</span><span class="nb">frozenset</span><span class="p">[</span><span class="nb">str</span><span class="p">],</span> <span class="n">collections</span><span class="o">.</span><span class="n">abc</span><span class="o">.</span><span class="n">Mapping</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]]</span></span><span class="return-annotation">) -> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]</span>:</span></span>
+
+                <label class="view-source-button" for="GWLosses2Domains.cycle_loss-view-source"><span>View Source</span></label>
+
+    </div>
+    <a class="headerlink" href="#GWLosses2Domains.cycle_loss"></a>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="GWLosses2Domains.cycle_loss-409"><a href="#GWLosses2Domains.cycle_loss-409"><span class="linenos">409</span></a>    <span class="k">def</span> <span class="nf">cycle_loss</span><span class="p">(</span>
+</span><span id="GWLosses2Domains.cycle_loss-410"><a href="#GWLosses2Domains.cycle_loss-410"><span class="linenos">410</span></a>        <span class="bp">self</span><span class="p">,</span> <span class="n">latent_domains</span><span class="p">:</span> <span class="n">LatentsDomainGroupsT</span>
+</span><span id="GWLosses2Domains.cycle_loss-411"><a href="#GWLosses2Domains.cycle_loss-411"><span class="linenos">411</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]:</span>
+</span><span id="GWLosses2Domains.cycle_loss-412"><a href="#GWLosses2Domains.cycle_loss-412"><span class="linenos">412</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="GWLosses2Domains.cycle_loss-413"><a href="#GWLosses2Domains.cycle_loss-413"><span class="linenos">413</span></a><span class="sd">        Computes the cycle loss.</span>
+</span><span id="GWLosses2Domains.cycle_loss-414"><a href="#GWLosses2Domains.cycle_loss-414"><span class="linenos">414</span></a>
+</span><span id="GWLosses2Domains.cycle_loss-415"><a href="#GWLosses2Domains.cycle_loss-415"><span class="linenos">415</span></a><span class="sd">        See `shimmer.modules.losses.cycle_loss`.</span>
+</span><span id="GWLosses2Domains.cycle_loss-416"><a href="#GWLosses2Domains.cycle_loss-416"><span class="linenos">416</span></a>
+</span><span id="GWLosses2Domains.cycle_loss-417"><a href="#GWLosses2Domains.cycle_loss-417"><span class="linenos">417</span></a><span class="sd">        Args:</span>
+</span><span id="GWLosses2Domains.cycle_loss-418"><a href="#GWLosses2Domains.cycle_loss-418"><span class="linenos">418</span></a><span class="sd">            latent_domains (`LatentsDomainGroupsT`): the latent unimodal groups</span>
+</span><span id="GWLosses2Domains.cycle_loss-419"><a href="#GWLosses2Domains.cycle_loss-419"><span class="linenos">419</span></a>
+</span><span id="GWLosses2Domains.cycle_loss-420"><a href="#GWLosses2Domains.cycle_loss-420"><span class="linenos">420</span></a><span class="sd">        Returns:</span>
+</span><span id="GWLosses2Domains.cycle_loss-421"><a href="#GWLosses2Domains.cycle_loss-421"><span class="linenos">421</span></a><span class="sd">            `dict[str, torch.Tensor]`: a dict of metrics.</span>
+</span><span id="GWLosses2Domains.cycle_loss-422"><a href="#GWLosses2Domains.cycle_loss-422"><span class="linenos">422</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="GWLosses2Domains.cycle_loss-423"><a href="#GWLosses2Domains.cycle_loss-423"><span class="linenos">423</span></a>        <span class="k">return</span> <span class="n">cycle_loss</span><span class="p">(</span>
+</span><span id="GWLosses2Domains.cycle_loss-424"><a href="#GWLosses2Domains.cycle_loss-424"><span class="linenos">424</span></a>            <span class="bp">self</span><span class="o">.</span><span class="n">gw_mod</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">selection_mod</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">domain_mods</span><span class="p">,</span> <span class="n">latent_domains</span>
+</span><span id="GWLosses2Domains.cycle_loss-425"><a href="#GWLosses2Domains.cycle_loss-425"><span class="linenos">425</span></a>        <span class="p">)</span>
+</span></pre></div>
+
+
+            <div class="docstring"><p>Computes the cycle loss.</p>
+
+<p>See <code><a href="#cycle_loss">cycle_loss</a></code>.</p>
+
+<h6 id="arguments">Arguments:</h6>
+
+<ul>
+<li><strong>latent_domains (<code>LatentsDomainGroupsT</code>):</strong>  the latent unimodal groups</li>
+</ul>
+
+<h6 id="returns">Returns:</h6>
+
+<blockquote>
+  <p><code>dict[str, torch.Tensor]</code>: a dict of metrics.</p>
+</blockquote>
+</div>
+
+
+                            </div>
+                            <div id="GWLosses2Domains.translation_loss" class="classattr">
+                                        <input id="GWLosses2Domains.translation_loss-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
+<div class="attr function">
+            
+        <span class="def">def</span>
+        <span class="name">translation_loss</span><span class="signature pdoc-code multiline">(<span class="param">	<span class="bp">self</span>,</span><span class="param">	<span class="n">latent_domains</span><span class="p">:</span> <span class="n">collections</span><span class="o">.</span><span class="n">abc</span><span class="o">.</span><span class="n">Mapping</span><span class="p">[</span><span class="nb">frozenset</span><span class="p">[</span><span class="nb">str</span><span class="p">],</span> <span class="n">collections</span><span class="o">.</span><span class="n">abc</span><span class="o">.</span><span class="n">Mapping</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]]</span></span><span class="return-annotation">) -> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]</span>:</span></span>
+
+                <label class="view-source-button" for="GWLosses2Domains.translation_loss-view-source"><span>View Source</span></label>
+
+    </div>
+    <a class="headerlink" href="#GWLosses2Domains.translation_loss"></a>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="GWLosses2Domains.translation_loss-427"><a href="#GWLosses2Domains.translation_loss-427"><span class="linenos">427</span></a>    <span class="k">def</span> <span class="nf">translation_loss</span><span class="p">(</span>
+</span><span id="GWLosses2Domains.translation_loss-428"><a href="#GWLosses2Domains.translation_loss-428"><span class="linenos">428</span></a>        <span class="bp">self</span><span class="p">,</span> <span class="n">latent_domains</span><span class="p">:</span> <span class="n">LatentsDomainGroupsT</span>
+</span><span id="GWLosses2Domains.translation_loss-429"><a href="#GWLosses2Domains.translation_loss-429"><span class="linenos">429</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]:</span>
+</span><span id="GWLosses2Domains.translation_loss-430"><a href="#GWLosses2Domains.translation_loss-430"><span class="linenos">430</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="GWLosses2Domains.translation_loss-431"><a href="#GWLosses2Domains.translation_loss-431"><span class="linenos">431</span></a><span class="sd">        Computes the translation loss.</span>
+</span><span id="GWLosses2Domains.translation_loss-432"><a href="#GWLosses2Domains.translation_loss-432"><span class="linenos">432</span></a>
+</span><span id="GWLosses2Domains.translation_loss-433"><a href="#GWLosses2Domains.translation_loss-433"><span class="linenos">433</span></a><span class="sd">        See `shimmer.modules.losses.translation_loss`.</span>
+</span><span id="GWLosses2Domains.translation_loss-434"><a href="#GWLosses2Domains.translation_loss-434"><span class="linenos">434</span></a>
+</span><span id="GWLosses2Domains.translation_loss-435"><a href="#GWLosses2Domains.translation_loss-435"><span class="linenos">435</span></a><span class="sd">        Args:</span>
+</span><span id="GWLosses2Domains.translation_loss-436"><a href="#GWLosses2Domains.translation_loss-436"><span class="linenos">436</span></a><span class="sd">            latent_domains (`LatentsDomainGroupsT`): the latent unimodal groups</span>
+</span><span id="GWLosses2Domains.translation_loss-437"><a href="#GWLosses2Domains.translation_loss-437"><span class="linenos">437</span></a>
+</span><span id="GWLosses2Domains.translation_loss-438"><a href="#GWLosses2Domains.translation_loss-438"><span class="linenos">438</span></a><span class="sd">        Returns:</span>
+</span><span id="GWLosses2Domains.translation_loss-439"><a href="#GWLosses2Domains.translation_loss-439"><span class="linenos">439</span></a><span class="sd">            `dict[str, torch.Tensor]`: a dict of metrics.</span>
+</span><span id="GWLosses2Domains.translation_loss-440"><a href="#GWLosses2Domains.translation_loss-440"><span class="linenos">440</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="GWLosses2Domains.translation_loss-441"><a href="#GWLosses2Domains.translation_loss-441"><span class="linenos">441</span></a>        <span class="k">return</span> <span class="n">translation_loss</span><span class="p">(</span>
+</span><span id="GWLosses2Domains.translation_loss-442"><a href="#GWLosses2Domains.translation_loss-442"><span class="linenos">442</span></a>            <span class="bp">self</span><span class="o">.</span><span class="n">gw_mod</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">selection_mod</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">domain_mods</span><span class="p">,</span> <span class="n">latent_domains</span>
+</span><span id="GWLosses2Domains.translation_loss-443"><a href="#GWLosses2Domains.translation_loss-443"><span class="linenos">443</span></a>        <span class="p">)</span>
+</span></pre></div>
+
+
+            <div class="docstring"><p>Computes the translation loss.</p>
+
+<p>See <code><a href="#translation_loss">translation_loss</a></code>.</p>
+
+<h6 id="arguments">Arguments:</h6>
+
+<ul>
+<li><strong>latent_domains (<code>LatentsDomainGroupsT</code>):</strong>  the latent unimodal groups</li>
+</ul>
+
+<h6 id="returns">Returns:</h6>
+
+<blockquote>
+  <p><code>dict[str, torch.Tensor]</code>: a dict of metrics.</p>
+</blockquote>
+</div>
+
+
+                            </div>
+                            <div id="GWLosses2Domains.contrastive_loss" class="classattr">
+                                        <input id="GWLosses2Domains.contrastive_loss-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
+<div class="attr function">
+            
+        <span class="def">def</span>
+        <span class="name">contrastive_loss</span><span class="signature pdoc-code multiline">(<span class="param">	<span class="bp">self</span>,</span><span class="param">	<span class="n">latent_domains</span><span class="p">:</span> <span class="n">collections</span><span class="o">.</span><span class="n">abc</span><span class="o">.</span><span class="n">Mapping</span><span class="p">[</span><span class="nb">frozenset</span><span class="p">[</span><span class="nb">str</span><span class="p">],</span> <span class="n">collections</span><span class="o">.</span><span class="n">abc</span><span class="o">.</span><span class="n">Mapping</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]]</span></span><span class="return-annotation">) -> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]</span>:</span></span>
+
+                <label class="view-source-button" for="GWLosses2Domains.contrastive_loss-view-source"><span>View Source</span></label>
+
+    </div>
+    <a class="headerlink" href="#GWLosses2Domains.contrastive_loss"></a>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="GWLosses2Domains.contrastive_loss-445"><a href="#GWLosses2Domains.contrastive_loss-445"><span class="linenos">445</span></a>    <span class="k">def</span> <span class="nf">contrastive_loss</span><span class="p">(</span>
+</span><span id="GWLosses2Domains.contrastive_loss-446"><a href="#GWLosses2Domains.contrastive_loss-446"><span class="linenos">446</span></a>        <span class="bp">self</span><span class="p">,</span> <span class="n">latent_domains</span><span class="p">:</span> <span class="n">LatentsDomainGroupsT</span>
+</span><span id="GWLosses2Domains.contrastive_loss-447"><a href="#GWLosses2Domains.contrastive_loss-447"><span class="linenos">447</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]:</span>
+</span><span id="GWLosses2Domains.contrastive_loss-448"><a href="#GWLosses2Domains.contrastive_loss-448"><span class="linenos">448</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="GWLosses2Domains.contrastive_loss-449"><a href="#GWLosses2Domains.contrastive_loss-449"><span class="linenos">449</span></a><span class="sd">        Computes the contrastive loss.</span>
+</span><span id="GWLosses2Domains.contrastive_loss-450"><a href="#GWLosses2Domains.contrastive_loss-450"><span class="linenos">450</span></a>
+</span><span id="GWLosses2Domains.contrastive_loss-451"><a href="#GWLosses2Domains.contrastive_loss-451"><span class="linenos">451</span></a><span class="sd">        See `shimmer.modules.losses.contrastive_loss`.</span>
+</span><span id="GWLosses2Domains.contrastive_loss-452"><a href="#GWLosses2Domains.contrastive_loss-452"><span class="linenos">452</span></a>
+</span><span id="GWLosses2Domains.contrastive_loss-453"><a href="#GWLosses2Domains.contrastive_loss-453"><span class="linenos">453</span></a><span class="sd">        Args:</span>
+</span><span id="GWLosses2Domains.contrastive_loss-454"><a href="#GWLosses2Domains.contrastive_loss-454"><span class="linenos">454</span></a><span class="sd">            latent_domains (`LatentsDomainGroupsT`): the latent unimodal groups</span>
+</span><span id="GWLosses2Domains.contrastive_loss-455"><a href="#GWLosses2Domains.contrastive_loss-455"><span class="linenos">455</span></a>
+</span><span id="GWLosses2Domains.contrastive_loss-456"><a href="#GWLosses2Domains.contrastive_loss-456"><span class="linenos">456</span></a><span class="sd">        Returns:</span>
+</span><span id="GWLosses2Domains.contrastive_loss-457"><a href="#GWLosses2Domains.contrastive_loss-457"><span class="linenos">457</span></a><span class="sd">            `dict[str, torch.Tensor]`: a dict of metrics.</span>
+</span><span id="GWLosses2Domains.contrastive_loss-458"><a href="#GWLosses2Domains.contrastive_loss-458"><span class="linenos">458</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="GWLosses2Domains.contrastive_loss-459"><a href="#GWLosses2Domains.contrastive_loss-459"><span class="linenos">459</span></a>        <span class="k">return</span> <span class="n">contrastive_loss</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">gw_mod</span><span class="p">,</span> <span class="n">latent_domains</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">contrastive_fn</span><span class="p">)</span>
+</span></pre></div>
+
+
+            <div class="docstring"><p>Computes the contrastive loss.</p>
+
+<p>See <code><a href="#contrastive_loss">contrastive_loss</a></code>.</p>
+
+<h6 id="arguments">Arguments:</h6>
+
+<ul>
+<li><strong>latent_domains (<code>LatentsDomainGroupsT</code>):</strong>  the latent unimodal groups</li>
+</ul>
+
+<h6 id="returns">Returns:</h6>
+
+<blockquote>
+  <p><code>dict[str, torch.Tensor]</code>: a dict of metrics.</p>
+</blockquote>
+</div>
+
+
+                            </div>
+                            <div id="GWLosses2Domains.step" class="classattr">
+                                        <input id="GWLosses2Domains.step-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
+<div class="attr function">
+            
+        <span class="def">def</span>
+        <span class="name">step</span><span class="signature pdoc-code multiline">(<span class="param">	<span class="bp">self</span>,</span><span class="param">	<span class="n">domain_latents</span><span class="p">:</span> <span class="n">collections</span><span class="o">.</span><span class="n">abc</span><span class="o">.</span><span class="n">Mapping</span><span class="p">[</span><span class="nb">frozenset</span><span class="p">[</span><span class="nb">str</span><span class="p">],</span> <span class="n">collections</span><span class="o">.</span><span class="n">abc</span><span class="o">.</span><span class="n">Mapping</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]]</span>,</span><span class="param">	<span class="n">mode</span><span class="p">:</span> <span class="n">Literal</span><span class="p">[</span><span class="s1">&#39;train&#39;</span><span class="p">,</span> <span class="s1">&#39;val&#39;</span><span class="p">,</span> <span class="s1">&#39;test&#39;</span><span class="p">,</span> <span class="s1">&#39;val/ood&#39;</span><span class="p">,</span> <span class="s1">&#39;test/ood&#39;</span><span class="p">]</span></span><span class="return-annotation">) -> <span class="n"><a href="domain.html#LossOutput">shimmer.modules.domain.LossOutput</a></span>:</span></span>
+
+                <label class="view-source-button" for="GWLosses2Domains.step-view-source"><span>View Source</span></label>
+
+    </div>
+    <a class="headerlink" href="#GWLosses2Domains.step"></a>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="GWLosses2Domains.step-461"><a href="#GWLosses2Domains.step-461"><span class="linenos">461</span></a>    <span class="k">def</span> <span class="nf">step</span><span class="p">(</span>
+</span><span id="GWLosses2Domains.step-462"><a href="#GWLosses2Domains.step-462"><span class="linenos">462</span></a>        <span class="bp">self</span><span class="p">,</span> <span class="n">domain_latents</span><span class="p">:</span> <span class="n">LatentsDomainGroupsT</span><span class="p">,</span> <span class="n">mode</span><span class="p">:</span> <span class="n">ModelModeT</span>
+</span><span id="GWLosses2Domains.step-463"><a href="#GWLosses2Domains.step-463"><span class="linenos">463</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="n">LossOutput</span><span class="p">:</span>
+</span><span id="GWLosses2Domains.step-464"><a href="#GWLosses2Domains.step-464"><span class="linenos">464</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="GWLosses2Domains.step-465"><a href="#GWLosses2Domains.step-465"><span class="linenos">465</span></a><span class="sd">        Computes and returns the losses</span>
+</span><span id="GWLosses2Domains.step-466"><a href="#GWLosses2Domains.step-466"><span class="linenos">466</span></a>
+</span><span id="GWLosses2Domains.step-467"><a href="#GWLosses2Domains.step-467"><span class="linenos">467</span></a><span class="sd">        Contains:</span>
+</span><span id="GWLosses2Domains.step-468"><a href="#GWLosses2Domains.step-468"><span class="linenos">468</span></a><span class="sd">            - Demi-cycle metrics (see `GWLosses.demi_cycle_loss`)</span>
+</span><span id="GWLosses2Domains.step-469"><a href="#GWLosses2Domains.step-469"><span class="linenos">469</span></a><span class="sd">            - Cycle metrics (see `GWLosses.cycle_loss`)</span>
+</span><span id="GWLosses2Domains.step-470"><a href="#GWLosses2Domains.step-470"><span class="linenos">470</span></a><span class="sd">            - Translation metrics (see `GWLosses.translation_loss`)</span>
+</span><span id="GWLosses2Domains.step-471"><a href="#GWLosses2Domains.step-471"><span class="linenos">471</span></a><span class="sd">            - Contrastive metrics (see `GWLosses.contrastive_loss`)</span>
+</span><span id="GWLosses2Domains.step-472"><a href="#GWLosses2Domains.step-472"><span class="linenos">472</span></a>
+</span><span id="GWLosses2Domains.step-473"><a href="#GWLosses2Domains.step-473"><span class="linenos">473</span></a><span class="sd">        Args:</span>
+</span><span id="GWLosses2Domains.step-474"><a href="#GWLosses2Domains.step-474"><span class="linenos">474</span></a><span class="sd">            domain_latents (`LatentsDomainGroupsT`): All latent groups</span>
+</span><span id="GWLosses2Domains.step-475"><a href="#GWLosses2Domains.step-475"><span class="linenos">475</span></a><span class="sd">            mode (`ModelModeT`): model mode</span>
+</span><span id="GWLosses2Domains.step-476"><a href="#GWLosses2Domains.step-476"><span class="linenos">476</span></a><span class="sd">        Returns:</span>
+</span><span id="GWLosses2Domains.step-477"><a href="#GWLosses2Domains.step-477"><span class="linenos">477</span></a><span class="sd">            `LossOutput`: the losses</span>
+</span><span id="GWLosses2Domains.step-478"><a href="#GWLosses2Domains.step-478"><span class="linenos">478</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="GWLosses2Domains.step-479"><a href="#GWLosses2Domains.step-479"><span class="linenos">479</span></a>        <span class="n">metrics</span><span class="p">:</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]</span> <span class="o">=</span> <span class="p">{}</span>
+</span><span id="GWLosses2Domains.step-480"><a href="#GWLosses2Domains.step-480"><span class="linenos">480</span></a>
+</span><span id="GWLosses2Domains.step-481"><a href="#GWLosses2Domains.step-481"><span class="linenos">481</span></a>        <span class="n">metrics</span><span class="o">.</span><span class="n">update</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">demi_cycle_loss</span><span class="p">(</span><span class="n">domain_latents</span><span class="p">))</span>
+</span><span id="GWLosses2Domains.step-482"><a href="#GWLosses2Domains.step-482"><span class="linenos">482</span></a>        <span class="n">metrics</span><span class="o">.</span><span class="n">update</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">cycle_loss</span><span class="p">(</span><span class="n">domain_latents</span><span class="p">))</span>
+</span><span id="GWLosses2Domains.step-483"><a href="#GWLosses2Domains.step-483"><span class="linenos">483</span></a>        <span class="n">metrics</span><span class="o">.</span><span class="n">update</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">translation_loss</span><span class="p">(</span><span class="n">domain_latents</span><span class="p">))</span>
+</span><span id="GWLosses2Domains.step-484"><a href="#GWLosses2Domains.step-484"><span class="linenos">484</span></a>        <span class="n">metrics</span><span class="o">.</span><span class="n">update</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">contrastive_loss</span><span class="p">(</span><span class="n">domain_latents</span><span class="p">))</span>
+</span><span id="GWLosses2Domains.step-485"><a href="#GWLosses2Domains.step-485"><span class="linenos">485</span></a>
+</span><span id="GWLosses2Domains.step-486"><a href="#GWLosses2Domains.step-486"><span class="linenos">486</span></a>        <span class="n">loss</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">stack</span><span class="p">(</span>
+</span><span id="GWLosses2Domains.step-487"><a href="#GWLosses2Domains.step-487"><span class="linenos">487</span></a>            <span class="p">[</span>
+</span><span id="GWLosses2Domains.step-488"><a href="#GWLosses2Domains.step-488"><span class="linenos">488</span></a>                <span class="n">metrics</span><span class="p">[</span><span class="n">name</span><span class="p">]</span> <span class="o">*</span> <span class="n">coef</span>
+</span><span id="GWLosses2Domains.step-489"><a href="#GWLosses2Domains.step-489"><span class="linenos">489</span></a>                <span class="k">for</span> <span class="n">name</span><span class="p">,</span> <span class="n">coef</span> <span class="ow">in</span> <span class="bp">self</span><span class="o">.</span><span class="n">loss_coefs</span><span class="o">.</span><span class="n">items</span><span class="p">()</span>
+</span><span id="GWLosses2Domains.step-490"><a href="#GWLosses2Domains.step-490"><span class="linenos">490</span></a>                <span class="k">if</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">coef</span><span class="p">,</span> <span class="nb">float</span><span class="p">)</span> <span class="ow">and</span> <span class="n">coef</span> <span class="o">&gt;</span> <span class="mi">0</span>
+</span><span id="GWLosses2Domains.step-491"><a href="#GWLosses2Domains.step-491"><span class="linenos">491</span></a>            <span class="p">],</span>
+</span><span id="GWLosses2Domains.step-492"><a href="#GWLosses2Domains.step-492"><span class="linenos">492</span></a>            <span class="n">dim</span><span class="o">=</span><span class="mi">0</span><span class="p">,</span>
+</span><span id="GWLosses2Domains.step-493"><a href="#GWLosses2Domains.step-493"><span class="linenos">493</span></a>        <span class="p">)</span><span class="o">.</span><span class="n">mean</span><span class="p">()</span>
+</span><span id="GWLosses2Domains.step-494"><a href="#GWLosses2Domains.step-494"><span class="linenos">494</span></a>
+</span><span id="GWLosses2Domains.step-495"><a href="#GWLosses2Domains.step-495"><span class="linenos">495</span></a>        <span class="k">return</span> <span class="n">LossOutput</span><span class="p">(</span><span class="n">loss</span><span class="p">,</span> <span class="n">metrics</span><span class="p">)</span>
+</span></pre></div>
+
+
+            <div class="docstring"><p>Computes and returns the losses</p>
+
+<h6 id="contains">Contains:</h6>
+
+<blockquote>
+  <ul>
+  <li>Demi-cycle metrics (see <code>GWLosses.demi_cycle_loss</code>)</li>
+  <li>Cycle metrics (see <code>GWLosses.cycle_loss</code>)</li>
+  <li>Translation metrics (see <code>GWLosses.translation_loss</code>)</li>
+  <li>Contrastive metrics (see <code><a href="#GWLosses.contrastive_loss">GWLosses.contrastive_loss</a></code>)</li>
+  </ul>
+</blockquote>
+
+<h6 id="arguments">Arguments:</h6>
+
+<ul>
+<li><strong>domain_latents (<code>LatentsDomainGroupsT</code>):</strong>  All latent groups</li>
+<li><strong>mode (<code>ModelModeT</code>):</strong>  model mode</li>
+</ul>
+
+<h6 id="returns">Returns:</h6>
+
+<blockquote>
+  <p><code>LossOutput</code>: the losses</p>
+</blockquote>
+</div>
+
+
+                            </div>
+                            <div class="inherited">
+                                <h5>Inherited Members</h5>
+                                <dl>
+                                    <div><dt>torch.nn.modules.module.Module</dt>
+                                <dd id="GWLosses2Domains.dump_patches" class="variable">dump_patches</dd>
+                <dd id="GWLosses2Domains.training" class="variable">training</dd>
+                <dd id="GWLosses2Domains.call_super_init" class="variable">call_super_init</dd>
+                <dd id="GWLosses2Domains.forward" class="function">forward</dd>
+                <dd id="GWLosses2Domains.register_buffer" class="function">register_buffer</dd>
+                <dd id="GWLosses2Domains.register_parameter" class="function">register_parameter</dd>
+                <dd id="GWLosses2Domains.add_module" class="function">add_module</dd>
+                <dd id="GWLosses2Domains.register_module" class="function">register_module</dd>
+                <dd id="GWLosses2Domains.get_submodule" class="function">get_submodule</dd>
+                <dd id="GWLosses2Domains.get_parameter" class="function">get_parameter</dd>
+                <dd id="GWLosses2Domains.get_buffer" class="function">get_buffer</dd>
+                <dd id="GWLosses2Domains.get_extra_state" class="function">get_extra_state</dd>
+                <dd id="GWLosses2Domains.set_extra_state" class="function">set_extra_state</dd>
+                <dd id="GWLosses2Domains.apply" class="function">apply</dd>
+                <dd id="GWLosses2Domains.cuda" class="function">cuda</dd>
+                <dd id="GWLosses2Domains.ipu" class="function">ipu</dd>
+                <dd id="GWLosses2Domains.xpu" class="function">xpu</dd>
+                <dd id="GWLosses2Domains.cpu" class="function">cpu</dd>
+                <dd id="GWLosses2Domains.type" class="function">type</dd>
+                <dd id="GWLosses2Domains.float" class="function">float</dd>
+                <dd id="GWLosses2Domains.double" class="function">double</dd>
+                <dd id="GWLosses2Domains.half" class="function">half</dd>
+                <dd id="GWLosses2Domains.bfloat16" class="function">bfloat16</dd>
+                <dd id="GWLosses2Domains.to_empty" class="function">to_empty</dd>
+                <dd id="GWLosses2Domains.to" class="function">to</dd>
+                <dd id="GWLosses2Domains.register_full_backward_pre_hook" class="function">register_full_backward_pre_hook</dd>
+                <dd id="GWLosses2Domains.register_backward_hook" class="function">register_backward_hook</dd>
+                <dd id="GWLosses2Domains.register_full_backward_hook" class="function">register_full_backward_hook</dd>
+                <dd id="GWLosses2Domains.register_forward_pre_hook" class="function">register_forward_pre_hook</dd>
+                <dd id="GWLosses2Domains.register_forward_hook" class="function">register_forward_hook</dd>
+                <dd id="GWLosses2Domains.register_state_dict_pre_hook" class="function">register_state_dict_pre_hook</dd>
+                <dd id="GWLosses2Domains.state_dict" class="function">state_dict</dd>
+                <dd id="GWLosses2Domains.register_load_state_dict_post_hook" class="function">register_load_state_dict_post_hook</dd>
+                <dd id="GWLosses2Domains.load_state_dict" class="function">load_state_dict</dd>
+                <dd id="GWLosses2Domains.parameters" class="function">parameters</dd>
+                <dd id="GWLosses2Domains.named_parameters" class="function">named_parameters</dd>
+                <dd id="GWLosses2Domains.buffers" class="function">buffers</dd>
+                <dd id="GWLosses2Domains.named_buffers" class="function">named_buffers</dd>
+                <dd id="GWLosses2Domains.children" class="function">children</dd>
+                <dd id="GWLosses2Domains.named_children" class="function">named_children</dd>
+                <dd id="GWLosses2Domains.modules" class="function">modules</dd>
+                <dd id="GWLosses2Domains.named_modules" class="function">named_modules</dd>
+                <dd id="GWLosses2Domains.train" class="function">train</dd>
+                <dd id="GWLosses2Domains.eval" class="function">eval</dd>
+                <dd id="GWLosses2Domains.requires_grad_" class="function">requires_grad_</dd>
+                <dd id="GWLosses2Domains.zero_grad" class="function">zero_grad</dd>
+                <dd id="GWLosses2Domains.share_memory" class="function">share_memory</dd>
+                <dd id="GWLosses2Domains.extra_repr" class="function">extra_repr</dd>
+                <dd id="GWLosses2Domains.compile" class="function">compile</dd>
+
+            </div>
+                                </dl>
+                            </div>
+                </section>
+                <section id="generate_partitions">
+                            <input id="generate_partitions-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
+<div class="attr function">
+            
+        <span class="def">def</span>
+        <span class="name">generate_partitions</span><span class="signature pdoc-code condensed">(<span class="param"><span class="n">n</span><span class="p">:</span> <span class="nb">int</span></span><span class="return-annotation">) -> <span class="n">collections</span><span class="o">.</span><span class="n">abc</span><span class="o">.</span><span class="n">Generator</span><span class="p">[</span><span class="nb">tuple</span><span class="p">[</span><span class="nb">int</span><span class="p">,</span> <span class="o">...</span><span class="p">],</span> <span class="kc">None</span><span class="p">,</span> <span class="kc">None</span><span class="p">]</span>:</span></span>
+
+                <label class="view-source-button" for="generate_partitions-view-source"><span>View Source</span></label>
+
+    </div>
+    <a class="headerlink" href="#generate_partitions"></a>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="generate_partitions-498"><a href="#generate_partitions-498"><span class="linenos">498</span></a><span class="k">def</span> <span class="nf">generate_partitions</span><span class="p">(</span><span class="n">n</span><span class="p">:</span> <span class="nb">int</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">Generator</span><span class="p">[</span><span class="nb">tuple</span><span class="p">[</span><span class="nb">int</span><span class="p">,</span> <span class="o">...</span><span class="p">],</span> <span class="kc">None</span><span class="p">,</span> <span class="kc">None</span><span class="p">]:</span>
+</span><span id="generate_partitions-499"><a href="#generate_partitions-499"><span class="linenos">499</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="generate_partitions-500"><a href="#generate_partitions-500"><span class="linenos">500</span></a><span class="sd">    Generates all possible partitions of zeros and ones for `n` elements,</span>
+</span><span id="generate_partitions-501"><a href="#generate_partitions-501"><span class="linenos">501</span></a><span class="sd">    excluding the all-zeros partition.</span>
+</span><span id="generate_partitions-502"><a href="#generate_partitions-502"><span class="linenos">502</span></a>
+</span><span id="generate_partitions-503"><a href="#generate_partitions-503"><span class="linenos">503</span></a><span class="sd">    Args:</span>
+</span><span id="generate_partitions-504"><a href="#generate_partitions-504"><span class="linenos">504</span></a><span class="sd">        n (`int`): The number of modalities to generate partitions for.</span>
+</span><span id="generate_partitions-505"><a href="#generate_partitions-505"><span class="linenos">505</span></a>
+</span><span id="generate_partitions-506"><a href="#generate_partitions-506"><span class="linenos">506</span></a><span class="sd">    Yields:</span>
+</span><span id="generate_partitions-507"><a href="#generate_partitions-507"><span class="linenos">507</span></a><span class="sd">        `tuple[int, ...]`: A partition of zeros and ones, excluding the</span>
+</span><span id="generate_partitions-508"><a href="#generate_partitions-508"><span class="linenos">508</span></a><span class="sd">        all-zeros partition.</span>
+</span><span id="generate_partitions-509"><a href="#generate_partitions-509"><span class="linenos">509</span></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="generate_partitions-510"><a href="#generate_partitions-510"><span class="linenos">510</span></a>    <span class="k">for</span> <span class="n">perm</span> <span class="ow">in</span> <span class="n">product</span><span class="p">([</span><span class="mi">0</span><span class="p">,</span> <span class="mi">1</span><span class="p">],</span> <span class="n">repeat</span><span class="o">=</span><span class="n">n</span><span class="p">):</span>
+</span><span id="generate_partitions-511"><a href="#generate_partitions-511"><span class="linenos">511</span></a>        <span class="k">if</span> <span class="nb">any</span><span class="p">(</span><span class="n">perm</span><span class="p">):</span>
+</span><span id="generate_partitions-512"><a href="#generate_partitions-512"><span class="linenos">512</span></a>            <span class="k">yield</span> <span class="n">perm</span>
+</span></pre></div>
+
+
+            <div class="docstring"><p>Generates all possible partitions of zeros and ones for <code>n</code> elements,
+excluding the all-zeros partition.</p>
+
+<h6 id="arguments">Arguments:</h6>
+
+<ul>
+<li><strong>n (<code>int</code>):</strong>  The number of modalities to generate partitions for.</li>
+</ul>
+
+<h6 id="yields">Yields:</h6>
+
+<blockquote>
+  <p><code>tuple[int, ...]</code>: A partition of zeros and ones, excluding the
+  all-zeros partition.</p>
+</blockquote>
+</div>
+
+
+                </section>
+                <section id="broadcast_loss">
+                            <input id="broadcast_loss-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
+<div class="attr function">
+            
+        <span class="def">def</span>
+        <span class="name">broadcast_loss</span><span class="signature pdoc-code multiline">(<span class="param">	<span class="n">gw_mod</span><span class="p">:</span> <span class="n"><a href="gw_module.html#GWModuleBase">shimmer.modules.gw_module.GWModuleBase</a></span>,</span><span class="param">	<span class="n">selection_mod</span><span class="p">:</span> <span class="n"><a href="selection.html#SelectionBase">shimmer.modules.selection.SelectionBase</a></span>,</span><span class="param">	<span class="n">domain_mods</span><span class="p">:</span> <span class="n">collections</span><span class="o">.</span><span class="n">abc</span><span class="o">.</span><span class="n">Mapping</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n"><a href="domain.html#DomainModule">shimmer.modules.domain.DomainModule</a></span><span class="p">]</span>,</span><span class="param">	<span class="n">latent_domains</span><span class="p">:</span> <span class="n">collections</span><span class="o">.</span><span class="n">abc</span><span class="o">.</span><span class="n">Mapping</span><span class="p">[</span><span class="nb">frozenset</span><span class="p">[</span><span class="nb">str</span><span class="p">],</span> <span class="n">collections</span><span class="o">.</span><span class="n">abc</span><span class="o">.</span><span class="n">Mapping</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]]</span></span><span class="return-annotation">) -> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]</span>:</span></span>
+
+                <label class="view-source-button" for="broadcast_loss-view-source"><span>View Source</span></label>
+
+    </div>
+    <a class="headerlink" href="#broadcast_loss"></a>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="broadcast_loss-515"><a href="#broadcast_loss-515"><span class="linenos">515</span></a><span class="k">def</span> <span class="nf">broadcast_loss</span><span class="p">(</span>
+</span><span id="broadcast_loss-516"><a href="#broadcast_loss-516"><span class="linenos">516</span></a>    <span class="n">gw_mod</span><span class="p">:</span> <span class="n">GWModuleBase</span><span class="p">,</span>
+</span><span id="broadcast_loss-517"><a href="#broadcast_loss-517"><span class="linenos">517</span></a>    <span class="n">selection_mod</span><span class="p">:</span> <span class="n">SelectionBase</span><span class="p">,</span>
+</span><span id="broadcast_loss-518"><a href="#broadcast_loss-518"><span class="linenos">518</span></a>    <span class="n">domain_mods</span><span class="p">:</span> <span class="n">Mapping</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">DomainModule</span><span class="p">],</span>
+</span><span id="broadcast_loss-519"><a href="#broadcast_loss-519"><span class="linenos">519</span></a>    <span class="n">latent_domains</span><span class="p">:</span> <span class="n">LatentsDomainGroupsT</span><span class="p">,</span>
+</span><span id="broadcast_loss-520"><a href="#broadcast_loss-520"><span class="linenos">520</span></a><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]:</span>
+</span><span id="broadcast_loss-521"><a href="#broadcast_loss-521"><span class="linenos">521</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="broadcast_loss-522"><a href="#broadcast_loss-522"><span class="linenos">522</span></a><span class="sd">    Computes broadcast loss including demi-cycle, cycle, and translation losses.</span>
+</span><span id="broadcast_loss-523"><a href="#broadcast_loss-523"><span class="linenos">523</span></a>
+</span><span id="broadcast_loss-524"><a href="#broadcast_loss-524"><span class="linenos">524</span></a><span class="sd">    Args:</span>
+</span><span id="broadcast_loss-525"><a href="#broadcast_loss-525"><span class="linenos">525</span></a><span class="sd">        gw_mod (`shimmer.modules.gw_module.GWModuleBase`): The GWModule to use</span>
+</span><span id="broadcast_loss-526"><a href="#broadcast_loss-526"><span class="linenos">526</span></a><span class="sd">        selection_mod (`shimmer.modules.selection.SelectionBase`): Selection mod to use</span>
+</span><span id="broadcast_loss-527"><a href="#broadcast_loss-527"><span class="linenos">527</span></a><span class="sd">        domain_mods (`Mapping[str, DomainModule]`): the domain modules</span>
+</span><span id="broadcast_loss-528"><a href="#broadcast_loss-528"><span class="linenos">528</span></a><span class="sd">        latent_domains: The latent domain representations.</span>
+</span><span id="broadcast_loss-529"><a href="#broadcast_loss-529"><span class="linenos">529</span></a>
+</span><span id="broadcast_loss-530"><a href="#broadcast_loss-530"><span class="linenos">530</span></a><span class="sd">    Returns:</span>
+</span><span id="broadcast_loss-531"><a href="#broadcast_loss-531"><span class="linenos">531</span></a><span class="sd">        A dictionary with the total loss and additional metrics.</span>
+</span><span id="broadcast_loss-532"><a href="#broadcast_loss-532"><span class="linenos">532</span></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="broadcast_loss-533"><a href="#broadcast_loss-533"><span class="linenos">533</span></a>    <span class="n">losses</span><span class="p">:</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]</span> <span class="o">=</span> <span class="p">{}</span>
+</span><span id="broadcast_loss-534"><a href="#broadcast_loss-534"><span class="linenos">534</span></a>    <span class="n">metrics</span><span class="p">:</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]</span> <span class="o">=</span> <span class="p">{}</span>
+</span><span id="broadcast_loss-535"><a href="#broadcast_loss-535"><span class="linenos">535</span></a>
+</span><span id="broadcast_loss-536"><a href="#broadcast_loss-536"><span class="linenos">536</span></a>    <span class="n">demi_cycle_losses</span><span class="p">:</span> <span class="nb">list</span><span class="p">[</span><span class="nb">str</span><span class="p">]</span> <span class="o">=</span> <span class="p">[]</span>
+</span><span id="broadcast_loss-537"><a href="#broadcast_loss-537"><span class="linenos">537</span></a>    <span class="n">cycle_losses</span><span class="p">:</span> <span class="nb">list</span><span class="p">[</span><span class="nb">str</span><span class="p">]</span> <span class="o">=</span> <span class="p">[]</span>
+</span><span id="broadcast_loss-538"><a href="#broadcast_loss-538"><span class="linenos">538</span></a>    <span class="n">translation_losses</span><span class="p">:</span> <span class="nb">list</span><span class="p">[</span><span class="nb">str</span><span class="p">]</span> <span class="o">=</span> <span class="p">[]</span>
+</span><span id="broadcast_loss-539"><a href="#broadcast_loss-539"><span class="linenos">539</span></a>    <span class="n">fused_losses</span><span class="p">:</span> <span class="nb">list</span><span class="p">[</span><span class="nb">str</span><span class="p">]</span> <span class="o">=</span> <span class="p">[]</span>
+</span><span id="broadcast_loss-540"><a href="#broadcast_loss-540"><span class="linenos">540</span></a>
+</span><span id="broadcast_loss-541"><a href="#broadcast_loss-541"><span class="linenos">541</span></a>    <span class="k">for</span> <span class="n">group_domains</span><span class="p">,</span> <span class="n">latents</span> <span class="ow">in</span> <span class="n">latent_domains</span><span class="o">.</span><span class="n">items</span><span class="p">():</span>
+</span><span id="broadcast_loss-542"><a href="#broadcast_loss-542"><span class="linenos">542</span></a>        <span class="n">encoded_latents</span> <span class="o">=</span> <span class="n">gw_mod</span><span class="o">.</span><span class="n">encode</span><span class="p">(</span><span class="n">latents</span><span class="p">)</span>
+</span><span id="broadcast_loss-543"><a href="#broadcast_loss-543"><span class="linenos">543</span></a>        <span class="n">partitions</span> <span class="o">=</span> <span class="n">generate_partitions</span><span class="p">(</span><span class="nb">len</span><span class="p">(</span><span class="n">group_domains</span><span class="p">))</span>
+</span><span id="broadcast_loss-544"><a href="#broadcast_loss-544"><span class="linenos">544</span></a>        <span class="n">domain_names</span> <span class="o">=</span> <span class="nb">list</span><span class="p">(</span><span class="n">latents</span><span class="p">)</span>
+</span><span id="broadcast_loss-545"><a href="#broadcast_loss-545"><span class="linenos">545</span></a>        <span class="n">group_name</span> <span class="o">=</span> <span class="s2">&quot;-&quot;</span><span class="o">.</span><span class="n">join</span><span class="p">(</span><span class="n">group_domains</span><span class="p">)</span>
+</span><span id="broadcast_loss-546"><a href="#broadcast_loss-546"><span class="linenos">546</span></a>
+</span><span id="broadcast_loss-547"><a href="#broadcast_loss-547"><span class="linenos">547</span></a>        <span class="k">for</span> <span class="n">partition</span> <span class="ow">in</span> <span class="n">partitions</span><span class="p">:</span>
+</span><span id="broadcast_loss-548"><a href="#broadcast_loss-548"><span class="linenos">548</span></a>            <span class="n">selected_latents</span> <span class="o">=</span> <span class="p">{</span>
+</span><span id="broadcast_loss-549"><a href="#broadcast_loss-549"><span class="linenos">549</span></a>                <span class="n">domain</span><span class="p">:</span> <span class="n">latents</span><span class="p">[</span><span class="n">domain</span><span class="p">]</span>
+</span><span id="broadcast_loss-550"><a href="#broadcast_loss-550"><span class="linenos">550</span></a>                <span class="k">for</span> <span class="n">domain</span><span class="p">,</span> <span class="n">present</span> <span class="ow">in</span> <span class="nb">zip</span><span class="p">(</span><span class="n">domain_names</span><span class="p">,</span> <span class="n">partition</span><span class="p">,</span> <span class="n">strict</span><span class="o">=</span><span class="kc">True</span><span class="p">)</span>
+</span><span id="broadcast_loss-551"><a href="#broadcast_loss-551"><span class="linenos">551</span></a>                <span class="k">if</span> <span class="n">present</span>
+</span><span id="broadcast_loss-552"><a href="#broadcast_loss-552"><span class="linenos">552</span></a>            <span class="p">}</span>
+</span><span id="broadcast_loss-553"><a href="#broadcast_loss-553"><span class="linenos">553</span></a>            <span class="n">selected_encoded_latents</span> <span class="o">=</span> <span class="p">{</span>
+</span><span id="broadcast_loss-554"><a href="#broadcast_loss-554"><span class="linenos">554</span></a>                <span class="n">domain</span><span class="p">:</span> <span class="n">encoded_latents</span><span class="p">[</span><span class="n">domain</span><span class="p">]</span> <span class="k">for</span> <span class="n">domain</span> <span class="ow">in</span> <span class="n">selected_latents</span>
+</span><span id="broadcast_loss-555"><a href="#broadcast_loss-555"><span class="linenos">555</span></a>            <span class="p">}</span>
+</span><span id="broadcast_loss-556"><a href="#broadcast_loss-556"><span class="linenos">556</span></a>            <span class="n">selected_group_label</span> <span class="o">=</span> <span class="s2">&quot;{&quot;</span> <span class="o">+</span> <span class="s2">&quot;, &quot;</span><span class="o">.</span><span class="n">join</span><span class="p">(</span><span class="nb">sorted</span><span class="p">(</span><span class="n">selected_latents</span><span class="p">))</span> <span class="o">+</span> <span class="s2">&quot;}&quot;</span>
+</span><span id="broadcast_loss-557"><a href="#broadcast_loss-557"><span class="linenos">557</span></a>
+</span><span id="broadcast_loss-558"><a href="#broadcast_loss-558"><span class="linenos">558</span></a>            <span class="n">selection_scores</span> <span class="o">=</span> <span class="n">selection_mod</span><span class="p">(</span><span class="n">selected_latents</span><span class="p">,</span> <span class="n">selected_encoded_latents</span><span class="p">)</span>
+</span><span id="broadcast_loss-559"><a href="#broadcast_loss-559"><span class="linenos">559</span></a>            <span class="n">fused_latents</span> <span class="o">=</span> <span class="n">gw_mod</span><span class="o">.</span><span class="n">fuse</span><span class="p">(</span><span class="n">selected_encoded_latents</span><span class="p">,</span> <span class="n">selection_scores</span><span class="p">)</span>
+</span><span id="broadcast_loss-560"><a href="#broadcast_loss-560"><span class="linenos">560</span></a>            <span class="n">decoded_latents</span> <span class="o">=</span> <span class="n">gw_mod</span><span class="o">.</span><span class="n">decode</span><span class="p">(</span><span class="n">fused_latents</span><span class="p">)</span>
+</span><span id="broadcast_loss-561"><a href="#broadcast_loss-561"><span class="linenos">561</span></a>
+</span><span id="broadcast_loss-562"><a href="#broadcast_loss-562"><span class="linenos">562</span></a>            <span class="n">num_active_domains</span> <span class="o">=</span> <span class="nb">sum</span><span class="p">(</span><span class="n">partition</span><span class="p">)</span>
+</span><span id="broadcast_loss-563"><a href="#broadcast_loss-563"><span class="linenos">563</span></a>            <span class="n">num_total_domains</span> <span class="o">=</span> <span class="nb">len</span><span class="p">(</span><span class="n">decoded_latents</span><span class="p">)</span>
+</span><span id="broadcast_loss-564"><a href="#broadcast_loss-564"><span class="linenos">564</span></a>
+</span><span id="broadcast_loss-565"><a href="#broadcast_loss-565"><span class="linenos">565</span></a>            <span class="k">for</span> <span class="n">domain</span><span class="p">,</span> <span class="n">pred</span> <span class="ow">in</span> <span class="n">decoded_latents</span><span class="o">.</span><span class="n">items</span><span class="p">():</span>
+</span><span id="broadcast_loss-566"><a href="#broadcast_loss-566"><span class="linenos">566</span></a>                <span class="k">if</span> <span class="n">domain</span> <span class="ow">not</span> <span class="ow">in</span> <span class="n">group_domains</span><span class="p">:</span>  <span class="c1"># if we don&#39;t have ground truth</span>
+</span><span id="broadcast_loss-567"><a href="#broadcast_loss-567"><span class="linenos">567</span></a>                    <span class="k">continue</span>
+</span><span id="broadcast_loss-568"><a href="#broadcast_loss-568"><span class="linenos">568</span></a>                <span class="n">ground_truth</span> <span class="o">=</span> <span class="n">latents</span><span class="p">[</span><span class="n">domain</span><span class="p">]</span>
+</span><span id="broadcast_loss-569"><a href="#broadcast_loss-569"><span class="linenos">569</span></a>                <span class="n">loss_output</span> <span class="o">=</span> <span class="n">domain_mods</span><span class="p">[</span><span class="n">domain</span><span class="p">]</span><span class="o">.</span><span class="n">compute_loss</span><span class="p">(</span><span class="n">pred</span><span class="p">,</span> <span class="n">ground_truth</span><span class="p">)</span>
+</span><span id="broadcast_loss-570"><a href="#broadcast_loss-570"><span class="linenos">570</span></a>                <span class="n">loss_label</span> <span class="o">=</span> <span class="sa">f</span><span class="s2">&quot;from_</span><span class="si">{</span><span class="n">selected_group_label</span><span class="si">}</span><span class="s2">_to_</span><span class="si">{</span><span class="n">domain</span><span class="si">}</span><span class="s2">&quot;</span>
+</span><span id="broadcast_loss-571"><a href="#broadcast_loss-571"><span class="linenos">571</span></a>                <span class="n">losses</span><span class="p">[</span><span class="n">loss_label</span> <span class="o">+</span> <span class="s2">&quot;_loss&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="n">loss_output</span><span class="o">.</span><span class="n">loss</span>
+</span><span id="broadcast_loss-572"><a href="#broadcast_loss-572"><span class="linenos">572</span></a>                <span class="n">metrics</span><span class="o">.</span><span class="n">update</span><span class="p">(</span>
+</span><span id="broadcast_loss-573"><a href="#broadcast_loss-573"><span class="linenos">573</span></a>                    <span class="p">{</span><span class="sa">f</span><span class="s2">&quot;</span><span class="si">{</span><span class="n">loss_label</span><span class="si">}</span><span class="s2">_</span><span class="si">{</span><span class="n">k</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">:</span> <span class="n">v</span> <span class="k">for</span> <span class="n">k</span><span class="p">,</span> <span class="n">v</span> <span class="ow">in</span> <span class="n">loss_output</span><span class="o">.</span><span class="n">metrics</span><span class="o">.</span><span class="n">items</span><span class="p">()}</span>
+</span><span id="broadcast_loss-574"><a href="#broadcast_loss-574"><span class="linenos">574</span></a>                <span class="p">)</span>
+</span><span id="broadcast_loss-575"><a href="#broadcast_loss-575"><span class="linenos">575</span></a>
+</span><span id="broadcast_loss-576"><a href="#broadcast_loss-576"><span class="linenos">576</span></a>                <span class="k">if</span> <span class="n">num_active_domains</span> <span class="o">==</span> <span class="mi">1</span> <span class="ow">and</span> <span class="n">domain</span> <span class="ow">in</span> <span class="n">selected_latents</span><span class="p">:</span>
+</span><span id="broadcast_loss-577"><a href="#broadcast_loss-577"><span class="linenos">577</span></a>                    <span class="n">demi_cycle_losses</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">loss_label</span> <span class="o">+</span> <span class="s2">&quot;_loss&quot;</span><span class="p">)</span>
+</span><span id="broadcast_loss-578"><a href="#broadcast_loss-578"><span class="linenos">578</span></a>                <span class="k">elif</span> <span class="n">domain</span> <span class="ow">not</span> <span class="ow">in</span> <span class="n">selected_latents</span><span class="p">:</span>
+</span><span id="broadcast_loss-579"><a href="#broadcast_loss-579"><span class="linenos">579</span></a>                    <span class="n">translation_losses</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">loss_label</span> <span class="o">+</span> <span class="s2">&quot;_loss&quot;</span><span class="p">)</span>
+</span><span id="broadcast_loss-580"><a href="#broadcast_loss-580"><span class="linenos">580</span></a>                <span class="k">else</span><span class="p">:</span>  <span class="c1"># fused loss</span>
+</span><span id="broadcast_loss-581"><a href="#broadcast_loss-581"><span class="linenos">581</span></a>                    <span class="n">fused_losses</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">loss_label</span> <span class="o">+</span> <span class="s2">&quot;_loss&quot;</span><span class="p">)</span>
+</span><span id="broadcast_loss-582"><a href="#broadcast_loss-582"><span class="linenos">582</span></a>
+</span><span id="broadcast_loss-583"><a href="#broadcast_loss-583"><span class="linenos">583</span></a>            <span class="k">if</span> <span class="n">num_active_domains</span> <span class="o">&lt;</span> <span class="n">num_total_domains</span><span class="p">:</span>
+</span><span id="broadcast_loss-584"><a href="#broadcast_loss-584"><span class="linenos">584</span></a>                <span class="n">inverse_selected_latents</span> <span class="o">=</span> <span class="p">{</span>
+</span><span id="broadcast_loss-585"><a href="#broadcast_loss-585"><span class="linenos">585</span></a>                    <span class="n">domain</span><span class="p">:</span> <span class="n">decoded_latents</span><span class="p">[</span><span class="n">domain</span><span class="p">]</span>
+</span><span id="broadcast_loss-586"><a href="#broadcast_loss-586"><span class="linenos">586</span></a>                    <span class="k">for</span> <span class="n">domain</span> <span class="ow">in</span> <span class="n">decoded_latents</span>
+</span><span id="broadcast_loss-587"><a href="#broadcast_loss-587"><span class="linenos">587</span></a>                    <span class="k">if</span> <span class="n">domain</span> <span class="ow">not</span> <span class="ow">in</span> <span class="n">selected_latents</span>
+</span><span id="broadcast_loss-588"><a href="#broadcast_loss-588"><span class="linenos">588</span></a>                <span class="p">}</span>
+</span><span id="broadcast_loss-589"><a href="#broadcast_loss-589"><span class="linenos">589</span></a>
+</span><span id="broadcast_loss-590"><a href="#broadcast_loss-590"><span class="linenos">590</span></a>                <span class="n">inverse_selected_group_label</span> <span class="o">=</span> <span class="p">(</span>
+</span><span id="broadcast_loss-591"><a href="#broadcast_loss-591"><span class="linenos">591</span></a>                    <span class="s2">&quot;{&quot;</span> <span class="o">+</span> <span class="s2">&quot;, &quot;</span><span class="o">.</span><span class="n">join</span><span class="p">(</span><span class="nb">sorted</span><span class="p">(</span><span class="n">inverse_selected_latents</span><span class="p">))</span> <span class="o">+</span> <span class="s2">&quot;}&quot;</span>
+</span><span id="broadcast_loss-592"><a href="#broadcast_loss-592"><span class="linenos">592</span></a>                <span class="p">)</span>
+</span><span id="broadcast_loss-593"><a href="#broadcast_loss-593"><span class="linenos">593</span></a>
+</span><span id="broadcast_loss-594"><a href="#broadcast_loss-594"><span class="linenos">594</span></a>                <span class="n">re_encoded_latents</span> <span class="o">=</span> <span class="n">gw_mod</span><span class="o">.</span><span class="n">encode</span><span class="p">(</span><span class="n">inverse_selected_latents</span><span class="p">)</span>
+</span><span id="broadcast_loss-595"><a href="#broadcast_loss-595"><span class="linenos">595</span></a>                <span class="n">re_selection_scores</span> <span class="o">=</span> <span class="n">selection_mod</span><span class="p">(</span>
+</span><span id="broadcast_loss-596"><a href="#broadcast_loss-596"><span class="linenos">596</span></a>                    <span class="n">inverse_selected_latents</span><span class="p">,</span> <span class="n">re_encoded_latents</span>
+</span><span id="broadcast_loss-597"><a href="#broadcast_loss-597"><span class="linenos">597</span></a>                <span class="p">)</span>
+</span><span id="broadcast_loss-598"><a href="#broadcast_loss-598"><span class="linenos">598</span></a>                <span class="n">re_fused_latents</span> <span class="o">=</span> <span class="n">gw_mod</span><span class="o">.</span><span class="n">fuse</span><span class="p">(</span><span class="n">re_encoded_latents</span><span class="p">,</span> <span class="n">re_selection_scores</span><span class="p">)</span>
+</span><span id="broadcast_loss-599"><a href="#broadcast_loss-599"><span class="linenos">599</span></a>                <span class="n">re_decoded_latents</span> <span class="o">=</span> <span class="n">gw_mod</span><span class="o">.</span><span class="n">decode</span><span class="p">(</span>
+</span><span id="broadcast_loss-600"><a href="#broadcast_loss-600"><span class="linenos">600</span></a>                    <span class="n">re_fused_latents</span><span class="p">,</span> <span class="n">domains</span><span class="o">=</span><span class="n">selected_latents</span><span class="o">.</span><span class="n">keys</span><span class="p">()</span>
+</span><span id="broadcast_loss-601"><a href="#broadcast_loss-601"><span class="linenos">601</span></a>                <span class="p">)</span>
+</span><span id="broadcast_loss-602"><a href="#broadcast_loss-602"><span class="linenos">602</span></a>
+</span><span id="broadcast_loss-603"><a href="#broadcast_loss-603"><span class="linenos">603</span></a>                <span class="k">for</span> <span class="n">domain</span> <span class="ow">in</span> <span class="n">selected_latents</span><span class="p">:</span>
+</span><span id="broadcast_loss-604"><a href="#broadcast_loss-604"><span class="linenos">604</span></a>                    <span class="n">re_ground_truth</span> <span class="o">=</span> <span class="n">latents</span><span class="p">[</span><span class="n">domain</span><span class="p">]</span>
+</span><span id="broadcast_loss-605"><a href="#broadcast_loss-605"><span class="linenos">605</span></a>                    <span class="n">re_loss_output</span> <span class="o">=</span> <span class="n">domain_mods</span><span class="p">[</span><span class="n">domain</span><span class="p">]</span><span class="o">.</span><span class="n">compute_loss</span><span class="p">(</span>
+</span><span id="broadcast_loss-606"><a href="#broadcast_loss-606"><span class="linenos">606</span></a>                        <span class="n">re_decoded_latents</span><span class="p">[</span><span class="n">domain</span><span class="p">],</span> <span class="n">re_ground_truth</span>
+</span><span id="broadcast_loss-607"><a href="#broadcast_loss-607"><span class="linenos">607</span></a>                    <span class="p">)</span>
+</span><span id="broadcast_loss-608"><a href="#broadcast_loss-608"><span class="linenos">608</span></a>                    <span class="n">loss_label</span> <span class="o">=</span> <span class="p">(</span>
+</span><span id="broadcast_loss-609"><a href="#broadcast_loss-609"><span class="linenos">609</span></a>                        <span class="sa">f</span><span class="s2">&quot;from_</span><span class="si">{</span><span class="n">selected_group_label</span><span class="si">}</span><span class="s2">_&quot;</span>
+</span><span id="broadcast_loss-610"><a href="#broadcast_loss-610"><span class="linenos">610</span></a>                        <span class="sa">f</span><span class="s2">&quot;through_</span><span class="si">{</span><span class="n">inverse_selected_group_label</span><span class="si">}</span><span class="s2">_to_</span><span class="si">{</span><span class="n">domain</span><span class="si">}</span><span class="s2">_&quot;</span>
+</span><span id="broadcast_loss-611"><a href="#broadcast_loss-611"><span class="linenos">611</span></a>                        <span class="sa">f</span><span class="s2">&quot;case_</span><span class="si">{</span><span class="n">group_name</span><span class="si">}</span><span class="s2">&quot;</span>
+</span><span id="broadcast_loss-612"><a href="#broadcast_loss-612"><span class="linenos">612</span></a>                    <span class="p">)</span>
+</span><span id="broadcast_loss-613"><a href="#broadcast_loss-613"><span class="linenos">613</span></a>                    <span class="n">losses</span><span class="p">[</span><span class="n">loss_label</span> <span class="o">+</span> <span class="s2">&quot;_loss&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="n">re_loss_output</span><span class="o">.</span><span class="n">loss</span>
+</span><span id="broadcast_loss-614"><a href="#broadcast_loss-614"><span class="linenos">614</span></a>                    <span class="n">metrics</span><span class="o">.</span><span class="n">update</span><span class="p">(</span>
+</span><span id="broadcast_loss-615"><a href="#broadcast_loss-615"><span class="linenos">615</span></a>                        <span class="p">{</span>
+</span><span id="broadcast_loss-616"><a href="#broadcast_loss-616"><span class="linenos">616</span></a>                            <span class="sa">f</span><span class="s2">&quot;</span><span class="si">{</span><span class="n">loss_label</span><span class="si">}</span><span class="s2">_</span><span class="si">{</span><span class="n">k</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">:</span> <span class="n">v</span>
+</span><span id="broadcast_loss-617"><a href="#broadcast_loss-617"><span class="linenos">617</span></a>                            <span class="k">for</span> <span class="n">k</span><span class="p">,</span> <span class="n">v</span> <span class="ow">in</span> <span class="n">re_loss_output</span><span class="o">.</span><span class="n">metrics</span><span class="o">.</span><span class="n">items</span><span class="p">()</span>
+</span><span id="broadcast_loss-618"><a href="#broadcast_loss-618"><span class="linenos">618</span></a>                        <span class="p">}</span>
+</span><span id="broadcast_loss-619"><a href="#broadcast_loss-619"><span class="linenos">619</span></a>                    <span class="p">)</span>
+</span><span id="broadcast_loss-620"><a href="#broadcast_loss-620"><span class="linenos">620</span></a>                    <span class="n">cycle_losses</span><span class="o">.</span><span class="n">append</span><span class="p">(</span><span class="n">loss_label</span> <span class="o">+</span> <span class="s2">&quot;_loss&quot;</span><span class="p">)</span>
+</span><span id="broadcast_loss-621"><a href="#broadcast_loss-621"><span class="linenos">621</span></a>
+</span><span id="broadcast_loss-622"><a href="#broadcast_loss-622"><span class="linenos">622</span></a>    <span class="k">if</span> <span class="n">demi_cycle_losses</span><span class="p">:</span>
+</span><span id="broadcast_loss-623"><a href="#broadcast_loss-623"><span class="linenos">623</span></a>        <span class="n">metrics</span><span class="p">[</span><span class="s2">&quot;demi_cycles&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">mean</span><span class="p">(</span>
+</span><span id="broadcast_loss-624"><a href="#broadcast_loss-624"><span class="linenos">624</span></a>            <span class="n">torch</span><span class="o">.</span><span class="n">stack</span><span class="p">([</span><span class="n">losses</span><span class="p">[</span><span class="n">loss_name</span><span class="p">]</span> <span class="k">for</span> <span class="n">loss_name</span> <span class="ow">in</span> <span class="n">demi_cycle_losses</span><span class="p">])</span>
+</span><span id="broadcast_loss-625"><a href="#broadcast_loss-625"><span class="linenos">625</span></a>        <span class="p">)</span>
+</span><span id="broadcast_loss-626"><a href="#broadcast_loss-626"><span class="linenos">626</span></a>    <span class="k">if</span> <span class="n">cycle_losses</span><span class="p">:</span>
+</span><span id="broadcast_loss-627"><a href="#broadcast_loss-627"><span class="linenos">627</span></a>        <span class="n">metrics</span><span class="p">[</span><span class="s2">&quot;cycles&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">mean</span><span class="p">(</span>
+</span><span id="broadcast_loss-628"><a href="#broadcast_loss-628"><span class="linenos">628</span></a>            <span class="n">torch</span><span class="o">.</span><span class="n">stack</span><span class="p">([</span><span class="n">losses</span><span class="p">[</span><span class="n">loss_name</span><span class="p">]</span> <span class="k">for</span> <span class="n">loss_name</span> <span class="ow">in</span> <span class="n">cycle_losses</span><span class="p">])</span>
+</span><span id="broadcast_loss-629"><a href="#broadcast_loss-629"><span class="linenos">629</span></a>        <span class="p">)</span>
+</span><span id="broadcast_loss-630"><a href="#broadcast_loss-630"><span class="linenos">630</span></a>    <span class="k">if</span> <span class="n">translation_losses</span><span class="p">:</span>
+</span><span id="broadcast_loss-631"><a href="#broadcast_loss-631"><span class="linenos">631</span></a>        <span class="n">metrics</span><span class="p">[</span><span class="s2">&quot;translations&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">mean</span><span class="p">(</span>
+</span><span id="broadcast_loss-632"><a href="#broadcast_loss-632"><span class="linenos">632</span></a>            <span class="n">torch</span><span class="o">.</span><span class="n">stack</span><span class="p">([</span><span class="n">losses</span><span class="p">[</span><span class="n">loss_name</span><span class="p">]</span> <span class="k">for</span> <span class="n">loss_name</span> <span class="ow">in</span> <span class="n">translation_losses</span><span class="p">])</span>
+</span><span id="broadcast_loss-633"><a href="#broadcast_loss-633"><span class="linenos">633</span></a>        <span class="p">)</span>
+</span><span id="broadcast_loss-634"><a href="#broadcast_loss-634"><span class="linenos">634</span></a>    <span class="k">if</span> <span class="n">fused_losses</span><span class="p">:</span>
+</span><span id="broadcast_loss-635"><a href="#broadcast_loss-635"><span class="linenos">635</span></a>        <span class="n">metrics</span><span class="p">[</span><span class="s2">&quot;fused&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">mean</span><span class="p">(</span>
+</span><span id="broadcast_loss-636"><a href="#broadcast_loss-636"><span class="linenos">636</span></a>            <span class="n">torch</span><span class="o">.</span><span class="n">stack</span><span class="p">([</span><span class="n">losses</span><span class="p">[</span><span class="n">loss_name</span><span class="p">]</span> <span class="k">for</span> <span class="n">loss_name</span> <span class="ow">in</span> <span class="n">fused_losses</span><span class="p">])</span>
+</span><span id="broadcast_loss-637"><a href="#broadcast_loss-637"><span class="linenos">637</span></a>        <span class="p">)</span>
+</span><span id="broadcast_loss-638"><a href="#broadcast_loss-638"><span class="linenos">638</span></a>
+</span><span id="broadcast_loss-639"><a href="#broadcast_loss-639"><span class="linenos">639</span></a>    <span class="n">metrics</span><span class="o">.</span><span class="n">update</span><span class="p">(</span><span class="n">losses</span><span class="p">)</span>
+</span><span id="broadcast_loss-640"><a href="#broadcast_loss-640"><span class="linenos">640</span></a>    <span class="k">return</span> <span class="n">metrics</span>
+</span></pre></div>
+
+
+            <div class="docstring"><p>Computes broadcast loss including demi-cycle, cycle, and translation losses.</p>
+
+<h6 id="arguments">Arguments:</h6>
+
+<ul>
+<li><strong>gw_mod (<code><a href="gw_module.html#GWModuleBase">shimmer.modules.gw_module.GWModuleBase</a></code>):</strong>  The GWModule to use</li>
+<li><strong>selection_mod (<code><a href="selection.html#SelectionBase">shimmer.modules.selection.SelectionBase</a></code>):</strong>  Selection mod to use</li>
+<li><strong>domain_mods (<code>Mapping[str, DomainModule]</code>):</strong>  the domain modules</li>
+<li><strong>latent_domains:</strong>  The latent domain representations.</li>
+</ul>
+
+<h6 id="returns">Returns:</h6>
+
+<blockquote>
+  <p>A dictionary with the total loss and additional metrics.</p>
+</blockquote>
+</div>
+
+
+                </section>
+                <section id="BroadcastLossCoefs">
+                            <input id="BroadcastLossCoefs-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
+<div class="attr class">
+            
+    <span class="def">class</span>
+    <span class="name">BroadcastLossCoefs</span><wbr>(<span class="base">typing.TypedDict</span>):
+
+                <label class="view-source-button" for="BroadcastLossCoefs-view-source"><span>View Source</span></label>
+
+    </div>
+    <a class="headerlink" href="#BroadcastLossCoefs"></a>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="BroadcastLossCoefs-643"><a href="#BroadcastLossCoefs-643"><span class="linenos">643</span></a><span class="k">class</span> <span class="nc">BroadcastLossCoefs</span><span class="p">(</span><span class="n">TypedDict</span><span class="p">,</span> <span class="n">total</span><span class="o">=</span><span class="kc">False</span><span class="p">):</span>
+</span><span id="BroadcastLossCoefs-644"><a href="#BroadcastLossCoefs-644"><span class="linenos">644</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="BroadcastLossCoefs-645"><a href="#BroadcastLossCoefs-645"><span class="linenos">645</span></a><span class="sd">    Dict of loss coefficients used in the GWLossesFusion.</span>
+</span><span id="BroadcastLossCoefs-646"><a href="#BroadcastLossCoefs-646"><span class="linenos">646</span></a>
+</span><span id="BroadcastLossCoefs-647"><a href="#BroadcastLossCoefs-647"><span class="linenos">647</span></a><span class="sd">    If one is not provided, the coefficient is assumed to be 0 and will not be logged.</span>
+</span><span id="BroadcastLossCoefs-648"><a href="#BroadcastLossCoefs-648"><span class="linenos">648</span></a><span class="sd">    If the loss is excplicitely set to 0, it will be logged, but not take part in</span>
+</span><span id="BroadcastLossCoefs-649"><a href="#BroadcastLossCoefs-649"><span class="linenos">649</span></a><span class="sd">    the total loss.</span>
+</span><span id="BroadcastLossCoefs-650"><a href="#BroadcastLossCoefs-650"><span class="linenos">650</span></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="BroadcastLossCoefs-651"><a href="#BroadcastLossCoefs-651"><span class="linenos">651</span></a>
+</span><span id="BroadcastLossCoefs-652"><a href="#BroadcastLossCoefs-652"><span class="linenos">652</span></a>    <span class="n">contrastives</span><span class="p">:</span> <span class="nb">float</span>
+</span><span id="BroadcastLossCoefs-653"><a href="#BroadcastLossCoefs-653"><span class="linenos">653</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;Contrastive loss coefficient.&quot;&quot;&quot;</span>
+</span><span id="BroadcastLossCoefs-654"><a href="#BroadcastLossCoefs-654"><span class="linenos">654</span></a>
+</span><span id="BroadcastLossCoefs-655"><a href="#BroadcastLossCoefs-655"><span class="linenos">655</span></a>    <span class="n">fused</span><span class="p">:</span> <span class="nb">float</span>
+</span><span id="BroadcastLossCoefs-656"><a href="#BroadcastLossCoefs-656"><span class="linenos">656</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;fused loss coefficient (encode multiple domains and decode to one of them).&quot;&quot;&quot;</span>
+</span><span id="BroadcastLossCoefs-657"><a href="#BroadcastLossCoefs-657"><span class="linenos">657</span></a>
+</span><span id="BroadcastLossCoefs-658"><a href="#BroadcastLossCoefs-658"><span class="linenos">658</span></a>    <span class="n">demi_cycles</span><span class="p">:</span> <span class="nb">float</span>
+</span><span id="BroadcastLossCoefs-659"><a href="#BroadcastLossCoefs-659"><span class="linenos">659</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;demi_cycles loss coefficient. Demi-cycles are always one-to-one&quot;&quot;&quot;</span>
+</span><span id="BroadcastLossCoefs-660"><a href="#BroadcastLossCoefs-660"><span class="linenos">660</span></a>
+</span><span id="BroadcastLossCoefs-661"><a href="#BroadcastLossCoefs-661"><span class="linenos">661</span></a>    <span class="n">cycles</span><span class="p">:</span> <span class="nb">float</span>
+</span><span id="BroadcastLossCoefs-662"><a href="#BroadcastLossCoefs-662"><span class="linenos">662</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;cycles loss coefficient. Cycles can be many-to-one&quot;&quot;&quot;</span>
+</span><span id="BroadcastLossCoefs-663"><a href="#BroadcastLossCoefs-663"><span class="linenos">663</span></a>
+</span><span id="BroadcastLossCoefs-664"><a href="#BroadcastLossCoefs-664"><span class="linenos">664</span></a>    <span class="n">translations</span><span class="p">:</span> <span class="nb">float</span>
+</span><span id="BroadcastLossCoefs-665"><a href="#BroadcastLossCoefs-665"><span class="linenos">665</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;translation loss coefficient. Translation, like cycles, can be many-to-one.&quot;&quot;&quot;</span>
+</span></pre></div>
+
+
+            <div class="docstring"><p>Dict of loss coefficients used in the GWLossesFusion.</p>
+
+<p>If one is not provided, the coefficient is assumed to be 0 and will not be logged.
+If the loss is excplicitely set to 0, it will be logged, but not take part in
+the total loss.</p>
+</div>
+
+
+                            <div id="BroadcastLossCoefs.contrastives" class="classattr">
+                                <div class="attr variable">
+            <span class="name">contrastives</span><span class="annotation">: float</span>
+
+        
+    </div>
+    <a class="headerlink" href="#BroadcastLossCoefs.contrastives"></a>
+    
+            <div class="docstring"><p>Contrastive loss coefficient.</p>
+</div>
+
+
+                            </div>
+                            <div id="BroadcastLossCoefs.fused" class="classattr">
+                                <div class="attr variable">
+            <span class="name">fused</span><span class="annotation">: float</span>
+
+        
+    </div>
+    <a class="headerlink" href="#BroadcastLossCoefs.fused"></a>
+    
+            <div class="docstring"><p>fused loss coefficient (encode multiple domains and decode to one of them).</p>
+</div>
+
+
+                            </div>
+                            <div id="BroadcastLossCoefs.demi_cycles" class="classattr">
+                                <div class="attr variable">
+            <span class="name">demi_cycles</span><span class="annotation">: float</span>
+
+        
+    </div>
+    <a class="headerlink" href="#BroadcastLossCoefs.demi_cycles"></a>
+    
+            <div class="docstring"><p>demi_cycles loss coefficient. Demi-cycles are always one-to-one</p>
+</div>
+
+
+                            </div>
+                            <div id="BroadcastLossCoefs.cycles" class="classattr">
+                                <div class="attr variable">
+            <span class="name">cycles</span><span class="annotation">: float</span>
+
+        
+    </div>
+    <a class="headerlink" href="#BroadcastLossCoefs.cycles"></a>
+    
+            <div class="docstring"><p>cycles loss coefficient. Cycles can be many-to-one</p>
+</div>
+
+
+                            </div>
+                            <div id="BroadcastLossCoefs.translations" class="classattr">
+                                <div class="attr variable">
+            <span class="name">translations</span><span class="annotation">: float</span>
+
+        
+    </div>
+    <a class="headerlink" href="#BroadcastLossCoefs.translations"></a>
+    
+            <div class="docstring"><p>translation loss coefficient. Translation, like cycles, can be many-to-one.</p>
+</div>
+
+
+                            </div>
+                </section>
+                <section id="GWLosses">
+                            <input id="GWLosses-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
+<div class="attr class">
+            
+    <span class="def">class</span>
+    <span class="name">GWLosses</span><wbr>(<span class="base"><a href="#GWLossesBase">GWLossesBase</a></span>):
+
+                <label class="view-source-button" for="GWLosses-view-source"><span>View Source</span></label>
+
+    </div>
+    <a class="headerlink" href="#GWLosses"></a>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="GWLosses-668"><a href="#GWLosses-668"><span class="linenos">668</span></a><span class="k">class</span> <span class="nc">GWLosses</span><span class="p">(</span><span class="n">GWLossesBase</span><span class="p">):</span>
+</span><span id="GWLosses-669"><a href="#GWLosses-669"><span class="linenos">669</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="GWLosses-670"><a href="#GWLosses-670"><span class="linenos">670</span></a><span class="sd">    Implementation of `GWLossesBase` for fusion-based models.</span>
+</span><span id="GWLosses-671"><a href="#GWLosses-671"><span class="linenos">671</span></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="GWLosses-672"><a href="#GWLosses-672"><span class="linenos">672</span></a>
+</span><span id="GWLosses-673"><a href="#GWLosses-673"><span class="linenos">673</span></a>    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span>
+</span><span id="GWLosses-674"><a href="#GWLosses-674"><span class="linenos">674</span></a>        <span class="bp">self</span><span class="p">,</span>
+</span><span id="GWLosses-675"><a href="#GWLosses-675"><span class="linenos">675</span></a>        <span class="n">gw_mod</span><span class="p">:</span> <span class="n">GWModule</span><span class="p">,</span>
+</span><span id="GWLosses-676"><a href="#GWLosses-676"><span class="linenos">676</span></a>        <span class="n">selection_mod</span><span class="p">:</span> <span class="n">SelectionBase</span><span class="p">,</span>
+</span><span id="GWLosses-677"><a href="#GWLosses-677"><span class="linenos">677</span></a>        <span class="n">domain_mods</span><span class="p">:</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">DomainModule</span><span class="p">],</span>
+</span><span id="GWLosses-678"><a href="#GWLosses-678"><span class="linenos">678</span></a>        <span class="n">loss_coefs</span><span class="p">:</span> <span class="n">BroadcastLossCoefs</span><span class="p">,</span>
+</span><span id="GWLosses-679"><a href="#GWLosses-679"><span class="linenos">679</span></a>        <span class="n">contrastive_fn</span><span class="p">:</span> <span class="n">ContrastiveLossType</span><span class="p">,</span>
+</span><span id="GWLosses-680"><a href="#GWLosses-680"><span class="linenos">680</span></a>    <span class="p">):</span>
+</span><span id="GWLosses-681"><a href="#GWLosses-681"><span class="linenos">681</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="GWLosses-682"><a href="#GWLosses-682"><span class="linenos">682</span></a><span class="sd">        Initializes the loss computation module for a Global Workspace Fusion model.</span>
+</span><span id="GWLosses-683"><a href="#GWLosses-683"><span class="linenos">683</span></a>
+</span><span id="GWLosses-684"><a href="#GWLosses-684"><span class="linenos">684</span></a><span class="sd">        Args:</span>
+</span><span id="GWLosses-685"><a href="#GWLosses-685"><span class="linenos">685</span></a><span class="sd">            gw_mod: The GWModule for the global workspace.</span>
+</span><span id="GWLosses-686"><a href="#GWLosses-686"><span class="linenos">686</span></a><span class="sd">            selection_mod: The selection mechanism for the model.</span>
+</span><span id="GWLosses-687"><a href="#GWLosses-687"><span class="linenos">687</span></a><span class="sd">            domain_mods: A mapping of domain names to their respective DomainModule.</span>
+</span><span id="GWLosses-688"><a href="#GWLosses-688"><span class="linenos">688</span></a><span class="sd">            loss_coefs (`BroadcastLossCoefs`): coefs for the losses</span>
+</span><span id="GWLosses-689"><a href="#GWLosses-689"><span class="linenos">689</span></a><span class="sd">            contrastive_fn: The function used for computing contrastive loss.</span>
+</span><span id="GWLosses-690"><a href="#GWLosses-690"><span class="linenos">690</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="GWLosses-691"><a href="#GWLosses-691"><span class="linenos">691</span></a>        <span class="nb">super</span><span class="p">()</span><span class="o">.</span><span class="fm">__init__</span><span class="p">()</span>
+</span><span id="GWLosses-692"><a href="#GWLosses-692"><span class="linenos">692</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">gw_mod</span> <span class="o">=</span> <span class="n">gw_mod</span>
+</span><span id="GWLosses-693"><a href="#GWLosses-693"><span class="linenos">693</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">selection_mod</span> <span class="o">=</span> <span class="n">selection_mod</span>
+</span><span id="GWLosses-694"><a href="#GWLosses-694"><span class="linenos">694</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">domain_mods</span> <span class="o">=</span> <span class="n">domain_mods</span>
+</span><span id="GWLosses-695"><a href="#GWLosses-695"><span class="linenos">695</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">loss_coefs</span> <span class="o">=</span> <span class="n">loss_coefs</span>
+</span><span id="GWLosses-696"><a href="#GWLosses-696"><span class="linenos">696</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">contrastive_fn</span> <span class="o">=</span> <span class="n">contrastive_fn</span>
+</span><span id="GWLosses-697"><a href="#GWLosses-697"><span class="linenos">697</span></a>
+</span><span id="GWLosses-698"><a href="#GWLosses-698"><span class="linenos">698</span></a>    <span class="k">def</span> <span class="nf">contrastive_loss</span><span class="p">(</span>
+</span><span id="GWLosses-699"><a href="#GWLosses-699"><span class="linenos">699</span></a>        <span class="bp">self</span><span class="p">,</span> <span class="n">latent_domains</span><span class="p">:</span> <span class="n">LatentsDomainGroupsT</span>
+</span><span id="GWLosses-700"><a href="#GWLosses-700"><span class="linenos">700</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]:</span>
+</span><span id="GWLosses-701"><a href="#GWLosses-701"><span class="linenos">701</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="GWLosses-702"><a href="#GWLosses-702"><span class="linenos">702</span></a><span class="sd">        Computes the contrastive loss for the given latent domains.</span>
+</span><span id="GWLosses-703"><a href="#GWLosses-703"><span class="linenos">703</span></a>
+</span><span id="GWLosses-704"><a href="#GWLosses-704"><span class="linenos">704</span></a><span class="sd">        Args:</span>
+</span><span id="GWLosses-705"><a href="#GWLosses-705"><span class="linenos">705</span></a><span class="sd">            latent_domains: The latent domain representations.</span>
+</span><span id="GWLosses-706"><a href="#GWLosses-706"><span class="linenos">706</span></a>
+</span><span id="GWLosses-707"><a href="#GWLosses-707"><span class="linenos">707</span></a><span class="sd">        Returns:</span>
+</span><span id="GWLosses-708"><a href="#GWLosses-708"><span class="linenos">708</span></a><span class="sd">            A dictionary of contrastive loss metrics.</span>
+</span><span id="GWLosses-709"><a href="#GWLosses-709"><span class="linenos">709</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="GWLosses-710"><a href="#GWLosses-710"><span class="linenos">710</span></a>
+</span><span id="GWLosses-711"><a href="#GWLosses-711"><span class="linenos">711</span></a>        <span class="k">return</span> <span class="n">contrastive_loss</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">gw_mod</span><span class="p">,</span> <span class="n">latent_domains</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">contrastive_fn</span><span class="p">)</span>
+</span><span id="GWLosses-712"><a href="#GWLosses-712"><span class="linenos">712</span></a>
+</span><span id="GWLosses-713"><a href="#GWLosses-713"><span class="linenos">713</span></a>    <span class="k">def</span> <span class="nf">broadcast_loss</span><span class="p">(</span>
+</span><span id="GWLosses-714"><a href="#GWLosses-714"><span class="linenos">714</span></a>        <span class="bp">self</span><span class="p">,</span> <span class="n">latent_domains</span><span class="p">:</span> <span class="n">LatentsDomainGroupsT</span>
+</span><span id="GWLosses-715"><a href="#GWLosses-715"><span class="linenos">715</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]:</span>
+</span><span id="GWLosses-716"><a href="#GWLosses-716"><span class="linenos">716</span></a>        <span class="k">return</span> <span class="n">broadcast_loss</span><span class="p">(</span>
+</span><span id="GWLosses-717"><a href="#GWLosses-717"><span class="linenos">717</span></a>            <span class="bp">self</span><span class="o">.</span><span class="n">gw_mod</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">selection_mod</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">domain_mods</span><span class="p">,</span> <span class="n">latent_domains</span>
+</span><span id="GWLosses-718"><a href="#GWLosses-718"><span class="linenos">718</span></a>        <span class="p">)</span>
+</span><span id="GWLosses-719"><a href="#GWLosses-719"><span class="linenos">719</span></a>
+</span><span id="GWLosses-720"><a href="#GWLosses-720"><span class="linenos">720</span></a>    <span class="k">def</span> <span class="nf">step</span><span class="p">(</span>
+</span><span id="GWLosses-721"><a href="#GWLosses-721"><span class="linenos">721</span></a>        <span class="bp">self</span><span class="p">,</span> <span class="n">domain_latents</span><span class="p">:</span> <span class="n">LatentsDomainGroupsT</span><span class="p">,</span> <span class="n">mode</span><span class="p">:</span> <span class="n">ModelModeT</span>
+</span><span id="GWLosses-722"><a href="#GWLosses-722"><span class="linenos">722</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="n">LossOutput</span><span class="p">:</span>
+</span><span id="GWLosses-723"><a href="#GWLosses-723"><span class="linenos">723</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="GWLosses-724"><a href="#GWLosses-724"><span class="linenos">724</span></a><span class="sd">        Performs a step of loss computation.</span>
+</span><span id="GWLosses-725"><a href="#GWLosses-725"><span class="linenos">725</span></a>
+</span><span id="GWLosses-726"><a href="#GWLosses-726"><span class="linenos">726</span></a><span class="sd">        Args:</span>
+</span><span id="GWLosses-727"><a href="#GWLosses-727"><span class="linenos">727</span></a><span class="sd">            domain_latents: Latent representations for all domains.</span>
+</span><span id="GWLosses-728"><a href="#GWLosses-728"><span class="linenos">728</span></a><span class="sd">            mode: The mode in which the model is currently operating.</span>
+</span><span id="GWLosses-729"><a href="#GWLosses-729"><span class="linenos">729</span></a>
+</span><span id="GWLosses-730"><a href="#GWLosses-730"><span class="linenos">730</span></a><span class="sd">        Returns:</span>
+</span><span id="GWLosses-731"><a href="#GWLosses-731"><span class="linenos">731</span></a><span class="sd">            A LossOutput object containing the loss and metrics for this step.</span>
+</span><span id="GWLosses-732"><a href="#GWLosses-732"><span class="linenos">732</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="GWLosses-733"><a href="#GWLosses-733"><span class="linenos">733</span></a>
+</span><span id="GWLosses-734"><a href="#GWLosses-734"><span class="linenos">734</span></a>        <span class="n">metrics</span><span class="p">:</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]</span> <span class="o">=</span> <span class="p">{}</span>
+</span><span id="GWLosses-735"><a href="#GWLosses-735"><span class="linenos">735</span></a>
+</span><span id="GWLosses-736"><a href="#GWLosses-736"><span class="linenos">736</span></a>        <span class="n">metrics</span><span class="o">.</span><span class="n">update</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">contrastive_loss</span><span class="p">(</span><span class="n">domain_latents</span><span class="p">))</span>
+</span><span id="GWLosses-737"><a href="#GWLosses-737"><span class="linenos">737</span></a>        <span class="n">metrics</span><span class="o">.</span><span class="n">update</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">broadcast_loss</span><span class="p">(</span><span class="n">domain_latents</span><span class="p">))</span>
+</span><span id="GWLosses-738"><a href="#GWLosses-738"><span class="linenos">738</span></a>
+</span><span id="GWLosses-739"><a href="#GWLosses-739"><span class="linenos">739</span></a>        <span class="n">loss</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">stack</span><span class="p">(</span>
+</span><span id="GWLosses-740"><a href="#GWLosses-740"><span class="linenos">740</span></a>            <span class="p">[</span>
+</span><span id="GWLosses-741"><a href="#GWLosses-741"><span class="linenos">741</span></a>                <span class="n">metrics</span><span class="p">[</span><span class="n">name</span><span class="p">]</span> <span class="o">*</span> <span class="n">coef</span>
+</span><span id="GWLosses-742"><a href="#GWLosses-742"><span class="linenos">742</span></a>                <span class="k">for</span> <span class="n">name</span><span class="p">,</span> <span class="n">coef</span> <span class="ow">in</span> <span class="bp">self</span><span class="o">.</span><span class="n">loss_coefs</span><span class="o">.</span><span class="n">items</span><span class="p">()</span>
+</span><span id="GWLosses-743"><a href="#GWLosses-743"><span class="linenos">743</span></a>                <span class="k">if</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">coef</span><span class="p">,</span> <span class="nb">float</span><span class="p">)</span> <span class="ow">and</span> <span class="n">coef</span> <span class="o">&gt;</span> <span class="mi">0</span>
+</span><span id="GWLosses-744"><a href="#GWLosses-744"><span class="linenos">744</span></a>            <span class="p">],</span>
+</span><span id="GWLosses-745"><a href="#GWLosses-745"><span class="linenos">745</span></a>            <span class="n">dim</span><span class="o">=</span><span class="mi">0</span><span class="p">,</span>
+</span><span id="GWLosses-746"><a href="#GWLosses-746"><span class="linenos">746</span></a>        <span class="p">)</span><span class="o">.</span><span class="n">mean</span><span class="p">()</span>
+</span><span id="GWLosses-747"><a href="#GWLosses-747"><span class="linenos">747</span></a>
+</span><span id="GWLosses-748"><a href="#GWLosses-748"><span class="linenos">748</span></a>        <span class="n">metrics</span><span class="p">[</span><span class="s2">&quot;broadcast_loss&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">stack</span><span class="p">(</span>
+</span><span id="GWLosses-749"><a href="#GWLosses-749"><span class="linenos">749</span></a>            <span class="p">[</span>
+</span><span id="GWLosses-750"><a href="#GWLosses-750"><span class="linenos">750</span></a>                <span class="n">metrics</span><span class="p">[</span><span class="n">name</span><span class="p">]</span>
+</span><span id="GWLosses-751"><a href="#GWLosses-751"><span class="linenos">751</span></a>                <span class="k">for</span> <span class="n">name</span><span class="p">,</span> <span class="n">coef</span> <span class="ow">in</span> <span class="bp">self</span><span class="o">.</span><span class="n">loss_coefs</span><span class="o">.</span><span class="n">items</span><span class="p">()</span>
+</span><span id="GWLosses-752"><a href="#GWLosses-752"><span class="linenos">752</span></a>                <span class="k">if</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">coef</span><span class="p">,</span> <span class="nb">float</span><span class="p">)</span> <span class="ow">and</span> <span class="n">coef</span> <span class="o">&gt;</span> <span class="mi">0</span> <span class="ow">and</span> <span class="n">name</span> <span class="o">!=</span> <span class="s2">&quot;contrastives&quot;</span>
+</span><span id="GWLosses-753"><a href="#GWLosses-753"><span class="linenos">753</span></a>            <span class="p">],</span>
+</span><span id="GWLosses-754"><a href="#GWLosses-754"><span class="linenos">754</span></a>            <span class="n">dim</span><span class="o">=</span><span class="mi">0</span><span class="p">,</span>
+</span><span id="GWLosses-755"><a href="#GWLosses-755"><span class="linenos">755</span></a>        <span class="p">)</span><span class="o">.</span><span class="n">mean</span><span class="p">()</span>
+</span><span id="GWLosses-756"><a href="#GWLosses-756"><span class="linenos">756</span></a>
+</span><span id="GWLosses-757"><a href="#GWLosses-757"><span class="linenos">757</span></a>        <span class="k">return</span> <span class="n">LossOutput</span><span class="p">(</span><span class="n">loss</span><span class="p">,</span> <span class="n">metrics</span><span class="p">)</span>
+</span></pre></div>
+
+
+            <div class="docstring"><p>Implementation of <code><a href="#GWLossesBase">GWLossesBase</a></code> for fusion-based models.</p>
+</div>
+
+
+                            <div id="GWLosses.__init__" class="classattr">
+                                        <input id="GWLosses.__init__-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
+<div class="attr function">
+            
+        <span class="name">GWLosses</span><span class="signature pdoc-code multiline">(<span class="param">	<span class="n">gw_mod</span><span class="p">:</span> <span class="n"><a href="gw_module.html#GWModule">shimmer.modules.gw_module.GWModule</a></span>,</span><span class="param">	<span class="n">selection_mod</span><span class="p">:</span> <span class="n"><a href="selection.html#SelectionBase">shimmer.modules.selection.SelectionBase</a></span>,</span><span class="param">	<span class="n">domain_mods</span><span class="p">:</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n"><a href="domain.html#DomainModule">shimmer.modules.domain.DomainModule</a></span><span class="p">]</span>,</span><span class="param">	<span class="n">loss_coefs</span><span class="p">:</span> <span class="n"><a href="#BroadcastLossCoefs">BroadcastLossCoefs</a></span>,</span><span class="param">	<span class="n">contrastive_fn</span><span class="p">:</span> <span class="n">collections</span><span class="o">.</span><span class="n">abc</span><span class="o">.</span><span class="n">Callable</span><span class="p">[[</span><span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">],</span> <span class="n"><a href="domain.html#LossOutput">shimmer.modules.domain.LossOutput</a></span><span class="p">]</span></span>)</span>
+
+                <label class="view-source-button" for="GWLosses.__init__-view-source"><span>View Source</span></label>
+
+    </div>
+    <a class="headerlink" href="#GWLosses.__init__"></a>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="GWLosses.__init__-673"><a href="#GWLosses.__init__-673"><span class="linenos">673</span></a>    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span>
+</span><span id="GWLosses.__init__-674"><a href="#GWLosses.__init__-674"><span class="linenos">674</span></a>        <span class="bp">self</span><span class="p">,</span>
+</span><span id="GWLosses.__init__-675"><a href="#GWLosses.__init__-675"><span class="linenos">675</span></a>        <span class="n">gw_mod</span><span class="p">:</span> <span class="n">GWModule</span><span class="p">,</span>
+</span><span id="GWLosses.__init__-676"><a href="#GWLosses.__init__-676"><span class="linenos">676</span></a>        <span class="n">selection_mod</span><span class="p">:</span> <span class="n">SelectionBase</span><span class="p">,</span>
+</span><span id="GWLosses.__init__-677"><a href="#GWLosses.__init__-677"><span class="linenos">677</span></a>        <span class="n">domain_mods</span><span class="p">:</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">DomainModule</span><span class="p">],</span>
+</span><span id="GWLosses.__init__-678"><a href="#GWLosses.__init__-678"><span class="linenos">678</span></a>        <span class="n">loss_coefs</span><span class="p">:</span> <span class="n">BroadcastLossCoefs</span><span class="p">,</span>
+</span><span id="GWLosses.__init__-679"><a href="#GWLosses.__init__-679"><span class="linenos">679</span></a>        <span class="n">contrastive_fn</span><span class="p">:</span> <span class="n">ContrastiveLossType</span><span class="p">,</span>
+</span><span id="GWLosses.__init__-680"><a href="#GWLosses.__init__-680"><span class="linenos">680</span></a>    <span class="p">):</span>
+</span><span id="GWLosses.__init__-681"><a href="#GWLosses.__init__-681"><span class="linenos">681</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="GWLosses.__init__-682"><a href="#GWLosses.__init__-682"><span class="linenos">682</span></a><span class="sd">        Initializes the loss computation module for a Global Workspace Fusion model.</span>
+</span><span id="GWLosses.__init__-683"><a href="#GWLosses.__init__-683"><span class="linenos">683</span></a>
+</span><span id="GWLosses.__init__-684"><a href="#GWLosses.__init__-684"><span class="linenos">684</span></a><span class="sd">        Args:</span>
+</span><span id="GWLosses.__init__-685"><a href="#GWLosses.__init__-685"><span class="linenos">685</span></a><span class="sd">            gw_mod: The GWModule for the global workspace.</span>
+</span><span id="GWLosses.__init__-686"><a href="#GWLosses.__init__-686"><span class="linenos">686</span></a><span class="sd">            selection_mod: The selection mechanism for the model.</span>
+</span><span id="GWLosses.__init__-687"><a href="#GWLosses.__init__-687"><span class="linenos">687</span></a><span class="sd">            domain_mods: A mapping of domain names to their respective DomainModule.</span>
+</span><span id="GWLosses.__init__-688"><a href="#GWLosses.__init__-688"><span class="linenos">688</span></a><span class="sd">            loss_coefs (`BroadcastLossCoefs`): coefs for the losses</span>
+</span><span id="GWLosses.__init__-689"><a href="#GWLosses.__init__-689"><span class="linenos">689</span></a><span class="sd">            contrastive_fn: The function used for computing contrastive loss.</span>
+</span><span id="GWLosses.__init__-690"><a href="#GWLosses.__init__-690"><span class="linenos">690</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="GWLosses.__init__-691"><a href="#GWLosses.__init__-691"><span class="linenos">691</span></a>        <span class="nb">super</span><span class="p">()</span><span class="o">.</span><span class="fm">__init__</span><span class="p">()</span>
+</span><span id="GWLosses.__init__-692"><a href="#GWLosses.__init__-692"><span class="linenos">692</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">gw_mod</span> <span class="o">=</span> <span class="n">gw_mod</span>
+</span><span id="GWLosses.__init__-693"><a href="#GWLosses.__init__-693"><span class="linenos">693</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">selection_mod</span> <span class="o">=</span> <span class="n">selection_mod</span>
+</span><span id="GWLosses.__init__-694"><a href="#GWLosses.__init__-694"><span class="linenos">694</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">domain_mods</span> <span class="o">=</span> <span class="n">domain_mods</span>
+</span><span id="GWLosses.__init__-695"><a href="#GWLosses.__init__-695"><span class="linenos">695</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">loss_coefs</span> <span class="o">=</span> <span class="n">loss_coefs</span>
+</span><span id="GWLosses.__init__-696"><a href="#GWLosses.__init__-696"><span class="linenos">696</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">contrastive_fn</span> <span class="o">=</span> <span class="n">contrastive_fn</span>
+</span></pre></div>
+
+
+            <div class="docstring"><p>Initializes the loss computation module for a Global Workspace Fusion model.</p>
+
+<h6 id="arguments">Arguments:</h6>
+
+<ul>
+<li><strong>gw_mod:</strong>  The GWModule for the global workspace.</li>
+<li><strong>selection_mod:</strong>  The selection mechanism for the model.</li>
+<li><strong>domain_mods:</strong>  A mapping of domain names to their respective DomainModule.</li>
+<li><strong>loss_coefs (<code><a href="#BroadcastLossCoefs">BroadcastLossCoefs</a></code>):</strong>  coefs for the losses</li>
+<li><strong>contrastive_fn:</strong>  The function used for computing contrastive loss.</li>
+</ul>
+</div>
+
+
+                            </div>
+                            <div id="GWLosses.gw_mod" class="classattr">
+                                <div class="attr variable">
+            <span class="name">gw_mod</span>
+
+        
+    </div>
+    <a class="headerlink" href="#GWLosses.gw_mod"></a>
+    
+    
+
+                            </div>
+                            <div id="GWLosses.selection_mod" class="classattr">
+                                <div class="attr variable">
+            <span class="name">selection_mod</span>
+
+        
+    </div>
+    <a class="headerlink" href="#GWLosses.selection_mod"></a>
+    
+    
+
+                            </div>
+                            <div id="GWLosses.domain_mods" class="classattr">
+                                <div class="attr variable">
+            <span class="name">domain_mods</span>
+
+        
+    </div>
+    <a class="headerlink" href="#GWLosses.domain_mods"></a>
+    
+    
+
+                            </div>
+                            <div id="GWLosses.loss_coefs" class="classattr">
+                                <div class="attr variable">
+            <span class="name">loss_coefs</span>
+
+        
+    </div>
+    <a class="headerlink" href="#GWLosses.loss_coefs"></a>
+    
+    
+
+                            </div>
+                            <div id="GWLosses.contrastive_fn" class="classattr">
+                                <div class="attr variable">
+            <span class="name">contrastive_fn</span>
+
+        
+    </div>
+    <a class="headerlink" href="#GWLosses.contrastive_fn"></a>
+    
+    
+
+                            </div>
+                            <div id="GWLosses.contrastive_loss" class="classattr">
+                                        <input id="GWLosses.contrastive_loss-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
+<div class="attr function">
+            
+        <span class="def">def</span>
+        <span class="name">contrastive_loss</span><span class="signature pdoc-code multiline">(<span class="param">	<span class="bp">self</span>,</span><span class="param">	<span class="n">latent_domains</span><span class="p">:</span> <span class="n">collections</span><span class="o">.</span><span class="n">abc</span><span class="o">.</span><span class="n">Mapping</span><span class="p">[</span><span class="nb">frozenset</span><span class="p">[</span><span class="nb">str</span><span class="p">],</span> <span class="n">collections</span><span class="o">.</span><span class="n">abc</span><span class="o">.</span><span class="n">Mapping</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]]</span></span><span class="return-annotation">) -> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]</span>:</span></span>
+
+                <label class="view-source-button" for="GWLosses.contrastive_loss-view-source"><span>View Source</span></label>
+
+    </div>
+    <a class="headerlink" href="#GWLosses.contrastive_loss"></a>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="GWLosses.contrastive_loss-698"><a href="#GWLosses.contrastive_loss-698"><span class="linenos">698</span></a>    <span class="k">def</span> <span class="nf">contrastive_loss</span><span class="p">(</span>
+</span><span id="GWLosses.contrastive_loss-699"><a href="#GWLosses.contrastive_loss-699"><span class="linenos">699</span></a>        <span class="bp">self</span><span class="p">,</span> <span class="n">latent_domains</span><span class="p">:</span> <span class="n">LatentsDomainGroupsT</span>
+</span><span id="GWLosses.contrastive_loss-700"><a href="#GWLosses.contrastive_loss-700"><span class="linenos">700</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]:</span>
+</span><span id="GWLosses.contrastive_loss-701"><a href="#GWLosses.contrastive_loss-701"><span class="linenos">701</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="GWLosses.contrastive_loss-702"><a href="#GWLosses.contrastive_loss-702"><span class="linenos">702</span></a><span class="sd">        Computes the contrastive loss for the given latent domains.</span>
+</span><span id="GWLosses.contrastive_loss-703"><a href="#GWLosses.contrastive_loss-703"><span class="linenos">703</span></a>
+</span><span id="GWLosses.contrastive_loss-704"><a href="#GWLosses.contrastive_loss-704"><span class="linenos">704</span></a><span class="sd">        Args:</span>
+</span><span id="GWLosses.contrastive_loss-705"><a href="#GWLosses.contrastive_loss-705"><span class="linenos">705</span></a><span class="sd">            latent_domains: The latent domain representations.</span>
+</span><span id="GWLosses.contrastive_loss-706"><a href="#GWLosses.contrastive_loss-706"><span class="linenos">706</span></a>
+</span><span id="GWLosses.contrastive_loss-707"><a href="#GWLosses.contrastive_loss-707"><span class="linenos">707</span></a><span class="sd">        Returns:</span>
+</span><span id="GWLosses.contrastive_loss-708"><a href="#GWLosses.contrastive_loss-708"><span class="linenos">708</span></a><span class="sd">            A dictionary of contrastive loss metrics.</span>
+</span><span id="GWLosses.contrastive_loss-709"><a href="#GWLosses.contrastive_loss-709"><span class="linenos">709</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="GWLosses.contrastive_loss-710"><a href="#GWLosses.contrastive_loss-710"><span class="linenos">710</span></a>
+</span><span id="GWLosses.contrastive_loss-711"><a href="#GWLosses.contrastive_loss-711"><span class="linenos">711</span></a>        <span class="k">return</span> <span class="n">contrastive_loss</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">gw_mod</span><span class="p">,</span> <span class="n">latent_domains</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">contrastive_fn</span><span class="p">)</span>
+</span></pre></div>
+
+
+            <div class="docstring"><p>Computes the contrastive loss for the given latent domains.</p>
+
+<h6 id="arguments">Arguments:</h6>
+
+<ul>
+<li><strong>latent_domains:</strong>  The latent domain representations.</li>
+</ul>
+
+<h6 id="returns">Returns:</h6>
+
+<blockquote>
+  <p>A dictionary of contrastive loss metrics.</p>
+</blockquote>
+</div>
+
+
+                            </div>
+                            <div id="GWLosses.broadcast_loss" class="classattr">
+                                        <input id="GWLosses.broadcast_loss-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
+<div class="attr function">
+            
+        <span class="def">def</span>
+        <span class="name">broadcast_loss</span><span class="signature pdoc-code multiline">(<span class="param">	<span class="bp">self</span>,</span><span class="param">	<span class="n">latent_domains</span><span class="p">:</span> <span class="n">collections</span><span class="o">.</span><span class="n">abc</span><span class="o">.</span><span class="n">Mapping</span><span class="p">[</span><span class="nb">frozenset</span><span class="p">[</span><span class="nb">str</span><span class="p">],</span> <span class="n">collections</span><span class="o">.</span><span class="n">abc</span><span class="o">.</span><span class="n">Mapping</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]]</span></span><span class="return-annotation">) -> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]</span>:</span></span>
+
+                <label class="view-source-button" for="GWLosses.broadcast_loss-view-source"><span>View Source</span></label>
+
+    </div>
+    <a class="headerlink" href="#GWLosses.broadcast_loss"></a>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="GWLosses.broadcast_loss-713"><a href="#GWLosses.broadcast_loss-713"><span class="linenos">713</span></a>    <span class="k">def</span> <span class="nf">broadcast_loss</span><span class="p">(</span>
+</span><span id="GWLosses.broadcast_loss-714"><a href="#GWLosses.broadcast_loss-714"><span class="linenos">714</span></a>        <span class="bp">self</span><span class="p">,</span> <span class="n">latent_domains</span><span class="p">:</span> <span class="n">LatentsDomainGroupsT</span>
+</span><span id="GWLosses.broadcast_loss-715"><a href="#GWLosses.broadcast_loss-715"><span class="linenos">715</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]:</span>
+</span><span id="GWLosses.broadcast_loss-716"><a href="#GWLosses.broadcast_loss-716"><span class="linenos">716</span></a>        <span class="k">return</span> <span class="n">broadcast_loss</span><span class="p">(</span>
+</span><span id="GWLosses.broadcast_loss-717"><a href="#GWLosses.broadcast_loss-717"><span class="linenos">717</span></a>            <span class="bp">self</span><span class="o">.</span><span class="n">gw_mod</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">selection_mod</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">domain_mods</span><span class="p">,</span> <span class="n">latent_domains</span>
+</span><span id="GWLosses.broadcast_loss-718"><a href="#GWLosses.broadcast_loss-718"><span class="linenos">718</span></a>        <span class="p">)</span>
+</span></pre></div>
+
+
+    
+
+                            </div>
+                            <div id="GWLosses.step" class="classattr">
+                                        <input id="GWLosses.step-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
+<div class="attr function">
+            
+        <span class="def">def</span>
+        <span class="name">step</span><span class="signature pdoc-code multiline">(<span class="param">	<span class="bp">self</span>,</span><span class="param">	<span class="n">domain_latents</span><span class="p">:</span> <span class="n">collections</span><span class="o">.</span><span class="n">abc</span><span class="o">.</span><span class="n">Mapping</span><span class="p">[</span><span class="nb">frozenset</span><span class="p">[</span><span class="nb">str</span><span class="p">],</span> <span class="n">collections</span><span class="o">.</span><span class="n">abc</span><span class="o">.</span><span class="n">Mapping</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]]</span>,</span><span class="param">	<span class="n">mode</span><span class="p">:</span> <span class="n">Literal</span><span class="p">[</span><span class="s1">&#39;train&#39;</span><span class="p">,</span> <span class="s1">&#39;val&#39;</span><span class="p">,</span> <span class="s1">&#39;test&#39;</span><span class="p">,</span> <span class="s1">&#39;val/ood&#39;</span><span class="p">,</span> <span class="s1">&#39;test/ood&#39;</span><span class="p">]</span></span><span class="return-annotation">) -> <span class="n"><a href="domain.html#LossOutput">shimmer.modules.domain.LossOutput</a></span>:</span></span>
+
+                <label class="view-source-button" for="GWLosses.step-view-source"><span>View Source</span></label>
+
+    </div>
+    <a class="headerlink" href="#GWLosses.step"></a>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="GWLosses.step-720"><a href="#GWLosses.step-720"><span class="linenos">720</span></a>    <span class="k">def</span> <span class="nf">step</span><span class="p">(</span>
+</span><span id="GWLosses.step-721"><a href="#GWLosses.step-721"><span class="linenos">721</span></a>        <span class="bp">self</span><span class="p">,</span> <span class="n">domain_latents</span><span class="p">:</span> <span class="n">LatentsDomainGroupsT</span><span class="p">,</span> <span class="n">mode</span><span class="p">:</span> <span class="n">ModelModeT</span>
+</span><span id="GWLosses.step-722"><a href="#GWLosses.step-722"><span class="linenos">722</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="n">LossOutput</span><span class="p">:</span>
+</span><span id="GWLosses.step-723"><a href="#GWLosses.step-723"><span class="linenos">723</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="GWLosses.step-724"><a href="#GWLosses.step-724"><span class="linenos">724</span></a><span class="sd">        Performs a step of loss computation.</span>
+</span><span id="GWLosses.step-725"><a href="#GWLosses.step-725"><span class="linenos">725</span></a>
+</span><span id="GWLosses.step-726"><a href="#GWLosses.step-726"><span class="linenos">726</span></a><span class="sd">        Args:</span>
+</span><span id="GWLosses.step-727"><a href="#GWLosses.step-727"><span class="linenos">727</span></a><span class="sd">            domain_latents: Latent representations for all domains.</span>
+</span><span id="GWLosses.step-728"><a href="#GWLosses.step-728"><span class="linenos">728</span></a><span class="sd">            mode: The mode in which the model is currently operating.</span>
+</span><span id="GWLosses.step-729"><a href="#GWLosses.step-729"><span class="linenos">729</span></a>
+</span><span id="GWLosses.step-730"><a href="#GWLosses.step-730"><span class="linenos">730</span></a><span class="sd">        Returns:</span>
+</span><span id="GWLosses.step-731"><a href="#GWLosses.step-731"><span class="linenos">731</span></a><span class="sd">            A LossOutput object containing the loss and metrics for this step.</span>
+</span><span id="GWLosses.step-732"><a href="#GWLosses.step-732"><span class="linenos">732</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="GWLosses.step-733"><a href="#GWLosses.step-733"><span class="linenos">733</span></a>
+</span><span id="GWLosses.step-734"><a href="#GWLosses.step-734"><span class="linenos">734</span></a>        <span class="n">metrics</span><span class="p">:</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]</span> <span class="o">=</span> <span class="p">{}</span>
+</span><span id="GWLosses.step-735"><a href="#GWLosses.step-735"><span class="linenos">735</span></a>
+</span><span id="GWLosses.step-736"><a href="#GWLosses.step-736"><span class="linenos">736</span></a>        <span class="n">metrics</span><span class="o">.</span><span class="n">update</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">contrastive_loss</span><span class="p">(</span><span class="n">domain_latents</span><span class="p">))</span>
+</span><span id="GWLosses.step-737"><a href="#GWLosses.step-737"><span class="linenos">737</span></a>        <span class="n">metrics</span><span class="o">.</span><span class="n">update</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">broadcast_loss</span><span class="p">(</span><span class="n">domain_latents</span><span class="p">))</span>
+</span><span id="GWLosses.step-738"><a href="#GWLosses.step-738"><span class="linenos">738</span></a>
+</span><span id="GWLosses.step-739"><a href="#GWLosses.step-739"><span class="linenos">739</span></a>        <span class="n">loss</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">stack</span><span class="p">(</span>
+</span><span id="GWLosses.step-740"><a href="#GWLosses.step-740"><span class="linenos">740</span></a>            <span class="p">[</span>
+</span><span id="GWLosses.step-741"><a href="#GWLosses.step-741"><span class="linenos">741</span></a>                <span class="n">metrics</span><span class="p">[</span><span class="n">name</span><span class="p">]</span> <span class="o">*</span> <span class="n">coef</span>
+</span><span id="GWLosses.step-742"><a href="#GWLosses.step-742"><span class="linenos">742</span></a>                <span class="k">for</span> <span class="n">name</span><span class="p">,</span> <span class="n">coef</span> <span class="ow">in</span> <span class="bp">self</span><span class="o">.</span><span class="n">loss_coefs</span><span class="o">.</span><span class="n">items</span><span class="p">()</span>
+</span><span id="GWLosses.step-743"><a href="#GWLosses.step-743"><span class="linenos">743</span></a>                <span class="k">if</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">coef</span><span class="p">,</span> <span class="nb">float</span><span class="p">)</span> <span class="ow">and</span> <span class="n">coef</span> <span class="o">&gt;</span> <span class="mi">0</span>
+</span><span id="GWLosses.step-744"><a href="#GWLosses.step-744"><span class="linenos">744</span></a>            <span class="p">],</span>
+</span><span id="GWLosses.step-745"><a href="#GWLosses.step-745"><span class="linenos">745</span></a>            <span class="n">dim</span><span class="o">=</span><span class="mi">0</span><span class="p">,</span>
+</span><span id="GWLosses.step-746"><a href="#GWLosses.step-746"><span class="linenos">746</span></a>        <span class="p">)</span><span class="o">.</span><span class="n">mean</span><span class="p">()</span>
+</span><span id="GWLosses.step-747"><a href="#GWLosses.step-747"><span class="linenos">747</span></a>
+</span><span id="GWLosses.step-748"><a href="#GWLosses.step-748"><span class="linenos">748</span></a>        <span class="n">metrics</span><span class="p">[</span><span class="s2">&quot;broadcast_loss&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">stack</span><span class="p">(</span>
+</span><span id="GWLosses.step-749"><a href="#GWLosses.step-749"><span class="linenos">749</span></a>            <span class="p">[</span>
+</span><span id="GWLosses.step-750"><a href="#GWLosses.step-750"><span class="linenos">750</span></a>                <span class="n">metrics</span><span class="p">[</span><span class="n">name</span><span class="p">]</span>
+</span><span id="GWLosses.step-751"><a href="#GWLosses.step-751"><span class="linenos">751</span></a>                <span class="k">for</span> <span class="n">name</span><span class="p">,</span> <span class="n">coef</span> <span class="ow">in</span> <span class="bp">self</span><span class="o">.</span><span class="n">loss_coefs</span><span class="o">.</span><span class="n">items</span><span class="p">()</span>
+</span><span id="GWLosses.step-752"><a href="#GWLosses.step-752"><span class="linenos">752</span></a>                <span class="k">if</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">coef</span><span class="p">,</span> <span class="nb">float</span><span class="p">)</span> <span class="ow">and</span> <span class="n">coef</span> <span class="o">&gt;</span> <span class="mi">0</span> <span class="ow">and</span> <span class="n">name</span> <span class="o">!=</span> <span class="s2">&quot;contrastives&quot;</span>
+</span><span id="GWLosses.step-753"><a href="#GWLosses.step-753"><span class="linenos">753</span></a>            <span class="p">],</span>
+</span><span id="GWLosses.step-754"><a href="#GWLosses.step-754"><span class="linenos">754</span></a>            <span class="n">dim</span><span class="o">=</span><span class="mi">0</span><span class="p">,</span>
+</span><span id="GWLosses.step-755"><a href="#GWLosses.step-755"><span class="linenos">755</span></a>        <span class="p">)</span><span class="o">.</span><span class="n">mean</span><span class="p">()</span>
+</span><span id="GWLosses.step-756"><a href="#GWLosses.step-756"><span class="linenos">756</span></a>
+</span><span id="GWLosses.step-757"><a href="#GWLosses.step-757"><span class="linenos">757</span></a>        <span class="k">return</span> <span class="n">LossOutput</span><span class="p">(</span><span class="n">loss</span><span class="p">,</span> <span class="n">metrics</span><span class="p">)</span>
+</span></pre></div>
+
+
+            <div class="docstring"><p>Performs a step of loss computation.</p>
+
+<h6 id="arguments">Arguments:</h6>
+
+<ul>
+<li><strong>domain_latents:</strong>  Latent representations for all domains.</li>
+<li><strong>mode:</strong>  The mode in which the model is currently operating.</li>
+</ul>
+
+<h6 id="returns">Returns:</h6>
+
+<blockquote>
+  <p>A LossOutput object containing the loss and metrics for this step.</p>
+</blockquote>
+</div>
+
+
+                            </div>
+                            <div class="inherited">
+                                <h5>Inherited Members</h5>
+                                <dl>
+                                    <div><dt>torch.nn.modules.module.Module</dt>
+                                <dd id="GWLosses.dump_patches" class="variable">dump_patches</dd>
+                <dd id="GWLosses.training" class="variable">training</dd>
+                <dd id="GWLosses.call_super_init" class="variable">call_super_init</dd>
+                <dd id="GWLosses.forward" class="function">forward</dd>
+                <dd id="GWLosses.register_buffer" class="function">register_buffer</dd>
+                <dd id="GWLosses.register_parameter" class="function">register_parameter</dd>
+                <dd id="GWLosses.add_module" class="function">add_module</dd>
+                <dd id="GWLosses.register_module" class="function">register_module</dd>
+                <dd id="GWLosses.get_submodule" class="function">get_submodule</dd>
+                <dd id="GWLosses.get_parameter" class="function">get_parameter</dd>
+                <dd id="GWLosses.get_buffer" class="function">get_buffer</dd>
+                <dd id="GWLosses.get_extra_state" class="function">get_extra_state</dd>
+                <dd id="GWLosses.set_extra_state" class="function">set_extra_state</dd>
+                <dd id="GWLosses.apply" class="function">apply</dd>
+                <dd id="GWLosses.cuda" class="function">cuda</dd>
+                <dd id="GWLosses.ipu" class="function">ipu</dd>
+                <dd id="GWLosses.xpu" class="function">xpu</dd>
+                <dd id="GWLosses.cpu" class="function">cpu</dd>
+                <dd id="GWLosses.type" class="function">type</dd>
+                <dd id="GWLosses.float" class="function">float</dd>
+                <dd id="GWLosses.double" class="function">double</dd>
+                <dd id="GWLosses.half" class="function">half</dd>
+                <dd id="GWLosses.bfloat16" class="function">bfloat16</dd>
+                <dd id="GWLosses.to_empty" class="function">to_empty</dd>
+                <dd id="GWLosses.to" class="function">to</dd>
+                <dd id="GWLosses.register_full_backward_pre_hook" class="function">register_full_backward_pre_hook</dd>
+                <dd id="GWLosses.register_backward_hook" class="function">register_backward_hook</dd>
+                <dd id="GWLosses.register_full_backward_hook" class="function">register_full_backward_hook</dd>
+                <dd id="GWLosses.register_forward_pre_hook" class="function">register_forward_pre_hook</dd>
+                <dd id="GWLosses.register_forward_hook" class="function">register_forward_hook</dd>
+                <dd id="GWLosses.register_state_dict_pre_hook" class="function">register_state_dict_pre_hook</dd>
+                <dd id="GWLosses.state_dict" class="function">state_dict</dd>
+                <dd id="GWLosses.register_load_state_dict_post_hook" class="function">register_load_state_dict_post_hook</dd>
+                <dd id="GWLosses.load_state_dict" class="function">load_state_dict</dd>
+                <dd id="GWLosses.parameters" class="function">parameters</dd>
+                <dd id="GWLosses.named_parameters" class="function">named_parameters</dd>
+                <dd id="GWLosses.buffers" class="function">buffers</dd>
+                <dd id="GWLosses.named_buffers" class="function">named_buffers</dd>
+                <dd id="GWLosses.children" class="function">children</dd>
+                <dd id="GWLosses.named_children" class="function">named_children</dd>
+                <dd id="GWLosses.modules" class="function">modules</dd>
+                <dd id="GWLosses.named_modules" class="function">named_modules</dd>
+                <dd id="GWLosses.train" class="function">train</dd>
+                <dd id="GWLosses.eval" class="function">eval</dd>
+                <dd id="GWLosses.requires_grad_" class="function">requires_grad_</dd>
+                <dd id="GWLosses.zero_grad" class="function">zero_grad</dd>
+                <dd id="GWLosses.share_memory" class="function">share_memory</dd>
+                <dd id="GWLosses.extra_repr" class="function">extra_repr</dd>
+                <dd id="GWLosses.compile" class="function">compile</dd>
+
+            </div>
+                                </dl>
+                            </div>
+                </section>
+                <section id="GWLossesBayesian">
+                            <input id="GWLossesBayesian-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
+<div class="attr class">
+            
+    <span class="def">class</span>
+    <span class="name">GWLossesBayesian</span><wbr>(<span class="base"><a href="#GWLossesBase">GWLossesBase</a></span>):
+
+                <label class="view-source-button" for="GWLossesBayesian-view-source"><span>View Source</span></label>
+
+    </div>
+    <a class="headerlink" href="#GWLossesBayesian"></a>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="GWLossesBayesian-760"><a href="#GWLossesBayesian-760"><span class="linenos">760</span></a><span class="k">class</span> <span class="nc">GWLossesBayesian</span><span class="p">(</span><span class="n">GWLossesBase</span><span class="p">):</span>
+</span><span id="GWLossesBayesian-761"><a href="#GWLossesBayesian-761"><span class="linenos">761</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="GWLossesBayesian-762"><a href="#GWLossesBayesian-762"><span class="linenos">762</span></a><span class="sd">    Implementation of `GWLossesBase` used for `GWModuleBayesian`.</span>
+</span><span id="GWLossesBayesian-763"><a href="#GWLossesBayesian-763"><span class="linenos">763</span></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="GWLossesBayesian-764"><a href="#GWLossesBayesian-764"><span class="linenos">764</span></a>
+</span><span id="GWLossesBayesian-765"><a href="#GWLossesBayesian-765"><span class="linenos">765</span></a>    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span>
+</span><span id="GWLossesBayesian-766"><a href="#GWLossesBayesian-766"><span class="linenos">766</span></a>        <span class="bp">self</span><span class="p">,</span>
+</span><span id="GWLossesBayesian-767"><a href="#GWLossesBayesian-767"><span class="linenos">767</span></a>        <span class="n">gw_mod</span><span class="p">:</span> <span class="n">GWModuleBayesian</span><span class="p">,</span>
+</span><span id="GWLossesBayesian-768"><a href="#GWLossesBayesian-768"><span class="linenos">768</span></a>        <span class="n">selection_mod</span><span class="p">:</span> <span class="n">SelectionBase</span><span class="p">,</span>
+</span><span id="GWLossesBayesian-769"><a href="#GWLossesBayesian-769"><span class="linenos">769</span></a>        <span class="n">domain_mods</span><span class="p">:</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">DomainModule</span><span class="p">],</span>
+</span><span id="GWLossesBayesian-770"><a href="#GWLossesBayesian-770"><span class="linenos">770</span></a>        <span class="n">loss_coefs</span><span class="p">:</span> <span class="n">BroadcastLossCoefs</span><span class="p">,</span>
+</span><span id="GWLossesBayesian-771"><a href="#GWLossesBayesian-771"><span class="linenos">771</span></a>        <span class="n">contrastive_fn</span><span class="p">:</span> <span class="n">ContrastiveLossType</span><span class="p">,</span>
+</span><span id="GWLossesBayesian-772"><a href="#GWLossesBayesian-772"><span class="linenos">772</span></a>        <span class="n">use_normalized_constrastive</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">True</span><span class="p">,</span>
+</span><span id="GWLossesBayesian-773"><a href="#GWLossesBayesian-773"><span class="linenos">773</span></a>    <span class="p">):</span>
+</span><span id="GWLossesBayesian-774"><a href="#GWLossesBayesian-774"><span class="linenos">774</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="GWLossesBayesian-775"><a href="#GWLossesBayesian-775"><span class="linenos">775</span></a><span class="sd">        Loss module with uncertainty prediction to use with the GlobalWorkspaceBayesian</span>
+</span><span id="GWLossesBayesian-776"><a href="#GWLossesBayesian-776"><span class="linenos">776</span></a>
+</span><span id="GWLossesBayesian-777"><a href="#GWLossesBayesian-777"><span class="linenos">777</span></a><span class="sd">        Args:</span>
+</span><span id="GWLossesBayesian-778"><a href="#GWLossesBayesian-778"><span class="linenos">778</span></a><span class="sd">            gw_mod (`GWModuleBayesian`): the GWModule</span>
+</span><span id="GWLossesBayesian-779"><a href="#GWLossesBayesian-779"><span class="linenos">779</span></a><span class="sd">            selection_mod (`SelectionBase`): selection module</span>
+</span><span id="GWLossesBayesian-780"><a href="#GWLossesBayesian-780"><span class="linenos">780</span></a><span class="sd">            domain_mods (`dict[str, DomainModule]`): a dict where the key is the</span>
+</span><span id="GWLossesBayesian-781"><a href="#GWLossesBayesian-781"><span class="linenos">781</span></a><span class="sd">                domain name and value is the DomainModule</span>
+</span><span id="GWLossesBayesian-782"><a href="#GWLossesBayesian-782"><span class="linenos">782</span></a><span class="sd">            loss_coefs (`BroadcastLossCoefs`): loss coefficients</span>
+</span><span id="GWLossesBayesian-783"><a href="#GWLossesBayesian-783"><span class="linenos">783</span></a><span class="sd">            contrastive_fn (`ContrastiveLossType`): the contrastive function</span>
+</span><span id="GWLossesBayesian-784"><a href="#GWLossesBayesian-784"><span class="linenos">784</span></a><span class="sd">                to use in contrastive loss</span>
+</span><span id="GWLossesBayesian-785"><a href="#GWLossesBayesian-785"><span class="linenos">785</span></a><span class="sd">            use_normalized_constrastive (`bool`): whether to use the normalized cont</span>
+</span><span id="GWLossesBayesian-786"><a href="#GWLossesBayesian-786"><span class="linenos">786</span></a><span class="sd">                loss by the precision coefs</span>
+</span><span id="GWLossesBayesian-787"><a href="#GWLossesBayesian-787"><span class="linenos">787</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="GWLossesBayesian-788"><a href="#GWLossesBayesian-788"><span class="linenos">788</span></a>        <span class="nb">super</span><span class="p">()</span><span class="o">.</span><span class="fm">__init__</span><span class="p">()</span>
+</span><span id="GWLossesBayesian-789"><a href="#GWLossesBayesian-789"><span class="linenos">789</span></a>
+</span><span id="GWLossesBayesian-790"><a href="#GWLossesBayesian-790"><span class="linenos">790</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">gw_mod</span> <span class="o">=</span> <span class="n">gw_mod</span>
+</span><span id="GWLossesBayesian-791"><a href="#GWLossesBayesian-791"><span class="linenos">791</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;The GWModule.&quot;&quot;&quot;</span>
+</span><span id="GWLossesBayesian-792"><a href="#GWLossesBayesian-792"><span class="linenos">792</span></a>
+</span><span id="GWLossesBayesian-793"><a href="#GWLossesBayesian-793"><span class="linenos">793</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">selection_mod</span> <span class="o">=</span> <span class="n">selection_mod</span>
+</span><span id="GWLossesBayesian-794"><a href="#GWLossesBayesian-794"><span class="linenos">794</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;Selection module&quot;&quot;&quot;</span>
+</span><span id="GWLossesBayesian-795"><a href="#GWLossesBayesian-795"><span class="linenos">795</span></a>
+</span><span id="GWLossesBayesian-796"><a href="#GWLossesBayesian-796"><span class="linenos">796</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">domain_mods</span> <span class="o">=</span> <span class="n">domain_mods</span>
+</span><span id="GWLossesBayesian-797"><a href="#GWLossesBayesian-797"><span class="linenos">797</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;Domain modules linked to the GW.&quot;&quot;&quot;</span>
+</span><span id="GWLossesBayesian-798"><a href="#GWLossesBayesian-798"><span class="linenos">798</span></a>
+</span><span id="GWLossesBayesian-799"><a href="#GWLossesBayesian-799"><span class="linenos">799</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">loss_coefs</span> <span class="o">=</span> <span class="n">loss_coefs</span>
+</span><span id="GWLossesBayesian-800"><a href="#GWLossesBayesian-800"><span class="linenos">800</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;The loss coefficients.&quot;&quot;&quot;</span>
+</span><span id="GWLossesBayesian-801"><a href="#GWLossesBayesian-801"><span class="linenos">801</span></a>
+</span><span id="GWLossesBayesian-802"><a href="#GWLossesBayesian-802"><span class="linenos">802</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">contrastive_fn</span> <span class="o">=</span> <span class="n">contrastive_fn</span>
+</span><span id="GWLossesBayesian-803"><a href="#GWLossesBayesian-803"><span class="linenos">803</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="GWLossesBayesian-804"><a href="#GWLossesBayesian-804"><span class="linenos">804</span></a><span class="sd">        Contrastive loss to use.</span>
+</span><span id="GWLossesBayesian-805"><a href="#GWLossesBayesian-805"><span class="linenos">805</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="GWLossesBayesian-806"><a href="#GWLossesBayesian-806"><span class="linenos">806</span></a>
+</span><span id="GWLossesBayesian-807"><a href="#GWLossesBayesian-807"><span class="linenos">807</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">use_normalized_constrastive</span> <span class="o">=</span> <span class="n">use_normalized_constrastive</span>
+</span><span id="GWLossesBayesian-808"><a href="#GWLossesBayesian-808"><span class="linenos">808</span></a>
+</span><span id="GWLossesBayesian-809"><a href="#GWLossesBayesian-809"><span class="linenos">809</span></a>    <span class="k">def</span> <span class="nf">contrastive_loss</span><span class="p">(</span>
+</span><span id="GWLossesBayesian-810"><a href="#GWLossesBayesian-810"><span class="linenos">810</span></a>        <span class="bp">self</span><span class="p">,</span> <span class="n">latent_domains</span><span class="p">:</span> <span class="n">LatentsDomainGroupsT</span>
+</span><span id="GWLossesBayesian-811"><a href="#GWLossesBayesian-811"><span class="linenos">811</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]:</span>
+</span><span id="GWLossesBayesian-812"><a href="#GWLossesBayesian-812"><span class="linenos">812</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="GWLossesBayesian-813"><a href="#GWLossesBayesian-813"><span class="linenos">813</span></a><span class="sd">        Contrastive loss.</span>
+</span><span id="GWLossesBayesian-814"><a href="#GWLossesBayesian-814"><span class="linenos">814</span></a>
+</span><span id="GWLossesBayesian-815"><a href="#GWLossesBayesian-815"><span class="linenos">815</span></a><span class="sd">        Args:</span>
+</span><span id="GWLossesBayesian-816"><a href="#GWLossesBayesian-816"><span class="linenos">816</span></a><span class="sd">            latent_domains (`LatentsDomainGroupsT`): the latent unimodal groups</span>
+</span><span id="GWLossesBayesian-817"><a href="#GWLossesBayesian-817"><span class="linenos">817</span></a>
+</span><span id="GWLossesBayesian-818"><a href="#GWLossesBayesian-818"><span class="linenos">818</span></a><span class="sd">        Returns:</span>
+</span><span id="GWLossesBayesian-819"><a href="#GWLossesBayesian-819"><span class="linenos">819</span></a><span class="sd">            `dict[str, torch.Tensor]`: a dict of metrics.</span>
+</span><span id="GWLossesBayesian-820"><a href="#GWLossesBayesian-820"><span class="linenos">820</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="GWLossesBayesian-821"><a href="#GWLossesBayesian-821"><span class="linenos">821</span></a>        <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">use_normalized_constrastive</span><span class="p">:</span>
+</span><span id="GWLossesBayesian-822"><a href="#GWLossesBayesian-822"><span class="linenos">822</span></a>            <span class="k">return</span> <span class="n">contrastive_loss_bayesian</span><span class="p">(</span>
+</span><span id="GWLossesBayesian-823"><a href="#GWLossesBayesian-823"><span class="linenos">823</span></a>                <span class="bp">self</span><span class="o">.</span><span class="n">gw_mod</span><span class="p">,</span> <span class="n">latent_domains</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">contrastive_fn</span>
+</span><span id="GWLossesBayesian-824"><a href="#GWLossesBayesian-824"><span class="linenos">824</span></a>            <span class="p">)</span>
+</span><span id="GWLossesBayesian-825"><a href="#GWLossesBayesian-825"><span class="linenos">825</span></a>        <span class="k">return</span> <span class="n">contrastive_loss</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">gw_mod</span><span class="p">,</span> <span class="n">latent_domains</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">contrastive_fn</span><span class="p">)</span>
+</span><span id="GWLossesBayesian-826"><a href="#GWLossesBayesian-826"><span class="linenos">826</span></a>
+</span><span id="GWLossesBayesian-827"><a href="#GWLossesBayesian-827"><span class="linenos">827</span></a>    <span class="k">def</span> <span class="nf">broadcast_loss</span><span class="p">(</span>
+</span><span id="GWLossesBayesian-828"><a href="#GWLossesBayesian-828"><span class="linenos">828</span></a>        <span class="bp">self</span><span class="p">,</span> <span class="n">latent_domains</span><span class="p">:</span> <span class="n">LatentsDomainGroupsT</span>
+</span><span id="GWLossesBayesian-829"><a href="#GWLossesBayesian-829"><span class="linenos">829</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]:</span>
+</span><span id="GWLossesBayesian-830"><a href="#GWLossesBayesian-830"><span class="linenos">830</span></a>        <span class="k">return</span> <span class="n">broadcast_loss</span><span class="p">(</span>
+</span><span id="GWLossesBayesian-831"><a href="#GWLossesBayesian-831"><span class="linenos">831</span></a>            <span class="bp">self</span><span class="o">.</span><span class="n">gw_mod</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">selection_mod</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">domain_mods</span><span class="p">,</span> <span class="n">latent_domains</span>
+</span><span id="GWLossesBayesian-832"><a href="#GWLossesBayesian-832"><span class="linenos">832</span></a>        <span class="p">)</span>
+</span><span id="GWLossesBayesian-833"><a href="#GWLossesBayesian-833"><span class="linenos">833</span></a>
+</span><span id="GWLossesBayesian-834"><a href="#GWLossesBayesian-834"><span class="linenos">834</span></a>    <span class="k">def</span> <span class="nf">step</span><span class="p">(</span>
+</span><span id="GWLossesBayesian-835"><a href="#GWLossesBayesian-835"><span class="linenos">835</span></a>        <span class="bp">self</span><span class="p">,</span> <span class="n">domain_latents</span><span class="p">:</span> <span class="n">LatentsDomainGroupsT</span><span class="p">,</span> <span class="n">mode</span><span class="p">:</span> <span class="n">ModelModeT</span>
+</span><span id="GWLossesBayesian-836"><a href="#GWLossesBayesian-836"><span class="linenos">836</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="n">LossOutput</span><span class="p">:</span>
+</span><span id="GWLossesBayesian-837"><a href="#GWLossesBayesian-837"><span class="linenos">837</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="GWLossesBayesian-838"><a href="#GWLossesBayesian-838"><span class="linenos">838</span></a><span class="sd">        Performs a step of loss computation.</span>
+</span><span id="GWLossesBayesian-839"><a href="#GWLossesBayesian-839"><span class="linenos">839</span></a>
+</span><span id="GWLossesBayesian-840"><a href="#GWLossesBayesian-840"><span class="linenos">840</span></a><span class="sd">        Args:</span>
+</span><span id="GWLossesBayesian-841"><a href="#GWLossesBayesian-841"><span class="linenos">841</span></a><span class="sd">            domain_latents: Latent representations for all domains.</span>
+</span><span id="GWLossesBayesian-842"><a href="#GWLossesBayesian-842"><span class="linenos">842</span></a><span class="sd">            mode: The mode in which the model is currently operating.</span>
+</span><span id="GWLossesBayesian-843"><a href="#GWLossesBayesian-843"><span class="linenos">843</span></a>
+</span><span id="GWLossesBayesian-844"><a href="#GWLossesBayesian-844"><span class="linenos">844</span></a><span class="sd">        Returns:</span>
+</span><span id="GWLossesBayesian-845"><a href="#GWLossesBayesian-845"><span class="linenos">845</span></a><span class="sd">            A LossOutput object containing the loss and metrics for this step.</span>
+</span><span id="GWLossesBayesian-846"><a href="#GWLossesBayesian-846"><span class="linenos">846</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="GWLossesBayesian-847"><a href="#GWLossesBayesian-847"><span class="linenos">847</span></a>
+</span><span id="GWLossesBayesian-848"><a href="#GWLossesBayesian-848"><span class="linenos">848</span></a>        <span class="n">metrics</span><span class="p">:</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]</span> <span class="o">=</span> <span class="p">{}</span>
+</span><span id="GWLossesBayesian-849"><a href="#GWLossesBayesian-849"><span class="linenos">849</span></a>
+</span><span id="GWLossesBayesian-850"><a href="#GWLossesBayesian-850"><span class="linenos">850</span></a>        <span class="n">metrics</span><span class="o">.</span><span class="n">update</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">contrastive_loss</span><span class="p">(</span><span class="n">domain_latents</span><span class="p">))</span>
+</span><span id="GWLossesBayesian-851"><a href="#GWLossesBayesian-851"><span class="linenos">851</span></a>        <span class="n">metrics</span><span class="o">.</span><span class="n">update</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">broadcast_loss</span><span class="p">(</span><span class="n">domain_latents</span><span class="p">))</span>
+</span><span id="GWLossesBayesian-852"><a href="#GWLossesBayesian-852"><span class="linenos">852</span></a>
+</span><span id="GWLossesBayesian-853"><a href="#GWLossesBayesian-853"><span class="linenos">853</span></a>        <span class="n">loss</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">stack</span><span class="p">(</span>
+</span><span id="GWLossesBayesian-854"><a href="#GWLossesBayesian-854"><span class="linenos">854</span></a>            <span class="p">[</span>
+</span><span id="GWLossesBayesian-855"><a href="#GWLossesBayesian-855"><span class="linenos">855</span></a>                <span class="n">metrics</span><span class="p">[</span><span class="n">name</span><span class="p">]</span> <span class="o">*</span> <span class="n">coef</span>
+</span><span id="GWLossesBayesian-856"><a href="#GWLossesBayesian-856"><span class="linenos">856</span></a>                <span class="k">for</span> <span class="n">name</span><span class="p">,</span> <span class="n">coef</span> <span class="ow">in</span> <span class="bp">self</span><span class="o">.</span><span class="n">loss_coefs</span><span class="o">.</span><span class="n">items</span><span class="p">()</span>
+</span><span id="GWLossesBayesian-857"><a href="#GWLossesBayesian-857"><span class="linenos">857</span></a>                <span class="k">if</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">coef</span><span class="p">,</span> <span class="nb">float</span><span class="p">)</span> <span class="ow">and</span> <span class="n">coef</span> <span class="o">&gt;</span> <span class="mi">0</span>
+</span><span id="GWLossesBayesian-858"><a href="#GWLossesBayesian-858"><span class="linenos">858</span></a>            <span class="p">],</span>
+</span><span id="GWLossesBayesian-859"><a href="#GWLossesBayesian-859"><span class="linenos">859</span></a>            <span class="n">dim</span><span class="o">=</span><span class="mi">0</span><span class="p">,</span>
+</span><span id="GWLossesBayesian-860"><a href="#GWLossesBayesian-860"><span class="linenos">860</span></a>        <span class="p">)</span><span class="o">.</span><span class="n">mean</span><span class="p">()</span>
+</span><span id="GWLossesBayesian-861"><a href="#GWLossesBayesian-861"><span class="linenos">861</span></a>
+</span><span id="GWLossesBayesian-862"><a href="#GWLossesBayesian-862"><span class="linenos">862</span></a>        <span class="n">metrics</span><span class="p">[</span><span class="s2">&quot;broadcast_loss&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">stack</span><span class="p">(</span>
+</span><span id="GWLossesBayesian-863"><a href="#GWLossesBayesian-863"><span class="linenos">863</span></a>            <span class="p">[</span>
+</span><span id="GWLossesBayesian-864"><a href="#GWLossesBayesian-864"><span class="linenos">864</span></a>                <span class="n">metrics</span><span class="p">[</span><span class="n">name</span><span class="p">]</span>
+</span><span id="GWLossesBayesian-865"><a href="#GWLossesBayesian-865"><span class="linenos">865</span></a>                <span class="k">for</span> <span class="n">name</span><span class="p">,</span> <span class="n">coef</span> <span class="ow">in</span> <span class="bp">self</span><span class="o">.</span><span class="n">loss_coefs</span><span class="o">.</span><span class="n">items</span><span class="p">()</span>
+</span><span id="GWLossesBayesian-866"><a href="#GWLossesBayesian-866"><span class="linenos">866</span></a>                <span class="k">if</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">coef</span><span class="p">,</span> <span class="nb">float</span><span class="p">)</span> <span class="ow">and</span> <span class="n">coef</span> <span class="o">&gt;</span> <span class="mi">0</span> <span class="ow">and</span> <span class="n">name</span> <span class="o">!=</span> <span class="s2">&quot;contrastives&quot;</span>
+</span><span id="GWLossesBayesian-867"><a href="#GWLossesBayesian-867"><span class="linenos">867</span></a>            <span class="p">],</span>
+</span><span id="GWLossesBayesian-868"><a href="#GWLossesBayesian-868"><span class="linenos">868</span></a>            <span class="n">dim</span><span class="o">=</span><span class="mi">0</span><span class="p">,</span>
+</span><span id="GWLossesBayesian-869"><a href="#GWLossesBayesian-869"><span class="linenos">869</span></a>        <span class="p">)</span><span class="o">.</span><span class="n">mean</span><span class="p">()</span>
+</span><span id="GWLossesBayesian-870"><a href="#GWLossesBayesian-870"><span class="linenos">870</span></a>
+</span><span id="GWLossesBayesian-871"><a href="#GWLossesBayesian-871"><span class="linenos">871</span></a>        <span class="k">return</span> <span class="n">LossOutput</span><span class="p">(</span><span class="n">loss</span><span class="p">,</span> <span class="n">metrics</span><span class="p">)</span>
+</span></pre></div>
+
+
+            <div class="docstring"><p>Implementation of <code><a href="#GWLossesBase">GWLossesBase</a></code> used for <code>GWModuleBayesian</code>.</p>
+</div>
+
+
+                            <div id="GWLossesBayesian.__init__" class="classattr">
+                                        <input id="GWLossesBayesian.__init__-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
+<div class="attr function">
+            
+        <span class="name">GWLossesBayesian</span><span class="signature pdoc-code multiline">(<span class="param">	<span class="n">gw_mod</span><span class="p">:</span> <span class="n"><a href="gw_module.html#GWModuleBayesian">shimmer.modules.gw_module.GWModuleBayesian</a></span>,</span><span class="param">	<span class="n">selection_mod</span><span class="p">:</span> <span class="n"><a href="selection.html#SelectionBase">shimmer.modules.selection.SelectionBase</a></span>,</span><span class="param">	<span class="n">domain_mods</span><span class="p">:</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n"><a href="domain.html#DomainModule">shimmer.modules.domain.DomainModule</a></span><span class="p">]</span>,</span><span class="param">	<span class="n">loss_coefs</span><span class="p">:</span> <span class="n"><a href="#BroadcastLossCoefs">BroadcastLossCoefs</a></span>,</span><span class="param">	<span class="n">contrastive_fn</span><span class="p">:</span> <span class="n">collections</span><span class="o">.</span><span class="n">abc</span><span class="o">.</span><span class="n">Callable</span><span class="p">[[</span><span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">],</span> <span class="n"><a href="domain.html#LossOutput">shimmer.modules.domain.LossOutput</a></span><span class="p">]</span>,</span><span class="param">	<span class="n">use_normalized_constrastive</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">True</span></span>)</span>
+
+                <label class="view-source-button" for="GWLossesBayesian.__init__-view-source"><span>View Source</span></label>
+
+    </div>
+    <a class="headerlink" href="#GWLossesBayesian.__init__"></a>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="GWLossesBayesian.__init__-765"><a href="#GWLossesBayesian.__init__-765"><span class="linenos">765</span></a>    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span>
+</span><span id="GWLossesBayesian.__init__-766"><a href="#GWLossesBayesian.__init__-766"><span class="linenos">766</span></a>        <span class="bp">self</span><span class="p">,</span>
+</span><span id="GWLossesBayesian.__init__-767"><a href="#GWLossesBayesian.__init__-767"><span class="linenos">767</span></a>        <span class="n">gw_mod</span><span class="p">:</span> <span class="n">GWModuleBayesian</span><span class="p">,</span>
+</span><span id="GWLossesBayesian.__init__-768"><a href="#GWLossesBayesian.__init__-768"><span class="linenos">768</span></a>        <span class="n">selection_mod</span><span class="p">:</span> <span class="n">SelectionBase</span><span class="p">,</span>
+</span><span id="GWLossesBayesian.__init__-769"><a href="#GWLossesBayesian.__init__-769"><span class="linenos">769</span></a>        <span class="n">domain_mods</span><span class="p">:</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">DomainModule</span><span class="p">],</span>
+</span><span id="GWLossesBayesian.__init__-770"><a href="#GWLossesBayesian.__init__-770"><span class="linenos">770</span></a>        <span class="n">loss_coefs</span><span class="p">:</span> <span class="n">BroadcastLossCoefs</span><span class="p">,</span>
+</span><span id="GWLossesBayesian.__init__-771"><a href="#GWLossesBayesian.__init__-771"><span class="linenos">771</span></a>        <span class="n">contrastive_fn</span><span class="p">:</span> <span class="n">ContrastiveLossType</span><span class="p">,</span>
+</span><span id="GWLossesBayesian.__init__-772"><a href="#GWLossesBayesian.__init__-772"><span class="linenos">772</span></a>        <span class="n">use_normalized_constrastive</span><span class="p">:</span> <span class="nb">bool</span> <span class="o">=</span> <span class="kc">True</span><span class="p">,</span>
+</span><span id="GWLossesBayesian.__init__-773"><a href="#GWLossesBayesian.__init__-773"><span class="linenos">773</span></a>    <span class="p">):</span>
+</span><span id="GWLossesBayesian.__init__-774"><a href="#GWLossesBayesian.__init__-774"><span class="linenos">774</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="GWLossesBayesian.__init__-775"><a href="#GWLossesBayesian.__init__-775"><span class="linenos">775</span></a><span class="sd">        Loss module with uncertainty prediction to use with the GlobalWorkspaceBayesian</span>
+</span><span id="GWLossesBayesian.__init__-776"><a href="#GWLossesBayesian.__init__-776"><span class="linenos">776</span></a>
+</span><span id="GWLossesBayesian.__init__-777"><a href="#GWLossesBayesian.__init__-777"><span class="linenos">777</span></a><span class="sd">        Args:</span>
+</span><span id="GWLossesBayesian.__init__-778"><a href="#GWLossesBayesian.__init__-778"><span class="linenos">778</span></a><span class="sd">            gw_mod (`GWModuleBayesian`): the GWModule</span>
+</span><span id="GWLossesBayesian.__init__-779"><a href="#GWLossesBayesian.__init__-779"><span class="linenos">779</span></a><span class="sd">            selection_mod (`SelectionBase`): selection module</span>
+</span><span id="GWLossesBayesian.__init__-780"><a href="#GWLossesBayesian.__init__-780"><span class="linenos">780</span></a><span class="sd">            domain_mods (`dict[str, DomainModule]`): a dict where the key is the</span>
+</span><span id="GWLossesBayesian.__init__-781"><a href="#GWLossesBayesian.__init__-781"><span class="linenos">781</span></a><span class="sd">                domain name and value is the DomainModule</span>
+</span><span id="GWLossesBayesian.__init__-782"><a href="#GWLossesBayesian.__init__-782"><span class="linenos">782</span></a><span class="sd">            loss_coefs (`BroadcastLossCoefs`): loss coefficients</span>
+</span><span id="GWLossesBayesian.__init__-783"><a href="#GWLossesBayesian.__init__-783"><span class="linenos">783</span></a><span class="sd">            contrastive_fn (`ContrastiveLossType`): the contrastive function</span>
+</span><span id="GWLossesBayesian.__init__-784"><a href="#GWLossesBayesian.__init__-784"><span class="linenos">784</span></a><span class="sd">                to use in contrastive loss</span>
+</span><span id="GWLossesBayesian.__init__-785"><a href="#GWLossesBayesian.__init__-785"><span class="linenos">785</span></a><span class="sd">            use_normalized_constrastive (`bool`): whether to use the normalized cont</span>
+</span><span id="GWLossesBayesian.__init__-786"><a href="#GWLossesBayesian.__init__-786"><span class="linenos">786</span></a><span class="sd">                loss by the precision coefs</span>
+</span><span id="GWLossesBayesian.__init__-787"><a href="#GWLossesBayesian.__init__-787"><span class="linenos">787</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="GWLossesBayesian.__init__-788"><a href="#GWLossesBayesian.__init__-788"><span class="linenos">788</span></a>        <span class="nb">super</span><span class="p">()</span><span class="o">.</span><span class="fm">__init__</span><span class="p">()</span>
+</span><span id="GWLossesBayesian.__init__-789"><a href="#GWLossesBayesian.__init__-789"><span class="linenos">789</span></a>
+</span><span id="GWLossesBayesian.__init__-790"><a href="#GWLossesBayesian.__init__-790"><span class="linenos">790</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">gw_mod</span> <span class="o">=</span> <span class="n">gw_mod</span>
+</span><span id="GWLossesBayesian.__init__-791"><a href="#GWLossesBayesian.__init__-791"><span class="linenos">791</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;The GWModule.&quot;&quot;&quot;</span>
+</span><span id="GWLossesBayesian.__init__-792"><a href="#GWLossesBayesian.__init__-792"><span class="linenos">792</span></a>
+</span><span id="GWLossesBayesian.__init__-793"><a href="#GWLossesBayesian.__init__-793"><span class="linenos">793</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">selection_mod</span> <span class="o">=</span> <span class="n">selection_mod</span>
+</span><span id="GWLossesBayesian.__init__-794"><a href="#GWLossesBayesian.__init__-794"><span class="linenos">794</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;Selection module&quot;&quot;&quot;</span>
+</span><span id="GWLossesBayesian.__init__-795"><a href="#GWLossesBayesian.__init__-795"><span class="linenos">795</span></a>
+</span><span id="GWLossesBayesian.__init__-796"><a href="#GWLossesBayesian.__init__-796"><span class="linenos">796</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">domain_mods</span> <span class="o">=</span> <span class="n">domain_mods</span>
+</span><span id="GWLossesBayesian.__init__-797"><a href="#GWLossesBayesian.__init__-797"><span class="linenos">797</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;Domain modules linked to the GW.&quot;&quot;&quot;</span>
+</span><span id="GWLossesBayesian.__init__-798"><a href="#GWLossesBayesian.__init__-798"><span class="linenos">798</span></a>
+</span><span id="GWLossesBayesian.__init__-799"><a href="#GWLossesBayesian.__init__-799"><span class="linenos">799</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">loss_coefs</span> <span class="o">=</span> <span class="n">loss_coefs</span>
+</span><span id="GWLossesBayesian.__init__-800"><a href="#GWLossesBayesian.__init__-800"><span class="linenos">800</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;The loss coefficients.&quot;&quot;&quot;</span>
+</span><span id="GWLossesBayesian.__init__-801"><a href="#GWLossesBayesian.__init__-801"><span class="linenos">801</span></a>
+</span><span id="GWLossesBayesian.__init__-802"><a href="#GWLossesBayesian.__init__-802"><span class="linenos">802</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">contrastive_fn</span> <span class="o">=</span> <span class="n">contrastive_fn</span>
+</span><span id="GWLossesBayesian.__init__-803"><a href="#GWLossesBayesian.__init__-803"><span class="linenos">803</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="GWLossesBayesian.__init__-804"><a href="#GWLossesBayesian.__init__-804"><span class="linenos">804</span></a><span class="sd">        Contrastive loss to use.</span>
+</span><span id="GWLossesBayesian.__init__-805"><a href="#GWLossesBayesian.__init__-805"><span class="linenos">805</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="GWLossesBayesian.__init__-806"><a href="#GWLossesBayesian.__init__-806"><span class="linenos">806</span></a>
+</span><span id="GWLossesBayesian.__init__-807"><a href="#GWLossesBayesian.__init__-807"><span class="linenos">807</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">use_normalized_constrastive</span> <span class="o">=</span> <span class="n">use_normalized_constrastive</span>
+</span></pre></div>
+
+
+            <div class="docstring"><p>Loss module with uncertainty prediction to use with the GlobalWorkspaceBayesian</p>
+
+<h6 id="arguments">Arguments:</h6>
+
+<ul>
+<li><strong>gw_mod (<code>GWModuleBayesian</code>):</strong>  the GWModule</li>
+<li><strong>selection_mod (<code>SelectionBase</code>):</strong>  selection module</li>
+<li><strong>domain_mods (<code>dict[str, DomainModule]</code>):</strong>  a dict where the key is the
+domain name and value is the DomainModule</li>
+<li><strong>loss_coefs (<code><a href="#BroadcastLossCoefs">BroadcastLossCoefs</a></code>):</strong>  loss coefficients</li>
+<li><strong>contrastive_fn (<code>ContrastiveLossType</code>):</strong>  the contrastive function
+to use in contrastive loss</li>
+<li><strong>use_normalized_constrastive (<code>bool</code>):</strong>  whether to use the normalized cont
+loss by the precision coefs</li>
+</ul>
+</div>
+
+
+                            </div>
+                            <div id="GWLossesBayesian.gw_mod" class="classattr">
+                                <div class="attr variable">
+            <span class="name">gw_mod</span>
+
+        
+    </div>
+    <a class="headerlink" href="#GWLossesBayesian.gw_mod"></a>
+    
+            <div class="docstring"><p>The GWModule.</p>
+</div>
+
+
+                            </div>
+                            <div id="GWLossesBayesian.selection_mod" class="classattr">
+                                <div class="attr variable">
+            <span class="name">selection_mod</span>
+
+        
+    </div>
+    <a class="headerlink" href="#GWLossesBayesian.selection_mod"></a>
+    
+            <div class="docstring"><p>Selection module</p>
+</div>
+
+
+                            </div>
+                            <div id="GWLossesBayesian.domain_mods" class="classattr">
+                                <div class="attr variable">
+            <span class="name">domain_mods</span>
+
+        
+    </div>
+    <a class="headerlink" href="#GWLossesBayesian.domain_mods"></a>
+    
+            <div class="docstring"><p>Domain modules linked to the GW.</p>
+</div>
+
+
+                            </div>
+                            <div id="GWLossesBayesian.loss_coefs" class="classattr">
+                                <div class="attr variable">
+            <span class="name">loss_coefs</span>
+
+        
+    </div>
+    <a class="headerlink" href="#GWLossesBayesian.loss_coefs"></a>
+    
+            <div class="docstring"><p>The loss coefficients.</p>
+</div>
+
+
+                            </div>
+                            <div id="GWLossesBayesian.contrastive_fn" class="classattr">
+                                <div class="attr variable">
+            <span class="name">contrastive_fn</span>
+
+        
+    </div>
+    <a class="headerlink" href="#GWLossesBayesian.contrastive_fn"></a>
+    
+            <div class="docstring"><p>Contrastive loss to use.</p>
+</div>
+
+
+                            </div>
+                            <div id="GWLossesBayesian.use_normalized_constrastive" class="classattr">
+                                <div class="attr variable">
+            <span class="name">use_normalized_constrastive</span>
+
+        
+    </div>
+    <a class="headerlink" href="#GWLossesBayesian.use_normalized_constrastive"></a>
+    
+    
+
+                            </div>
+                            <div id="GWLossesBayesian.contrastive_loss" class="classattr">
+                                        <input id="GWLossesBayesian.contrastive_loss-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
+<div class="attr function">
+            
+        <span class="def">def</span>
+        <span class="name">contrastive_loss</span><span class="signature pdoc-code multiline">(<span class="param">	<span class="bp">self</span>,</span><span class="param">	<span class="n">latent_domains</span><span class="p">:</span> <span class="n">collections</span><span class="o">.</span><span class="n">abc</span><span class="o">.</span><span class="n">Mapping</span><span class="p">[</span><span class="nb">frozenset</span><span class="p">[</span><span class="nb">str</span><span class="p">],</span> <span class="n">collections</span><span class="o">.</span><span class="n">abc</span><span class="o">.</span><span class="n">Mapping</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]]</span></span><span class="return-annotation">) -> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]</span>:</span></span>
+
+                <label class="view-source-button" for="GWLossesBayesian.contrastive_loss-view-source"><span>View Source</span></label>
+
+    </div>
+    <a class="headerlink" href="#GWLossesBayesian.contrastive_loss"></a>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="GWLossesBayesian.contrastive_loss-809"><a href="#GWLossesBayesian.contrastive_loss-809"><span class="linenos">809</span></a>    <span class="k">def</span> <span class="nf">contrastive_loss</span><span class="p">(</span>
+</span><span id="GWLossesBayesian.contrastive_loss-810"><a href="#GWLossesBayesian.contrastive_loss-810"><span class="linenos">810</span></a>        <span class="bp">self</span><span class="p">,</span> <span class="n">latent_domains</span><span class="p">:</span> <span class="n">LatentsDomainGroupsT</span>
+</span><span id="GWLossesBayesian.contrastive_loss-811"><a href="#GWLossesBayesian.contrastive_loss-811"><span class="linenos">811</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]:</span>
+</span><span id="GWLossesBayesian.contrastive_loss-812"><a href="#GWLossesBayesian.contrastive_loss-812"><span class="linenos">812</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="GWLossesBayesian.contrastive_loss-813"><a href="#GWLossesBayesian.contrastive_loss-813"><span class="linenos">813</span></a><span class="sd">        Contrastive loss.</span>
+</span><span id="GWLossesBayesian.contrastive_loss-814"><a href="#GWLossesBayesian.contrastive_loss-814"><span class="linenos">814</span></a>
+</span><span id="GWLossesBayesian.contrastive_loss-815"><a href="#GWLossesBayesian.contrastive_loss-815"><span class="linenos">815</span></a><span class="sd">        Args:</span>
+</span><span id="GWLossesBayesian.contrastive_loss-816"><a href="#GWLossesBayesian.contrastive_loss-816"><span class="linenos">816</span></a><span class="sd">            latent_domains (`LatentsDomainGroupsT`): the latent unimodal groups</span>
+</span><span id="GWLossesBayesian.contrastive_loss-817"><a href="#GWLossesBayesian.contrastive_loss-817"><span class="linenos">817</span></a>
+</span><span id="GWLossesBayesian.contrastive_loss-818"><a href="#GWLossesBayesian.contrastive_loss-818"><span class="linenos">818</span></a><span class="sd">        Returns:</span>
+</span><span id="GWLossesBayesian.contrastive_loss-819"><a href="#GWLossesBayesian.contrastive_loss-819"><span class="linenos">819</span></a><span class="sd">            `dict[str, torch.Tensor]`: a dict of metrics.</span>
+</span><span id="GWLossesBayesian.contrastive_loss-820"><a href="#GWLossesBayesian.contrastive_loss-820"><span class="linenos">820</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="GWLossesBayesian.contrastive_loss-821"><a href="#GWLossesBayesian.contrastive_loss-821"><span class="linenos">821</span></a>        <span class="k">if</span> <span class="bp">self</span><span class="o">.</span><span class="n">use_normalized_constrastive</span><span class="p">:</span>
+</span><span id="GWLossesBayesian.contrastive_loss-822"><a href="#GWLossesBayesian.contrastive_loss-822"><span class="linenos">822</span></a>            <span class="k">return</span> <span class="n">contrastive_loss_bayesian</span><span class="p">(</span>
+</span><span id="GWLossesBayesian.contrastive_loss-823"><a href="#GWLossesBayesian.contrastive_loss-823"><span class="linenos">823</span></a>                <span class="bp">self</span><span class="o">.</span><span class="n">gw_mod</span><span class="p">,</span> <span class="n">latent_domains</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">contrastive_fn</span>
+</span><span id="GWLossesBayesian.contrastive_loss-824"><a href="#GWLossesBayesian.contrastive_loss-824"><span class="linenos">824</span></a>            <span class="p">)</span>
+</span><span id="GWLossesBayesian.contrastive_loss-825"><a href="#GWLossesBayesian.contrastive_loss-825"><span class="linenos">825</span></a>        <span class="k">return</span> <span class="n">contrastive_loss</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">gw_mod</span><span class="p">,</span> <span class="n">latent_domains</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">contrastive_fn</span><span class="p">)</span>
+</span></pre></div>
+
+
+            <div class="docstring"><p>Contrastive loss.</p>
+
+<h6 id="arguments">Arguments:</h6>
+
+<ul>
+<li><strong>latent_domains (<code>LatentsDomainGroupsT</code>):</strong>  the latent unimodal groups</li>
+</ul>
+
+<h6 id="returns">Returns:</h6>
+
+<blockquote>
+  <p><code>dict[str, torch.Tensor]</code>: a dict of metrics.</p>
+</blockquote>
+</div>
+
+
+                            </div>
+                            <div id="GWLossesBayesian.broadcast_loss" class="classattr">
+                                        <input id="GWLossesBayesian.broadcast_loss-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
+<div class="attr function">
+            
+        <span class="def">def</span>
+        <span class="name">broadcast_loss</span><span class="signature pdoc-code multiline">(<span class="param">	<span class="bp">self</span>,</span><span class="param">	<span class="n">latent_domains</span><span class="p">:</span> <span class="n">collections</span><span class="o">.</span><span class="n">abc</span><span class="o">.</span><span class="n">Mapping</span><span class="p">[</span><span class="nb">frozenset</span><span class="p">[</span><span class="nb">str</span><span class="p">],</span> <span class="n">collections</span><span class="o">.</span><span class="n">abc</span><span class="o">.</span><span class="n">Mapping</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]]</span></span><span class="return-annotation">) -> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]</span>:</span></span>
+
+                <label class="view-source-button" for="GWLossesBayesian.broadcast_loss-view-source"><span>View Source</span></label>
+
+    </div>
+    <a class="headerlink" href="#GWLossesBayesian.broadcast_loss"></a>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="GWLossesBayesian.broadcast_loss-827"><a href="#GWLossesBayesian.broadcast_loss-827"><span class="linenos">827</span></a>    <span class="k">def</span> <span class="nf">broadcast_loss</span><span class="p">(</span>
+</span><span id="GWLossesBayesian.broadcast_loss-828"><a href="#GWLossesBayesian.broadcast_loss-828"><span class="linenos">828</span></a>        <span class="bp">self</span><span class="p">,</span> <span class="n">latent_domains</span><span class="p">:</span> <span class="n">LatentsDomainGroupsT</span>
+</span><span id="GWLossesBayesian.broadcast_loss-829"><a href="#GWLossesBayesian.broadcast_loss-829"><span class="linenos">829</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]:</span>
+</span><span id="GWLossesBayesian.broadcast_loss-830"><a href="#GWLossesBayesian.broadcast_loss-830"><span class="linenos">830</span></a>        <span class="k">return</span> <span class="n">broadcast_loss</span><span class="p">(</span>
+</span><span id="GWLossesBayesian.broadcast_loss-831"><a href="#GWLossesBayesian.broadcast_loss-831"><span class="linenos">831</span></a>            <span class="bp">self</span><span class="o">.</span><span class="n">gw_mod</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">selection_mod</span><span class="p">,</span> <span class="bp">self</span><span class="o">.</span><span class="n">domain_mods</span><span class="p">,</span> <span class="n">latent_domains</span>
+</span><span id="GWLossesBayesian.broadcast_loss-832"><a href="#GWLossesBayesian.broadcast_loss-832"><span class="linenos">832</span></a>        <span class="p">)</span>
+</span></pre></div>
+
+
+    
+
+                            </div>
+                            <div id="GWLossesBayesian.step" class="classattr">
+                                        <input id="GWLossesBayesian.step-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
+<div class="attr function">
+            
+        <span class="def">def</span>
+        <span class="name">step</span><span class="signature pdoc-code multiline">(<span class="param">	<span class="bp">self</span>,</span><span class="param">	<span class="n">domain_latents</span><span class="p">:</span> <span class="n">collections</span><span class="o">.</span><span class="n">abc</span><span class="o">.</span><span class="n">Mapping</span><span class="p">[</span><span class="nb">frozenset</span><span class="p">[</span><span class="nb">str</span><span class="p">],</span> <span class="n">collections</span><span class="o">.</span><span class="n">abc</span><span class="o">.</span><span class="n">Mapping</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]]</span>,</span><span class="param">	<span class="n">mode</span><span class="p">:</span> <span class="n">Literal</span><span class="p">[</span><span class="s1">&#39;train&#39;</span><span class="p">,</span> <span class="s1">&#39;val&#39;</span><span class="p">,</span> <span class="s1">&#39;test&#39;</span><span class="p">,</span> <span class="s1">&#39;val/ood&#39;</span><span class="p">,</span> <span class="s1">&#39;test/ood&#39;</span><span class="p">]</span></span><span class="return-annotation">) -> <span class="n"><a href="domain.html#LossOutput">shimmer.modules.domain.LossOutput</a></span>:</span></span>
+
+                <label class="view-source-button" for="GWLossesBayesian.step-view-source"><span>View Source</span></label>
+
+    </div>
+    <a class="headerlink" href="#GWLossesBayesian.step"></a>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="GWLossesBayesian.step-834"><a href="#GWLossesBayesian.step-834"><span class="linenos">834</span></a>    <span class="k">def</span> <span class="nf">step</span><span class="p">(</span>
+</span><span id="GWLossesBayesian.step-835"><a href="#GWLossesBayesian.step-835"><span class="linenos">835</span></a>        <span class="bp">self</span><span class="p">,</span> <span class="n">domain_latents</span><span class="p">:</span> <span class="n">LatentsDomainGroupsT</span><span class="p">,</span> <span class="n">mode</span><span class="p">:</span> <span class="n">ModelModeT</span>
+</span><span id="GWLossesBayesian.step-836"><a href="#GWLossesBayesian.step-836"><span class="linenos">836</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="n">LossOutput</span><span class="p">:</span>
+</span><span id="GWLossesBayesian.step-837"><a href="#GWLossesBayesian.step-837"><span class="linenos">837</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="GWLossesBayesian.step-838"><a href="#GWLossesBayesian.step-838"><span class="linenos">838</span></a><span class="sd">        Performs a step of loss computation.</span>
+</span><span id="GWLossesBayesian.step-839"><a href="#GWLossesBayesian.step-839"><span class="linenos">839</span></a>
+</span><span id="GWLossesBayesian.step-840"><a href="#GWLossesBayesian.step-840"><span class="linenos">840</span></a><span class="sd">        Args:</span>
+</span><span id="GWLossesBayesian.step-841"><a href="#GWLossesBayesian.step-841"><span class="linenos">841</span></a><span class="sd">            domain_latents: Latent representations for all domains.</span>
+</span><span id="GWLossesBayesian.step-842"><a href="#GWLossesBayesian.step-842"><span class="linenos">842</span></a><span class="sd">            mode: The mode in which the model is currently operating.</span>
+</span><span id="GWLossesBayesian.step-843"><a href="#GWLossesBayesian.step-843"><span class="linenos">843</span></a>
+</span><span id="GWLossesBayesian.step-844"><a href="#GWLossesBayesian.step-844"><span class="linenos">844</span></a><span class="sd">        Returns:</span>
+</span><span id="GWLossesBayesian.step-845"><a href="#GWLossesBayesian.step-845"><span class="linenos">845</span></a><span class="sd">            A LossOutput object containing the loss and metrics for this step.</span>
+</span><span id="GWLossesBayesian.step-846"><a href="#GWLossesBayesian.step-846"><span class="linenos">846</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="GWLossesBayesian.step-847"><a href="#GWLossesBayesian.step-847"><span class="linenos">847</span></a>
+</span><span id="GWLossesBayesian.step-848"><a href="#GWLossesBayesian.step-848"><span class="linenos">848</span></a>        <span class="n">metrics</span><span class="p">:</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]</span> <span class="o">=</span> <span class="p">{}</span>
+</span><span id="GWLossesBayesian.step-849"><a href="#GWLossesBayesian.step-849"><span class="linenos">849</span></a>
+</span><span id="GWLossesBayesian.step-850"><a href="#GWLossesBayesian.step-850"><span class="linenos">850</span></a>        <span class="n">metrics</span><span class="o">.</span><span class="n">update</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">contrastive_loss</span><span class="p">(</span><span class="n">domain_latents</span><span class="p">))</span>
+</span><span id="GWLossesBayesian.step-851"><a href="#GWLossesBayesian.step-851"><span class="linenos">851</span></a>        <span class="n">metrics</span><span class="o">.</span><span class="n">update</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">broadcast_loss</span><span class="p">(</span><span class="n">domain_latents</span><span class="p">))</span>
+</span><span id="GWLossesBayesian.step-852"><a href="#GWLossesBayesian.step-852"><span class="linenos">852</span></a>
+</span><span id="GWLossesBayesian.step-853"><a href="#GWLossesBayesian.step-853"><span class="linenos">853</span></a>        <span class="n">loss</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">stack</span><span class="p">(</span>
+</span><span id="GWLossesBayesian.step-854"><a href="#GWLossesBayesian.step-854"><span class="linenos">854</span></a>            <span class="p">[</span>
+</span><span id="GWLossesBayesian.step-855"><a href="#GWLossesBayesian.step-855"><span class="linenos">855</span></a>                <span class="n">metrics</span><span class="p">[</span><span class="n">name</span><span class="p">]</span> <span class="o">*</span> <span class="n">coef</span>
+</span><span id="GWLossesBayesian.step-856"><a href="#GWLossesBayesian.step-856"><span class="linenos">856</span></a>                <span class="k">for</span> <span class="n">name</span><span class="p">,</span> <span class="n">coef</span> <span class="ow">in</span> <span class="bp">self</span><span class="o">.</span><span class="n">loss_coefs</span><span class="o">.</span><span class="n">items</span><span class="p">()</span>
+</span><span id="GWLossesBayesian.step-857"><a href="#GWLossesBayesian.step-857"><span class="linenos">857</span></a>                <span class="k">if</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">coef</span><span class="p">,</span> <span class="nb">float</span><span class="p">)</span> <span class="ow">and</span> <span class="n">coef</span> <span class="o">&gt;</span> <span class="mi">0</span>
+</span><span id="GWLossesBayesian.step-858"><a href="#GWLossesBayesian.step-858"><span class="linenos">858</span></a>            <span class="p">],</span>
+</span><span id="GWLossesBayesian.step-859"><a href="#GWLossesBayesian.step-859"><span class="linenos">859</span></a>            <span class="n">dim</span><span class="o">=</span><span class="mi">0</span><span class="p">,</span>
+</span><span id="GWLossesBayesian.step-860"><a href="#GWLossesBayesian.step-860"><span class="linenos">860</span></a>        <span class="p">)</span><span class="o">.</span><span class="n">mean</span><span class="p">()</span>
+</span><span id="GWLossesBayesian.step-861"><a href="#GWLossesBayesian.step-861"><span class="linenos">861</span></a>
+</span><span id="GWLossesBayesian.step-862"><a href="#GWLossesBayesian.step-862"><span class="linenos">862</span></a>        <span class="n">metrics</span><span class="p">[</span><span class="s2">&quot;broadcast_loss&quot;</span><span class="p">]</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">stack</span><span class="p">(</span>
+</span><span id="GWLossesBayesian.step-863"><a href="#GWLossesBayesian.step-863"><span class="linenos">863</span></a>            <span class="p">[</span>
+</span><span id="GWLossesBayesian.step-864"><a href="#GWLossesBayesian.step-864"><span class="linenos">864</span></a>                <span class="n">metrics</span><span class="p">[</span><span class="n">name</span><span class="p">]</span>
+</span><span id="GWLossesBayesian.step-865"><a href="#GWLossesBayesian.step-865"><span class="linenos">865</span></a>                <span class="k">for</span> <span class="n">name</span><span class="p">,</span> <span class="n">coef</span> <span class="ow">in</span> <span class="bp">self</span><span class="o">.</span><span class="n">loss_coefs</span><span class="o">.</span><span class="n">items</span><span class="p">()</span>
+</span><span id="GWLossesBayesian.step-866"><a href="#GWLossesBayesian.step-866"><span class="linenos">866</span></a>                <span class="k">if</span> <span class="nb">isinstance</span><span class="p">(</span><span class="n">coef</span><span class="p">,</span> <span class="nb">float</span><span class="p">)</span> <span class="ow">and</span> <span class="n">coef</span> <span class="o">&gt;</span> <span class="mi">0</span> <span class="ow">and</span> <span class="n">name</span> <span class="o">!=</span> <span class="s2">&quot;contrastives&quot;</span>
+</span><span id="GWLossesBayesian.step-867"><a href="#GWLossesBayesian.step-867"><span class="linenos">867</span></a>            <span class="p">],</span>
+</span><span id="GWLossesBayesian.step-868"><a href="#GWLossesBayesian.step-868"><span class="linenos">868</span></a>            <span class="n">dim</span><span class="o">=</span><span class="mi">0</span><span class="p">,</span>
+</span><span id="GWLossesBayesian.step-869"><a href="#GWLossesBayesian.step-869"><span class="linenos">869</span></a>        <span class="p">)</span><span class="o">.</span><span class="n">mean</span><span class="p">()</span>
+</span><span id="GWLossesBayesian.step-870"><a href="#GWLossesBayesian.step-870"><span class="linenos">870</span></a>
+</span><span id="GWLossesBayesian.step-871"><a href="#GWLossesBayesian.step-871"><span class="linenos">871</span></a>        <span class="k">return</span> <span class="n">LossOutput</span><span class="p">(</span><span class="n">loss</span><span class="p">,</span> <span class="n">metrics</span><span class="p">)</span>
+</span></pre></div>
+
+
+            <div class="docstring"><p>Performs a step of loss computation.</p>
+
+<h6 id="arguments">Arguments:</h6>
+
+<ul>
+<li><strong>domain_latents:</strong>  Latent representations for all domains.</li>
+<li><strong>mode:</strong>  The mode in which the model is currently operating.</li>
+</ul>
+
+<h6 id="returns">Returns:</h6>
+
+<blockquote>
+  <p>A LossOutput object containing the loss and metrics for this step.</p>
+</blockquote>
+</div>
+
+
+                            </div>
+                            <div class="inherited">
+                                <h5>Inherited Members</h5>
+                                <dl>
+                                    <div><dt>torch.nn.modules.module.Module</dt>
+                                <dd id="GWLossesBayesian.dump_patches" class="variable">dump_patches</dd>
+                <dd id="GWLossesBayesian.training" class="variable">training</dd>
+                <dd id="GWLossesBayesian.call_super_init" class="variable">call_super_init</dd>
+                <dd id="GWLossesBayesian.forward" class="function">forward</dd>
+                <dd id="GWLossesBayesian.register_buffer" class="function">register_buffer</dd>
+                <dd id="GWLossesBayesian.register_parameter" class="function">register_parameter</dd>
+                <dd id="GWLossesBayesian.add_module" class="function">add_module</dd>
+                <dd id="GWLossesBayesian.register_module" class="function">register_module</dd>
+                <dd id="GWLossesBayesian.get_submodule" class="function">get_submodule</dd>
+                <dd id="GWLossesBayesian.get_parameter" class="function">get_parameter</dd>
+                <dd id="GWLossesBayesian.get_buffer" class="function">get_buffer</dd>
+                <dd id="GWLossesBayesian.get_extra_state" class="function">get_extra_state</dd>
+                <dd id="GWLossesBayesian.set_extra_state" class="function">set_extra_state</dd>
+                <dd id="GWLossesBayesian.apply" class="function">apply</dd>
+                <dd id="GWLossesBayesian.cuda" class="function">cuda</dd>
+                <dd id="GWLossesBayesian.ipu" class="function">ipu</dd>
+                <dd id="GWLossesBayesian.xpu" class="function">xpu</dd>
+                <dd id="GWLossesBayesian.cpu" class="function">cpu</dd>
+                <dd id="GWLossesBayesian.type" class="function">type</dd>
+                <dd id="GWLossesBayesian.float" class="function">float</dd>
+                <dd id="GWLossesBayesian.double" class="function">double</dd>
+                <dd id="GWLossesBayesian.half" class="function">half</dd>
+                <dd id="GWLossesBayesian.bfloat16" class="function">bfloat16</dd>
+                <dd id="GWLossesBayesian.to_empty" class="function">to_empty</dd>
+                <dd id="GWLossesBayesian.to" class="function">to</dd>
+                <dd id="GWLossesBayesian.register_full_backward_pre_hook" class="function">register_full_backward_pre_hook</dd>
+                <dd id="GWLossesBayesian.register_backward_hook" class="function">register_backward_hook</dd>
+                <dd id="GWLossesBayesian.register_full_backward_hook" class="function">register_full_backward_hook</dd>
+                <dd id="GWLossesBayesian.register_forward_pre_hook" class="function">register_forward_pre_hook</dd>
+                <dd id="GWLossesBayesian.register_forward_hook" class="function">register_forward_hook</dd>
+                <dd id="GWLossesBayesian.register_state_dict_pre_hook" class="function">register_state_dict_pre_hook</dd>
+                <dd id="GWLossesBayesian.state_dict" class="function">state_dict</dd>
+                <dd id="GWLossesBayesian.register_load_state_dict_post_hook" class="function">register_load_state_dict_post_hook</dd>
+                <dd id="GWLossesBayesian.load_state_dict" class="function">load_state_dict</dd>
+                <dd id="GWLossesBayesian.parameters" class="function">parameters</dd>
+                <dd id="GWLossesBayesian.named_parameters" class="function">named_parameters</dd>
+                <dd id="GWLossesBayesian.buffers" class="function">buffers</dd>
+                <dd id="GWLossesBayesian.named_buffers" class="function">named_buffers</dd>
+                <dd id="GWLossesBayesian.children" class="function">children</dd>
+                <dd id="GWLossesBayesian.named_children" class="function">named_children</dd>
+                <dd id="GWLossesBayesian.modules" class="function">modules</dd>
+                <dd id="GWLossesBayesian.named_modules" class="function">named_modules</dd>
+                <dd id="GWLossesBayesian.train" class="function">train</dd>
+                <dd id="GWLossesBayesian.eval" class="function">eval</dd>
+                <dd id="GWLossesBayesian.requires_grad_" class="function">requires_grad_</dd>
+                <dd id="GWLossesBayesian.zero_grad" class="function">zero_grad</dd>
+                <dd id="GWLossesBayesian.share_memory" class="function">share_memory</dd>
+                <dd id="GWLossesBayesian.extra_repr" class="function">extra_repr</dd>
+                <dd id="GWLossesBayesian.compile" class="function">compile</dd>
+
+            </div>
+                                </dl>
+                            </div>
+                </section>
+    </main>
+<script>
+    function escapeHTML(html) {
+        return document.createElement('div').appendChild(document.createTextNode(html)).parentNode.innerHTML;
+    }
+
+    const originalContent = document.querySelector("main.pdoc");
+    let currentContent = originalContent;
+
+    function setContent(innerHTML) {
+        let elem;
+        if (innerHTML) {
+            elem = document.createElement("main");
+            elem.classList.add("pdoc");
+            elem.innerHTML = innerHTML;
+        } else {
+            elem = originalContent;
+        }
+        if (currentContent !== elem) {
+            currentContent.replaceWith(elem);
+            currentContent = elem;
+        }
+    }
+
+    function getSearchTerm() {
+        return (new URL(window.location)).searchParams.get("search");
+    }
+
+    const searchBox = document.querySelector(".pdoc input[type=search]");
+    searchBox.addEventListener("input", function () {
+        let url = new URL(window.location);
+        if (searchBox.value.trim()) {
+            url.hash = "";
+            url.searchParams.set("search", searchBox.value);
+        } else {
+            url.searchParams.delete("search");
+        }
+        history.replaceState("", "", url.toString());
+        onInput();
+    });
+    window.addEventListener("popstate", onInput);
+
+
+    let search, searchErr;
+
+    async function initialize() {
+        try {
+            search = await new Promise((resolve, reject) => {
+                const script = document.createElement("script");
+                script.type = "text/javascript";
+                script.async = true;
+                script.onload = () => resolve(window.pdocSearch);
+                script.onerror = (e) => reject(e);
+                script.src = "../../search.js";
+                document.getElementsByTagName("head")[0].appendChild(script);
+            });
+        } catch (e) {
+            console.error("Cannot fetch pdoc search index");
+            searchErr = "Cannot fetch search index.";
+        }
+        onInput();
+
+        document.querySelector("nav.pdoc").addEventListener("click", e => {
+            if (e.target.hash) {
+                searchBox.value = "";
+                searchBox.dispatchEvent(new Event("input"));
+            }
+        });
+    }
+
+    function onInput() {
+        setContent((() => {
+            const term = getSearchTerm();
+            if (!term) {
+                return null
+            }
+            if (searchErr) {
+                return `<h3>Error: ${searchErr}</h3>`
+            }
+            if (!search) {
+                return "<h3>Searching...</h3>"
+            }
+
+            window.scrollTo({top: 0, left: 0, behavior: 'auto'});
+
+            const results = search(term);
+
+            let html;
+            if (results.length === 0) {
+                html = `No search results for '${escapeHTML(term)}'.`
+            } else {
+                html = `<h4>${results.length} search result${results.length > 1 ? "s" : ""} for '${escapeHTML(term)}'.</h4>`;
+            }
+            for (let result of results.slice(0, 10)) {
+                let doc = result.doc;
+                let url = `../../${doc.modulename.replaceAll(".", "/")}.html`;
+                if (doc.qualname) {
+                    url += `#${doc.qualname}`;
+                }
+
+                let heading;
+                switch (result.doc.kind) {
+                    case "function":
+                        if (doc.fullname.endsWith(".__init__")) {
+                            heading = `<span class="name">${doc.fullname.replace(/\.__init__$/, "")}</span>${doc.signature}`;
+                        } else {
+                            heading = `<span class="def">${doc.funcdef}</span> <span class="name">${doc.fullname}</span>${doc.signature}`;
+                        }
+                        break;
+                    case "class":
+                        heading = `<span class="def">class</span> <span class="name">${doc.fullname}</span>`;
+                        if (doc.bases)
+                            heading += `<wbr>(<span class="base">${doc.bases}</span>)`;
+                        heading += `:`;
+                        break;
+                    case "variable":
+                        heading = `<span class="name">${doc.fullname}</span>`;
+                        if (doc.annotation)
+                            heading += `<span class="annotation">${doc.annotation}</span>`;
+                        if (doc.default_value)
+                            heading += `<span class="default_value"> = ${doc.default_value}</span>`;
+                        break;
+                    default:
+                        heading = `<span class="name">${doc.fullname}</span>`;
+                        break;
+                }
+                html += `
+                        <section class="search-result">
+                        <a href="${url}" class="attr ${doc.kind}">${heading}</a>
+                        <div class="docstring">${doc.doc}</div>
+                        </section>
+                    `;
+
+            }
+            return html;
+        })());
+    }
+
+    if (getSearchTerm()) {
+        initialize();
+        searchBox.value = getSearchTerm();
+        onInput();
+    } else {
+        searchBox.addEventListener("focus", initialize, {once: true});
+    }
+
+    searchBox.addEventListener("keydown", e => {
+        if (["ArrowDown", "ArrowUp", "Enter"].includes(e.key)) {
+            let focused = currentContent.querySelector(".search-result.focused");
+            if (!focused) {
+                currentContent.querySelector(".search-result").classList.add("focused");
+            } else if (
+                e.key === "ArrowDown"
+                && focused.nextElementSibling
+                && focused.nextElementSibling.classList.contains("search-result")
+            ) {
+                focused.classList.remove("focused");
+                focused.nextElementSibling.classList.add("focused");
+                focused.nextElementSibling.scrollIntoView({
+                    behavior: "smooth",
+                    block: "nearest",
+                    inline: "nearest"
+                });
+            } else if (
+                e.key === "ArrowUp"
+                && focused.previousElementSibling
+                && focused.previousElementSibling.classList.contains("search-result")
+            ) {
+                focused.classList.remove("focused");
+                focused.previousElementSibling.classList.add("focused");
+                focused.previousElementSibling.scrollIntoView({
+                    behavior: "smooth",
+                    block: "nearest",
+                    inline: "nearest"
+                });
+            } else if (
+                e.key === "Enter"
+            ) {
+                focused.querySelector("a").click();
+            }
+        }
+    });
+</script></body>
+</html>
\ No newline at end of file
diff --git a/docs/api/v0.5.1/shimmer/modules/selection.html b/docs/api/v0.5.1/shimmer/modules/selection.html
new file mode 100644
index 00000000..6a4bb9c0
--- /dev/null
+++ b/docs/api/v0.5.1/shimmer/modules/selection.html
@@ -0,0 +1,2151 @@
+<!doctype html>
+<html lang="en">
+<head>
+    <meta charset="utf-8">
+    <meta name="viewport" content="width=device-width, initial-scale=1">
+    <meta name="generator" content="pdoc 14.4.0"/>
+    <title>shimmer.modules.selection API documentation</title>
+
+    <style>/*! * Bootstrap Reboot v5.0.0 (https://getbootstrap.com/) * Copyright 2011-2021 The Bootstrap Authors * Copyright 2011-2021 Twitter, Inc. * Licensed under MIT (https://github.com/twbs/bootstrap/blob/main/LICENSE) * Forked from Normalize.css, licensed MIT (https://github.com/necolas/normalize.css/blob/master/LICENSE.md) */*,::after,::before{box-sizing:border-box}@media (prefers-reduced-motion:no-preference){:root{scroll-behavior:smooth}}body{margin:0;font-family:system-ui,-apple-system,"Segoe UI",Roboto,"Helvetica Neue",Arial,"Noto Sans","Liberation Sans",sans-serif,"Apple Color Emoji","Segoe UI Emoji","Segoe UI Symbol","Noto Color Emoji";font-size:1rem;font-weight:400;line-height:1.5;color:#212529;background-color:#fff;-webkit-text-size-adjust:100%;-webkit-tap-highlight-color:transparent}hr{margin:1rem 0;color:inherit;background-color:currentColor;border:0;opacity:.25}hr:not([size]){height:1px}h1,h2,h3,h4,h5,h6{margin-top:0;margin-bottom:.5rem;font-weight:500;line-height:1.2}h1{font-size:calc(1.375rem + 1.5vw)}@media (min-width:1200px){h1{font-size:2.5rem}}h2{font-size:calc(1.325rem + .9vw)}@media (min-width:1200px){h2{font-size:2rem}}h3{font-size:calc(1.3rem + .6vw)}@media (min-width:1200px){h3{font-size:1.75rem}}h4{font-size:calc(1.275rem + .3vw)}@media (min-width:1200px){h4{font-size:1.5rem}}h5{font-size:1.25rem}h6{font-size:1rem}p{margin-top:0;margin-bottom:1rem}abbr[data-bs-original-title],abbr[title]{-webkit-text-decoration:underline dotted;text-decoration:underline dotted;cursor:help;-webkit-text-decoration-skip-ink:none;text-decoration-skip-ink:none}address{margin-bottom:1rem;font-style:normal;line-height:inherit}ol,ul{padding-left:2rem}dl,ol,ul{margin-top:0;margin-bottom:1rem}ol ol,ol ul,ul ol,ul ul{margin-bottom:0}dt{font-weight:700}dd{margin-bottom:.5rem;margin-left:0}blockquote{margin:0 0 1rem}b,strong{font-weight:bolder}small{font-size:.875em}mark{padding:.2em;background-color:#fcf8e3}sub,sup{position:relative;font-size:.75em;line-height:0;vertical-align:baseline}sub{bottom:-.25em}sup{top:-.5em}a{color:#0d6efd;text-decoration:underline}a:hover{color:#0a58ca}a:not([href]):not([class]),a:not([href]):not([class]):hover{color:inherit;text-decoration:none}code,kbd,pre,samp{font-family:SFMono-Regular,Menlo,Monaco,Consolas,"Liberation Mono","Courier New",monospace;font-size:1em;direction:ltr;unicode-bidi:bidi-override}pre{display:block;margin-top:0;margin-bottom:1rem;overflow:auto;font-size:.875em}pre code{font-size:inherit;color:inherit;word-break:normal}code{font-size:.875em;color:#d63384;word-wrap:break-word}a>code{color:inherit}kbd{padding:.2rem .4rem;font-size:.875em;color:#fff;background-color:#212529;border-radius:.2rem}kbd kbd{padding:0;font-size:1em;font-weight:700}figure{margin:0 0 1rem}img,svg{vertical-align:middle}table{caption-side:bottom;border-collapse:collapse}caption{padding-top:.5rem;padding-bottom:.5rem;color:#6c757d;text-align:left}th{text-align:inherit;text-align:-webkit-match-parent}tbody,td,tfoot,th,thead,tr{border-color:inherit;border-style:solid;border-width:0}label{display:inline-block}button{border-radius:0}button:focus:not(:focus-visible){outline:0}button,input,optgroup,select,textarea{margin:0;font-family:inherit;font-size:inherit;line-height:inherit}button,select{text-transform:none}[role=button]{cursor:pointer}select{word-wrap:normal}select:disabled{opacity:1}[list]::-webkit-calendar-picker-indicator{display:none}[type=button],[type=reset],[type=submit],button{-webkit-appearance:button}[type=button]:not(:disabled),[type=reset]:not(:disabled),[type=submit]:not(:disabled),button:not(:disabled){cursor:pointer}::-moz-focus-inner{padding:0;border-style:none}textarea{resize:vertical}fieldset{min-width:0;padding:0;margin:0;border:0}legend{float:left;width:100%;padding:0;margin-bottom:.5rem;font-size:calc(1.275rem + .3vw);line-height:inherit}@media (min-width:1200px){legend{font-size:1.5rem}}legend+*{clear:left}::-webkit-datetime-edit-day-field,::-webkit-datetime-edit-fields-wrapper,::-webkit-datetime-edit-hour-field,::-webkit-datetime-edit-minute,::-webkit-datetime-edit-month-field,::-webkit-datetime-edit-text,::-webkit-datetime-edit-year-field{padding:0}::-webkit-inner-spin-button{height:auto}[type=search]{outline-offset:-2px;-webkit-appearance:textfield}::-webkit-search-decoration{-webkit-appearance:none}::-webkit-color-swatch-wrapper{padding:0}::file-selector-button{font:inherit}::-webkit-file-upload-button{font:inherit;-webkit-appearance:button}output{display:inline-block}iframe{border:0}summary{display:list-item;cursor:pointer}progress{vertical-align:baseline}[hidden]{display:none!important}</style>
+    <style>/*! syntax-highlighting.css */pre{line-height:125%;}span.linenos{color:inherit; background-color:transparent; padding-left:5px; padding-right:20px;}.pdoc-code .hll{background-color:#ffffcc}.pdoc-code{background:#f8f8f8;}.pdoc-code .c{color:#3D7B7B; font-style:italic}.pdoc-code .err{border:1px solid #FF0000}.pdoc-code .k{color:#008000; font-weight:bold}.pdoc-code .o{color:#666666}.pdoc-code .ch{color:#3D7B7B; font-style:italic}.pdoc-code .cm{color:#3D7B7B; font-style:italic}.pdoc-code .cp{color:#9C6500}.pdoc-code .cpf{color:#3D7B7B; font-style:italic}.pdoc-code .c1{color:#3D7B7B; font-style:italic}.pdoc-code .cs{color:#3D7B7B; font-style:italic}.pdoc-code .gd{color:#A00000}.pdoc-code .ge{font-style:italic}.pdoc-code .gr{color:#E40000}.pdoc-code .gh{color:#000080; font-weight:bold}.pdoc-code .gi{color:#008400}.pdoc-code .go{color:#717171}.pdoc-code .gp{color:#000080; font-weight:bold}.pdoc-code .gs{font-weight:bold}.pdoc-code .gu{color:#800080; font-weight:bold}.pdoc-code .gt{color:#0044DD}.pdoc-code .kc{color:#008000; font-weight:bold}.pdoc-code .kd{color:#008000; font-weight:bold}.pdoc-code .kn{color:#008000; font-weight:bold}.pdoc-code .kp{color:#008000}.pdoc-code .kr{color:#008000; font-weight:bold}.pdoc-code .kt{color:#B00040}.pdoc-code .m{color:#666666}.pdoc-code .s{color:#BA2121}.pdoc-code .na{color:#687822}.pdoc-code .nb{color:#008000}.pdoc-code .nc{color:#0000FF; font-weight:bold}.pdoc-code .no{color:#880000}.pdoc-code .nd{color:#AA22FF}.pdoc-code .ni{color:#717171; font-weight:bold}.pdoc-code .ne{color:#CB3F38; font-weight:bold}.pdoc-code .nf{color:#0000FF}.pdoc-code .nl{color:#767600}.pdoc-code .nn{color:#0000FF; font-weight:bold}.pdoc-code .nt{color:#008000; font-weight:bold}.pdoc-code .nv{color:#19177C}.pdoc-code .ow{color:#AA22FF; font-weight:bold}.pdoc-code .w{color:#bbbbbb}.pdoc-code .mb{color:#666666}.pdoc-code .mf{color:#666666}.pdoc-code .mh{color:#666666}.pdoc-code .mi{color:#666666}.pdoc-code .mo{color:#666666}.pdoc-code .sa{color:#BA2121}.pdoc-code .sb{color:#BA2121}.pdoc-code .sc{color:#BA2121}.pdoc-code .dl{color:#BA2121}.pdoc-code .sd{color:#BA2121; font-style:italic}.pdoc-code .s2{color:#BA2121}.pdoc-code .se{color:#AA5D1F; font-weight:bold}.pdoc-code .sh{color:#BA2121}.pdoc-code .si{color:#A45A77; font-weight:bold}.pdoc-code .sx{color:#008000}.pdoc-code .sr{color:#A45A77}.pdoc-code .s1{color:#BA2121}.pdoc-code .ss{color:#19177C}.pdoc-code .bp{color:#008000}.pdoc-code .fm{color:#0000FF}.pdoc-code .vc{color:#19177C}.pdoc-code .vg{color:#19177C}.pdoc-code .vi{color:#19177C}.pdoc-code .vm{color:#19177C}.pdoc-code .il{color:#666666}</style>
+    <style>/*! theme.css */:root{--pdoc-background:#fff;}.pdoc{--text:#212529;--muted:#6c757d;--link:#3660a5;--link-hover:#1659c5;--code:#f8f8f8;--active:#fff598;--accent:#eee;--accent2:#c1c1c1;--nav-hover:rgba(255, 255, 255, 0.5);--name:#0066BB;--def:#008800;--annotation:#007020;}</style>
+    <style>/*! layout.css */html, body{width:100%;height:100%;}html, main{scroll-behavior:smooth;}body{background-color:var(--pdoc-background);}@media (max-width:769px){#navtoggle{cursor:pointer;position:absolute;width:50px;height:40px;top:1rem;right:1rem;border-color:var(--text);color:var(--text);display:flex;opacity:0.8;z-index:999;}#navtoggle:hover{opacity:1;}#togglestate + div{display:none;}#togglestate:checked + div{display:inherit;}main, header{padding:2rem 3vw;}header + main{margin-top:-3rem;}.git-button{display:none !important;}nav input[type="search"]{max-width:77%;}nav input[type="search"]:first-child{margin-top:-6px;}nav input[type="search"]:valid ~ *{display:none !important;}}@media (min-width:770px){:root{--sidebar-width:clamp(12.5rem, 28vw, 22rem);}nav{position:fixed;overflow:auto;height:100vh;width:var(--sidebar-width);}main, header{padding:3rem 2rem 3rem calc(var(--sidebar-width) + 3rem);width:calc(54rem + var(--sidebar-width));max-width:100%;}header + main{margin-top:-4rem;}#navtoggle{display:none;}}#togglestate{position:absolute;height:0;opacity:0;}nav.pdoc{--pad:clamp(0.5rem, 2vw, 1.75rem);--indent:1.5rem;background-color:var(--accent);border-right:1px solid var(--accent2);box-shadow:0 0 20px rgba(50, 50, 50, .2) inset;padding:0 0 0 var(--pad);overflow-wrap:anywhere;scrollbar-width:thin; scrollbar-color:var(--accent2) transparent; z-index:1}nav.pdoc::-webkit-scrollbar{width:.4rem; }nav.pdoc::-webkit-scrollbar-thumb{background-color:var(--accent2); }nav.pdoc > div{padding:var(--pad) 0;}nav.pdoc .module-list-button{display:inline-flex;align-items:center;color:var(--text);border-color:var(--muted);margin-bottom:1rem;}nav.pdoc .module-list-button:hover{border-color:var(--text);}nav.pdoc input[type=search]{display:block;outline-offset:0;width:calc(100% - var(--pad));}nav.pdoc .logo{max-width:calc(100% - var(--pad));max-height:35vh;display:block;margin:0 auto 1rem;transform:translate(calc(-.5 * var(--pad)), 0);}nav.pdoc ul{list-style:none;padding-left:0;}nav.pdoc > div > ul{margin-left:calc(0px - var(--pad));}nav.pdoc li a{padding:.2rem 0 .2rem calc(var(--pad) + var(--indent));}nav.pdoc > div > ul > li > a{padding-left:var(--pad);}nav.pdoc li{transition:all 100ms;}nav.pdoc li:hover{background-color:var(--nav-hover);}nav.pdoc a, nav.pdoc a:hover{color:var(--text);}nav.pdoc a{display:block;}nav.pdoc > h2:first-of-type{margin-top:1.5rem;}nav.pdoc .class:before{content:"class ";color:var(--muted);}nav.pdoc .function:after{content:"()";color:var(--muted);}nav.pdoc footer:before{content:"";display:block;width:calc(100% - var(--pad));border-top:solid var(--accent2) 1px;margin-top:1.5rem;padding-top:.5rem;}nav.pdoc footer{font-size:small;}</style>
+    <style>/*! content.css */.pdoc{color:var(--text);box-sizing:border-box;line-height:1.5;background:none;}.pdoc .pdoc-button{cursor:pointer;display:inline-block;border:solid black 1px;border-radius:2px;font-size:.75rem;padding:calc(0.5em - 1px) 1em;transition:100ms all;}.pdoc .pdoc-alert{padding:1rem 1rem 1rem calc(1.5rem + 24px);border:1px solid transparent;border-radius:.25rem;background-repeat:no-repeat;background-position:1rem center;margin-bottom:1rem;}.pdoc .pdoc-alert > *:last-child{margin-bottom:0;}.pdoc .pdoc-alert-note {color:#084298;background-color:#cfe2ff;border-color:#b6d4fe;background-image:url("data:image/svg+xml,%3Csvg%20xmlns%3D%22http%3A//www.w3.org/2000/svg%22%20width%3D%2224%22%20height%3D%2224%22%20fill%3D%22%23084298%22%20viewBox%3D%220%200%2016%2016%22%3E%3Cpath%20d%3D%22M8%2016A8%208%200%201%200%208%200a8%208%200%200%200%200%2016zm.93-9.412-1%204.705c-.07.34.029.533.304.533.194%200%20.487-.07.686-.246l-.088.416c-.287.346-.92.598-1.465.598-.703%200-1.002-.422-.808-1.319l.738-3.468c.064-.293.006-.399-.287-.47l-.451-.081.082-.381%202.29-.287zM8%205.5a1%201%200%201%201%200-2%201%201%200%200%201%200%202z%22/%3E%3C/svg%3E");}.pdoc .pdoc-alert-warning{color:#664d03;background-color:#fff3cd;border-color:#ffecb5;background-image:url("data:image/svg+xml,%3Csvg%20xmlns%3D%22http%3A//www.w3.org/2000/svg%22%20width%3D%2224%22%20height%3D%2224%22%20fill%3D%22%23664d03%22%20viewBox%3D%220%200%2016%2016%22%3E%3Cpath%20d%3D%22M8.982%201.566a1.13%201.13%200%200%200-1.96%200L.165%2013.233c-.457.778.091%201.767.98%201.767h13.713c.889%200%201.438-.99.98-1.767L8.982%201.566zM8%205c.535%200%20.954.462.9.995l-.35%203.507a.552.552%200%200%201-1.1%200L7.1%205.995A.905.905%200%200%201%208%205zm.002%206a1%201%200%201%201%200%202%201%201%200%200%201%200-2z%22/%3E%3C/svg%3E");}.pdoc .pdoc-alert-danger{color:#842029;background-color:#f8d7da;border-color:#f5c2c7;background-image:url("data:image/svg+xml,%3Csvg%20xmlns%3D%22http%3A//www.w3.org/2000/svg%22%20width%3D%2224%22%20height%3D%2224%22%20fill%3D%22%23842029%22%20viewBox%3D%220%200%2016%2016%22%3E%3Cpath%20d%3D%22M5.52.359A.5.5%200%200%201%206%200h4a.5.5%200%200%201%20.474.658L8.694%206H12.5a.5.5%200%200%201%20.395.807l-7%209a.5.5%200%200%201-.873-.454L6.823%209.5H3.5a.5.5%200%200%201-.48-.641l2.5-8.5z%22/%3E%3C/svg%3E");}.pdoc .visually-hidden{position:absolute !important;width:1px !important;height:1px !important;padding:0 !important;margin:-1px !important;overflow:hidden !important;clip:rect(0, 0, 0, 0) !important;white-space:nowrap !important;border:0 !important;}.pdoc h1, .pdoc h2, .pdoc h3{font-weight:300;margin:.3em 0;padding:.2em 0;}.pdoc > section:not(.module-info) h1{font-size:1.5rem;font-weight:500;}.pdoc > section:not(.module-info) h2{font-size:1.4rem;font-weight:500;}.pdoc > section:not(.module-info) h3{font-size:1.3rem;font-weight:500;}.pdoc > section:not(.module-info) h4{font-size:1.2rem;}.pdoc > section:not(.module-info) h5{font-size:1.1rem;}.pdoc a{text-decoration:none;color:var(--link);}.pdoc a:hover{color:var(--link-hover);}.pdoc blockquote{margin-left:2rem;}.pdoc pre{border-top:1px solid var(--accent2);border-bottom:1px solid var(--accent2);margin-top:0;margin-bottom:1em;padding:.5rem 0 .5rem .5rem;overflow-x:auto;background-color:var(--code);}.pdoc code{color:var(--text);padding:.2em .4em;margin:0;font-size:85%;background-color:var(--accent);border-radius:6px;}.pdoc a > code{color:inherit;}.pdoc pre > code{display:inline-block;font-size:inherit;background:none;border:none;padding:0;}.pdoc > section:not(.module-info){margin-bottom:1.5rem;}.pdoc .modulename{margin-top:0;font-weight:bold;}.pdoc .modulename a{color:var(--link);transition:100ms all;}.pdoc .git-button{float:right;border:solid var(--link) 1px;}.pdoc .git-button:hover{background-color:var(--link);color:var(--pdoc-background);}.view-source-toggle-state,.view-source-toggle-state ~ .pdoc-code{display:none;}.view-source-toggle-state:checked ~ .pdoc-code{display:block;}.view-source-button{display:inline-block;float:right;font-size:.75rem;line-height:1.5rem;color:var(--muted);padding:0 .4rem 0 1.3rem;cursor:pointer;text-indent:-2px;}.view-source-button > span{visibility:hidden;}.module-info .view-source-button{float:none;display:flex;justify-content:flex-end;margin:-1.2rem .4rem -.2rem 0;}.view-source-button::before{position:absolute;content:"View Source";display:list-item;list-style-type:disclosure-closed;}.view-source-toggle-state:checked ~ .attr .view-source-button::before,.view-source-toggle-state:checked ~ .view-source-button::before{list-style-type:disclosure-open;}.pdoc .docstring{margin-bottom:1.5rem;}.pdoc section:not(.module-info) .docstring{margin-left:clamp(0rem, 5vw - 2rem, 1rem);}.pdoc .docstring .pdoc-code{margin-left:1em;margin-right:1em;}.pdoc h1:target,.pdoc h2:target,.pdoc h3:target,.pdoc h4:target,.pdoc h5:target,.pdoc h6:target,.pdoc .pdoc-code > pre > span:target{background-color:var(--active);box-shadow:-1rem 0 0 0 var(--active);}.pdoc .pdoc-code > pre > span:target{display:block;}.pdoc div:target > .attr,.pdoc section:target > .attr,.pdoc dd:target > a{background-color:var(--active);}.pdoc *{scroll-margin:2rem;}.pdoc .pdoc-code .linenos{user-select:none;}.pdoc .attr:hover{filter:contrast(0.95);}.pdoc section, .pdoc .classattr{position:relative;}.pdoc .headerlink{--width:clamp(1rem, 3vw, 2rem);position:absolute;top:0;left:calc(0rem - var(--width));transition:all 100ms ease-in-out;opacity:0;}.pdoc .headerlink::before{content:"#";display:block;text-align:center;width:var(--width);height:2.3rem;line-height:2.3rem;font-size:1.5rem;}.pdoc .attr:hover ~ .headerlink,.pdoc *:target > .headerlink,.pdoc .headerlink:hover{opacity:1;}.pdoc .attr{display:block;margin:.5rem 0 .5rem;padding:.4rem .4rem .4rem 1rem;background-color:var(--accent);overflow-x:auto;}.pdoc .classattr{margin-left:2rem;}.pdoc .name{color:var(--name);font-weight:bold;}.pdoc .def{color:var(--def);font-weight:bold;}.pdoc .signature{background-color:transparent;}.pdoc .param, .pdoc .return-annotation{white-space:pre;}.pdoc .signature.multiline .param{display:block;}.pdoc .signature.condensed .param{display:inline-block;}.pdoc .annotation{color:var(--annotation);}.pdoc .view-value-toggle-state,.pdoc .view-value-toggle-state ~ .default_value{display:none;}.pdoc .view-value-toggle-state:checked ~ .default_value{display:inherit;}.pdoc .view-value-button{font-size:.5rem;vertical-align:middle;border-style:dashed;margin-top:-0.1rem;}.pdoc .view-value-button:hover{background:white;}.pdoc .view-value-button::before{content:"show";text-align:center;width:2.2em;display:inline-block;}.pdoc .view-value-toggle-state:checked ~ .view-value-button::before{content:"hide";}.pdoc .inherited{margin-left:2rem;}.pdoc .inherited dt{font-weight:700;}.pdoc .inherited dt, .pdoc .inherited dd{display:inline;margin-left:0;margin-bottom:.5rem;}.pdoc .inherited dd:not(:last-child):after{content:", ";}.pdoc .inherited .class:before{content:"class ";}.pdoc .inherited .function a:after{content:"()";}.pdoc .search-result .docstring{overflow:auto;max-height:25vh;}.pdoc .search-result.focused > .attr{background-color:var(--active);}.pdoc .attribution{margin-top:2rem;display:block;opacity:0.5;transition:all 200ms;filter:grayscale(100%);}.pdoc .attribution:hover{opacity:1;filter:grayscale(0%);}.pdoc .attribution img{margin-left:5px;height:35px;vertical-align:middle;width:70px;transition:all 200ms;}.pdoc table{display:block;width:max-content;max-width:100%;overflow:auto;margin-bottom:1rem;}.pdoc table th{font-weight:600;}.pdoc table th, .pdoc table td{padding:6px 13px;border:1px solid var(--accent2);}</style>
+    <style>/*! custom.css */</style><script>
+    window.MathJax = {
+        tex: {
+            inlineMath: [['$', '$'], ['\\(', '\\)']]
+        }
+    };
+</script>
+<script src="https://polyfill.io/v3/polyfill.min.js?features=es6"></script>
+<script id="MathJax-script" async src="https://cdn.jsdelivr.net/npm/mathjax@3/es5/tex-mml-chtml.js"></script>
+<script>
+    /* Re-invoke MathJax when DOM content changes, for example during search. */
+    document.addEventListener("DOMContentLoaded", () => {
+        new MutationObserver(() => MathJax.typeset()).observe(
+            document.querySelector("main.pdoc").parentNode,
+            {childList: true}
+        );
+    })
+</script>
+<style>
+    mjx-container {
+        overflow-x: auto;
+    }
+</style></head>
+<body>
+    <nav class="pdoc">
+        <label id="navtoggle" for="togglestate" class="pdoc-button"><svg xmlns='http://www.w3.org/2000/svg' viewBox='0 0 30 30'><path stroke-linecap='round' stroke="currentColor" stroke-miterlimit='10' stroke-width='2' d='M4 7h22M4 15h22M4 23h22'/></svg></label>
+        <input id="togglestate" type="checkbox" aria-hidden="true" tabindex="-1">
+        <div>            <a class="pdoc-button module-list-button" href="../../index.html">
+<svg xmlns="http://www.w3.org/2000/svg" width="16" height="16" fill="currentColor" class="bi bi-box-arrow-in-left" viewBox="0 0 16 16">
+  <path fill-rule="evenodd" d="M10 3.5a.5.5 0 0 0-.5-.5h-8a.5.5 0 0 0-.5.5v9a.5.5 0 0 0 .5.5h8a.5.5 0 0 0 .5-.5v-2a.5.5 0 0 1 1 0v2A1.5 1.5 0 0 1 9.5 14h-8A1.5 1.5 0 0 1 0 12.5v-9A1.5 1.5 0 0 1 1.5 2h8A1.5 1.5 0 0 1 11 3.5v2a.5.5 0 0 1-1 0v-2z"/>
+  <path fill-rule="evenodd" d="M4.146 8.354a.5.5 0 0 1 0-.708l3-3a.5.5 0 1 1 .708.708L5.707 7.5H14.5a.5.5 0 0 1 0 1H5.707l2.147 2.146a.5.5 0 0 1-.708.708l-3-3z"/>
+</svg>                &nbsp;
+                Module Index
+            </a>
+
+
+            <input type="search" placeholder="Search..." role="searchbox" aria-label="search"
+                   pattern=".+" required>
+
+
+
+            <h2>API Documentation</h2>
+                <ul class="memberlist">
+            <li>
+                    <a class="class" href="#SelectionBase">SelectionBase</a>
+                            <ul class="memberlist">
+                        <li>
+                                <a class="function" href="#SelectionBase.update_gw_state">update_gw_state</a>
+                        </li>
+                        <li>
+                                <a class="function" href="#SelectionBase.forward">forward</a>
+                        </li>
+                </ul>
+
+            </li>
+            <li>
+                    <a class="class" href="#SingleDomainSelection">SingleDomainSelection</a>
+                            <ul class="memberlist">
+                        <li>
+                                <a class="function" href="#SingleDomainSelection.forward">forward</a>
+                        </li>
+                </ul>
+
+            </li>
+            <li>
+                    <a class="class" href="#FixedSharedSelection">FixedSharedSelection</a>
+                            <ul class="memberlist">
+                        <li>
+                                <a class="function" href="#FixedSharedSelection.forward">forward</a>
+                        </li>
+                </ul>
+
+            </li>
+            <li>
+                    <a class="class" href="#KQFixedQSelection">KQFixedQSelection</a>
+                            <ul class="memberlist">
+                        <li>
+                                <a class="function" href="#KQFixedQSelection.__init__">KQFixedQSelection</a>
+                        </li>
+                        <li>
+                                <a class="variable" href="#KQFixedQSelection.head_size">head_size</a>
+                        </li>
+                        <li>
+                                <a class="variable" href="#KQFixedQSelection.query_layer">query_layer</a>
+                        </li>
+                        <li>
+                                <a class="variable" href="#KQFixedQSelection.key_layers">key_layers</a>
+                        </li>
+                        <li>
+                                <a class="function" href="#KQFixedQSelection.forward">forward</a>
+                        </li>
+                </ul>
+
+            </li>
+            <li>
+                    <a class="class" href="#RandomSelection">RandomSelection</a>
+                            <ul class="memberlist">
+                        <li>
+                                <a class="function" href="#RandomSelection.__init__">RandomSelection</a>
+                        </li>
+                        <li>
+                                <a class="variable" href="#RandomSelection.temperature">temperature</a>
+                        </li>
+                        <li>
+                                <a class="function" href="#RandomSelection.forward">forward</a>
+                        </li>
+                </ul>
+
+            </li>
+            <li>
+                    <a class="class" href="#DynamicQueryAttention">DynamicQueryAttention</a>
+                            <ul class="memberlist">
+                        <li>
+                                <a class="function" href="#DynamicQueryAttention.__init__">DynamicQueryAttention</a>
+                        </li>
+                        <li>
+                                <a class="variable" href="#DynamicQueryAttention.head_size">head_size</a>
+                        </li>
+                        <li>
+                                <a class="variable" href="#DynamicQueryAttention.query_layer">query_layer</a>
+                        </li>
+                        <li>
+                                <a class="variable" href="#DynamicQueryAttention.key_layers">key_layers</a>
+                        </li>
+                        <li>
+                                <a class="function" href="#DynamicQueryAttention.fuse_weighted_encodings">fuse_weighted_encodings</a>
+                        </li>
+                        <li>
+                                <a class="function" href="#DynamicQueryAttention.forward">forward</a>
+                        </li>
+                </ul>
+
+            </li>
+    </ul>
+
+
+
+        <a class="attribution" title="pdoc: Python API documentation generator" href="https://pdoc.dev" target="_blank">
+            built with <span class="visually-hidden">pdoc</span><img
+                alt="pdoc logo"
+                src="data:image/svg+xml,%3Csvg%20xmlns%3D%22http%3A//www.w3.org/2000/svg%22%20role%3D%22img%22%20aria-label%3D%22pdoc%20logo%22%20width%3D%22300%22%20height%3D%22150%22%20viewBox%3D%22-1%200%2060%2030%22%3E%3Ctitle%3Epdoc%3C/title%3E%3Cpath%20d%3D%22M29.621%2021.293c-.011-.273-.214-.475-.511-.481a.5.5%200%200%200-.489.503l-.044%201.393c-.097.551-.695%201.215-1.566%201.704-.577.428-1.306.486-2.193.182-1.426-.617-2.467-1.654-3.304-2.487l-.173-.172a3.43%203.43%200%200%200-.365-.306.49.49%200%200%200-.286-.196c-1.718-1.06-4.931-1.47-7.353.191l-.219.15c-1.707%201.187-3.413%202.131-4.328%201.03-.02-.027-.49-.685-.141-1.763.233-.721.546-2.408.772-4.076.042-.09.067-.187.046-.288.166-1.347.277-2.625.241-3.351%201.378-1.008%202.271-2.586%202.271-4.362%200-.976-.272-1.935-.788-2.774-.057-.094-.122-.18-.184-.268.033-.167.052-.339.052-.516%200-1.477-1.202-2.679-2.679-2.679-.791%200-1.496.352-1.987.9a6.3%206.3%200%200%200-1.001.029c-.492-.564-1.207-.929-2.012-.929-1.477%200-2.679%201.202-2.679%202.679A2.65%202.65%200%200%200%20.97%206.554c-.383.747-.595%201.572-.595%202.41%200%202.311%201.507%204.29%203.635%205.107-.037.699-.147%202.27-.423%203.294l-.137.461c-.622%202.042-2.515%208.257%201.727%2010.643%201.614.908%203.06%201.248%204.317%201.248%202.665%200%204.492-1.524%205.322-2.401%201.476-1.559%202.886-1.854%206.491.82%201.877%201.393%203.514%201.753%204.861%201.068%202.223-1.713%202.811-3.867%203.399-6.374.077-.846.056-1.469.054-1.537zm-4.835%204.313c-.054.305-.156.586-.242.629-.034-.007-.131-.022-.307-.157-.145-.111-.314-.478-.456-.908.221.121.432.25.675.355.115.039.219.051.33.081zm-2.251-1.238c-.05.33-.158.648-.252.694-.022.001-.125-.018-.307-.157-.217-.166-.488-.906-.639-1.573.358.344.754.693%201.198%201.036zm-3.887-2.337c-.006-.116-.018-.231-.041-.342.635.145%201.189.368%201.599.625.097.231.166.481.174.642-.03.049-.055.101-.067.158-.046.013-.128.026-.298.004-.278-.037-.901-.57-1.367-1.087zm-1.127-.497c.116.306.176.625.12.71-.019.014-.117.045-.345.016-.206-.027-.604-.332-.986-.695.41-.051.816-.056%201.211-.031zm-4.535%201.535c.209.22.379.47.358.598-.006.041-.088.138-.351.234-.144.055-.539-.063-.979-.259a11.66%2011.66%200%200%200%20.972-.573zm.983-.664c.359-.237.738-.418%201.126-.554.25.237.479.548.457.694-.006.042-.087.138-.351.235-.174.064-.694-.105-1.232-.375zm-3.381%201.794c-.022.145-.061.29-.149.401-.133.166-.358.248-.69.251h-.002c-.133%200-.306-.26-.45-.621.417.091.854.07%201.291-.031zm-2.066-8.077a4.78%204.78%200%200%201-.775-.584c.172-.115.505-.254.88-.378l-.105.962zm-.331%202.302a10.32%2010.32%200%200%201-.828-.502c.202-.143.576-.328.984-.49l-.156.992zm-.45%202.157l-.701-.403c.214-.115.536-.249.891-.376a11.57%2011.57%200%200%201-.19.779zm-.181%201.716c.064.398.194.702.298.893-.194-.051-.435-.162-.736-.398.061-.119.224-.3.438-.495zM8.87%204.141c0%20.152-.123.276-.276.276s-.275-.124-.275-.276.123-.276.276-.276.275.124.275.276zm-.735-.389a1.15%201.15%200%200%200-.314.783%201.16%201.16%200%200%200%201.162%201.162c.457%200%20.842-.27%201.032-.653.026.117.042.238.042.362a1.68%201.68%200%200%201-1.679%201.679%201.68%201.68%200%200%201-1.679-1.679c0-.843.626-1.535%201.436-1.654zM5.059%205.406A1.68%201.68%200%200%201%203.38%207.085a1.68%201.68%200%200%201-1.679-1.679c0-.037.009-.072.011-.109.21.3.541.508.935.508a1.16%201.16%200%200%200%201.162-1.162%201.14%201.14%200%200%200-.474-.912c.015%200%20.03-.005.045-.005.926.001%201.679.754%201.679%201.68zM3.198%204.141c0%20.152-.123.276-.276.276s-.275-.124-.275-.276.123-.276.276-.276.275.124.275.276zM1.375%208.964c0-.52.103-1.035.288-1.52.466.394%201.06.64%201.717.64%201.144%200%202.116-.725%202.499-1.738.383%201.012%201.355%201.738%202.499%201.738.867%200%201.631-.421%202.121-1.062.307.605.478%201.267.478%201.942%200%202.486-2.153%204.51-4.801%204.51s-4.801-2.023-4.801-4.51zm24.342%2019.349c-.985.498-2.267.168-3.813-.979-3.073-2.281-5.453-3.199-7.813-.705-1.315%201.391-4.163%203.365-8.423.97-3.174-1.786-2.239-6.266-1.261-9.479l.146-.492c.276-1.02.395-2.457.444-3.268a6.11%206.11%200%200%200%201.18.115%206.01%206.01%200%200%200%202.536-.562l-.006.175c-.802.215-1.848.612-2.021%201.25-.079.295.021.601.274.837.219.203.415.364.598.501-.667.304-1.243.698-1.311%201.179-.02.144-.022.507.393.787.213.144.395.26.564.365-1.285.521-1.361.96-1.381%201.126-.018.142-.011.496.427.746l.854.489c-.473.389-.971.914-.999%201.429-.018.278.095.532.316.713.675.556%201.231.721%201.653.721.059%200%20.104-.014.158-.02.207.707.641%201.64%201.513%201.64h.013c.8-.008%201.236-.345%201.462-.626.173-.216.268-.457.325-.692.424.195.93.374%201.372.374.151%200%20.294-.021.423-.068.732-.27.944-.704.993-1.021.009-.061.003-.119.002-.179.266.086.538.147.789.147.15%200%20.294-.021.423-.069.542-.2.797-.489.914-.754.237.147.478.258.704.288.106.014.205.021.296.021.356%200%20.595-.101.767-.229.438.435%201.094.992%201.656%201.067.106.014.205.021.296.021a1.56%201.56%200%200%200%20.323-.035c.17.575.453%201.289.866%201.605.358.273.665.362.914.362a.99.99%200%200%200%20.421-.093%201.03%201.03%200%200%200%20.245-.164c.168.428.39.846.68%201.068.358.273.665.362.913.362a.99.99%200%200%200%20.421-.093c.317-.148.512-.448.639-.762.251.157.495.257.726.257.127%200%20.25-.024.37-.071.427-.17.706-.617.841-1.314.022-.015.047-.022.068-.038.067-.051.133-.104.196-.159-.443%201.486-1.107%202.761-2.086%203.257zM8.66%209.925a.5.5%200%201%200-1%200c0%20.653-.818%201.205-1.787%201.205s-1.787-.552-1.787-1.205a.5.5%200%201%200-1%200c0%201.216%201.25%202.205%202.787%202.205s2.787-.989%202.787-2.205zm4.4%2015.965l-.208.097c-2.661%201.258-4.708%201.436-6.086.527-1.542-1.017-1.88-3.19-1.844-4.198a.4.4%200%200%200-.385-.414c-.242-.029-.406.164-.414.385-.046%201.249.367%203.686%202.202%204.896.708.467%201.547.7%202.51.7%201.248%200%202.706-.392%204.362-1.174l.185-.086a.4.4%200%200%200%20.205-.527c-.089-.204-.326-.291-.527-.206zM9.547%202.292c.093.077.205.114.317.114a.5.5%200%200%200%20.318-.886L8.817.397a.5.5%200%200%200-.703.068.5.5%200%200%200%20.069.703l1.364%201.124zm-7.661-.065c.086%200%20.173-.022.253-.068l1.523-.893a.5.5%200%200%200-.506-.863l-1.523.892a.5.5%200%200%200-.179.685c.094.158.261.247.432.247z%22%20transform%3D%22matrix%28-1%200%200%201%2058%200%29%22%20fill%3D%22%233bb300%22/%3E%3Cpath%20d%3D%22M.3%2021.86V10.18q0-.46.02-.68.04-.22.18-.5.28-.54%201.34-.54%201.06%200%201.42.28.38.26.44.78.76-1.04%202.38-1.04%201.64%200%203.1%201.54%201.46%201.54%201.46%203.58%200%202.04-1.46%203.58-1.44%201.54-3.08%201.54-1.64%200-2.38-.92v4.04q0%20.46-.04.68-.02.22-.18.5-.14.3-.5.42-.36.12-.98.12-.62%200-1-.12-.36-.12-.52-.4-.14-.28-.18-.5-.02-.22-.02-.68zm3.96-9.42q-.46.54-.46%201.18%200%20.64.46%201.18.48.52%201.2.52.74%200%201.24-.52.52-.52.52-1.18%200-.66-.48-1.18-.48-.54-1.26-.54-.76%200-1.22.54zm14.741-8.36q.16-.3.54-.42.38-.12%201-.12.64%200%201.02.12.38.12.52.42.16.3.18.54.04.22.04.68v11.94q0%20.46-.04.7-.02.22-.18.5-.3.54-1.7.54-1.38%200-1.54-.98-.84.96-2.34.96-1.8%200-3.28-1.56-1.48-1.58-1.48-3.66%200-2.1%201.48-3.68%201.5-1.58%203.28-1.58%201.48%200%202.3%201v-4.2q0-.46.02-.68.04-.24.18-.52zm-3.24%2010.86q.52.54%201.26.54.74%200%201.22-.54.5-.54.5-1.18%200-.66-.48-1.22-.46-.56-1.26-.56-.8%200-1.28.56-.48.54-.48%201.2%200%20.66.52%201.2zm7.833-1.2q0-2.4%201.68-3.96%201.68-1.56%203.84-1.56%202.16%200%203.82%201.56%201.66%201.54%201.66%203.94%200%201.66-.86%202.96-.86%201.28-2.1%201.9-1.22.6-2.54.6-1.32%200-2.56-.64-1.24-.66-2.1-1.92-.84-1.28-.84-2.88zm4.18%201.44q.64.48%201.3.48.66%200%201.32-.5.66-.5.66-1.48%200-.98-.62-1.46-.62-.48-1.34-.48-.72%200-1.34.5-.62.5-.62%201.48%200%20.96.64%201.46zm11.412-1.44q0%20.84.56%201.32.56.46%201.18.46.64%200%201.18-.36.56-.38.9-.38.6%200%201.46%201.06.46.58.46%201.04%200%20.76-1.1%201.42-1.14.8-2.8.8-1.86%200-3.58-1.34-.82-.64-1.34-1.7-.52-1.08-.52-2.36%200-1.3.52-2.34.52-1.06%201.34-1.7%201.66-1.32%203.54-1.32.76%200%201.48.22.72.2%201.06.4l.32.2q.36.24.56.38.52.4.52.92%200%20.5-.42%201.14-.72%201.1-1.38%201.1-.38%200-1.08-.44-.36-.34-1.04-.34-.66%200-1.24.48-.58.48-.58%201.34z%22%20fill%3D%22green%22/%3E%3C/svg%3E"/>
+        </a>
+</div>
+    </nav>
+    <main class="pdoc">
+            <section class="module-info">
+                    <h1 class="modulename">
+shimmer<wbr>.modules<wbr>.selection    </h1>
+
+                
+                        <input id="mod-selection-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
+
+                        <label class="view-source-button" for="mod-selection-view-source"><span>View Source</span></label>
+
+                        <div class="pdoc-code codehilite"><pre><span></span><span id="L-1"><a href="#L-1"><span class="linenos">  1</span></a><span class="kn">from</span> <span class="nn">abc</span> <span class="kn">import</span> <span class="n">ABC</span><span class="p">,</span> <span class="n">abstractmethod</span>
+</span><span id="L-2"><a href="#L-2"><span class="linenos">  2</span></a><span class="kn">from</span> <span class="nn">collections.abc</span> <span class="kn">import</span> <span class="n">Iterable</span>
+</span><span id="L-3"><a href="#L-3"><span class="linenos">  3</span></a>
+</span><span id="L-4"><a href="#L-4"><span class="linenos">  4</span></a><span class="kn">import</span> <span class="nn">torch</span>
+</span><span id="L-5"><a href="#L-5"><span class="linenos">  5</span></a><span class="kn">import</span> <span class="nn">torch.nn</span> <span class="k">as</span> <span class="nn">nn</span>
+</span><span id="L-6"><a href="#L-6"><span class="linenos">  6</span></a>
+</span><span id="L-7"><a href="#L-7"><span class="linenos">  7</span></a><span class="kn">from</span> <span class="nn">shimmer.types</span> <span class="kn">import</span> <span class="n">LatentsDomainGroupT</span>
+</span><span id="L-8"><a href="#L-8"><span class="linenos">  8</span></a><span class="kn">from</span> <span class="nn">shimmer.utils</span> <span class="kn">import</span> <span class="n">group_batch_size</span><span class="p">,</span> <span class="n">group_device</span>
+</span><span id="L-9"><a href="#L-9"><span class="linenos">  9</span></a>
+</span><span id="L-10"><a href="#L-10"><span class="linenos"> 10</span></a>
+</span><span id="L-11"><a href="#L-11"><span class="linenos"> 11</span></a><span class="k">class</span> <span class="nc">SelectionBase</span><span class="p">(</span><span class="n">torch</span><span class="o">.</span><span class="n">nn</span><span class="o">.</span><span class="n">Module</span><span class="p">,</span> <span class="n">ABC</span><span class="p">):</span>
+</span><span id="L-12"><a href="#L-12"><span class="linenos"> 12</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="L-13"><a href="#L-13"><span class="linenos"> 13</span></a><span class="sd">    This is the base class for the selection mechanism.</span>
+</span><span id="L-14"><a href="#L-14"><span class="linenos"> 14</span></a><span class="sd">    The selection mechanisms handles the &quot;competition&quot; between modules and *selects*</span>
+</span><span id="L-15"><a href="#L-15"><span class="linenos"> 15</span></a><span class="sd">    fusion coefficients for the domains.</span>
+</span><span id="L-16"><a href="#L-16"><span class="linenos"> 16</span></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="L-17"><a href="#L-17"><span class="linenos"> 17</span></a>
+</span><span id="L-18"><a href="#L-18"><span class="linenos"> 18</span></a>    <span class="k">def</span> <span class="nf">update_gw_state</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">gw_state</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="L-19"><a href="#L-19"><span class="linenos"> 19</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="L-20"><a href="#L-20"><span class="linenos"> 20</span></a><span class="sd">        Update the internal copy of the previous GW state.</span>
+</span><span id="L-21"><a href="#L-21"><span class="linenos"> 21</span></a><span class="sd">        By default, this is not implemented and will raise an error if used.</span>
+</span><span id="L-22"><a href="#L-22"><span class="linenos"> 22</span></a>
+</span><span id="L-23"><a href="#L-23"><span class="linenos"> 23</span></a><span class="sd">        :note..</span>
+</span><span id="L-24"><a href="#L-24"><span class="linenos"> 24</span></a><span class="sd">            This is not defined as an abstractmethod as some selection method may</span>
+</span><span id="L-25"><a href="#L-25"><span class="linenos"> 25</span></a><span class="sd">            not need it.</span>
+</span><span id="L-26"><a href="#L-26"><span class="linenos"> 26</span></a>
+</span><span id="L-27"><a href="#L-27"><span class="linenos"> 27</span></a><span class="sd">        Args:</span>
+</span><span id="L-28"><a href="#L-28"><span class="linenos"> 28</span></a><span class="sd">            gw_state (`torch.Tensor`): the previous GW state</span>
+</span><span id="L-29"><a href="#L-29"><span class="linenos"> 29</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="L-30"><a href="#L-30"><span class="linenos"> 30</span></a>        <span class="k">pass</span>
+</span><span id="L-31"><a href="#L-31"><span class="linenos"> 31</span></a>
+</span><span id="L-32"><a href="#L-32"><span class="linenos"> 32</span></a>    <span class="nd">@abstractmethod</span>
+</span><span id="L-33"><a href="#L-33"><span class="linenos"> 33</span></a>    <span class="k">def</span> <span class="nf">forward</span><span class="p">(</span>
+</span><span id="L-34"><a href="#L-34"><span class="linenos"> 34</span></a>        <span class="bp">self</span><span class="p">,</span> <span class="n">domains</span><span class="p">:</span> <span class="n">LatentsDomainGroupT</span><span class="p">,</span> <span class="n">encodings_pre_fusion</span><span class="p">:</span> <span class="n">LatentsDomainGroupT</span>
+</span><span id="L-35"><a href="#L-35"><span class="linenos"> 35</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]:</span>
+</span><span id="L-36"><a href="#L-36"><span class="linenos"> 36</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="L-37"><a href="#L-37"><span class="linenos"> 37</span></a><span class="sd">        Forward pass of the selection method.</span>
+</span><span id="L-38"><a href="#L-38"><span class="linenos"> 38</span></a>
+</span><span id="L-39"><a href="#L-39"><span class="linenos"> 39</span></a><span class="sd">        Args:</span>
+</span><span id="L-40"><a href="#L-40"><span class="linenos"> 40</span></a><span class="sd">            domains (`LatentsDomainGroupT`): Group of unimodal latent representations.</span>
+</span><span id="L-41"><a href="#L-41"><span class="linenos"> 41</span></a>
+</span><span id="L-42"><a href="#L-42"><span class="linenos"> 42</span></a><span class="sd">        Returns:</span>
+</span><span id="L-43"><a href="#L-43"><span class="linenos"> 43</span></a><span class="sd">            `dict[str, torch.Tensor]`: for each domain in the group, the fusion</span>
+</span><span id="L-44"><a href="#L-44"><span class="linenos"> 44</span></a><span class="sd">            coefficient for each item in the batch.</span>
+</span><span id="L-45"><a href="#L-45"><span class="linenos"> 45</span></a>
+</span><span id="L-46"><a href="#L-46"><span class="linenos"> 46</span></a><span class="sd">        Example:</span>
+</span><span id="L-47"><a href="#L-47"><span class="linenos"> 47</span></a><span class="sd">            &gt;&gt;&gt; SomeSelectionImplementation().forward(</span>
+</span><span id="L-48"><a href="#L-48"><span class="linenos"> 48</span></a><span class="sd">            ...     {&quot;v&quot;: torch.randn(3, 4), &quot;t&quot;: torch.randn(3, 8)}</span>
+</span><span id="L-49"><a href="#L-49"><span class="linenos"> 49</span></a><span class="sd">            ... )</span>
+</span><span id="L-50"><a href="#L-50"><span class="linenos"> 50</span></a><span class="sd">            {&quot;v&quot;: torch.Tensor([0.0, 0.4, 1.0]), &quot;t&quot;: torch.Tensor([1.0, 0.6, 0.0])}</span>
+</span><span id="L-51"><a href="#L-51"><span class="linenos"> 51</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="L-52"><a href="#L-52"><span class="linenos"> 52</span></a>        <span class="o">...</span>
+</span><span id="L-53"><a href="#L-53"><span class="linenos"> 53</span></a>
+</span><span id="L-54"><a href="#L-54"><span class="linenos"> 54</span></a>    <span class="c1"># This is just for proper auto-completion...</span>
+</span><span id="L-55"><a href="#L-55"><span class="linenos"> 55</span></a>    <span class="k">def</span> <span class="fm">__call__</span><span class="p">(</span>
+</span><span id="L-56"><a href="#L-56"><span class="linenos"> 56</span></a>        <span class="bp">self</span><span class="p">,</span> <span class="n">domains</span><span class="p">:</span> <span class="n">LatentsDomainGroupT</span><span class="p">,</span> <span class="n">encodings_pre_fusion</span><span class="p">:</span> <span class="n">LatentsDomainGroupT</span>
+</span><span id="L-57"><a href="#L-57"><span class="linenos"> 57</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]:</span>
+</span><span id="L-58"><a href="#L-58"><span class="linenos"> 58</span></a>        <span class="k">return</span> <span class="nb">super</span><span class="p">()</span><span class="o">.</span><span class="fm">__call__</span><span class="p">(</span><span class="n">domains</span><span class="p">,</span> <span class="n">encodings_pre_fusion</span><span class="p">)</span>
+</span><span id="L-59"><a href="#L-59"><span class="linenos"> 59</span></a>
+</span><span id="L-60"><a href="#L-60"><span class="linenos"> 60</span></a>
+</span><span id="L-61"><a href="#L-61"><span class="linenos"> 61</span></a><span class="k">class</span> <span class="nc">SingleDomainSelection</span><span class="p">(</span><span class="n">SelectionBase</span><span class="p">):</span>
+</span><span id="L-62"><a href="#L-62"><span class="linenos"> 62</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="L-63"><a href="#L-63"><span class="linenos"> 63</span></a><span class="sd">    This selection mechanism handles groups that can have multiple domains, but always</span>
+</span><span id="L-64"><a href="#L-64"><span class="linenos"> 64</span></a><span class="sd">    return a selection of 1 domain from the group with a uniform distribution.</span>
+</span><span id="L-65"><a href="#L-65"><span class="linenos"> 65</span></a>
+</span><span id="L-66"><a href="#L-66"><span class="linenos"> 66</span></a><span class="sd">    For example, if the group has 2 domains, there is a 50% chance of selecting each</span>
+</span><span id="L-67"><a href="#L-67"><span class="linenos"> 67</span></a><span class="sd">    domain.</span>
+</span><span id="L-68"><a href="#L-68"><span class="linenos"> 68</span></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="L-69"><a href="#L-69"><span class="linenos"> 69</span></a>
+</span><span id="L-70"><a href="#L-70"><span class="linenos"> 70</span></a>    <span class="k">def</span> <span class="nf">forward</span><span class="p">(</span>
+</span><span id="L-71"><a href="#L-71"><span class="linenos"> 71</span></a>        <span class="bp">self</span><span class="p">,</span> <span class="n">domains</span><span class="p">:</span> <span class="n">LatentsDomainGroupT</span><span class="p">,</span> <span class="n">encodings_pre_fusion</span><span class="p">:</span> <span class="n">LatentsDomainGroupT</span>
+</span><span id="L-72"><a href="#L-72"><span class="linenos"> 72</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]:</span>
+</span><span id="L-73"><a href="#L-73"><span class="linenos"> 73</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="L-74"><a href="#L-74"><span class="linenos"> 74</span></a><span class="sd">        Forward pass of the module.</span>
+</span><span id="L-75"><a href="#L-75"><span class="linenos"> 75</span></a>
+</span><span id="L-76"><a href="#L-76"><span class="linenos"> 76</span></a><span class="sd">        Args:</span>
+</span><span id="L-77"><a href="#L-77"><span class="linenos"> 77</span></a><span class="sd">            domains (`LatentsDomainGroupT`): input unimodal latent representations</span>
+</span><span id="L-78"><a href="#L-78"><span class="linenos"> 78</span></a><span class="sd">            gw_state (`torch.Tensor`): the previous GW state</span>
+</span><span id="L-79"><a href="#L-79"><span class="linenos"> 79</span></a>
+</span><span id="L-80"><a href="#L-80"><span class="linenos"> 80</span></a><span class="sd">        Returns:</span>
+</span><span id="L-81"><a href="#L-81"><span class="linenos"> 81</span></a><span class="sd">            `dict[str, torch.Tensor]`: whether the domain is selected for each input</span>
+</span><span id="L-82"><a href="#L-82"><span class="linenos"> 82</span></a><span class="sd">            in the batch.</span>
+</span><span id="L-83"><a href="#L-83"><span class="linenos"> 83</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="L-84"><a href="#L-84"><span class="linenos"> 84</span></a>        <span class="n">selection</span><span class="p">:</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]</span> <span class="o">=</span> <span class="p">{}</span>
+</span><span id="L-85"><a href="#L-85"><span class="linenos"> 85</span></a>        <span class="n">bs</span> <span class="o">=</span> <span class="n">group_batch_size</span><span class="p">(</span><span class="n">domains</span><span class="p">)</span>
+</span><span id="L-86"><a href="#L-86"><span class="linenos"> 86</span></a>        <span class="n">choice</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">randint</span><span class="p">(</span><span class="nb">len</span><span class="p">(</span><span class="n">domains</span><span class="p">),</span> <span class="n">size</span><span class="o">=</span><span class="p">(</span><span class="n">bs</span><span class="p">,),</span> <span class="n">device</span><span class="o">=</span><span class="n">group_device</span><span class="p">(</span><span class="n">domains</span><span class="p">))</span>
+</span><span id="L-87"><a href="#L-87"><span class="linenos"> 87</span></a>        <span class="k">for</span> <span class="n">k</span><span class="p">,</span> <span class="n">domain</span> <span class="ow">in</span> <span class="nb">enumerate</span><span class="p">(</span><span class="n">domains</span><span class="o">.</span><span class="n">keys</span><span class="p">()):</span>
+</span><span id="L-88"><a href="#L-88"><span class="linenos"> 88</span></a>            <span class="n">selection</span><span class="p">[</span><span class="n">domain</span><span class="p">]</span> <span class="o">=</span> <span class="p">(</span><span class="n">choice</span> <span class="o">==</span> <span class="n">k</span><span class="p">)</span><span class="o">.</span><span class="n">to</span><span class="p">(</span><span class="n">torch</span><span class="o">.</span><span class="n">float32</span><span class="p">)</span>
+</span><span id="L-89"><a href="#L-89"><span class="linenos"> 89</span></a>        <span class="k">return</span> <span class="n">selection</span>
+</span><span id="L-90"><a href="#L-90"><span class="linenos"> 90</span></a>
+</span><span id="L-91"><a href="#L-91"><span class="linenos"> 91</span></a>
+</span><span id="L-92"><a href="#L-92"><span class="linenos"> 92</span></a><span class="k">class</span> <span class="nc">FixedSharedSelection</span><span class="p">(</span><span class="n">SelectionBase</span><span class="p">):</span>
+</span><span id="L-93"><a href="#L-93"><span class="linenos"> 93</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="L-94"><a href="#L-94"><span class="linenos"> 94</span></a><span class="sd">    This selection mechanism is deterministic and always shares the weights equally</span>
+</span><span id="L-95"><a href="#L-95"><span class="linenos"> 95</span></a><span class="sd">    between domains.</span>
+</span><span id="L-96"><a href="#L-96"><span class="linenos"> 96</span></a>
+</span><span id="L-97"><a href="#L-97"><span class="linenos"> 97</span></a><span class="sd">    For example, if 2 domains, it gives 0.5 for each; 3 domains, 1/3 for each...</span>
+</span><span id="L-98"><a href="#L-98"><span class="linenos"> 98</span></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="L-99"><a href="#L-99"><span class="linenos"> 99</span></a>
+</span><span id="L-100"><a href="#L-100"><span class="linenos">100</span></a>    <span class="k">def</span> <span class="nf">forward</span><span class="p">(</span>
+</span><span id="L-101"><a href="#L-101"><span class="linenos">101</span></a>        <span class="bp">self</span><span class="p">,</span> <span class="n">domains</span><span class="p">:</span> <span class="n">LatentsDomainGroupT</span><span class="p">,</span> <span class="n">encodings_pre_fusion</span><span class="p">:</span> <span class="n">LatentsDomainGroupT</span>
+</span><span id="L-102"><a href="#L-102"><span class="linenos">102</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]:</span>
+</span><span id="L-103"><a href="#L-103"><span class="linenos">103</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="L-104"><a href="#L-104"><span class="linenos">104</span></a><span class="sd">        Forward pass of the module.</span>
+</span><span id="L-105"><a href="#L-105"><span class="linenos">105</span></a>
+</span><span id="L-106"><a href="#L-106"><span class="linenos">106</span></a><span class="sd">        Args:</span>
+</span><span id="L-107"><a href="#L-107"><span class="linenos">107</span></a><span class="sd">            domains (`LatentsDomainGroupT`): input unimodal latent representations</span>
+</span><span id="L-108"><a href="#L-108"><span class="linenos">108</span></a><span class="sd">            gw_state (`torch.Tensor`): the previous GW state</span>
+</span><span id="L-109"><a href="#L-109"><span class="linenos">109</span></a>
+</span><span id="L-110"><a href="#L-110"><span class="linenos">110</span></a><span class="sd">        Returns:</span>
+</span><span id="L-111"><a href="#L-111"><span class="linenos">111</span></a><span class="sd">            `dict[str, torch.Tensor]`: whether the domain is selected for each input</span>
+</span><span id="L-112"><a href="#L-112"><span class="linenos">112</span></a><span class="sd">            in the batch.</span>
+</span><span id="L-113"><a href="#L-113"><span class="linenos">113</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="L-114"><a href="#L-114"><span class="linenos">114</span></a>        <span class="n">selection</span><span class="p">:</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]</span> <span class="o">=</span> <span class="p">{}</span>
+</span><span id="L-115"><a href="#L-115"><span class="linenos">115</span></a>        <span class="n">bs</span> <span class="o">=</span> <span class="n">group_batch_size</span><span class="p">(</span><span class="n">domains</span><span class="p">)</span>
+</span><span id="L-116"><a href="#L-116"><span class="linenos">116</span></a>        <span class="n">coef</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">full</span><span class="p">((</span><span class="n">bs</span><span class="p">,),</span> <span class="mf">1.0</span> <span class="o">/</span> <span class="nb">len</span><span class="p">(</span><span class="n">domains</span><span class="p">),</span> <span class="n">device</span><span class="o">=</span><span class="n">group_device</span><span class="p">(</span><span class="n">domains</span><span class="p">))</span>
+</span><span id="L-117"><a href="#L-117"><span class="linenos">117</span></a>        <span class="k">for</span> <span class="n">domain</span> <span class="ow">in</span> <span class="n">domains</span><span class="p">:</span>
+</span><span id="L-118"><a href="#L-118"><span class="linenos">118</span></a>            <span class="n">selection</span><span class="p">[</span><span class="n">domain</span><span class="p">]</span> <span class="o">=</span> <span class="n">coef</span><span class="o">.</span><span class="n">clone</span><span class="p">()</span>
+</span><span id="L-119"><a href="#L-119"><span class="linenos">119</span></a>        <span class="k">return</span> <span class="n">selection</span>
+</span><span id="L-120"><a href="#L-120"><span class="linenos">120</span></a>
+</span><span id="L-121"><a href="#L-121"><span class="linenos">121</span></a>
+</span><span id="L-122"><a href="#L-122"><span class="linenos">122</span></a><span class="k">def</span> <span class="nf">_calculate_attention_dict</span><span class="p">(</span>
+</span><span id="L-123"><a href="#L-123"><span class="linenos">123</span></a>    <span class="n">domains</span><span class="p">:</span> <span class="n">LatentsDomainGroupT</span><span class="p">,</span>
+</span><span id="L-124"><a href="#L-124"><span class="linenos">124</span></a>    <span class="n">keys</span><span class="p">:</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">],</span>
+</span><span id="L-125"><a href="#L-125"><span class="linenos">125</span></a>    <span class="n">query</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">,</span>
+</span><span id="L-126"><a href="#L-126"><span class="linenos">126</span></a><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]:</span>
+</span><span id="L-127"><a href="#L-127"><span class="linenos">127</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="L-128"><a href="#L-128"><span class="linenos">128</span></a><span class="sd">    Args:</span>
+</span><span id="L-129"><a href="#L-129"><span class="linenos">129</span></a><span class="sd">        domains (`LatentsDomainGroupT`): Group of unimodal latent representations.</span>
+</span><span id="L-130"><a href="#L-130"><span class="linenos">130</span></a><span class="sd">        keys (`dict[str, torch.Tensor]`): The keys for each domain.</span>
+</span><span id="L-131"><a href="#L-131"><span class="linenos">131</span></a><span class="sd">        query (`torch.Tensor`): The query tensor.</span>
+</span><span id="L-132"><a href="#L-132"><span class="linenos">132</span></a>
+</span><span id="L-133"><a href="#L-133"><span class="linenos">133</span></a><span class="sd">    Returns:</span>
+</span><span id="L-134"><a href="#L-134"><span class="linenos">134</span></a><span class="sd">        `dict[str, torch.Tensor]`: The attention scores for each domain.</span>
+</span><span id="L-135"><a href="#L-135"><span class="linenos">135</span></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="L-136"><a href="#L-136"><span class="linenos">136</span></a>    <span class="n">dot_products</span> <span class="o">=</span> <span class="p">{</span>
+</span><span id="L-137"><a href="#L-137"><span class="linenos">137</span></a>        <span class="n">domain</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">bmm</span><span class="p">(</span><span class="n">key</span><span class="o">.</span><span class="n">unsqueeze</span><span class="p">(</span><span class="mi">1</span><span class="p">),</span> <span class="n">query</span><span class="o">.</span><span class="n">unsqueeze</span><span class="p">(</span><span class="mi">2</span><span class="p">))</span><span class="o">.</span><span class="n">squeeze</span><span class="p">()</span>
+</span><span id="L-138"><a href="#L-138"><span class="linenos">138</span></a>        <span class="k">for</span> <span class="n">domain</span><span class="p">,</span> <span class="n">key</span> <span class="ow">in</span> <span class="n">keys</span><span class="o">.</span><span class="n">items</span><span class="p">()</span>
+</span><span id="L-139"><a href="#L-139"><span class="linenos">139</span></a>    <span class="p">}</span>
+</span><span id="L-140"><a href="#L-140"><span class="linenos">140</span></a>
+</span><span id="L-141"><a href="#L-141"><span class="linenos">141</span></a>    <span class="n">dot_products_tensor</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">stack</span><span class="p">(</span><span class="nb">list</span><span class="p">(</span><span class="n">dot_products</span><span class="o">.</span><span class="n">values</span><span class="p">()),</span> <span class="n">dim</span><span class="o">=</span><span class="mi">1</span><span class="p">)</span>
+</span><span id="L-142"><a href="#L-142"><span class="linenos">142</span></a>
+</span><span id="L-143"><a href="#L-143"><span class="linenos">143</span></a>    <span class="n">attention_scores</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">softmax</span><span class="p">(</span><span class="n">dot_products_tensor</span><span class="p">,</span> <span class="n">dim</span><span class="o">=</span><span class="mi">1</span><span class="p">)</span>
+</span><span id="L-144"><a href="#L-144"><span class="linenos">144</span></a>
+</span><span id="L-145"><a href="#L-145"><span class="linenos">145</span></a>    <span class="n">attention_dict</span> <span class="o">=</span> <span class="p">{</span>
+</span><span id="L-146"><a href="#L-146"><span class="linenos">146</span></a>        <span class="n">domain</span><span class="p">:</span> <span class="n">attention_scores</span><span class="p">[:,</span> <span class="n">i</span><span class="p">]</span> <span class="k">for</span> <span class="n">i</span><span class="p">,</span> <span class="n">domain</span> <span class="ow">in</span> <span class="nb">enumerate</span><span class="p">(</span><span class="n">domains</span><span class="p">)</span>
+</span><span id="L-147"><a href="#L-147"><span class="linenos">147</span></a>    <span class="p">}</span>
+</span><span id="L-148"><a href="#L-148"><span class="linenos">148</span></a>    <span class="k">return</span> <span class="n">attention_dict</span>
+</span><span id="L-149"><a href="#L-149"><span class="linenos">149</span></a>
+</span><span id="L-150"><a href="#L-150"><span class="linenos">150</span></a>
+</span><span id="L-151"><a href="#L-151"><span class="linenos">151</span></a><span class="k">class</span> <span class="nc">KQFixedQSelection</span><span class="p">(</span><span class="n">SelectionBase</span><span class="p">):</span>
+</span><span id="L-152"><a href="#L-152"><span class="linenos">152</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="L-153"><a href="#L-153"><span class="linenos">153</span></a><span class="sd">    Key-Query attention with a fixed gw vector.</span>
+</span><span id="L-154"><a href="#L-154"><span class="linenos">154</span></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="L-155"><a href="#L-155"><span class="linenos">155</span></a>
+</span><span id="L-156"><a href="#L-156"><span class="linenos">156</span></a>    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">head_size</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span> <span class="n">domain_dim</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span> <span class="n">domain_names</span><span class="p">:</span> <span class="n">Iterable</span><span class="p">[</span><span class="nb">str</span><span class="p">]):</span>
+</span><span id="L-157"><a href="#L-157"><span class="linenos">157</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="L-158"><a href="#L-158"><span class="linenos">158</span></a><span class="sd">        Args:</span>
+</span><span id="L-159"><a href="#L-159"><span class="linenos">159</span></a><span class="sd">            head_size (`int`) : dimension of the key and query vectors.</span>
+</span><span id="L-160"><a href="#L-160"><span class="linenos">160</span></a><span class="sd">            domain_dim (`int`) : dimension of the input dims (assumed to be the same</span>
+</span><span id="L-161"><a href="#L-161"><span class="linenos">161</span></a><span class="sd">                for now)</span>
+</span><span id="L-162"><a href="#L-162"><span class="linenos">162</span></a><span class="sd">            domain_names  (`Iterable[str]`) : list of input domains</span>
+</span><span id="L-163"><a href="#L-163"><span class="linenos">163</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="L-164"><a href="#L-164"><span class="linenos">164</span></a>        <span class="nb">super</span><span class="p">()</span><span class="o">.</span><span class="fm">__init__</span><span class="p">()</span>
+</span><span id="L-165"><a href="#L-165"><span class="linenos">165</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">head_size</span> <span class="o">=</span> <span class="n">head_size</span>
+</span><span id="L-166"><a href="#L-166"><span class="linenos">166</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">query_layer</span> <span class="o">=</span> <span class="n">nn</span><span class="o">.</span><span class="n">Linear</span><span class="p">(</span><span class="n">domain_dim</span><span class="p">,</span> <span class="n">head_size</span><span class="p">)</span>
+</span><span id="L-167"><a href="#L-167"><span class="linenos">167</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">key_layers</span> <span class="o">=</span> <span class="n">nn</span><span class="o">.</span><span class="n">ModuleDict</span><span class="p">(</span>
+</span><span id="L-168"><a href="#L-168"><span class="linenos">168</span></a>            <span class="p">{</span><span class="n">domain</span><span class="p">:</span> <span class="n">nn</span><span class="o">.</span><span class="n">Linear</span><span class="p">(</span><span class="n">domain_dim</span><span class="p">,</span> <span class="n">head_size</span><span class="p">)</span> <span class="k">for</span> <span class="n">domain</span> <span class="ow">in</span> <span class="n">domain_names</span><span class="p">}</span>
+</span><span id="L-169"><a href="#L-169"><span class="linenos">169</span></a>        <span class="p">)</span>
+</span><span id="L-170"><a href="#L-170"><span class="linenos">170</span></a>        <span class="c1"># Start with a random gw state</span>
+</span><span id="L-171"><a href="#L-171"><span class="linenos">171</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">register_buffer</span><span class="p">(</span><span class="s2">&quot;initial_gw_state&quot;</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">rand</span><span class="p">(</span><span class="n">domain_dim</span><span class="p">))</span>
+</span><span id="L-172"><a href="#L-172"><span class="linenos">172</span></a>
+</span><span id="L-173"><a href="#L-173"><span class="linenos">173</span></a>    <span class="k">def</span> <span class="nf">forward</span><span class="p">(</span>
+</span><span id="L-174"><a href="#L-174"><span class="linenos">174</span></a>        <span class="bp">self</span><span class="p">,</span> <span class="n">domains</span><span class="p">:</span> <span class="n">LatentsDomainGroupT</span><span class="p">,</span> <span class="n">encodings_pre_fusion</span><span class="p">:</span> <span class="n">LatentsDomainGroupT</span>
+</span><span id="L-175"><a href="#L-175"><span class="linenos">175</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]:</span>
+</span><span id="L-176"><a href="#L-176"><span class="linenos">176</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="L-177"><a href="#L-177"><span class="linenos">177</span></a><span class="sd">        Compute keys and queries, match them with dot product and softmax.</span>
+</span><span id="L-178"><a href="#L-178"><span class="linenos">178</span></a><span class="sd">        Does this twice, once with the static query and once with a dynamic query.</span>
+</span><span id="L-179"><a href="#L-179"><span class="linenos">179</span></a>
+</span><span id="L-180"><a href="#L-180"><span class="linenos">180</span></a><span class="sd">        Args:</span>
+</span><span id="L-181"><a href="#L-181"><span class="linenos">181</span></a><span class="sd">            domains (`LatentsDomainGroupT`): Group of unimodal latent representations.</span>
+</span><span id="L-182"><a href="#L-182"><span class="linenos">182</span></a><span class="sd">            encodings (`LatentsDomainGroupT`): Group of pre-fusion encodings.</span>
+</span><span id="L-183"><a href="#L-183"><span class="linenos">183</span></a>
+</span><span id="L-184"><a href="#L-184"><span class="linenos">184</span></a><span class="sd">        Returns:</span>
+</span><span id="L-185"><a href="#L-185"><span class="linenos">185</span></a><span class="sd">            `dict[str, torch.Tensor]`: the attention scores for each domain in the</span>
+</span><span id="L-186"><a href="#L-186"><span class="linenos">186</span></a><span class="sd">            group.</span>
+</span><span id="L-187"><a href="#L-187"><span class="linenos">187</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="L-188"><a href="#L-188"><span class="linenos">188</span></a>
+</span><span id="L-189"><a href="#L-189"><span class="linenos">189</span></a>        <span class="n">keys</span> <span class="o">=</span> <span class="p">{</span>
+</span><span id="L-190"><a href="#L-190"><span class="linenos">190</span></a>            <span class="n">domain</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">key_layers</span><span class="p">[</span><span class="n">domain</span><span class="p">](</span><span class="n">encoding</span><span class="p">)</span>
+</span><span id="L-191"><a href="#L-191"><span class="linenos">191</span></a>            <span class="k">for</span> <span class="n">domain</span><span class="p">,</span> <span class="n">encoding</span> <span class="ow">in</span> <span class="n">domains</span><span class="o">.</span><span class="n">items</span><span class="p">()</span>
+</span><span id="L-192"><a href="#L-192"><span class="linenos">192</span></a>        <span class="p">}</span>
+</span><span id="L-193"><a href="#L-193"><span class="linenos">193</span></a>
+</span><span id="L-194"><a href="#L-194"><span class="linenos">194</span></a>        <span class="n">batch_size</span> <span class="o">=</span> <span class="n">group_batch_size</span><span class="p">(</span><span class="n">domains</span><span class="p">)</span>
+</span><span id="L-195"><a href="#L-195"><span class="linenos">195</span></a>
+</span><span id="L-196"><a href="#L-196"><span class="linenos">196</span></a>        <span class="c1"># Retrieve random query</span>
+</span><span id="L-197"><a href="#L-197"><span class="linenos">197</span></a>        <span class="n">query</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">query_layer</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">initial_gw_state</span><span class="o">.</span><span class="n">expand</span><span class="p">(</span><span class="n">batch_size</span><span class="p">,</span> <span class="o">-</span><span class="mi">1</span><span class="p">))</span>
+</span><span id="L-198"><a href="#L-198"><span class="linenos">198</span></a>
+</span><span id="L-199"><a href="#L-199"><span class="linenos">199</span></a>        <span class="c1"># Calculate the attention scores</span>
+</span><span id="L-200"><a href="#L-200"><span class="linenos">200</span></a>        <span class="k">return</span> <span class="n">_calculate_attention_dict</span><span class="p">(</span><span class="n">domains</span><span class="p">,</span> <span class="n">keys</span><span class="p">,</span> <span class="n">query</span><span class="p">)</span>
+</span><span id="L-201"><a href="#L-201"><span class="linenos">201</span></a>
+</span><span id="L-202"><a href="#L-202"><span class="linenos">202</span></a>
+</span><span id="L-203"><a href="#L-203"><span class="linenos">203</span></a><span class="k">class</span> <span class="nc">RandomSelection</span><span class="p">(</span><span class="n">SelectionBase</span><span class="p">):</span>
+</span><span id="L-204"><a href="#L-204"><span class="linenos">204</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="L-205"><a href="#L-205"><span class="linenos">205</span></a><span class="sd">    Modified random attention to only utilize uniform-softmax scores across modalities.</span>
+</span><span id="L-206"><a href="#L-206"><span class="linenos">206</span></a><span class="sd">    This version omits the binary scaling factors and focuses on generating attention</span>
+</span><span id="L-207"><a href="#L-207"><span class="linenos">207</span></a><span class="sd">    coefficients using a uniform distribution followed by a domain-wise softmax.</span>
+</span><span id="L-208"><a href="#L-208"><span class="linenos">208</span></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="L-209"><a href="#L-209"><span class="linenos">209</span></a>
+</span><span id="L-210"><a href="#L-210"><span class="linenos">210</span></a>    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">temperature</span><span class="p">:</span> <span class="nb">float</span><span class="p">):</span>
+</span><span id="L-211"><a href="#L-211"><span class="linenos">211</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="L-212"><a href="#L-212"><span class="linenos">212</span></a><span class="sd">        Args:</span>
+</span><span id="L-213"><a href="#L-213"><span class="linenos">213</span></a><span class="sd">            temperature (`float`): Temperature of the softmax applied to uniform</span>
+</span><span id="L-214"><a href="#L-214"><span class="linenos">214</span></a><span class="sd">                scaling factors.</span>
+</span><span id="L-215"><a href="#L-215"><span class="linenos">215</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="L-216"><a href="#L-216"><span class="linenos">216</span></a>        <span class="nb">super</span><span class="p">()</span><span class="o">.</span><span class="fm">__init__</span><span class="p">()</span>
+</span><span id="L-217"><a href="#L-217"><span class="linenos">217</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">temperature</span> <span class="o">=</span> <span class="n">temperature</span>
+</span><span id="L-218"><a href="#L-218"><span class="linenos">218</span></a>
+</span><span id="L-219"><a href="#L-219"><span class="linenos">219</span></a>    <span class="k">def</span> <span class="nf">forward</span><span class="p">(</span>
+</span><span id="L-220"><a href="#L-220"><span class="linenos">220</span></a>        <span class="bp">self</span><span class="p">,</span> <span class="n">domains</span><span class="p">:</span> <span class="n">LatentsDomainGroupT</span><span class="p">,</span> <span class="n">encodings_pre_fusion</span><span class="p">:</span> <span class="n">LatentsDomainGroupT</span>
+</span><span id="L-221"><a href="#L-221"><span class="linenos">221</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]:</span>
+</span><span id="L-222"><a href="#L-222"><span class="linenos">222</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="L-223"><a href="#L-223"><span class="linenos">223</span></a><span class="sd">        Generate uniform-then-domain-wise-softmaxed samples for each domain.</span>
+</span><span id="L-224"><a href="#L-224"><span class="linenos">224</span></a>
+</span><span id="L-225"><a href="#L-225"><span class="linenos">225</span></a><span class="sd">        Args:</span>
+</span><span id="L-226"><a href="#L-226"><span class="linenos">226</span></a><span class="sd">            domains (`LatentsDomainGroupT`): Group of unimodal latent representations.</span>
+</span><span id="L-227"><a href="#L-227"><span class="linenos">227</span></a><span class="sd">                This is not used in the function directly but determines the structure</span>
+</span><span id="L-228"><a href="#L-228"><span class="linenos">228</span></a><span class="sd">                of the returned attention coefficients.</span>
+</span><span id="L-229"><a href="#L-229"><span class="linenos">229</span></a>
+</span><span id="L-230"><a href="#L-230"><span class="linenos">230</span></a><span class="sd">        Returns:</span>
+</span><span id="L-231"><a href="#L-231"><span class="linenos">231</span></a><span class="sd">            `dict[str, torch.Tensor]`: For each domain in the group, the fusion</span>
+</span><span id="L-232"><a href="#L-232"><span class="linenos">232</span></a><span class="sd">            coefficient for each item in the batch, based solely on</span>
+</span><span id="L-233"><a href="#L-233"><span class="linenos">233</span></a><span class="sd">            uniform-softmax scores.</span>
+</span><span id="L-234"><a href="#L-234"><span class="linenos">234</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="L-235"><a href="#L-235"><span class="linenos">235</span></a>        <span class="n">num_domains</span> <span class="o">=</span> <span class="nb">len</span><span class="p">(</span><span class="n">domains</span><span class="p">)</span>
+</span><span id="L-236"><a href="#L-236"><span class="linenos">236</span></a>        <span class="n">batch_size</span> <span class="o">=</span> <span class="n">group_batch_size</span><span class="p">(</span><span class="n">domains</span><span class="p">)</span>
+</span><span id="L-237"><a href="#L-237"><span class="linenos">237</span></a>        <span class="n">device</span> <span class="o">=</span> <span class="n">group_device</span><span class="p">(</span><span class="n">domains</span><span class="p">)</span>
+</span><span id="L-238"><a href="#L-238"><span class="linenos">238</span></a>
+</span><span id="L-239"><a href="#L-239"><span class="linenos">239</span></a>        <span class="c1"># Generate uniform scores</span>
+</span><span id="L-240"><a href="#L-240"><span class="linenos">240</span></a>        <span class="n">uniform_scores</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">rand</span><span class="p">(</span><span class="n">batch_size</span><span class="p">,</span> <span class="n">num_domains</span><span class="p">,</span> <span class="n">device</span><span class="o">=</span><span class="n">device</span><span class="p">)</span>
+</span><span id="L-241"><a href="#L-241"><span class="linenos">241</span></a>
+</span><span id="L-242"><a href="#L-242"><span class="linenos">242</span></a>        <span class="c1"># Apply softmax across domains with temperature scaling</span>
+</span><span id="L-243"><a href="#L-243"><span class="linenos">243</span></a>        <span class="n">softmax_scores</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">softmax</span><span class="p">(</span><span class="n">uniform_scores</span> <span class="o">/</span> <span class="bp">self</span><span class="o">.</span><span class="n">temperature</span><span class="p">,</span> <span class="n">dim</span><span class="o">=</span><span class="mi">1</span><span class="p">)</span>
+</span><span id="L-244"><a href="#L-244"><span class="linenos">244</span></a>        <span class="c1"># Create attention dictionary for each domain</span>
+</span><span id="L-245"><a href="#L-245"><span class="linenos">245</span></a>        <span class="n">attention_dict</span> <span class="o">=</span> <span class="p">{</span>
+</span><span id="L-246"><a href="#L-246"><span class="linenos">246</span></a>            <span class="n">domain</span><span class="p">:</span> <span class="n">softmax_scores</span><span class="p">[:,</span> <span class="n">i</span><span class="p">]</span> <span class="k">for</span> <span class="n">i</span><span class="p">,</span> <span class="n">domain</span> <span class="ow">in</span> <span class="nb">enumerate</span><span class="p">(</span><span class="n">domains</span><span class="p">)</span>
+</span><span id="L-247"><a href="#L-247"><span class="linenos">247</span></a>        <span class="p">}</span>
+</span><span id="L-248"><a href="#L-248"><span class="linenos">248</span></a>
+</span><span id="L-249"><a href="#L-249"><span class="linenos">249</span></a>        <span class="k">return</span> <span class="n">attention_dict</span>
+</span><span id="L-250"><a href="#L-250"><span class="linenos">250</span></a>
+</span><span id="L-251"><a href="#L-251"><span class="linenos">251</span></a>
+</span><span id="L-252"><a href="#L-252"><span class="linenos">252</span></a><span class="k">class</span> <span class="nc">DynamicQueryAttention</span><span class="p">(</span><span class="n">SelectionBase</span><span class="p">):</span>
+</span><span id="L-253"><a href="#L-253"><span class="linenos">253</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="L-254"><a href="#L-254"><span class="linenos">254</span></a><span class="sd">    Key-Query attention with a dynamic gw vector.</span>
+</span><span id="L-255"><a href="#L-255"><span class="linenos">255</span></a><span class="sd">    The query is updated based on the scaled gw vector.</span>
+</span><span id="L-256"><a href="#L-256"><span class="linenos">256</span></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="L-257"><a href="#L-257"><span class="linenos">257</span></a>
+</span><span id="L-258"><a href="#L-258"><span class="linenos">258</span></a>    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">head_size</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span> <span class="n">domain_dim</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span> <span class="n">domain_names</span><span class="p">:</span> <span class="n">Iterable</span><span class="p">[</span><span class="nb">str</span><span class="p">]):</span>
+</span><span id="L-259"><a href="#L-259"><span class="linenos">259</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="L-260"><a href="#L-260"><span class="linenos">260</span></a><span class="sd">        Args:</span>
+</span><span id="L-261"><a href="#L-261"><span class="linenos">261</span></a><span class="sd">            head_size (`int`) : dimension of the key and query vectors.</span>
+</span><span id="L-262"><a href="#L-262"><span class="linenos">262</span></a><span class="sd">            domain_dim (`int`) : dimension of the input dims (assumed to be the same</span>
+</span><span id="L-263"><a href="#L-263"><span class="linenos">263</span></a><span class="sd">                for now)</span>
+</span><span id="L-264"><a href="#L-264"><span class="linenos">264</span></a><span class="sd">            domain_names  (`Iterable[str]`) : list of input domains</span>
+</span><span id="L-265"><a href="#L-265"><span class="linenos">265</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="L-266"><a href="#L-266"><span class="linenos">266</span></a>        <span class="nb">super</span><span class="p">()</span><span class="o">.</span><span class="fm">__init__</span><span class="p">()</span>
+</span><span id="L-267"><a href="#L-267"><span class="linenos">267</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">head_size</span> <span class="o">=</span> <span class="n">head_size</span>
+</span><span id="L-268"><a href="#L-268"><span class="linenos">268</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">query_layer</span> <span class="o">=</span> <span class="n">nn</span><span class="o">.</span><span class="n">Linear</span><span class="p">(</span><span class="n">domain_dim</span><span class="p">,</span> <span class="n">head_size</span><span class="p">)</span>
+</span><span id="L-269"><a href="#L-269"><span class="linenos">269</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">key_layers</span> <span class="o">=</span> <span class="n">nn</span><span class="o">.</span><span class="n">ModuleDict</span><span class="p">(</span>
+</span><span id="L-270"><a href="#L-270"><span class="linenos">270</span></a>            <span class="p">{</span><span class="n">domain</span><span class="p">:</span> <span class="n">nn</span><span class="o">.</span><span class="n">Linear</span><span class="p">(</span><span class="n">domain_dim</span><span class="p">,</span> <span class="n">head_size</span><span class="p">)</span> <span class="k">for</span> <span class="n">domain</span> <span class="ow">in</span> <span class="n">domain_names</span><span class="p">}</span>
+</span><span id="L-271"><a href="#L-271"><span class="linenos">271</span></a>        <span class="p">)</span>
+</span><span id="L-272"><a href="#L-272"><span class="linenos">272</span></a>        <span class="c1"># Start with a random gw state</span>
+</span><span id="L-273"><a href="#L-273"><span class="linenos">273</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">register_buffer</span><span class="p">(</span><span class="s2">&quot;initial_gw_state&quot;</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">rand</span><span class="p">(</span><span class="n">domain_dim</span><span class="p">))</span>
+</span><span id="L-274"><a href="#L-274"><span class="linenos">274</span></a>
+</span><span id="L-275"><a href="#L-275"><span class="linenos">275</span></a>    <span class="k">def</span> <span class="nf">fuse_weighted_encodings</span><span class="p">(</span>
+</span><span id="L-276"><a href="#L-276"><span class="linenos">276</span></a>        <span class="bp">self</span><span class="p">,</span> <span class="n">encodings</span><span class="p">:</span> <span class="n">LatentsDomainGroupT</span><span class="p">,</span> <span class="n">attention_dict</span><span class="p">:</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]</span>
+</span><span id="L-277"><a href="#L-277"><span class="linenos">277</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">:</span>
+</span><span id="L-278"><a href="#L-278"><span class="linenos">278</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="L-279"><a href="#L-279"><span class="linenos">279</span></a><span class="sd">        Fuse the weighted encodings using the attention scores.</span>
+</span><span id="L-280"><a href="#L-280"><span class="linenos">280</span></a>
+</span><span id="L-281"><a href="#L-281"><span class="linenos">281</span></a><span class="sd">        Args:</span>
+</span><span id="L-282"><a href="#L-282"><span class="linenos">282</span></a><span class="sd">            encodings (`LatentsDomainGroupT`): Unimodal latent representation</span>
+</span><span id="L-283"><a href="#L-283"><span class="linenos">283</span></a><span class="sd">            attention_dict (`dict[str, torch.Tensor]`): The attention scores for each</span>
+</span><span id="L-284"><a href="#L-284"><span class="linenos">284</span></a><span class="sd">                domain in the group.</span>
+</span><span id="L-285"><a href="#L-285"><span class="linenos">285</span></a>
+</span><span id="L-286"><a href="#L-286"><span class="linenos">286</span></a><span class="sd">        Returns:</span>
+</span><span id="L-287"><a href="#L-287"><span class="linenos">287</span></a><span class="sd">            `torch.Tensor`: The fused tensor.</span>
+</span><span id="L-288"><a href="#L-288"><span class="linenos">288</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="L-289"><a href="#L-289"><span class="linenos">289</span></a>        <span class="c1"># Apply attention scores to the encodings</span>
+</span><span id="L-290"><a href="#L-290"><span class="linenos">290</span></a>        <span class="n">weighted_encodings</span> <span class="o">=</span> <span class="p">{}</span>
+</span><span id="L-291"><a href="#L-291"><span class="linenos">291</span></a>        <span class="k">for</span> <span class="n">key</span> <span class="ow">in</span> <span class="n">attention_dict</span><span class="p">:</span>
+</span><span id="L-292"><a href="#L-292"><span class="linenos">292</span></a>            <span class="k">if</span> <span class="n">key</span> <span class="ow">in</span> <span class="n">encodings</span><span class="p">:</span>
+</span><span id="L-293"><a href="#L-293"><span class="linenos">293</span></a>                <span class="c1"># Perform element-wise multiplication</span>
+</span><span id="L-294"><a href="#L-294"><span class="linenos">294</span></a>                <span class="n">weighted_encodings</span><span class="p">[</span><span class="n">key</span><span class="p">]</span> <span class="o">=</span> <span class="p">(</span>
+</span><span id="L-295"><a href="#L-295"><span class="linenos">295</span></a>                    <span class="n">attention_dict</span><span class="p">[</span><span class="n">key</span><span class="p">]</span><span class="o">.</span><span class="n">unsqueeze</span><span class="p">(</span><span class="mi">1</span><span class="p">)</span> <span class="o">*</span> <span class="n">encodings</span><span class="p">[</span><span class="n">key</span><span class="p">]</span>
+</span><span id="L-296"><a href="#L-296"><span class="linenos">296</span></a>                <span class="p">)</span>
+</span><span id="L-297"><a href="#L-297"><span class="linenos">297</span></a>
+</span><span id="L-298"><a href="#L-298"><span class="linenos">298</span></a>        <span class="c1"># Stack the tensors along a new dimension (dimension 0)</span>
+</span><span id="L-299"><a href="#L-299"><span class="linenos">299</span></a>        <span class="n">stacked_tensors</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">stack</span><span class="p">(</span><span class="nb">list</span><span class="p">(</span><span class="n">weighted_encodings</span><span class="o">.</span><span class="n">values</span><span class="p">()))</span>
+</span><span id="L-300"><a href="#L-300"><span class="linenos">300</span></a>
+</span><span id="L-301"><a href="#L-301"><span class="linenos">301</span></a>        <span class="c1"># Apply fusion by summing along the newly created dimension</span>
+</span><span id="L-302"><a href="#L-302"><span class="linenos">302</span></a>        <span class="n">summed_tensor</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">sum</span><span class="p">(</span><span class="n">stacked_tensors</span><span class="p">,</span> <span class="n">dim</span><span class="o">=</span><span class="mi">0</span><span class="p">)</span>
+</span><span id="L-303"><a href="#L-303"><span class="linenos">303</span></a>        <span class="k">return</span> <span class="n">summed_tensor</span>
+</span><span id="L-304"><a href="#L-304"><span class="linenos">304</span></a>
+</span><span id="L-305"><a href="#L-305"><span class="linenos">305</span></a>    <span class="k">def</span> <span class="nf">forward</span><span class="p">(</span>
+</span><span id="L-306"><a href="#L-306"><span class="linenos">306</span></a>        <span class="bp">self</span><span class="p">,</span> <span class="n">domains</span><span class="p">:</span> <span class="n">LatentsDomainGroupT</span><span class="p">,</span> <span class="n">encodings_pre_fusion</span><span class="p">:</span> <span class="n">LatentsDomainGroupT</span>
+</span><span id="L-307"><a href="#L-307"><span class="linenos">307</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]:</span>
+</span><span id="L-308"><a href="#L-308"><span class="linenos">308</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="L-309"><a href="#L-309"><span class="linenos">309</span></a><span class="sd">        Compute keys and queries, match them with dot product and softmax.</span>
+</span><span id="L-310"><a href="#L-310"><span class="linenos">310</span></a><span class="sd">        Does this twice, once with the static query and once with a dynamic query.</span>
+</span><span id="L-311"><a href="#L-311"><span class="linenos">311</span></a>
+</span><span id="L-312"><a href="#L-312"><span class="linenos">312</span></a><span class="sd">        Args:</span>
+</span><span id="L-313"><a href="#L-313"><span class="linenos">313</span></a><span class="sd">            domains (`LatentsDomainGroupT`): Group of unimodal latent representations.</span>
+</span><span id="L-314"><a href="#L-314"><span class="linenos">314</span></a><span class="sd">            encodings (`LatentsDomainGroupT`): Group of pre-fusion encodings.</span>
+</span><span id="L-315"><a href="#L-315"><span class="linenos">315</span></a>
+</span><span id="L-316"><a href="#L-316"><span class="linenos">316</span></a><span class="sd">        Returns:</span>
+</span><span id="L-317"><a href="#L-317"><span class="linenos">317</span></a><span class="sd">            `dict[str, torch.Tensor]`: the attention scores for each domain in the</span>
+</span><span id="L-318"><a href="#L-318"><span class="linenos">318</span></a><span class="sd">            group.</span>
+</span><span id="L-319"><a href="#L-319"><span class="linenos">319</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="L-320"><a href="#L-320"><span class="linenos">320</span></a>
+</span><span id="L-321"><a href="#L-321"><span class="linenos">321</span></a>        <span class="n">keys</span> <span class="o">=</span> <span class="p">{</span>
+</span><span id="L-322"><a href="#L-322"><span class="linenos">322</span></a>            <span class="n">domain</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">key_layers</span><span class="p">[</span><span class="n">domain</span><span class="p">](</span><span class="n">encoding</span><span class="p">)</span>
+</span><span id="L-323"><a href="#L-323"><span class="linenos">323</span></a>            <span class="k">for</span> <span class="n">domain</span><span class="p">,</span> <span class="n">encoding</span> <span class="ow">in</span> <span class="n">domains</span><span class="o">.</span><span class="n">items</span><span class="p">()</span>
+</span><span id="L-324"><a href="#L-324"><span class="linenos">324</span></a>        <span class="p">}</span>
+</span><span id="L-325"><a href="#L-325"><span class="linenos">325</span></a>
+</span><span id="L-326"><a href="#L-326"><span class="linenos">326</span></a>        <span class="n">batch_size</span> <span class="o">=</span> <span class="n">group_batch_size</span><span class="p">(</span><span class="n">domains</span><span class="p">)</span>
+</span><span id="L-327"><a href="#L-327"><span class="linenos">327</span></a>
+</span><span id="L-328"><a href="#L-328"><span class="linenos">328</span></a>        <span class="c1"># Retrieve random query</span>
+</span><span id="L-329"><a href="#L-329"><span class="linenos">329</span></a>        <span class="n">query</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">query_layer</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">initial_gw_state</span><span class="o">.</span><span class="n">expand</span><span class="p">(</span><span class="n">batch_size</span><span class="p">,</span> <span class="o">-</span><span class="mi">1</span><span class="p">))</span>
+</span><span id="L-330"><a href="#L-330"><span class="linenos">330</span></a>
+</span><span id="L-331"><a href="#L-331"><span class="linenos">331</span></a>        <span class="c1"># Calculate the attention scores</span>
+</span><span id="L-332"><a href="#L-332"><span class="linenos">332</span></a>        <span class="n">static_attention_dict</span> <span class="o">=</span> <span class="n">_calculate_attention_dict</span><span class="p">(</span><span class="n">domains</span><span class="p">,</span> <span class="n">keys</span><span class="p">,</span> <span class="n">query</span><span class="p">)</span>
+</span><span id="L-333"><a href="#L-333"><span class="linenos">333</span></a>
+</span><span id="L-334"><a href="#L-334"><span class="linenos">334</span></a>        <span class="c1"># Apply the attention scores to the encodings</span>
+</span><span id="L-335"><a href="#L-335"><span class="linenos">335</span></a>        <span class="n">summed_tensor</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">fuse_weighted_encodings</span><span class="p">(</span>
+</span><span id="L-336"><a href="#L-336"><span class="linenos">336</span></a>            <span class="n">encodings_pre_fusion</span><span class="p">,</span> <span class="n">static_attention_dict</span>
+</span><span id="L-337"><a href="#L-337"><span class="linenos">337</span></a>        <span class="p">)</span>
+</span><span id="L-338"><a href="#L-338"><span class="linenos">338</span></a>
+</span><span id="L-339"><a href="#L-339"><span class="linenos">339</span></a>        <span class="c1"># Retrieve query (now it is dependent on the new gw state)</span>
+</span><span id="L-340"><a href="#L-340"><span class="linenos">340</span></a>        <span class="n">query</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">query_layer</span><span class="p">(</span><span class="n">summed_tensor</span><span class="p">)</span>
+</span><span id="L-341"><a href="#L-341"><span class="linenos">341</span></a>
+</span><span id="L-342"><a href="#L-342"><span class="linenos">342</span></a>        <span class="c1"># Calculate the attention scores again</span>
+</span><span id="L-343"><a href="#L-343"><span class="linenos">343</span></a>        <span class="n">dynamic_attention_dict</span> <span class="o">=</span> <span class="n">_calculate_attention_dict</span><span class="p">(</span><span class="n">domains</span><span class="p">,</span> <span class="n">keys</span><span class="p">,</span> <span class="n">query</span><span class="p">)</span>
+</span><span id="L-344"><a href="#L-344"><span class="linenos">344</span></a>
+</span><span id="L-345"><a href="#L-345"><span class="linenos">345</span></a>        <span class="k">return</span> <span class="n">dynamic_attention_dict</span>
+</span></pre></div>
+
+
+            </section>
+                <section id="SelectionBase">
+                            <input id="SelectionBase-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
+<div class="attr class">
+            
+    <span class="def">class</span>
+    <span class="name">SelectionBase</span><wbr>(<span class="base">torch.nn.modules.module.Module</span>, <span class="base">abc.ABC</span>):
+
+                <label class="view-source-button" for="SelectionBase-view-source"><span>View Source</span></label>
+
+    </div>
+    <a class="headerlink" href="#SelectionBase"></a>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="SelectionBase-12"><a href="#SelectionBase-12"><span class="linenos">12</span></a><span class="k">class</span> <span class="nc">SelectionBase</span><span class="p">(</span><span class="n">torch</span><span class="o">.</span><span class="n">nn</span><span class="o">.</span><span class="n">Module</span><span class="p">,</span> <span class="n">ABC</span><span class="p">):</span>
+</span><span id="SelectionBase-13"><a href="#SelectionBase-13"><span class="linenos">13</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="SelectionBase-14"><a href="#SelectionBase-14"><span class="linenos">14</span></a><span class="sd">    This is the base class for the selection mechanism.</span>
+</span><span id="SelectionBase-15"><a href="#SelectionBase-15"><span class="linenos">15</span></a><span class="sd">    The selection mechanisms handles the &quot;competition&quot; between modules and *selects*</span>
+</span><span id="SelectionBase-16"><a href="#SelectionBase-16"><span class="linenos">16</span></a><span class="sd">    fusion coefficients for the domains.</span>
+</span><span id="SelectionBase-17"><a href="#SelectionBase-17"><span class="linenos">17</span></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="SelectionBase-18"><a href="#SelectionBase-18"><span class="linenos">18</span></a>
+</span><span id="SelectionBase-19"><a href="#SelectionBase-19"><span class="linenos">19</span></a>    <span class="k">def</span> <span class="nf">update_gw_state</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">gw_state</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="SelectionBase-20"><a href="#SelectionBase-20"><span class="linenos">20</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="SelectionBase-21"><a href="#SelectionBase-21"><span class="linenos">21</span></a><span class="sd">        Update the internal copy of the previous GW state.</span>
+</span><span id="SelectionBase-22"><a href="#SelectionBase-22"><span class="linenos">22</span></a><span class="sd">        By default, this is not implemented and will raise an error if used.</span>
+</span><span id="SelectionBase-23"><a href="#SelectionBase-23"><span class="linenos">23</span></a>
+</span><span id="SelectionBase-24"><a href="#SelectionBase-24"><span class="linenos">24</span></a><span class="sd">        :note..</span>
+</span><span id="SelectionBase-25"><a href="#SelectionBase-25"><span class="linenos">25</span></a><span class="sd">            This is not defined as an abstractmethod as some selection method may</span>
+</span><span id="SelectionBase-26"><a href="#SelectionBase-26"><span class="linenos">26</span></a><span class="sd">            not need it.</span>
+</span><span id="SelectionBase-27"><a href="#SelectionBase-27"><span class="linenos">27</span></a>
+</span><span id="SelectionBase-28"><a href="#SelectionBase-28"><span class="linenos">28</span></a><span class="sd">        Args:</span>
+</span><span id="SelectionBase-29"><a href="#SelectionBase-29"><span class="linenos">29</span></a><span class="sd">            gw_state (`torch.Tensor`): the previous GW state</span>
+</span><span id="SelectionBase-30"><a href="#SelectionBase-30"><span class="linenos">30</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="SelectionBase-31"><a href="#SelectionBase-31"><span class="linenos">31</span></a>        <span class="k">pass</span>
+</span><span id="SelectionBase-32"><a href="#SelectionBase-32"><span class="linenos">32</span></a>
+</span><span id="SelectionBase-33"><a href="#SelectionBase-33"><span class="linenos">33</span></a>    <span class="nd">@abstractmethod</span>
+</span><span id="SelectionBase-34"><a href="#SelectionBase-34"><span class="linenos">34</span></a>    <span class="k">def</span> <span class="nf">forward</span><span class="p">(</span>
+</span><span id="SelectionBase-35"><a href="#SelectionBase-35"><span class="linenos">35</span></a>        <span class="bp">self</span><span class="p">,</span> <span class="n">domains</span><span class="p">:</span> <span class="n">LatentsDomainGroupT</span><span class="p">,</span> <span class="n">encodings_pre_fusion</span><span class="p">:</span> <span class="n">LatentsDomainGroupT</span>
+</span><span id="SelectionBase-36"><a href="#SelectionBase-36"><span class="linenos">36</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]:</span>
+</span><span id="SelectionBase-37"><a href="#SelectionBase-37"><span class="linenos">37</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="SelectionBase-38"><a href="#SelectionBase-38"><span class="linenos">38</span></a><span class="sd">        Forward pass of the selection method.</span>
+</span><span id="SelectionBase-39"><a href="#SelectionBase-39"><span class="linenos">39</span></a>
+</span><span id="SelectionBase-40"><a href="#SelectionBase-40"><span class="linenos">40</span></a><span class="sd">        Args:</span>
+</span><span id="SelectionBase-41"><a href="#SelectionBase-41"><span class="linenos">41</span></a><span class="sd">            domains (`LatentsDomainGroupT`): Group of unimodal latent representations.</span>
+</span><span id="SelectionBase-42"><a href="#SelectionBase-42"><span class="linenos">42</span></a>
+</span><span id="SelectionBase-43"><a href="#SelectionBase-43"><span class="linenos">43</span></a><span class="sd">        Returns:</span>
+</span><span id="SelectionBase-44"><a href="#SelectionBase-44"><span class="linenos">44</span></a><span class="sd">            `dict[str, torch.Tensor]`: for each domain in the group, the fusion</span>
+</span><span id="SelectionBase-45"><a href="#SelectionBase-45"><span class="linenos">45</span></a><span class="sd">            coefficient for each item in the batch.</span>
+</span><span id="SelectionBase-46"><a href="#SelectionBase-46"><span class="linenos">46</span></a>
+</span><span id="SelectionBase-47"><a href="#SelectionBase-47"><span class="linenos">47</span></a><span class="sd">        Example:</span>
+</span><span id="SelectionBase-48"><a href="#SelectionBase-48"><span class="linenos">48</span></a><span class="sd">            &gt;&gt;&gt; SomeSelectionImplementation().forward(</span>
+</span><span id="SelectionBase-49"><a href="#SelectionBase-49"><span class="linenos">49</span></a><span class="sd">            ...     {&quot;v&quot;: torch.randn(3, 4), &quot;t&quot;: torch.randn(3, 8)}</span>
+</span><span id="SelectionBase-50"><a href="#SelectionBase-50"><span class="linenos">50</span></a><span class="sd">            ... )</span>
+</span><span id="SelectionBase-51"><a href="#SelectionBase-51"><span class="linenos">51</span></a><span class="sd">            {&quot;v&quot;: torch.Tensor([0.0, 0.4, 1.0]), &quot;t&quot;: torch.Tensor([1.0, 0.6, 0.0])}</span>
+</span><span id="SelectionBase-52"><a href="#SelectionBase-52"><span class="linenos">52</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="SelectionBase-53"><a href="#SelectionBase-53"><span class="linenos">53</span></a>        <span class="o">...</span>
+</span><span id="SelectionBase-54"><a href="#SelectionBase-54"><span class="linenos">54</span></a>
+</span><span id="SelectionBase-55"><a href="#SelectionBase-55"><span class="linenos">55</span></a>    <span class="c1"># This is just for proper auto-completion...</span>
+</span><span id="SelectionBase-56"><a href="#SelectionBase-56"><span class="linenos">56</span></a>    <span class="k">def</span> <span class="fm">__call__</span><span class="p">(</span>
+</span><span id="SelectionBase-57"><a href="#SelectionBase-57"><span class="linenos">57</span></a>        <span class="bp">self</span><span class="p">,</span> <span class="n">domains</span><span class="p">:</span> <span class="n">LatentsDomainGroupT</span><span class="p">,</span> <span class="n">encodings_pre_fusion</span><span class="p">:</span> <span class="n">LatentsDomainGroupT</span>
+</span><span id="SelectionBase-58"><a href="#SelectionBase-58"><span class="linenos">58</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]:</span>
+</span><span id="SelectionBase-59"><a href="#SelectionBase-59"><span class="linenos">59</span></a>        <span class="k">return</span> <span class="nb">super</span><span class="p">()</span><span class="o">.</span><span class="fm">__call__</span><span class="p">(</span><span class="n">domains</span><span class="p">,</span> <span class="n">encodings_pre_fusion</span><span class="p">)</span>
+</span></pre></div>
+
+
+            <div class="docstring"><p>This is the base class for the selection mechanism.
+The selection mechanisms handles the "competition" between modules and <em>selects</em>
+fusion coefficients for the domains.</p>
+</div>
+
+
+                            <div id="SelectionBase.update_gw_state" class="classattr">
+                                        <input id="SelectionBase.update_gw_state-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
+<div class="attr function">
+            
+        <span class="def">def</span>
+        <span class="name">update_gw_state</span><span class="signature pdoc-code condensed">(<span class="param"><span class="bp">self</span>, </span><span class="param"><span class="n">gw_state</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span></span><span class="return-annotation">) -> <span class="kc">None</span>:</span></span>
+
+                <label class="view-source-button" for="SelectionBase.update_gw_state-view-source"><span>View Source</span></label>
+
+    </div>
+    <a class="headerlink" href="#SelectionBase.update_gw_state"></a>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="SelectionBase.update_gw_state-19"><a href="#SelectionBase.update_gw_state-19"><span class="linenos">19</span></a>    <span class="k">def</span> <span class="nf">update_gw_state</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">gw_state</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="kc">None</span><span class="p">:</span>
+</span><span id="SelectionBase.update_gw_state-20"><a href="#SelectionBase.update_gw_state-20"><span class="linenos">20</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="SelectionBase.update_gw_state-21"><a href="#SelectionBase.update_gw_state-21"><span class="linenos">21</span></a><span class="sd">        Update the internal copy of the previous GW state.</span>
+</span><span id="SelectionBase.update_gw_state-22"><a href="#SelectionBase.update_gw_state-22"><span class="linenos">22</span></a><span class="sd">        By default, this is not implemented and will raise an error if used.</span>
+</span><span id="SelectionBase.update_gw_state-23"><a href="#SelectionBase.update_gw_state-23"><span class="linenos">23</span></a>
+</span><span id="SelectionBase.update_gw_state-24"><a href="#SelectionBase.update_gw_state-24"><span class="linenos">24</span></a><span class="sd">        :note..</span>
+</span><span id="SelectionBase.update_gw_state-25"><a href="#SelectionBase.update_gw_state-25"><span class="linenos">25</span></a><span class="sd">            This is not defined as an abstractmethod as some selection method may</span>
+</span><span id="SelectionBase.update_gw_state-26"><a href="#SelectionBase.update_gw_state-26"><span class="linenos">26</span></a><span class="sd">            not need it.</span>
+</span><span id="SelectionBase.update_gw_state-27"><a href="#SelectionBase.update_gw_state-27"><span class="linenos">27</span></a>
+</span><span id="SelectionBase.update_gw_state-28"><a href="#SelectionBase.update_gw_state-28"><span class="linenos">28</span></a><span class="sd">        Args:</span>
+</span><span id="SelectionBase.update_gw_state-29"><a href="#SelectionBase.update_gw_state-29"><span class="linenos">29</span></a><span class="sd">            gw_state (`torch.Tensor`): the previous GW state</span>
+</span><span id="SelectionBase.update_gw_state-30"><a href="#SelectionBase.update_gw_state-30"><span class="linenos">30</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="SelectionBase.update_gw_state-31"><a href="#SelectionBase.update_gw_state-31"><span class="linenos">31</span></a>        <span class="k">pass</span>
+</span></pre></div>
+
+
+            <div class="docstring"><p>Update the internal copy of the previous GW state.
+By default, this is not implemented and will raise an error if used.</p>
+
+<p>:note..
+    This is not defined as an abstractmethod as some selection method may
+    not need it.</p>
+
+<h6 id="arguments">Arguments:</h6>
+
+<ul>
+<li><strong>gw_state (<code>torch.Tensor</code>):</strong>  the previous GW state</li>
+</ul>
+</div>
+
+
+                            </div>
+                            <div id="SelectionBase.forward" class="classattr">
+                                        <input id="SelectionBase.forward-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
+<div class="attr function">
+                    <div class="decorator">@abstractmethod</div>
+
+        <span class="def">def</span>
+        <span class="name">forward</span><span class="signature pdoc-code multiline">(<span class="param">	<span class="bp">self</span>,</span><span class="param">	<span class="n">domains</span><span class="p">:</span> <span class="n">collections</span><span class="o">.</span><span class="n">abc</span><span class="o">.</span><span class="n">Mapping</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]</span>,</span><span class="param">	<span class="n">encodings_pre_fusion</span><span class="p">:</span> <span class="n">collections</span><span class="o">.</span><span class="n">abc</span><span class="o">.</span><span class="n">Mapping</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]</span></span><span class="return-annotation">) -> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]</span>:</span></span>
+
+                <label class="view-source-button" for="SelectionBase.forward-view-source"><span>View Source</span></label>
+
+    </div>
+    <a class="headerlink" href="#SelectionBase.forward"></a>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="SelectionBase.forward-33"><a href="#SelectionBase.forward-33"><span class="linenos">33</span></a>    <span class="nd">@abstractmethod</span>
+</span><span id="SelectionBase.forward-34"><a href="#SelectionBase.forward-34"><span class="linenos">34</span></a>    <span class="k">def</span> <span class="nf">forward</span><span class="p">(</span>
+</span><span id="SelectionBase.forward-35"><a href="#SelectionBase.forward-35"><span class="linenos">35</span></a>        <span class="bp">self</span><span class="p">,</span> <span class="n">domains</span><span class="p">:</span> <span class="n">LatentsDomainGroupT</span><span class="p">,</span> <span class="n">encodings_pre_fusion</span><span class="p">:</span> <span class="n">LatentsDomainGroupT</span>
+</span><span id="SelectionBase.forward-36"><a href="#SelectionBase.forward-36"><span class="linenos">36</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]:</span>
+</span><span id="SelectionBase.forward-37"><a href="#SelectionBase.forward-37"><span class="linenos">37</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="SelectionBase.forward-38"><a href="#SelectionBase.forward-38"><span class="linenos">38</span></a><span class="sd">        Forward pass of the selection method.</span>
+</span><span id="SelectionBase.forward-39"><a href="#SelectionBase.forward-39"><span class="linenos">39</span></a>
+</span><span id="SelectionBase.forward-40"><a href="#SelectionBase.forward-40"><span class="linenos">40</span></a><span class="sd">        Args:</span>
+</span><span id="SelectionBase.forward-41"><a href="#SelectionBase.forward-41"><span class="linenos">41</span></a><span class="sd">            domains (`LatentsDomainGroupT`): Group of unimodal latent representations.</span>
+</span><span id="SelectionBase.forward-42"><a href="#SelectionBase.forward-42"><span class="linenos">42</span></a>
+</span><span id="SelectionBase.forward-43"><a href="#SelectionBase.forward-43"><span class="linenos">43</span></a><span class="sd">        Returns:</span>
+</span><span id="SelectionBase.forward-44"><a href="#SelectionBase.forward-44"><span class="linenos">44</span></a><span class="sd">            `dict[str, torch.Tensor]`: for each domain in the group, the fusion</span>
+</span><span id="SelectionBase.forward-45"><a href="#SelectionBase.forward-45"><span class="linenos">45</span></a><span class="sd">            coefficient for each item in the batch.</span>
+</span><span id="SelectionBase.forward-46"><a href="#SelectionBase.forward-46"><span class="linenos">46</span></a>
+</span><span id="SelectionBase.forward-47"><a href="#SelectionBase.forward-47"><span class="linenos">47</span></a><span class="sd">        Example:</span>
+</span><span id="SelectionBase.forward-48"><a href="#SelectionBase.forward-48"><span class="linenos">48</span></a><span class="sd">            &gt;&gt;&gt; SomeSelectionImplementation().forward(</span>
+</span><span id="SelectionBase.forward-49"><a href="#SelectionBase.forward-49"><span class="linenos">49</span></a><span class="sd">            ...     {&quot;v&quot;: torch.randn(3, 4), &quot;t&quot;: torch.randn(3, 8)}</span>
+</span><span id="SelectionBase.forward-50"><a href="#SelectionBase.forward-50"><span class="linenos">50</span></a><span class="sd">            ... )</span>
+</span><span id="SelectionBase.forward-51"><a href="#SelectionBase.forward-51"><span class="linenos">51</span></a><span class="sd">            {&quot;v&quot;: torch.Tensor([0.0, 0.4, 1.0]), &quot;t&quot;: torch.Tensor([1.0, 0.6, 0.0])}</span>
+</span><span id="SelectionBase.forward-52"><a href="#SelectionBase.forward-52"><span class="linenos">52</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="SelectionBase.forward-53"><a href="#SelectionBase.forward-53"><span class="linenos">53</span></a>        <span class="o">...</span>
+</span></pre></div>
+
+
+            <div class="docstring"><p>Forward pass of the selection method.</p>
+
+<h6 id="arguments">Arguments:</h6>
+
+<ul>
+<li><strong>domains (<code>LatentsDomainGroupT</code>):</strong>  Group of unimodal latent representations.</li>
+</ul>
+
+<h6 id="returns">Returns:</h6>
+
+<blockquote>
+  <p><code>dict[str, torch.Tensor]</code>: for each domain in the group, the fusion
+  coefficient for each item in the batch.</p>
+</blockquote>
+
+<h6 id="example">Example:</h6>
+
+<blockquote>
+  <div class="pdoc-code codehilite">
+<pre><span></span><code><span class="gp">&gt;&gt;&gt; </span><span class="n">SomeSelectionImplementation</span><span class="p">()</span><span class="o">.</span><span class="n">forward</span><span class="p">(</span>
+<span class="gp">... </span>    <span class="p">{</span><span class="s2">&quot;v&quot;</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">randn</span><span class="p">(</span><span class="mi">3</span><span class="p">,</span> <span class="mi">4</span><span class="p">),</span> <span class="s2">&quot;t&quot;</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">randn</span><span class="p">(</span><span class="mi">3</span><span class="p">,</span> <span class="mi">8</span><span class="p">)}</span>
+<span class="gp">... </span><span class="p">)</span>
+<span class="go">{&quot;v&quot;: torch.Tensor([0.0, 0.4, 1.0]), &quot;t&quot;: torch.Tensor([1.0, 0.6, 0.0])}</span>
+</code></pre>
+  </div>
+</blockquote>
+</div>
+
+
+                            </div>
+                            <div class="inherited">
+                                <h5>Inherited Members</h5>
+                                <dl>
+                                    <div><dt>torch.nn.modules.module.Module</dt>
+                                <dd id="SelectionBase.__init__" class="function">Module</dd>
+                <dd id="SelectionBase.dump_patches" class="variable">dump_patches</dd>
+                <dd id="SelectionBase.training" class="variable">training</dd>
+                <dd id="SelectionBase.call_super_init" class="variable">call_super_init</dd>
+                <dd id="SelectionBase.register_buffer" class="function">register_buffer</dd>
+                <dd id="SelectionBase.register_parameter" class="function">register_parameter</dd>
+                <dd id="SelectionBase.add_module" class="function">add_module</dd>
+                <dd id="SelectionBase.register_module" class="function">register_module</dd>
+                <dd id="SelectionBase.get_submodule" class="function">get_submodule</dd>
+                <dd id="SelectionBase.get_parameter" class="function">get_parameter</dd>
+                <dd id="SelectionBase.get_buffer" class="function">get_buffer</dd>
+                <dd id="SelectionBase.get_extra_state" class="function">get_extra_state</dd>
+                <dd id="SelectionBase.set_extra_state" class="function">set_extra_state</dd>
+                <dd id="SelectionBase.apply" class="function">apply</dd>
+                <dd id="SelectionBase.cuda" class="function">cuda</dd>
+                <dd id="SelectionBase.ipu" class="function">ipu</dd>
+                <dd id="SelectionBase.xpu" class="function">xpu</dd>
+                <dd id="SelectionBase.cpu" class="function">cpu</dd>
+                <dd id="SelectionBase.type" class="function">type</dd>
+                <dd id="SelectionBase.float" class="function">float</dd>
+                <dd id="SelectionBase.double" class="function">double</dd>
+                <dd id="SelectionBase.half" class="function">half</dd>
+                <dd id="SelectionBase.bfloat16" class="function">bfloat16</dd>
+                <dd id="SelectionBase.to_empty" class="function">to_empty</dd>
+                <dd id="SelectionBase.to" class="function">to</dd>
+                <dd id="SelectionBase.register_full_backward_pre_hook" class="function">register_full_backward_pre_hook</dd>
+                <dd id="SelectionBase.register_backward_hook" class="function">register_backward_hook</dd>
+                <dd id="SelectionBase.register_full_backward_hook" class="function">register_full_backward_hook</dd>
+                <dd id="SelectionBase.register_forward_pre_hook" class="function">register_forward_pre_hook</dd>
+                <dd id="SelectionBase.register_forward_hook" class="function">register_forward_hook</dd>
+                <dd id="SelectionBase.register_state_dict_pre_hook" class="function">register_state_dict_pre_hook</dd>
+                <dd id="SelectionBase.state_dict" class="function">state_dict</dd>
+                <dd id="SelectionBase.register_load_state_dict_post_hook" class="function">register_load_state_dict_post_hook</dd>
+                <dd id="SelectionBase.load_state_dict" class="function">load_state_dict</dd>
+                <dd id="SelectionBase.parameters" class="function">parameters</dd>
+                <dd id="SelectionBase.named_parameters" class="function">named_parameters</dd>
+                <dd id="SelectionBase.buffers" class="function">buffers</dd>
+                <dd id="SelectionBase.named_buffers" class="function">named_buffers</dd>
+                <dd id="SelectionBase.children" class="function">children</dd>
+                <dd id="SelectionBase.named_children" class="function">named_children</dd>
+                <dd id="SelectionBase.modules" class="function">modules</dd>
+                <dd id="SelectionBase.named_modules" class="function">named_modules</dd>
+                <dd id="SelectionBase.train" class="function">train</dd>
+                <dd id="SelectionBase.eval" class="function">eval</dd>
+                <dd id="SelectionBase.requires_grad_" class="function">requires_grad_</dd>
+                <dd id="SelectionBase.zero_grad" class="function">zero_grad</dd>
+                <dd id="SelectionBase.share_memory" class="function">share_memory</dd>
+                <dd id="SelectionBase.extra_repr" class="function">extra_repr</dd>
+                <dd id="SelectionBase.compile" class="function">compile</dd>
+
+            </div>
+                                </dl>
+                            </div>
+                </section>
+                <section id="SingleDomainSelection">
+                            <input id="SingleDomainSelection-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
+<div class="attr class">
+            
+    <span class="def">class</span>
+    <span class="name">SingleDomainSelection</span><wbr>(<span class="base"><a href="#SelectionBase">SelectionBase</a></span>):
+
+                <label class="view-source-button" for="SingleDomainSelection-view-source"><span>View Source</span></label>
+
+    </div>
+    <a class="headerlink" href="#SingleDomainSelection"></a>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="SingleDomainSelection-62"><a href="#SingleDomainSelection-62"><span class="linenos">62</span></a><span class="k">class</span> <span class="nc">SingleDomainSelection</span><span class="p">(</span><span class="n">SelectionBase</span><span class="p">):</span>
+</span><span id="SingleDomainSelection-63"><a href="#SingleDomainSelection-63"><span class="linenos">63</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="SingleDomainSelection-64"><a href="#SingleDomainSelection-64"><span class="linenos">64</span></a><span class="sd">    This selection mechanism handles groups that can have multiple domains, but always</span>
+</span><span id="SingleDomainSelection-65"><a href="#SingleDomainSelection-65"><span class="linenos">65</span></a><span class="sd">    return a selection of 1 domain from the group with a uniform distribution.</span>
+</span><span id="SingleDomainSelection-66"><a href="#SingleDomainSelection-66"><span class="linenos">66</span></a>
+</span><span id="SingleDomainSelection-67"><a href="#SingleDomainSelection-67"><span class="linenos">67</span></a><span class="sd">    For example, if the group has 2 domains, there is a 50% chance of selecting each</span>
+</span><span id="SingleDomainSelection-68"><a href="#SingleDomainSelection-68"><span class="linenos">68</span></a><span class="sd">    domain.</span>
+</span><span id="SingleDomainSelection-69"><a href="#SingleDomainSelection-69"><span class="linenos">69</span></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="SingleDomainSelection-70"><a href="#SingleDomainSelection-70"><span class="linenos">70</span></a>
+</span><span id="SingleDomainSelection-71"><a href="#SingleDomainSelection-71"><span class="linenos">71</span></a>    <span class="k">def</span> <span class="nf">forward</span><span class="p">(</span>
+</span><span id="SingleDomainSelection-72"><a href="#SingleDomainSelection-72"><span class="linenos">72</span></a>        <span class="bp">self</span><span class="p">,</span> <span class="n">domains</span><span class="p">:</span> <span class="n">LatentsDomainGroupT</span><span class="p">,</span> <span class="n">encodings_pre_fusion</span><span class="p">:</span> <span class="n">LatentsDomainGroupT</span>
+</span><span id="SingleDomainSelection-73"><a href="#SingleDomainSelection-73"><span class="linenos">73</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]:</span>
+</span><span id="SingleDomainSelection-74"><a href="#SingleDomainSelection-74"><span class="linenos">74</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="SingleDomainSelection-75"><a href="#SingleDomainSelection-75"><span class="linenos">75</span></a><span class="sd">        Forward pass of the module.</span>
+</span><span id="SingleDomainSelection-76"><a href="#SingleDomainSelection-76"><span class="linenos">76</span></a>
+</span><span id="SingleDomainSelection-77"><a href="#SingleDomainSelection-77"><span class="linenos">77</span></a><span class="sd">        Args:</span>
+</span><span id="SingleDomainSelection-78"><a href="#SingleDomainSelection-78"><span class="linenos">78</span></a><span class="sd">            domains (`LatentsDomainGroupT`): input unimodal latent representations</span>
+</span><span id="SingleDomainSelection-79"><a href="#SingleDomainSelection-79"><span class="linenos">79</span></a><span class="sd">            gw_state (`torch.Tensor`): the previous GW state</span>
+</span><span id="SingleDomainSelection-80"><a href="#SingleDomainSelection-80"><span class="linenos">80</span></a>
+</span><span id="SingleDomainSelection-81"><a href="#SingleDomainSelection-81"><span class="linenos">81</span></a><span class="sd">        Returns:</span>
+</span><span id="SingleDomainSelection-82"><a href="#SingleDomainSelection-82"><span class="linenos">82</span></a><span class="sd">            `dict[str, torch.Tensor]`: whether the domain is selected for each input</span>
+</span><span id="SingleDomainSelection-83"><a href="#SingleDomainSelection-83"><span class="linenos">83</span></a><span class="sd">            in the batch.</span>
+</span><span id="SingleDomainSelection-84"><a href="#SingleDomainSelection-84"><span class="linenos">84</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="SingleDomainSelection-85"><a href="#SingleDomainSelection-85"><span class="linenos">85</span></a>        <span class="n">selection</span><span class="p">:</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]</span> <span class="o">=</span> <span class="p">{}</span>
+</span><span id="SingleDomainSelection-86"><a href="#SingleDomainSelection-86"><span class="linenos">86</span></a>        <span class="n">bs</span> <span class="o">=</span> <span class="n">group_batch_size</span><span class="p">(</span><span class="n">domains</span><span class="p">)</span>
+</span><span id="SingleDomainSelection-87"><a href="#SingleDomainSelection-87"><span class="linenos">87</span></a>        <span class="n">choice</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">randint</span><span class="p">(</span><span class="nb">len</span><span class="p">(</span><span class="n">domains</span><span class="p">),</span> <span class="n">size</span><span class="o">=</span><span class="p">(</span><span class="n">bs</span><span class="p">,),</span> <span class="n">device</span><span class="o">=</span><span class="n">group_device</span><span class="p">(</span><span class="n">domains</span><span class="p">))</span>
+</span><span id="SingleDomainSelection-88"><a href="#SingleDomainSelection-88"><span class="linenos">88</span></a>        <span class="k">for</span> <span class="n">k</span><span class="p">,</span> <span class="n">domain</span> <span class="ow">in</span> <span class="nb">enumerate</span><span class="p">(</span><span class="n">domains</span><span class="o">.</span><span class="n">keys</span><span class="p">()):</span>
+</span><span id="SingleDomainSelection-89"><a href="#SingleDomainSelection-89"><span class="linenos">89</span></a>            <span class="n">selection</span><span class="p">[</span><span class="n">domain</span><span class="p">]</span> <span class="o">=</span> <span class="p">(</span><span class="n">choice</span> <span class="o">==</span> <span class="n">k</span><span class="p">)</span><span class="o">.</span><span class="n">to</span><span class="p">(</span><span class="n">torch</span><span class="o">.</span><span class="n">float32</span><span class="p">)</span>
+</span><span id="SingleDomainSelection-90"><a href="#SingleDomainSelection-90"><span class="linenos">90</span></a>        <span class="k">return</span> <span class="n">selection</span>
+</span></pre></div>
+
+
+            <div class="docstring"><p>This selection mechanism handles groups that can have multiple domains, but always
+return a selection of 1 domain from the group with a uniform distribution.</p>
+
+<p>For example, if the group has 2 domains, there is a 50% chance of selecting each
+domain.</p>
+</div>
+
+
+                            <div id="SingleDomainSelection.forward" class="classattr">
+                                        <input id="SingleDomainSelection.forward-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
+<div class="attr function">
+            
+        <span class="def">def</span>
+        <span class="name">forward</span><span class="signature pdoc-code multiline">(<span class="param">	<span class="bp">self</span>,</span><span class="param">	<span class="n">domains</span><span class="p">:</span> <span class="n">collections</span><span class="o">.</span><span class="n">abc</span><span class="o">.</span><span class="n">Mapping</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]</span>,</span><span class="param">	<span class="n">encodings_pre_fusion</span><span class="p">:</span> <span class="n">collections</span><span class="o">.</span><span class="n">abc</span><span class="o">.</span><span class="n">Mapping</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]</span></span><span class="return-annotation">) -> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]</span>:</span></span>
+
+                <label class="view-source-button" for="SingleDomainSelection.forward-view-source"><span>View Source</span></label>
+
+    </div>
+    <a class="headerlink" href="#SingleDomainSelection.forward"></a>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="SingleDomainSelection.forward-71"><a href="#SingleDomainSelection.forward-71"><span class="linenos">71</span></a>    <span class="k">def</span> <span class="nf">forward</span><span class="p">(</span>
+</span><span id="SingleDomainSelection.forward-72"><a href="#SingleDomainSelection.forward-72"><span class="linenos">72</span></a>        <span class="bp">self</span><span class="p">,</span> <span class="n">domains</span><span class="p">:</span> <span class="n">LatentsDomainGroupT</span><span class="p">,</span> <span class="n">encodings_pre_fusion</span><span class="p">:</span> <span class="n">LatentsDomainGroupT</span>
+</span><span id="SingleDomainSelection.forward-73"><a href="#SingleDomainSelection.forward-73"><span class="linenos">73</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]:</span>
+</span><span id="SingleDomainSelection.forward-74"><a href="#SingleDomainSelection.forward-74"><span class="linenos">74</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="SingleDomainSelection.forward-75"><a href="#SingleDomainSelection.forward-75"><span class="linenos">75</span></a><span class="sd">        Forward pass of the module.</span>
+</span><span id="SingleDomainSelection.forward-76"><a href="#SingleDomainSelection.forward-76"><span class="linenos">76</span></a>
+</span><span id="SingleDomainSelection.forward-77"><a href="#SingleDomainSelection.forward-77"><span class="linenos">77</span></a><span class="sd">        Args:</span>
+</span><span id="SingleDomainSelection.forward-78"><a href="#SingleDomainSelection.forward-78"><span class="linenos">78</span></a><span class="sd">            domains (`LatentsDomainGroupT`): input unimodal latent representations</span>
+</span><span id="SingleDomainSelection.forward-79"><a href="#SingleDomainSelection.forward-79"><span class="linenos">79</span></a><span class="sd">            gw_state (`torch.Tensor`): the previous GW state</span>
+</span><span id="SingleDomainSelection.forward-80"><a href="#SingleDomainSelection.forward-80"><span class="linenos">80</span></a>
+</span><span id="SingleDomainSelection.forward-81"><a href="#SingleDomainSelection.forward-81"><span class="linenos">81</span></a><span class="sd">        Returns:</span>
+</span><span id="SingleDomainSelection.forward-82"><a href="#SingleDomainSelection.forward-82"><span class="linenos">82</span></a><span class="sd">            `dict[str, torch.Tensor]`: whether the domain is selected for each input</span>
+</span><span id="SingleDomainSelection.forward-83"><a href="#SingleDomainSelection.forward-83"><span class="linenos">83</span></a><span class="sd">            in the batch.</span>
+</span><span id="SingleDomainSelection.forward-84"><a href="#SingleDomainSelection.forward-84"><span class="linenos">84</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="SingleDomainSelection.forward-85"><a href="#SingleDomainSelection.forward-85"><span class="linenos">85</span></a>        <span class="n">selection</span><span class="p">:</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]</span> <span class="o">=</span> <span class="p">{}</span>
+</span><span id="SingleDomainSelection.forward-86"><a href="#SingleDomainSelection.forward-86"><span class="linenos">86</span></a>        <span class="n">bs</span> <span class="o">=</span> <span class="n">group_batch_size</span><span class="p">(</span><span class="n">domains</span><span class="p">)</span>
+</span><span id="SingleDomainSelection.forward-87"><a href="#SingleDomainSelection.forward-87"><span class="linenos">87</span></a>        <span class="n">choice</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">randint</span><span class="p">(</span><span class="nb">len</span><span class="p">(</span><span class="n">domains</span><span class="p">),</span> <span class="n">size</span><span class="o">=</span><span class="p">(</span><span class="n">bs</span><span class="p">,),</span> <span class="n">device</span><span class="o">=</span><span class="n">group_device</span><span class="p">(</span><span class="n">domains</span><span class="p">))</span>
+</span><span id="SingleDomainSelection.forward-88"><a href="#SingleDomainSelection.forward-88"><span class="linenos">88</span></a>        <span class="k">for</span> <span class="n">k</span><span class="p">,</span> <span class="n">domain</span> <span class="ow">in</span> <span class="nb">enumerate</span><span class="p">(</span><span class="n">domains</span><span class="o">.</span><span class="n">keys</span><span class="p">()):</span>
+</span><span id="SingleDomainSelection.forward-89"><a href="#SingleDomainSelection.forward-89"><span class="linenos">89</span></a>            <span class="n">selection</span><span class="p">[</span><span class="n">domain</span><span class="p">]</span> <span class="o">=</span> <span class="p">(</span><span class="n">choice</span> <span class="o">==</span> <span class="n">k</span><span class="p">)</span><span class="o">.</span><span class="n">to</span><span class="p">(</span><span class="n">torch</span><span class="o">.</span><span class="n">float32</span><span class="p">)</span>
+</span><span id="SingleDomainSelection.forward-90"><a href="#SingleDomainSelection.forward-90"><span class="linenos">90</span></a>        <span class="k">return</span> <span class="n">selection</span>
+</span></pre></div>
+
+
+            <div class="docstring"><p>Forward pass of the module.</p>
+
+<h6 id="arguments">Arguments:</h6>
+
+<ul>
+<li><strong>domains (<code>LatentsDomainGroupT</code>):</strong>  input unimodal latent representations</li>
+<li><strong>gw_state (<code>torch.Tensor</code>):</strong>  the previous GW state</li>
+</ul>
+
+<h6 id="returns">Returns:</h6>
+
+<blockquote>
+  <p><code>dict[str, torch.Tensor]</code>: whether the domain is selected for each input
+  in the batch.</p>
+</blockquote>
+</div>
+
+
+                            </div>
+                            <div class="inherited">
+                                <h5>Inherited Members</h5>
+                                <dl>
+                                    <div><dt>torch.nn.modules.module.Module</dt>
+                                <dd id="SingleDomainSelection.__init__" class="function">Module</dd>
+                <dd id="SingleDomainSelection.dump_patches" class="variable">dump_patches</dd>
+                <dd id="SingleDomainSelection.training" class="variable">training</dd>
+                <dd id="SingleDomainSelection.call_super_init" class="variable">call_super_init</dd>
+                <dd id="SingleDomainSelection.register_buffer" class="function">register_buffer</dd>
+                <dd id="SingleDomainSelection.register_parameter" class="function">register_parameter</dd>
+                <dd id="SingleDomainSelection.add_module" class="function">add_module</dd>
+                <dd id="SingleDomainSelection.register_module" class="function">register_module</dd>
+                <dd id="SingleDomainSelection.get_submodule" class="function">get_submodule</dd>
+                <dd id="SingleDomainSelection.get_parameter" class="function">get_parameter</dd>
+                <dd id="SingleDomainSelection.get_buffer" class="function">get_buffer</dd>
+                <dd id="SingleDomainSelection.get_extra_state" class="function">get_extra_state</dd>
+                <dd id="SingleDomainSelection.set_extra_state" class="function">set_extra_state</dd>
+                <dd id="SingleDomainSelection.apply" class="function">apply</dd>
+                <dd id="SingleDomainSelection.cuda" class="function">cuda</dd>
+                <dd id="SingleDomainSelection.ipu" class="function">ipu</dd>
+                <dd id="SingleDomainSelection.xpu" class="function">xpu</dd>
+                <dd id="SingleDomainSelection.cpu" class="function">cpu</dd>
+                <dd id="SingleDomainSelection.type" class="function">type</dd>
+                <dd id="SingleDomainSelection.float" class="function">float</dd>
+                <dd id="SingleDomainSelection.double" class="function">double</dd>
+                <dd id="SingleDomainSelection.half" class="function">half</dd>
+                <dd id="SingleDomainSelection.bfloat16" class="function">bfloat16</dd>
+                <dd id="SingleDomainSelection.to_empty" class="function">to_empty</dd>
+                <dd id="SingleDomainSelection.to" class="function">to</dd>
+                <dd id="SingleDomainSelection.register_full_backward_pre_hook" class="function">register_full_backward_pre_hook</dd>
+                <dd id="SingleDomainSelection.register_backward_hook" class="function">register_backward_hook</dd>
+                <dd id="SingleDomainSelection.register_full_backward_hook" class="function">register_full_backward_hook</dd>
+                <dd id="SingleDomainSelection.register_forward_pre_hook" class="function">register_forward_pre_hook</dd>
+                <dd id="SingleDomainSelection.register_forward_hook" class="function">register_forward_hook</dd>
+                <dd id="SingleDomainSelection.register_state_dict_pre_hook" class="function">register_state_dict_pre_hook</dd>
+                <dd id="SingleDomainSelection.state_dict" class="function">state_dict</dd>
+                <dd id="SingleDomainSelection.register_load_state_dict_post_hook" class="function">register_load_state_dict_post_hook</dd>
+                <dd id="SingleDomainSelection.load_state_dict" class="function">load_state_dict</dd>
+                <dd id="SingleDomainSelection.parameters" class="function">parameters</dd>
+                <dd id="SingleDomainSelection.named_parameters" class="function">named_parameters</dd>
+                <dd id="SingleDomainSelection.buffers" class="function">buffers</dd>
+                <dd id="SingleDomainSelection.named_buffers" class="function">named_buffers</dd>
+                <dd id="SingleDomainSelection.children" class="function">children</dd>
+                <dd id="SingleDomainSelection.named_children" class="function">named_children</dd>
+                <dd id="SingleDomainSelection.modules" class="function">modules</dd>
+                <dd id="SingleDomainSelection.named_modules" class="function">named_modules</dd>
+                <dd id="SingleDomainSelection.train" class="function">train</dd>
+                <dd id="SingleDomainSelection.eval" class="function">eval</dd>
+                <dd id="SingleDomainSelection.requires_grad_" class="function">requires_grad_</dd>
+                <dd id="SingleDomainSelection.zero_grad" class="function">zero_grad</dd>
+                <dd id="SingleDomainSelection.share_memory" class="function">share_memory</dd>
+                <dd id="SingleDomainSelection.extra_repr" class="function">extra_repr</dd>
+                <dd id="SingleDomainSelection.compile" class="function">compile</dd>
+
+            </div>
+            <div><dt><a href="#SelectionBase">SelectionBase</a></dt>
+                                <dd id="SingleDomainSelection.update_gw_state" class="function"><a href="#SelectionBase.update_gw_state">update_gw_state</a></dd>
+
+            </div>
+                                </dl>
+                            </div>
+                </section>
+                <section id="FixedSharedSelection">
+                            <input id="FixedSharedSelection-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
+<div class="attr class">
+            
+    <span class="def">class</span>
+    <span class="name">FixedSharedSelection</span><wbr>(<span class="base"><a href="#SelectionBase">SelectionBase</a></span>):
+
+                <label class="view-source-button" for="FixedSharedSelection-view-source"><span>View Source</span></label>
+
+    </div>
+    <a class="headerlink" href="#FixedSharedSelection"></a>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="FixedSharedSelection-93"><a href="#FixedSharedSelection-93"><span class="linenos"> 93</span></a><span class="k">class</span> <span class="nc">FixedSharedSelection</span><span class="p">(</span><span class="n">SelectionBase</span><span class="p">):</span>
+</span><span id="FixedSharedSelection-94"><a href="#FixedSharedSelection-94"><span class="linenos"> 94</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="FixedSharedSelection-95"><a href="#FixedSharedSelection-95"><span class="linenos"> 95</span></a><span class="sd">    This selection mechanism is deterministic and always shares the weights equally</span>
+</span><span id="FixedSharedSelection-96"><a href="#FixedSharedSelection-96"><span class="linenos"> 96</span></a><span class="sd">    between domains.</span>
+</span><span id="FixedSharedSelection-97"><a href="#FixedSharedSelection-97"><span class="linenos"> 97</span></a>
+</span><span id="FixedSharedSelection-98"><a href="#FixedSharedSelection-98"><span class="linenos"> 98</span></a><span class="sd">    For example, if 2 domains, it gives 0.5 for each; 3 domains, 1/3 for each...</span>
+</span><span id="FixedSharedSelection-99"><a href="#FixedSharedSelection-99"><span class="linenos"> 99</span></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="FixedSharedSelection-100"><a href="#FixedSharedSelection-100"><span class="linenos">100</span></a>
+</span><span id="FixedSharedSelection-101"><a href="#FixedSharedSelection-101"><span class="linenos">101</span></a>    <span class="k">def</span> <span class="nf">forward</span><span class="p">(</span>
+</span><span id="FixedSharedSelection-102"><a href="#FixedSharedSelection-102"><span class="linenos">102</span></a>        <span class="bp">self</span><span class="p">,</span> <span class="n">domains</span><span class="p">:</span> <span class="n">LatentsDomainGroupT</span><span class="p">,</span> <span class="n">encodings_pre_fusion</span><span class="p">:</span> <span class="n">LatentsDomainGroupT</span>
+</span><span id="FixedSharedSelection-103"><a href="#FixedSharedSelection-103"><span class="linenos">103</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]:</span>
+</span><span id="FixedSharedSelection-104"><a href="#FixedSharedSelection-104"><span class="linenos">104</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="FixedSharedSelection-105"><a href="#FixedSharedSelection-105"><span class="linenos">105</span></a><span class="sd">        Forward pass of the module.</span>
+</span><span id="FixedSharedSelection-106"><a href="#FixedSharedSelection-106"><span class="linenos">106</span></a>
+</span><span id="FixedSharedSelection-107"><a href="#FixedSharedSelection-107"><span class="linenos">107</span></a><span class="sd">        Args:</span>
+</span><span id="FixedSharedSelection-108"><a href="#FixedSharedSelection-108"><span class="linenos">108</span></a><span class="sd">            domains (`LatentsDomainGroupT`): input unimodal latent representations</span>
+</span><span id="FixedSharedSelection-109"><a href="#FixedSharedSelection-109"><span class="linenos">109</span></a><span class="sd">            gw_state (`torch.Tensor`): the previous GW state</span>
+</span><span id="FixedSharedSelection-110"><a href="#FixedSharedSelection-110"><span class="linenos">110</span></a>
+</span><span id="FixedSharedSelection-111"><a href="#FixedSharedSelection-111"><span class="linenos">111</span></a><span class="sd">        Returns:</span>
+</span><span id="FixedSharedSelection-112"><a href="#FixedSharedSelection-112"><span class="linenos">112</span></a><span class="sd">            `dict[str, torch.Tensor]`: whether the domain is selected for each input</span>
+</span><span id="FixedSharedSelection-113"><a href="#FixedSharedSelection-113"><span class="linenos">113</span></a><span class="sd">            in the batch.</span>
+</span><span id="FixedSharedSelection-114"><a href="#FixedSharedSelection-114"><span class="linenos">114</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="FixedSharedSelection-115"><a href="#FixedSharedSelection-115"><span class="linenos">115</span></a>        <span class="n">selection</span><span class="p">:</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]</span> <span class="o">=</span> <span class="p">{}</span>
+</span><span id="FixedSharedSelection-116"><a href="#FixedSharedSelection-116"><span class="linenos">116</span></a>        <span class="n">bs</span> <span class="o">=</span> <span class="n">group_batch_size</span><span class="p">(</span><span class="n">domains</span><span class="p">)</span>
+</span><span id="FixedSharedSelection-117"><a href="#FixedSharedSelection-117"><span class="linenos">117</span></a>        <span class="n">coef</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">full</span><span class="p">((</span><span class="n">bs</span><span class="p">,),</span> <span class="mf">1.0</span> <span class="o">/</span> <span class="nb">len</span><span class="p">(</span><span class="n">domains</span><span class="p">),</span> <span class="n">device</span><span class="o">=</span><span class="n">group_device</span><span class="p">(</span><span class="n">domains</span><span class="p">))</span>
+</span><span id="FixedSharedSelection-118"><a href="#FixedSharedSelection-118"><span class="linenos">118</span></a>        <span class="k">for</span> <span class="n">domain</span> <span class="ow">in</span> <span class="n">domains</span><span class="p">:</span>
+</span><span id="FixedSharedSelection-119"><a href="#FixedSharedSelection-119"><span class="linenos">119</span></a>            <span class="n">selection</span><span class="p">[</span><span class="n">domain</span><span class="p">]</span> <span class="o">=</span> <span class="n">coef</span><span class="o">.</span><span class="n">clone</span><span class="p">()</span>
+</span><span id="FixedSharedSelection-120"><a href="#FixedSharedSelection-120"><span class="linenos">120</span></a>        <span class="k">return</span> <span class="n">selection</span>
+</span></pre></div>
+
+
+            <div class="docstring"><p>This selection mechanism is deterministic and always shares the weights equally
+between domains.</p>
+
+<p>For example, if 2 domains, it gives 0.5 for each; 3 domains, 1/3 for each...</p>
+</div>
+
+
+                            <div id="FixedSharedSelection.forward" class="classattr">
+                                        <input id="FixedSharedSelection.forward-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
+<div class="attr function">
+            
+        <span class="def">def</span>
+        <span class="name">forward</span><span class="signature pdoc-code multiline">(<span class="param">	<span class="bp">self</span>,</span><span class="param">	<span class="n">domains</span><span class="p">:</span> <span class="n">collections</span><span class="o">.</span><span class="n">abc</span><span class="o">.</span><span class="n">Mapping</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]</span>,</span><span class="param">	<span class="n">encodings_pre_fusion</span><span class="p">:</span> <span class="n">collections</span><span class="o">.</span><span class="n">abc</span><span class="o">.</span><span class="n">Mapping</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]</span></span><span class="return-annotation">) -> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]</span>:</span></span>
+
+                <label class="view-source-button" for="FixedSharedSelection.forward-view-source"><span>View Source</span></label>
+
+    </div>
+    <a class="headerlink" href="#FixedSharedSelection.forward"></a>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="FixedSharedSelection.forward-101"><a href="#FixedSharedSelection.forward-101"><span class="linenos">101</span></a>    <span class="k">def</span> <span class="nf">forward</span><span class="p">(</span>
+</span><span id="FixedSharedSelection.forward-102"><a href="#FixedSharedSelection.forward-102"><span class="linenos">102</span></a>        <span class="bp">self</span><span class="p">,</span> <span class="n">domains</span><span class="p">:</span> <span class="n">LatentsDomainGroupT</span><span class="p">,</span> <span class="n">encodings_pre_fusion</span><span class="p">:</span> <span class="n">LatentsDomainGroupT</span>
+</span><span id="FixedSharedSelection.forward-103"><a href="#FixedSharedSelection.forward-103"><span class="linenos">103</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]:</span>
+</span><span id="FixedSharedSelection.forward-104"><a href="#FixedSharedSelection.forward-104"><span class="linenos">104</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="FixedSharedSelection.forward-105"><a href="#FixedSharedSelection.forward-105"><span class="linenos">105</span></a><span class="sd">        Forward pass of the module.</span>
+</span><span id="FixedSharedSelection.forward-106"><a href="#FixedSharedSelection.forward-106"><span class="linenos">106</span></a>
+</span><span id="FixedSharedSelection.forward-107"><a href="#FixedSharedSelection.forward-107"><span class="linenos">107</span></a><span class="sd">        Args:</span>
+</span><span id="FixedSharedSelection.forward-108"><a href="#FixedSharedSelection.forward-108"><span class="linenos">108</span></a><span class="sd">            domains (`LatentsDomainGroupT`): input unimodal latent representations</span>
+</span><span id="FixedSharedSelection.forward-109"><a href="#FixedSharedSelection.forward-109"><span class="linenos">109</span></a><span class="sd">            gw_state (`torch.Tensor`): the previous GW state</span>
+</span><span id="FixedSharedSelection.forward-110"><a href="#FixedSharedSelection.forward-110"><span class="linenos">110</span></a>
+</span><span id="FixedSharedSelection.forward-111"><a href="#FixedSharedSelection.forward-111"><span class="linenos">111</span></a><span class="sd">        Returns:</span>
+</span><span id="FixedSharedSelection.forward-112"><a href="#FixedSharedSelection.forward-112"><span class="linenos">112</span></a><span class="sd">            `dict[str, torch.Tensor]`: whether the domain is selected for each input</span>
+</span><span id="FixedSharedSelection.forward-113"><a href="#FixedSharedSelection.forward-113"><span class="linenos">113</span></a><span class="sd">            in the batch.</span>
+</span><span id="FixedSharedSelection.forward-114"><a href="#FixedSharedSelection.forward-114"><span class="linenos">114</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="FixedSharedSelection.forward-115"><a href="#FixedSharedSelection.forward-115"><span class="linenos">115</span></a>        <span class="n">selection</span><span class="p">:</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]</span> <span class="o">=</span> <span class="p">{}</span>
+</span><span id="FixedSharedSelection.forward-116"><a href="#FixedSharedSelection.forward-116"><span class="linenos">116</span></a>        <span class="n">bs</span> <span class="o">=</span> <span class="n">group_batch_size</span><span class="p">(</span><span class="n">domains</span><span class="p">)</span>
+</span><span id="FixedSharedSelection.forward-117"><a href="#FixedSharedSelection.forward-117"><span class="linenos">117</span></a>        <span class="n">coef</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">full</span><span class="p">((</span><span class="n">bs</span><span class="p">,),</span> <span class="mf">1.0</span> <span class="o">/</span> <span class="nb">len</span><span class="p">(</span><span class="n">domains</span><span class="p">),</span> <span class="n">device</span><span class="o">=</span><span class="n">group_device</span><span class="p">(</span><span class="n">domains</span><span class="p">))</span>
+</span><span id="FixedSharedSelection.forward-118"><a href="#FixedSharedSelection.forward-118"><span class="linenos">118</span></a>        <span class="k">for</span> <span class="n">domain</span> <span class="ow">in</span> <span class="n">domains</span><span class="p">:</span>
+</span><span id="FixedSharedSelection.forward-119"><a href="#FixedSharedSelection.forward-119"><span class="linenos">119</span></a>            <span class="n">selection</span><span class="p">[</span><span class="n">domain</span><span class="p">]</span> <span class="o">=</span> <span class="n">coef</span><span class="o">.</span><span class="n">clone</span><span class="p">()</span>
+</span><span id="FixedSharedSelection.forward-120"><a href="#FixedSharedSelection.forward-120"><span class="linenos">120</span></a>        <span class="k">return</span> <span class="n">selection</span>
+</span></pre></div>
+
+
+            <div class="docstring"><p>Forward pass of the module.</p>
+
+<h6 id="arguments">Arguments:</h6>
+
+<ul>
+<li><strong>domains (<code>LatentsDomainGroupT</code>):</strong>  input unimodal latent representations</li>
+<li><strong>gw_state (<code>torch.Tensor</code>):</strong>  the previous GW state</li>
+</ul>
+
+<h6 id="returns">Returns:</h6>
+
+<blockquote>
+  <p><code>dict[str, torch.Tensor]</code>: whether the domain is selected for each input
+  in the batch.</p>
+</blockquote>
+</div>
+
+
+                            </div>
+                            <div class="inherited">
+                                <h5>Inherited Members</h5>
+                                <dl>
+                                    <div><dt>torch.nn.modules.module.Module</dt>
+                                <dd id="FixedSharedSelection.__init__" class="function">Module</dd>
+                <dd id="FixedSharedSelection.dump_patches" class="variable">dump_patches</dd>
+                <dd id="FixedSharedSelection.training" class="variable">training</dd>
+                <dd id="FixedSharedSelection.call_super_init" class="variable">call_super_init</dd>
+                <dd id="FixedSharedSelection.register_buffer" class="function">register_buffer</dd>
+                <dd id="FixedSharedSelection.register_parameter" class="function">register_parameter</dd>
+                <dd id="FixedSharedSelection.add_module" class="function">add_module</dd>
+                <dd id="FixedSharedSelection.register_module" class="function">register_module</dd>
+                <dd id="FixedSharedSelection.get_submodule" class="function">get_submodule</dd>
+                <dd id="FixedSharedSelection.get_parameter" class="function">get_parameter</dd>
+                <dd id="FixedSharedSelection.get_buffer" class="function">get_buffer</dd>
+                <dd id="FixedSharedSelection.get_extra_state" class="function">get_extra_state</dd>
+                <dd id="FixedSharedSelection.set_extra_state" class="function">set_extra_state</dd>
+                <dd id="FixedSharedSelection.apply" class="function">apply</dd>
+                <dd id="FixedSharedSelection.cuda" class="function">cuda</dd>
+                <dd id="FixedSharedSelection.ipu" class="function">ipu</dd>
+                <dd id="FixedSharedSelection.xpu" class="function">xpu</dd>
+                <dd id="FixedSharedSelection.cpu" class="function">cpu</dd>
+                <dd id="FixedSharedSelection.type" class="function">type</dd>
+                <dd id="FixedSharedSelection.float" class="function">float</dd>
+                <dd id="FixedSharedSelection.double" class="function">double</dd>
+                <dd id="FixedSharedSelection.half" class="function">half</dd>
+                <dd id="FixedSharedSelection.bfloat16" class="function">bfloat16</dd>
+                <dd id="FixedSharedSelection.to_empty" class="function">to_empty</dd>
+                <dd id="FixedSharedSelection.to" class="function">to</dd>
+                <dd id="FixedSharedSelection.register_full_backward_pre_hook" class="function">register_full_backward_pre_hook</dd>
+                <dd id="FixedSharedSelection.register_backward_hook" class="function">register_backward_hook</dd>
+                <dd id="FixedSharedSelection.register_full_backward_hook" class="function">register_full_backward_hook</dd>
+                <dd id="FixedSharedSelection.register_forward_pre_hook" class="function">register_forward_pre_hook</dd>
+                <dd id="FixedSharedSelection.register_forward_hook" class="function">register_forward_hook</dd>
+                <dd id="FixedSharedSelection.register_state_dict_pre_hook" class="function">register_state_dict_pre_hook</dd>
+                <dd id="FixedSharedSelection.state_dict" class="function">state_dict</dd>
+                <dd id="FixedSharedSelection.register_load_state_dict_post_hook" class="function">register_load_state_dict_post_hook</dd>
+                <dd id="FixedSharedSelection.load_state_dict" class="function">load_state_dict</dd>
+                <dd id="FixedSharedSelection.parameters" class="function">parameters</dd>
+                <dd id="FixedSharedSelection.named_parameters" class="function">named_parameters</dd>
+                <dd id="FixedSharedSelection.buffers" class="function">buffers</dd>
+                <dd id="FixedSharedSelection.named_buffers" class="function">named_buffers</dd>
+                <dd id="FixedSharedSelection.children" class="function">children</dd>
+                <dd id="FixedSharedSelection.named_children" class="function">named_children</dd>
+                <dd id="FixedSharedSelection.modules" class="function">modules</dd>
+                <dd id="FixedSharedSelection.named_modules" class="function">named_modules</dd>
+                <dd id="FixedSharedSelection.train" class="function">train</dd>
+                <dd id="FixedSharedSelection.eval" class="function">eval</dd>
+                <dd id="FixedSharedSelection.requires_grad_" class="function">requires_grad_</dd>
+                <dd id="FixedSharedSelection.zero_grad" class="function">zero_grad</dd>
+                <dd id="FixedSharedSelection.share_memory" class="function">share_memory</dd>
+                <dd id="FixedSharedSelection.extra_repr" class="function">extra_repr</dd>
+                <dd id="FixedSharedSelection.compile" class="function">compile</dd>
+
+            </div>
+            <div><dt><a href="#SelectionBase">SelectionBase</a></dt>
+                                <dd id="FixedSharedSelection.update_gw_state" class="function"><a href="#SelectionBase.update_gw_state">update_gw_state</a></dd>
+
+            </div>
+                                </dl>
+                            </div>
+                </section>
+                <section id="KQFixedQSelection">
+                            <input id="KQFixedQSelection-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
+<div class="attr class">
+            
+    <span class="def">class</span>
+    <span class="name">KQFixedQSelection</span><wbr>(<span class="base"><a href="#SelectionBase">SelectionBase</a></span>):
+
+                <label class="view-source-button" for="KQFixedQSelection-view-source"><span>View Source</span></label>
+
+    </div>
+    <a class="headerlink" href="#KQFixedQSelection"></a>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="KQFixedQSelection-152"><a href="#KQFixedQSelection-152"><span class="linenos">152</span></a><span class="k">class</span> <span class="nc">KQFixedQSelection</span><span class="p">(</span><span class="n">SelectionBase</span><span class="p">):</span>
+</span><span id="KQFixedQSelection-153"><a href="#KQFixedQSelection-153"><span class="linenos">153</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="KQFixedQSelection-154"><a href="#KQFixedQSelection-154"><span class="linenos">154</span></a><span class="sd">    Key-Query attention with a fixed gw vector.</span>
+</span><span id="KQFixedQSelection-155"><a href="#KQFixedQSelection-155"><span class="linenos">155</span></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="KQFixedQSelection-156"><a href="#KQFixedQSelection-156"><span class="linenos">156</span></a>
+</span><span id="KQFixedQSelection-157"><a href="#KQFixedQSelection-157"><span class="linenos">157</span></a>    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">head_size</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span> <span class="n">domain_dim</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span> <span class="n">domain_names</span><span class="p">:</span> <span class="n">Iterable</span><span class="p">[</span><span class="nb">str</span><span class="p">]):</span>
+</span><span id="KQFixedQSelection-158"><a href="#KQFixedQSelection-158"><span class="linenos">158</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="KQFixedQSelection-159"><a href="#KQFixedQSelection-159"><span class="linenos">159</span></a><span class="sd">        Args:</span>
+</span><span id="KQFixedQSelection-160"><a href="#KQFixedQSelection-160"><span class="linenos">160</span></a><span class="sd">            head_size (`int`) : dimension of the key and query vectors.</span>
+</span><span id="KQFixedQSelection-161"><a href="#KQFixedQSelection-161"><span class="linenos">161</span></a><span class="sd">            domain_dim (`int`) : dimension of the input dims (assumed to be the same</span>
+</span><span id="KQFixedQSelection-162"><a href="#KQFixedQSelection-162"><span class="linenos">162</span></a><span class="sd">                for now)</span>
+</span><span id="KQFixedQSelection-163"><a href="#KQFixedQSelection-163"><span class="linenos">163</span></a><span class="sd">            domain_names  (`Iterable[str]`) : list of input domains</span>
+</span><span id="KQFixedQSelection-164"><a href="#KQFixedQSelection-164"><span class="linenos">164</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="KQFixedQSelection-165"><a href="#KQFixedQSelection-165"><span class="linenos">165</span></a>        <span class="nb">super</span><span class="p">()</span><span class="o">.</span><span class="fm">__init__</span><span class="p">()</span>
+</span><span id="KQFixedQSelection-166"><a href="#KQFixedQSelection-166"><span class="linenos">166</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">head_size</span> <span class="o">=</span> <span class="n">head_size</span>
+</span><span id="KQFixedQSelection-167"><a href="#KQFixedQSelection-167"><span class="linenos">167</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">query_layer</span> <span class="o">=</span> <span class="n">nn</span><span class="o">.</span><span class="n">Linear</span><span class="p">(</span><span class="n">domain_dim</span><span class="p">,</span> <span class="n">head_size</span><span class="p">)</span>
+</span><span id="KQFixedQSelection-168"><a href="#KQFixedQSelection-168"><span class="linenos">168</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">key_layers</span> <span class="o">=</span> <span class="n">nn</span><span class="o">.</span><span class="n">ModuleDict</span><span class="p">(</span>
+</span><span id="KQFixedQSelection-169"><a href="#KQFixedQSelection-169"><span class="linenos">169</span></a>            <span class="p">{</span><span class="n">domain</span><span class="p">:</span> <span class="n">nn</span><span class="o">.</span><span class="n">Linear</span><span class="p">(</span><span class="n">domain_dim</span><span class="p">,</span> <span class="n">head_size</span><span class="p">)</span> <span class="k">for</span> <span class="n">domain</span> <span class="ow">in</span> <span class="n">domain_names</span><span class="p">}</span>
+</span><span id="KQFixedQSelection-170"><a href="#KQFixedQSelection-170"><span class="linenos">170</span></a>        <span class="p">)</span>
+</span><span id="KQFixedQSelection-171"><a href="#KQFixedQSelection-171"><span class="linenos">171</span></a>        <span class="c1"># Start with a random gw state</span>
+</span><span id="KQFixedQSelection-172"><a href="#KQFixedQSelection-172"><span class="linenos">172</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">register_buffer</span><span class="p">(</span><span class="s2">&quot;initial_gw_state&quot;</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">rand</span><span class="p">(</span><span class="n">domain_dim</span><span class="p">))</span>
+</span><span id="KQFixedQSelection-173"><a href="#KQFixedQSelection-173"><span class="linenos">173</span></a>
+</span><span id="KQFixedQSelection-174"><a href="#KQFixedQSelection-174"><span class="linenos">174</span></a>    <span class="k">def</span> <span class="nf">forward</span><span class="p">(</span>
+</span><span id="KQFixedQSelection-175"><a href="#KQFixedQSelection-175"><span class="linenos">175</span></a>        <span class="bp">self</span><span class="p">,</span> <span class="n">domains</span><span class="p">:</span> <span class="n">LatentsDomainGroupT</span><span class="p">,</span> <span class="n">encodings_pre_fusion</span><span class="p">:</span> <span class="n">LatentsDomainGroupT</span>
+</span><span id="KQFixedQSelection-176"><a href="#KQFixedQSelection-176"><span class="linenos">176</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]:</span>
+</span><span id="KQFixedQSelection-177"><a href="#KQFixedQSelection-177"><span class="linenos">177</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="KQFixedQSelection-178"><a href="#KQFixedQSelection-178"><span class="linenos">178</span></a><span class="sd">        Compute keys and queries, match them with dot product and softmax.</span>
+</span><span id="KQFixedQSelection-179"><a href="#KQFixedQSelection-179"><span class="linenos">179</span></a><span class="sd">        Does this twice, once with the static query and once with a dynamic query.</span>
+</span><span id="KQFixedQSelection-180"><a href="#KQFixedQSelection-180"><span class="linenos">180</span></a>
+</span><span id="KQFixedQSelection-181"><a href="#KQFixedQSelection-181"><span class="linenos">181</span></a><span class="sd">        Args:</span>
+</span><span id="KQFixedQSelection-182"><a href="#KQFixedQSelection-182"><span class="linenos">182</span></a><span class="sd">            domains (`LatentsDomainGroupT`): Group of unimodal latent representations.</span>
+</span><span id="KQFixedQSelection-183"><a href="#KQFixedQSelection-183"><span class="linenos">183</span></a><span class="sd">            encodings (`LatentsDomainGroupT`): Group of pre-fusion encodings.</span>
+</span><span id="KQFixedQSelection-184"><a href="#KQFixedQSelection-184"><span class="linenos">184</span></a>
+</span><span id="KQFixedQSelection-185"><a href="#KQFixedQSelection-185"><span class="linenos">185</span></a><span class="sd">        Returns:</span>
+</span><span id="KQFixedQSelection-186"><a href="#KQFixedQSelection-186"><span class="linenos">186</span></a><span class="sd">            `dict[str, torch.Tensor]`: the attention scores for each domain in the</span>
+</span><span id="KQFixedQSelection-187"><a href="#KQFixedQSelection-187"><span class="linenos">187</span></a><span class="sd">            group.</span>
+</span><span id="KQFixedQSelection-188"><a href="#KQFixedQSelection-188"><span class="linenos">188</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="KQFixedQSelection-189"><a href="#KQFixedQSelection-189"><span class="linenos">189</span></a>
+</span><span id="KQFixedQSelection-190"><a href="#KQFixedQSelection-190"><span class="linenos">190</span></a>        <span class="n">keys</span> <span class="o">=</span> <span class="p">{</span>
+</span><span id="KQFixedQSelection-191"><a href="#KQFixedQSelection-191"><span class="linenos">191</span></a>            <span class="n">domain</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">key_layers</span><span class="p">[</span><span class="n">domain</span><span class="p">](</span><span class="n">encoding</span><span class="p">)</span>
+</span><span id="KQFixedQSelection-192"><a href="#KQFixedQSelection-192"><span class="linenos">192</span></a>            <span class="k">for</span> <span class="n">domain</span><span class="p">,</span> <span class="n">encoding</span> <span class="ow">in</span> <span class="n">domains</span><span class="o">.</span><span class="n">items</span><span class="p">()</span>
+</span><span id="KQFixedQSelection-193"><a href="#KQFixedQSelection-193"><span class="linenos">193</span></a>        <span class="p">}</span>
+</span><span id="KQFixedQSelection-194"><a href="#KQFixedQSelection-194"><span class="linenos">194</span></a>
+</span><span id="KQFixedQSelection-195"><a href="#KQFixedQSelection-195"><span class="linenos">195</span></a>        <span class="n">batch_size</span> <span class="o">=</span> <span class="n">group_batch_size</span><span class="p">(</span><span class="n">domains</span><span class="p">)</span>
+</span><span id="KQFixedQSelection-196"><a href="#KQFixedQSelection-196"><span class="linenos">196</span></a>
+</span><span id="KQFixedQSelection-197"><a href="#KQFixedQSelection-197"><span class="linenos">197</span></a>        <span class="c1"># Retrieve random query</span>
+</span><span id="KQFixedQSelection-198"><a href="#KQFixedQSelection-198"><span class="linenos">198</span></a>        <span class="n">query</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">query_layer</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">initial_gw_state</span><span class="o">.</span><span class="n">expand</span><span class="p">(</span><span class="n">batch_size</span><span class="p">,</span> <span class="o">-</span><span class="mi">1</span><span class="p">))</span>
+</span><span id="KQFixedQSelection-199"><a href="#KQFixedQSelection-199"><span class="linenos">199</span></a>
+</span><span id="KQFixedQSelection-200"><a href="#KQFixedQSelection-200"><span class="linenos">200</span></a>        <span class="c1"># Calculate the attention scores</span>
+</span><span id="KQFixedQSelection-201"><a href="#KQFixedQSelection-201"><span class="linenos">201</span></a>        <span class="k">return</span> <span class="n">_calculate_attention_dict</span><span class="p">(</span><span class="n">domains</span><span class="p">,</span> <span class="n">keys</span><span class="p">,</span> <span class="n">query</span><span class="p">)</span>
+</span></pre></div>
+
+
+            <div class="docstring"><p>Key-Query attention with a fixed gw vector.</p>
+</div>
+
+
+                            <div id="KQFixedQSelection.__init__" class="classattr">
+                                        <input id="KQFixedQSelection.__init__-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
+<div class="attr function">
+            
+        <span class="name">KQFixedQSelection</span><span class="signature pdoc-code multiline">(<span class="param">	<span class="n">head_size</span><span class="p">:</span> <span class="nb">int</span>,</span><span class="param">	<span class="n">domain_dim</span><span class="p">:</span> <span class="nb">int</span>,</span><span class="param">	<span class="n">domain_names</span><span class="p">:</span> <span class="n">collections</span><span class="o">.</span><span class="n">abc</span><span class="o">.</span><span class="n">Iterable</span><span class="p">[</span><span class="nb">str</span><span class="p">]</span></span>)</span>
+
+                <label class="view-source-button" for="KQFixedQSelection.__init__-view-source"><span>View Source</span></label>
+
+    </div>
+    <a class="headerlink" href="#KQFixedQSelection.__init__"></a>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="KQFixedQSelection.__init__-157"><a href="#KQFixedQSelection.__init__-157"><span class="linenos">157</span></a>    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">head_size</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span> <span class="n">domain_dim</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span> <span class="n">domain_names</span><span class="p">:</span> <span class="n">Iterable</span><span class="p">[</span><span class="nb">str</span><span class="p">]):</span>
+</span><span id="KQFixedQSelection.__init__-158"><a href="#KQFixedQSelection.__init__-158"><span class="linenos">158</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="KQFixedQSelection.__init__-159"><a href="#KQFixedQSelection.__init__-159"><span class="linenos">159</span></a><span class="sd">        Args:</span>
+</span><span id="KQFixedQSelection.__init__-160"><a href="#KQFixedQSelection.__init__-160"><span class="linenos">160</span></a><span class="sd">            head_size (`int`) : dimension of the key and query vectors.</span>
+</span><span id="KQFixedQSelection.__init__-161"><a href="#KQFixedQSelection.__init__-161"><span class="linenos">161</span></a><span class="sd">            domain_dim (`int`) : dimension of the input dims (assumed to be the same</span>
+</span><span id="KQFixedQSelection.__init__-162"><a href="#KQFixedQSelection.__init__-162"><span class="linenos">162</span></a><span class="sd">                for now)</span>
+</span><span id="KQFixedQSelection.__init__-163"><a href="#KQFixedQSelection.__init__-163"><span class="linenos">163</span></a><span class="sd">            domain_names  (`Iterable[str]`) : list of input domains</span>
+</span><span id="KQFixedQSelection.__init__-164"><a href="#KQFixedQSelection.__init__-164"><span class="linenos">164</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="KQFixedQSelection.__init__-165"><a href="#KQFixedQSelection.__init__-165"><span class="linenos">165</span></a>        <span class="nb">super</span><span class="p">()</span><span class="o">.</span><span class="fm">__init__</span><span class="p">()</span>
+</span><span id="KQFixedQSelection.__init__-166"><a href="#KQFixedQSelection.__init__-166"><span class="linenos">166</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">head_size</span> <span class="o">=</span> <span class="n">head_size</span>
+</span><span id="KQFixedQSelection.__init__-167"><a href="#KQFixedQSelection.__init__-167"><span class="linenos">167</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">query_layer</span> <span class="o">=</span> <span class="n">nn</span><span class="o">.</span><span class="n">Linear</span><span class="p">(</span><span class="n">domain_dim</span><span class="p">,</span> <span class="n">head_size</span><span class="p">)</span>
+</span><span id="KQFixedQSelection.__init__-168"><a href="#KQFixedQSelection.__init__-168"><span class="linenos">168</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">key_layers</span> <span class="o">=</span> <span class="n">nn</span><span class="o">.</span><span class="n">ModuleDict</span><span class="p">(</span>
+</span><span id="KQFixedQSelection.__init__-169"><a href="#KQFixedQSelection.__init__-169"><span class="linenos">169</span></a>            <span class="p">{</span><span class="n">domain</span><span class="p">:</span> <span class="n">nn</span><span class="o">.</span><span class="n">Linear</span><span class="p">(</span><span class="n">domain_dim</span><span class="p">,</span> <span class="n">head_size</span><span class="p">)</span> <span class="k">for</span> <span class="n">domain</span> <span class="ow">in</span> <span class="n">domain_names</span><span class="p">}</span>
+</span><span id="KQFixedQSelection.__init__-170"><a href="#KQFixedQSelection.__init__-170"><span class="linenos">170</span></a>        <span class="p">)</span>
+</span><span id="KQFixedQSelection.__init__-171"><a href="#KQFixedQSelection.__init__-171"><span class="linenos">171</span></a>        <span class="c1"># Start with a random gw state</span>
+</span><span id="KQFixedQSelection.__init__-172"><a href="#KQFixedQSelection.__init__-172"><span class="linenos">172</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">register_buffer</span><span class="p">(</span><span class="s2">&quot;initial_gw_state&quot;</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">rand</span><span class="p">(</span><span class="n">domain_dim</span><span class="p">))</span>
+</span></pre></div>
+
+
+            <div class="docstring"><h6 id="arguments">Arguments:</h6>
+
+<ul>
+<li><strong>head_size (<code>int</code>) :</strong>  dimension of the key and query vectors.</li>
+<li><strong>domain_dim (<code>int</code>) :</strong>  dimension of the input dims (assumed to be the same
+for now)</li>
+<li><strong>domain_names  (<code>Iterable[str]</code>) :</strong>  list of input domains</li>
+</ul>
+</div>
+
+
+                            </div>
+                            <div id="KQFixedQSelection.head_size" class="classattr">
+                                <div class="attr variable">
+            <span class="name">head_size</span>
+
+        
+    </div>
+    <a class="headerlink" href="#KQFixedQSelection.head_size"></a>
+    
+    
+
+                            </div>
+                            <div id="KQFixedQSelection.query_layer" class="classattr">
+                                <div class="attr variable">
+            <span class="name">query_layer</span>
+
+        
+    </div>
+    <a class="headerlink" href="#KQFixedQSelection.query_layer"></a>
+    
+    
+
+                            </div>
+                            <div id="KQFixedQSelection.key_layers" class="classattr">
+                                <div class="attr variable">
+            <span class="name">key_layers</span>
+
+        
+    </div>
+    <a class="headerlink" href="#KQFixedQSelection.key_layers"></a>
+    
+    
+
+                            </div>
+                            <div id="KQFixedQSelection.forward" class="classattr">
+                                        <input id="KQFixedQSelection.forward-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
+<div class="attr function">
+            
+        <span class="def">def</span>
+        <span class="name">forward</span><span class="signature pdoc-code multiline">(<span class="param">	<span class="bp">self</span>,</span><span class="param">	<span class="n">domains</span><span class="p">:</span> <span class="n">collections</span><span class="o">.</span><span class="n">abc</span><span class="o">.</span><span class="n">Mapping</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]</span>,</span><span class="param">	<span class="n">encodings_pre_fusion</span><span class="p">:</span> <span class="n">collections</span><span class="o">.</span><span class="n">abc</span><span class="o">.</span><span class="n">Mapping</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]</span></span><span class="return-annotation">) -> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]</span>:</span></span>
+
+                <label class="view-source-button" for="KQFixedQSelection.forward-view-source"><span>View Source</span></label>
+
+    </div>
+    <a class="headerlink" href="#KQFixedQSelection.forward"></a>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="KQFixedQSelection.forward-174"><a href="#KQFixedQSelection.forward-174"><span class="linenos">174</span></a>    <span class="k">def</span> <span class="nf">forward</span><span class="p">(</span>
+</span><span id="KQFixedQSelection.forward-175"><a href="#KQFixedQSelection.forward-175"><span class="linenos">175</span></a>        <span class="bp">self</span><span class="p">,</span> <span class="n">domains</span><span class="p">:</span> <span class="n">LatentsDomainGroupT</span><span class="p">,</span> <span class="n">encodings_pre_fusion</span><span class="p">:</span> <span class="n">LatentsDomainGroupT</span>
+</span><span id="KQFixedQSelection.forward-176"><a href="#KQFixedQSelection.forward-176"><span class="linenos">176</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]:</span>
+</span><span id="KQFixedQSelection.forward-177"><a href="#KQFixedQSelection.forward-177"><span class="linenos">177</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="KQFixedQSelection.forward-178"><a href="#KQFixedQSelection.forward-178"><span class="linenos">178</span></a><span class="sd">        Compute keys and queries, match them with dot product and softmax.</span>
+</span><span id="KQFixedQSelection.forward-179"><a href="#KQFixedQSelection.forward-179"><span class="linenos">179</span></a><span class="sd">        Does this twice, once with the static query and once with a dynamic query.</span>
+</span><span id="KQFixedQSelection.forward-180"><a href="#KQFixedQSelection.forward-180"><span class="linenos">180</span></a>
+</span><span id="KQFixedQSelection.forward-181"><a href="#KQFixedQSelection.forward-181"><span class="linenos">181</span></a><span class="sd">        Args:</span>
+</span><span id="KQFixedQSelection.forward-182"><a href="#KQFixedQSelection.forward-182"><span class="linenos">182</span></a><span class="sd">            domains (`LatentsDomainGroupT`): Group of unimodal latent representations.</span>
+</span><span id="KQFixedQSelection.forward-183"><a href="#KQFixedQSelection.forward-183"><span class="linenos">183</span></a><span class="sd">            encodings (`LatentsDomainGroupT`): Group of pre-fusion encodings.</span>
+</span><span id="KQFixedQSelection.forward-184"><a href="#KQFixedQSelection.forward-184"><span class="linenos">184</span></a>
+</span><span id="KQFixedQSelection.forward-185"><a href="#KQFixedQSelection.forward-185"><span class="linenos">185</span></a><span class="sd">        Returns:</span>
+</span><span id="KQFixedQSelection.forward-186"><a href="#KQFixedQSelection.forward-186"><span class="linenos">186</span></a><span class="sd">            `dict[str, torch.Tensor]`: the attention scores for each domain in the</span>
+</span><span id="KQFixedQSelection.forward-187"><a href="#KQFixedQSelection.forward-187"><span class="linenos">187</span></a><span class="sd">            group.</span>
+</span><span id="KQFixedQSelection.forward-188"><a href="#KQFixedQSelection.forward-188"><span class="linenos">188</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="KQFixedQSelection.forward-189"><a href="#KQFixedQSelection.forward-189"><span class="linenos">189</span></a>
+</span><span id="KQFixedQSelection.forward-190"><a href="#KQFixedQSelection.forward-190"><span class="linenos">190</span></a>        <span class="n">keys</span> <span class="o">=</span> <span class="p">{</span>
+</span><span id="KQFixedQSelection.forward-191"><a href="#KQFixedQSelection.forward-191"><span class="linenos">191</span></a>            <span class="n">domain</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">key_layers</span><span class="p">[</span><span class="n">domain</span><span class="p">](</span><span class="n">encoding</span><span class="p">)</span>
+</span><span id="KQFixedQSelection.forward-192"><a href="#KQFixedQSelection.forward-192"><span class="linenos">192</span></a>            <span class="k">for</span> <span class="n">domain</span><span class="p">,</span> <span class="n">encoding</span> <span class="ow">in</span> <span class="n">domains</span><span class="o">.</span><span class="n">items</span><span class="p">()</span>
+</span><span id="KQFixedQSelection.forward-193"><a href="#KQFixedQSelection.forward-193"><span class="linenos">193</span></a>        <span class="p">}</span>
+</span><span id="KQFixedQSelection.forward-194"><a href="#KQFixedQSelection.forward-194"><span class="linenos">194</span></a>
+</span><span id="KQFixedQSelection.forward-195"><a href="#KQFixedQSelection.forward-195"><span class="linenos">195</span></a>        <span class="n">batch_size</span> <span class="o">=</span> <span class="n">group_batch_size</span><span class="p">(</span><span class="n">domains</span><span class="p">)</span>
+</span><span id="KQFixedQSelection.forward-196"><a href="#KQFixedQSelection.forward-196"><span class="linenos">196</span></a>
+</span><span id="KQFixedQSelection.forward-197"><a href="#KQFixedQSelection.forward-197"><span class="linenos">197</span></a>        <span class="c1"># Retrieve random query</span>
+</span><span id="KQFixedQSelection.forward-198"><a href="#KQFixedQSelection.forward-198"><span class="linenos">198</span></a>        <span class="n">query</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">query_layer</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">initial_gw_state</span><span class="o">.</span><span class="n">expand</span><span class="p">(</span><span class="n">batch_size</span><span class="p">,</span> <span class="o">-</span><span class="mi">1</span><span class="p">))</span>
+</span><span id="KQFixedQSelection.forward-199"><a href="#KQFixedQSelection.forward-199"><span class="linenos">199</span></a>
+</span><span id="KQFixedQSelection.forward-200"><a href="#KQFixedQSelection.forward-200"><span class="linenos">200</span></a>        <span class="c1"># Calculate the attention scores</span>
+</span><span id="KQFixedQSelection.forward-201"><a href="#KQFixedQSelection.forward-201"><span class="linenos">201</span></a>        <span class="k">return</span> <span class="n">_calculate_attention_dict</span><span class="p">(</span><span class="n">domains</span><span class="p">,</span> <span class="n">keys</span><span class="p">,</span> <span class="n">query</span><span class="p">)</span>
+</span></pre></div>
+
+
+            <div class="docstring"><p>Compute keys and queries, match them with dot product and softmax.
+Does this twice, once with the static query and once with a dynamic query.</p>
+
+<h6 id="arguments">Arguments:</h6>
+
+<ul>
+<li><strong>domains (<code>LatentsDomainGroupT</code>):</strong>  Group of unimodal latent representations.</li>
+<li><strong>encodings (<code>LatentsDomainGroupT</code>):</strong>  Group of pre-fusion encodings.</li>
+</ul>
+
+<h6 id="returns">Returns:</h6>
+
+<blockquote>
+  <p><code>dict[str, torch.Tensor]</code>: the attention scores for each domain in the
+  group.</p>
+</blockquote>
+</div>
+
+
+                            </div>
+                            <div class="inherited">
+                                <h5>Inherited Members</h5>
+                                <dl>
+                                    <div><dt><a href="#SelectionBase">SelectionBase</a></dt>
+                                <dd id="KQFixedQSelection.update_gw_state" class="function"><a href="#SelectionBase.update_gw_state">update_gw_state</a></dd>
+
+            </div>
+            <div><dt>torch.nn.modules.module.Module</dt>
+                                <dd id="KQFixedQSelection.dump_patches" class="variable">dump_patches</dd>
+                <dd id="KQFixedQSelection.training" class="variable">training</dd>
+                <dd id="KQFixedQSelection.call_super_init" class="variable">call_super_init</dd>
+                <dd id="KQFixedQSelection.register_buffer" class="function">register_buffer</dd>
+                <dd id="KQFixedQSelection.register_parameter" class="function">register_parameter</dd>
+                <dd id="KQFixedQSelection.add_module" class="function">add_module</dd>
+                <dd id="KQFixedQSelection.register_module" class="function">register_module</dd>
+                <dd id="KQFixedQSelection.get_submodule" class="function">get_submodule</dd>
+                <dd id="KQFixedQSelection.get_parameter" class="function">get_parameter</dd>
+                <dd id="KQFixedQSelection.get_buffer" class="function">get_buffer</dd>
+                <dd id="KQFixedQSelection.get_extra_state" class="function">get_extra_state</dd>
+                <dd id="KQFixedQSelection.set_extra_state" class="function">set_extra_state</dd>
+                <dd id="KQFixedQSelection.apply" class="function">apply</dd>
+                <dd id="KQFixedQSelection.cuda" class="function">cuda</dd>
+                <dd id="KQFixedQSelection.ipu" class="function">ipu</dd>
+                <dd id="KQFixedQSelection.xpu" class="function">xpu</dd>
+                <dd id="KQFixedQSelection.cpu" class="function">cpu</dd>
+                <dd id="KQFixedQSelection.type" class="function">type</dd>
+                <dd id="KQFixedQSelection.float" class="function">float</dd>
+                <dd id="KQFixedQSelection.double" class="function">double</dd>
+                <dd id="KQFixedQSelection.half" class="function">half</dd>
+                <dd id="KQFixedQSelection.bfloat16" class="function">bfloat16</dd>
+                <dd id="KQFixedQSelection.to_empty" class="function">to_empty</dd>
+                <dd id="KQFixedQSelection.to" class="function">to</dd>
+                <dd id="KQFixedQSelection.register_full_backward_pre_hook" class="function">register_full_backward_pre_hook</dd>
+                <dd id="KQFixedQSelection.register_backward_hook" class="function">register_backward_hook</dd>
+                <dd id="KQFixedQSelection.register_full_backward_hook" class="function">register_full_backward_hook</dd>
+                <dd id="KQFixedQSelection.register_forward_pre_hook" class="function">register_forward_pre_hook</dd>
+                <dd id="KQFixedQSelection.register_forward_hook" class="function">register_forward_hook</dd>
+                <dd id="KQFixedQSelection.register_state_dict_pre_hook" class="function">register_state_dict_pre_hook</dd>
+                <dd id="KQFixedQSelection.state_dict" class="function">state_dict</dd>
+                <dd id="KQFixedQSelection.register_load_state_dict_post_hook" class="function">register_load_state_dict_post_hook</dd>
+                <dd id="KQFixedQSelection.load_state_dict" class="function">load_state_dict</dd>
+                <dd id="KQFixedQSelection.parameters" class="function">parameters</dd>
+                <dd id="KQFixedQSelection.named_parameters" class="function">named_parameters</dd>
+                <dd id="KQFixedQSelection.buffers" class="function">buffers</dd>
+                <dd id="KQFixedQSelection.named_buffers" class="function">named_buffers</dd>
+                <dd id="KQFixedQSelection.children" class="function">children</dd>
+                <dd id="KQFixedQSelection.named_children" class="function">named_children</dd>
+                <dd id="KQFixedQSelection.modules" class="function">modules</dd>
+                <dd id="KQFixedQSelection.named_modules" class="function">named_modules</dd>
+                <dd id="KQFixedQSelection.train" class="function">train</dd>
+                <dd id="KQFixedQSelection.eval" class="function">eval</dd>
+                <dd id="KQFixedQSelection.requires_grad_" class="function">requires_grad_</dd>
+                <dd id="KQFixedQSelection.zero_grad" class="function">zero_grad</dd>
+                <dd id="KQFixedQSelection.share_memory" class="function">share_memory</dd>
+                <dd id="KQFixedQSelection.extra_repr" class="function">extra_repr</dd>
+                <dd id="KQFixedQSelection.compile" class="function">compile</dd>
+
+            </div>
+                                </dl>
+                            </div>
+                </section>
+                <section id="RandomSelection">
+                            <input id="RandomSelection-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
+<div class="attr class">
+            
+    <span class="def">class</span>
+    <span class="name">RandomSelection</span><wbr>(<span class="base"><a href="#SelectionBase">SelectionBase</a></span>):
+
+                <label class="view-source-button" for="RandomSelection-view-source"><span>View Source</span></label>
+
+    </div>
+    <a class="headerlink" href="#RandomSelection"></a>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="RandomSelection-204"><a href="#RandomSelection-204"><span class="linenos">204</span></a><span class="k">class</span> <span class="nc">RandomSelection</span><span class="p">(</span><span class="n">SelectionBase</span><span class="p">):</span>
+</span><span id="RandomSelection-205"><a href="#RandomSelection-205"><span class="linenos">205</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="RandomSelection-206"><a href="#RandomSelection-206"><span class="linenos">206</span></a><span class="sd">    Modified random attention to only utilize uniform-softmax scores across modalities.</span>
+</span><span id="RandomSelection-207"><a href="#RandomSelection-207"><span class="linenos">207</span></a><span class="sd">    This version omits the binary scaling factors and focuses on generating attention</span>
+</span><span id="RandomSelection-208"><a href="#RandomSelection-208"><span class="linenos">208</span></a><span class="sd">    coefficients using a uniform distribution followed by a domain-wise softmax.</span>
+</span><span id="RandomSelection-209"><a href="#RandomSelection-209"><span class="linenos">209</span></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="RandomSelection-210"><a href="#RandomSelection-210"><span class="linenos">210</span></a>
+</span><span id="RandomSelection-211"><a href="#RandomSelection-211"><span class="linenos">211</span></a>    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">temperature</span><span class="p">:</span> <span class="nb">float</span><span class="p">):</span>
+</span><span id="RandomSelection-212"><a href="#RandomSelection-212"><span class="linenos">212</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="RandomSelection-213"><a href="#RandomSelection-213"><span class="linenos">213</span></a><span class="sd">        Args:</span>
+</span><span id="RandomSelection-214"><a href="#RandomSelection-214"><span class="linenos">214</span></a><span class="sd">            temperature (`float`): Temperature of the softmax applied to uniform</span>
+</span><span id="RandomSelection-215"><a href="#RandomSelection-215"><span class="linenos">215</span></a><span class="sd">                scaling factors.</span>
+</span><span id="RandomSelection-216"><a href="#RandomSelection-216"><span class="linenos">216</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="RandomSelection-217"><a href="#RandomSelection-217"><span class="linenos">217</span></a>        <span class="nb">super</span><span class="p">()</span><span class="o">.</span><span class="fm">__init__</span><span class="p">()</span>
+</span><span id="RandomSelection-218"><a href="#RandomSelection-218"><span class="linenos">218</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">temperature</span> <span class="o">=</span> <span class="n">temperature</span>
+</span><span id="RandomSelection-219"><a href="#RandomSelection-219"><span class="linenos">219</span></a>
+</span><span id="RandomSelection-220"><a href="#RandomSelection-220"><span class="linenos">220</span></a>    <span class="k">def</span> <span class="nf">forward</span><span class="p">(</span>
+</span><span id="RandomSelection-221"><a href="#RandomSelection-221"><span class="linenos">221</span></a>        <span class="bp">self</span><span class="p">,</span> <span class="n">domains</span><span class="p">:</span> <span class="n">LatentsDomainGroupT</span><span class="p">,</span> <span class="n">encodings_pre_fusion</span><span class="p">:</span> <span class="n">LatentsDomainGroupT</span>
+</span><span id="RandomSelection-222"><a href="#RandomSelection-222"><span class="linenos">222</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]:</span>
+</span><span id="RandomSelection-223"><a href="#RandomSelection-223"><span class="linenos">223</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="RandomSelection-224"><a href="#RandomSelection-224"><span class="linenos">224</span></a><span class="sd">        Generate uniform-then-domain-wise-softmaxed samples for each domain.</span>
+</span><span id="RandomSelection-225"><a href="#RandomSelection-225"><span class="linenos">225</span></a>
+</span><span id="RandomSelection-226"><a href="#RandomSelection-226"><span class="linenos">226</span></a><span class="sd">        Args:</span>
+</span><span id="RandomSelection-227"><a href="#RandomSelection-227"><span class="linenos">227</span></a><span class="sd">            domains (`LatentsDomainGroupT`): Group of unimodal latent representations.</span>
+</span><span id="RandomSelection-228"><a href="#RandomSelection-228"><span class="linenos">228</span></a><span class="sd">                This is not used in the function directly but determines the structure</span>
+</span><span id="RandomSelection-229"><a href="#RandomSelection-229"><span class="linenos">229</span></a><span class="sd">                of the returned attention coefficients.</span>
+</span><span id="RandomSelection-230"><a href="#RandomSelection-230"><span class="linenos">230</span></a>
+</span><span id="RandomSelection-231"><a href="#RandomSelection-231"><span class="linenos">231</span></a><span class="sd">        Returns:</span>
+</span><span id="RandomSelection-232"><a href="#RandomSelection-232"><span class="linenos">232</span></a><span class="sd">            `dict[str, torch.Tensor]`: For each domain in the group, the fusion</span>
+</span><span id="RandomSelection-233"><a href="#RandomSelection-233"><span class="linenos">233</span></a><span class="sd">            coefficient for each item in the batch, based solely on</span>
+</span><span id="RandomSelection-234"><a href="#RandomSelection-234"><span class="linenos">234</span></a><span class="sd">            uniform-softmax scores.</span>
+</span><span id="RandomSelection-235"><a href="#RandomSelection-235"><span class="linenos">235</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="RandomSelection-236"><a href="#RandomSelection-236"><span class="linenos">236</span></a>        <span class="n">num_domains</span> <span class="o">=</span> <span class="nb">len</span><span class="p">(</span><span class="n">domains</span><span class="p">)</span>
+</span><span id="RandomSelection-237"><a href="#RandomSelection-237"><span class="linenos">237</span></a>        <span class="n">batch_size</span> <span class="o">=</span> <span class="n">group_batch_size</span><span class="p">(</span><span class="n">domains</span><span class="p">)</span>
+</span><span id="RandomSelection-238"><a href="#RandomSelection-238"><span class="linenos">238</span></a>        <span class="n">device</span> <span class="o">=</span> <span class="n">group_device</span><span class="p">(</span><span class="n">domains</span><span class="p">)</span>
+</span><span id="RandomSelection-239"><a href="#RandomSelection-239"><span class="linenos">239</span></a>
+</span><span id="RandomSelection-240"><a href="#RandomSelection-240"><span class="linenos">240</span></a>        <span class="c1"># Generate uniform scores</span>
+</span><span id="RandomSelection-241"><a href="#RandomSelection-241"><span class="linenos">241</span></a>        <span class="n">uniform_scores</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">rand</span><span class="p">(</span><span class="n">batch_size</span><span class="p">,</span> <span class="n">num_domains</span><span class="p">,</span> <span class="n">device</span><span class="o">=</span><span class="n">device</span><span class="p">)</span>
+</span><span id="RandomSelection-242"><a href="#RandomSelection-242"><span class="linenos">242</span></a>
+</span><span id="RandomSelection-243"><a href="#RandomSelection-243"><span class="linenos">243</span></a>        <span class="c1"># Apply softmax across domains with temperature scaling</span>
+</span><span id="RandomSelection-244"><a href="#RandomSelection-244"><span class="linenos">244</span></a>        <span class="n">softmax_scores</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">softmax</span><span class="p">(</span><span class="n">uniform_scores</span> <span class="o">/</span> <span class="bp">self</span><span class="o">.</span><span class="n">temperature</span><span class="p">,</span> <span class="n">dim</span><span class="o">=</span><span class="mi">1</span><span class="p">)</span>
+</span><span id="RandomSelection-245"><a href="#RandomSelection-245"><span class="linenos">245</span></a>        <span class="c1"># Create attention dictionary for each domain</span>
+</span><span id="RandomSelection-246"><a href="#RandomSelection-246"><span class="linenos">246</span></a>        <span class="n">attention_dict</span> <span class="o">=</span> <span class="p">{</span>
+</span><span id="RandomSelection-247"><a href="#RandomSelection-247"><span class="linenos">247</span></a>            <span class="n">domain</span><span class="p">:</span> <span class="n">softmax_scores</span><span class="p">[:,</span> <span class="n">i</span><span class="p">]</span> <span class="k">for</span> <span class="n">i</span><span class="p">,</span> <span class="n">domain</span> <span class="ow">in</span> <span class="nb">enumerate</span><span class="p">(</span><span class="n">domains</span><span class="p">)</span>
+</span><span id="RandomSelection-248"><a href="#RandomSelection-248"><span class="linenos">248</span></a>        <span class="p">}</span>
+</span><span id="RandomSelection-249"><a href="#RandomSelection-249"><span class="linenos">249</span></a>
+</span><span id="RandomSelection-250"><a href="#RandomSelection-250"><span class="linenos">250</span></a>        <span class="k">return</span> <span class="n">attention_dict</span>
+</span></pre></div>
+
+
+            <div class="docstring"><p>Modified random attention to only utilize uniform-softmax scores across modalities.
+This version omits the binary scaling factors and focuses on generating attention
+coefficients using a uniform distribution followed by a domain-wise softmax.</p>
+</div>
+
+
+                            <div id="RandomSelection.__init__" class="classattr">
+                                        <input id="RandomSelection.__init__-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
+<div class="attr function">
+            
+        <span class="name">RandomSelection</span><span class="signature pdoc-code condensed">(<span class="param"><span class="n">temperature</span><span class="p">:</span> <span class="nb">float</span></span>)</span>
+
+                <label class="view-source-button" for="RandomSelection.__init__-view-source"><span>View Source</span></label>
+
+    </div>
+    <a class="headerlink" href="#RandomSelection.__init__"></a>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="RandomSelection.__init__-211"><a href="#RandomSelection.__init__-211"><span class="linenos">211</span></a>    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">temperature</span><span class="p">:</span> <span class="nb">float</span><span class="p">):</span>
+</span><span id="RandomSelection.__init__-212"><a href="#RandomSelection.__init__-212"><span class="linenos">212</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="RandomSelection.__init__-213"><a href="#RandomSelection.__init__-213"><span class="linenos">213</span></a><span class="sd">        Args:</span>
+</span><span id="RandomSelection.__init__-214"><a href="#RandomSelection.__init__-214"><span class="linenos">214</span></a><span class="sd">            temperature (`float`): Temperature of the softmax applied to uniform</span>
+</span><span id="RandomSelection.__init__-215"><a href="#RandomSelection.__init__-215"><span class="linenos">215</span></a><span class="sd">                scaling factors.</span>
+</span><span id="RandomSelection.__init__-216"><a href="#RandomSelection.__init__-216"><span class="linenos">216</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="RandomSelection.__init__-217"><a href="#RandomSelection.__init__-217"><span class="linenos">217</span></a>        <span class="nb">super</span><span class="p">()</span><span class="o">.</span><span class="fm">__init__</span><span class="p">()</span>
+</span><span id="RandomSelection.__init__-218"><a href="#RandomSelection.__init__-218"><span class="linenos">218</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">temperature</span> <span class="o">=</span> <span class="n">temperature</span>
+</span></pre></div>
+
+
+            <div class="docstring"><h6 id="arguments">Arguments:</h6>
+
+<ul>
+<li><strong>temperature (<code><a href="#RandomSelection.float">float</a></code>):</strong>  Temperature of the softmax applied to uniform
+scaling factors.</li>
+</ul>
+</div>
+
+
+                            </div>
+                            <div id="RandomSelection.temperature" class="classattr">
+                                <div class="attr variable">
+            <span class="name">temperature</span>
+
+        
+    </div>
+    <a class="headerlink" href="#RandomSelection.temperature"></a>
+    
+    
+
+                            </div>
+                            <div id="RandomSelection.forward" class="classattr">
+                                        <input id="RandomSelection.forward-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
+<div class="attr function">
+            
+        <span class="def">def</span>
+        <span class="name">forward</span><span class="signature pdoc-code multiline">(<span class="param">	<span class="bp">self</span>,</span><span class="param">	<span class="n">domains</span><span class="p">:</span> <span class="n">collections</span><span class="o">.</span><span class="n">abc</span><span class="o">.</span><span class="n">Mapping</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]</span>,</span><span class="param">	<span class="n">encodings_pre_fusion</span><span class="p">:</span> <span class="n">collections</span><span class="o">.</span><span class="n">abc</span><span class="o">.</span><span class="n">Mapping</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]</span></span><span class="return-annotation">) -> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]</span>:</span></span>
+
+                <label class="view-source-button" for="RandomSelection.forward-view-source"><span>View Source</span></label>
+
+    </div>
+    <a class="headerlink" href="#RandomSelection.forward"></a>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="RandomSelection.forward-220"><a href="#RandomSelection.forward-220"><span class="linenos">220</span></a>    <span class="k">def</span> <span class="nf">forward</span><span class="p">(</span>
+</span><span id="RandomSelection.forward-221"><a href="#RandomSelection.forward-221"><span class="linenos">221</span></a>        <span class="bp">self</span><span class="p">,</span> <span class="n">domains</span><span class="p">:</span> <span class="n">LatentsDomainGroupT</span><span class="p">,</span> <span class="n">encodings_pre_fusion</span><span class="p">:</span> <span class="n">LatentsDomainGroupT</span>
+</span><span id="RandomSelection.forward-222"><a href="#RandomSelection.forward-222"><span class="linenos">222</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]:</span>
+</span><span id="RandomSelection.forward-223"><a href="#RandomSelection.forward-223"><span class="linenos">223</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="RandomSelection.forward-224"><a href="#RandomSelection.forward-224"><span class="linenos">224</span></a><span class="sd">        Generate uniform-then-domain-wise-softmaxed samples for each domain.</span>
+</span><span id="RandomSelection.forward-225"><a href="#RandomSelection.forward-225"><span class="linenos">225</span></a>
+</span><span id="RandomSelection.forward-226"><a href="#RandomSelection.forward-226"><span class="linenos">226</span></a><span class="sd">        Args:</span>
+</span><span id="RandomSelection.forward-227"><a href="#RandomSelection.forward-227"><span class="linenos">227</span></a><span class="sd">            domains (`LatentsDomainGroupT`): Group of unimodal latent representations.</span>
+</span><span id="RandomSelection.forward-228"><a href="#RandomSelection.forward-228"><span class="linenos">228</span></a><span class="sd">                This is not used in the function directly but determines the structure</span>
+</span><span id="RandomSelection.forward-229"><a href="#RandomSelection.forward-229"><span class="linenos">229</span></a><span class="sd">                of the returned attention coefficients.</span>
+</span><span id="RandomSelection.forward-230"><a href="#RandomSelection.forward-230"><span class="linenos">230</span></a>
+</span><span id="RandomSelection.forward-231"><a href="#RandomSelection.forward-231"><span class="linenos">231</span></a><span class="sd">        Returns:</span>
+</span><span id="RandomSelection.forward-232"><a href="#RandomSelection.forward-232"><span class="linenos">232</span></a><span class="sd">            `dict[str, torch.Tensor]`: For each domain in the group, the fusion</span>
+</span><span id="RandomSelection.forward-233"><a href="#RandomSelection.forward-233"><span class="linenos">233</span></a><span class="sd">            coefficient for each item in the batch, based solely on</span>
+</span><span id="RandomSelection.forward-234"><a href="#RandomSelection.forward-234"><span class="linenos">234</span></a><span class="sd">            uniform-softmax scores.</span>
+</span><span id="RandomSelection.forward-235"><a href="#RandomSelection.forward-235"><span class="linenos">235</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="RandomSelection.forward-236"><a href="#RandomSelection.forward-236"><span class="linenos">236</span></a>        <span class="n">num_domains</span> <span class="o">=</span> <span class="nb">len</span><span class="p">(</span><span class="n">domains</span><span class="p">)</span>
+</span><span id="RandomSelection.forward-237"><a href="#RandomSelection.forward-237"><span class="linenos">237</span></a>        <span class="n">batch_size</span> <span class="o">=</span> <span class="n">group_batch_size</span><span class="p">(</span><span class="n">domains</span><span class="p">)</span>
+</span><span id="RandomSelection.forward-238"><a href="#RandomSelection.forward-238"><span class="linenos">238</span></a>        <span class="n">device</span> <span class="o">=</span> <span class="n">group_device</span><span class="p">(</span><span class="n">domains</span><span class="p">)</span>
+</span><span id="RandomSelection.forward-239"><a href="#RandomSelection.forward-239"><span class="linenos">239</span></a>
+</span><span id="RandomSelection.forward-240"><a href="#RandomSelection.forward-240"><span class="linenos">240</span></a>        <span class="c1"># Generate uniform scores</span>
+</span><span id="RandomSelection.forward-241"><a href="#RandomSelection.forward-241"><span class="linenos">241</span></a>        <span class="n">uniform_scores</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">rand</span><span class="p">(</span><span class="n">batch_size</span><span class="p">,</span> <span class="n">num_domains</span><span class="p">,</span> <span class="n">device</span><span class="o">=</span><span class="n">device</span><span class="p">)</span>
+</span><span id="RandomSelection.forward-242"><a href="#RandomSelection.forward-242"><span class="linenos">242</span></a>
+</span><span id="RandomSelection.forward-243"><a href="#RandomSelection.forward-243"><span class="linenos">243</span></a>        <span class="c1"># Apply softmax across domains with temperature scaling</span>
+</span><span id="RandomSelection.forward-244"><a href="#RandomSelection.forward-244"><span class="linenos">244</span></a>        <span class="n">softmax_scores</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">softmax</span><span class="p">(</span><span class="n">uniform_scores</span> <span class="o">/</span> <span class="bp">self</span><span class="o">.</span><span class="n">temperature</span><span class="p">,</span> <span class="n">dim</span><span class="o">=</span><span class="mi">1</span><span class="p">)</span>
+</span><span id="RandomSelection.forward-245"><a href="#RandomSelection.forward-245"><span class="linenos">245</span></a>        <span class="c1"># Create attention dictionary for each domain</span>
+</span><span id="RandomSelection.forward-246"><a href="#RandomSelection.forward-246"><span class="linenos">246</span></a>        <span class="n">attention_dict</span> <span class="o">=</span> <span class="p">{</span>
+</span><span id="RandomSelection.forward-247"><a href="#RandomSelection.forward-247"><span class="linenos">247</span></a>            <span class="n">domain</span><span class="p">:</span> <span class="n">softmax_scores</span><span class="p">[:,</span> <span class="n">i</span><span class="p">]</span> <span class="k">for</span> <span class="n">i</span><span class="p">,</span> <span class="n">domain</span> <span class="ow">in</span> <span class="nb">enumerate</span><span class="p">(</span><span class="n">domains</span><span class="p">)</span>
+</span><span id="RandomSelection.forward-248"><a href="#RandomSelection.forward-248"><span class="linenos">248</span></a>        <span class="p">}</span>
+</span><span id="RandomSelection.forward-249"><a href="#RandomSelection.forward-249"><span class="linenos">249</span></a>
+</span><span id="RandomSelection.forward-250"><a href="#RandomSelection.forward-250"><span class="linenos">250</span></a>        <span class="k">return</span> <span class="n">attention_dict</span>
+</span></pre></div>
+
+
+            <div class="docstring"><p>Generate uniform-then-domain-wise-softmaxed samples for each domain.</p>
+
+<h6 id="arguments">Arguments:</h6>
+
+<ul>
+<li><strong>domains (<code>LatentsDomainGroupT</code>):</strong>  Group of unimodal latent representations.
+This is not used in the function directly but determines the structure
+of the returned attention coefficients.</li>
+</ul>
+
+<h6 id="returns">Returns:</h6>
+
+<blockquote>
+  <p><code>dict[str, torch.Tensor]</code>: For each domain in the group, the fusion
+  coefficient for each item in the batch, based solely on
+  uniform-softmax scores.</p>
+</blockquote>
+</div>
+
+
+                            </div>
+                            <div class="inherited">
+                                <h5>Inherited Members</h5>
+                                <dl>
+                                    <div><dt><a href="#SelectionBase">SelectionBase</a></dt>
+                                <dd id="RandomSelection.update_gw_state" class="function"><a href="#SelectionBase.update_gw_state">update_gw_state</a></dd>
+
+            </div>
+            <div><dt>torch.nn.modules.module.Module</dt>
+                                <dd id="RandomSelection.dump_patches" class="variable">dump_patches</dd>
+                <dd id="RandomSelection.training" class="variable">training</dd>
+                <dd id="RandomSelection.call_super_init" class="variable">call_super_init</dd>
+                <dd id="RandomSelection.register_buffer" class="function">register_buffer</dd>
+                <dd id="RandomSelection.register_parameter" class="function">register_parameter</dd>
+                <dd id="RandomSelection.add_module" class="function">add_module</dd>
+                <dd id="RandomSelection.register_module" class="function">register_module</dd>
+                <dd id="RandomSelection.get_submodule" class="function">get_submodule</dd>
+                <dd id="RandomSelection.get_parameter" class="function">get_parameter</dd>
+                <dd id="RandomSelection.get_buffer" class="function">get_buffer</dd>
+                <dd id="RandomSelection.get_extra_state" class="function">get_extra_state</dd>
+                <dd id="RandomSelection.set_extra_state" class="function">set_extra_state</dd>
+                <dd id="RandomSelection.apply" class="function">apply</dd>
+                <dd id="RandomSelection.cuda" class="function">cuda</dd>
+                <dd id="RandomSelection.ipu" class="function">ipu</dd>
+                <dd id="RandomSelection.xpu" class="function">xpu</dd>
+                <dd id="RandomSelection.cpu" class="function">cpu</dd>
+                <dd id="RandomSelection.type" class="function">type</dd>
+                <dd id="RandomSelection.float" class="function">float</dd>
+                <dd id="RandomSelection.double" class="function">double</dd>
+                <dd id="RandomSelection.half" class="function">half</dd>
+                <dd id="RandomSelection.bfloat16" class="function">bfloat16</dd>
+                <dd id="RandomSelection.to_empty" class="function">to_empty</dd>
+                <dd id="RandomSelection.to" class="function">to</dd>
+                <dd id="RandomSelection.register_full_backward_pre_hook" class="function">register_full_backward_pre_hook</dd>
+                <dd id="RandomSelection.register_backward_hook" class="function">register_backward_hook</dd>
+                <dd id="RandomSelection.register_full_backward_hook" class="function">register_full_backward_hook</dd>
+                <dd id="RandomSelection.register_forward_pre_hook" class="function">register_forward_pre_hook</dd>
+                <dd id="RandomSelection.register_forward_hook" class="function">register_forward_hook</dd>
+                <dd id="RandomSelection.register_state_dict_pre_hook" class="function">register_state_dict_pre_hook</dd>
+                <dd id="RandomSelection.state_dict" class="function">state_dict</dd>
+                <dd id="RandomSelection.register_load_state_dict_post_hook" class="function">register_load_state_dict_post_hook</dd>
+                <dd id="RandomSelection.load_state_dict" class="function">load_state_dict</dd>
+                <dd id="RandomSelection.parameters" class="function">parameters</dd>
+                <dd id="RandomSelection.named_parameters" class="function">named_parameters</dd>
+                <dd id="RandomSelection.buffers" class="function">buffers</dd>
+                <dd id="RandomSelection.named_buffers" class="function">named_buffers</dd>
+                <dd id="RandomSelection.children" class="function">children</dd>
+                <dd id="RandomSelection.named_children" class="function">named_children</dd>
+                <dd id="RandomSelection.modules" class="function">modules</dd>
+                <dd id="RandomSelection.named_modules" class="function">named_modules</dd>
+                <dd id="RandomSelection.train" class="function">train</dd>
+                <dd id="RandomSelection.eval" class="function">eval</dd>
+                <dd id="RandomSelection.requires_grad_" class="function">requires_grad_</dd>
+                <dd id="RandomSelection.zero_grad" class="function">zero_grad</dd>
+                <dd id="RandomSelection.share_memory" class="function">share_memory</dd>
+                <dd id="RandomSelection.extra_repr" class="function">extra_repr</dd>
+                <dd id="RandomSelection.compile" class="function">compile</dd>
+
+            </div>
+                                </dl>
+                            </div>
+                </section>
+                <section id="DynamicQueryAttention">
+                            <input id="DynamicQueryAttention-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
+<div class="attr class">
+            
+    <span class="def">class</span>
+    <span class="name">DynamicQueryAttention</span><wbr>(<span class="base"><a href="#SelectionBase">SelectionBase</a></span>):
+
+                <label class="view-source-button" for="DynamicQueryAttention-view-source"><span>View Source</span></label>
+
+    </div>
+    <a class="headerlink" href="#DynamicQueryAttention"></a>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="DynamicQueryAttention-253"><a href="#DynamicQueryAttention-253"><span class="linenos">253</span></a><span class="k">class</span> <span class="nc">DynamicQueryAttention</span><span class="p">(</span><span class="n">SelectionBase</span><span class="p">):</span>
+</span><span id="DynamicQueryAttention-254"><a href="#DynamicQueryAttention-254"><span class="linenos">254</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="DynamicQueryAttention-255"><a href="#DynamicQueryAttention-255"><span class="linenos">255</span></a><span class="sd">    Key-Query attention with a dynamic gw vector.</span>
+</span><span id="DynamicQueryAttention-256"><a href="#DynamicQueryAttention-256"><span class="linenos">256</span></a><span class="sd">    The query is updated based on the scaled gw vector.</span>
+</span><span id="DynamicQueryAttention-257"><a href="#DynamicQueryAttention-257"><span class="linenos">257</span></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="DynamicQueryAttention-258"><a href="#DynamicQueryAttention-258"><span class="linenos">258</span></a>
+</span><span id="DynamicQueryAttention-259"><a href="#DynamicQueryAttention-259"><span class="linenos">259</span></a>    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">head_size</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span> <span class="n">domain_dim</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span> <span class="n">domain_names</span><span class="p">:</span> <span class="n">Iterable</span><span class="p">[</span><span class="nb">str</span><span class="p">]):</span>
+</span><span id="DynamicQueryAttention-260"><a href="#DynamicQueryAttention-260"><span class="linenos">260</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="DynamicQueryAttention-261"><a href="#DynamicQueryAttention-261"><span class="linenos">261</span></a><span class="sd">        Args:</span>
+</span><span id="DynamicQueryAttention-262"><a href="#DynamicQueryAttention-262"><span class="linenos">262</span></a><span class="sd">            head_size (`int`) : dimension of the key and query vectors.</span>
+</span><span id="DynamicQueryAttention-263"><a href="#DynamicQueryAttention-263"><span class="linenos">263</span></a><span class="sd">            domain_dim (`int`) : dimension of the input dims (assumed to be the same</span>
+</span><span id="DynamicQueryAttention-264"><a href="#DynamicQueryAttention-264"><span class="linenos">264</span></a><span class="sd">                for now)</span>
+</span><span id="DynamicQueryAttention-265"><a href="#DynamicQueryAttention-265"><span class="linenos">265</span></a><span class="sd">            domain_names  (`Iterable[str]`) : list of input domains</span>
+</span><span id="DynamicQueryAttention-266"><a href="#DynamicQueryAttention-266"><span class="linenos">266</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="DynamicQueryAttention-267"><a href="#DynamicQueryAttention-267"><span class="linenos">267</span></a>        <span class="nb">super</span><span class="p">()</span><span class="o">.</span><span class="fm">__init__</span><span class="p">()</span>
+</span><span id="DynamicQueryAttention-268"><a href="#DynamicQueryAttention-268"><span class="linenos">268</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">head_size</span> <span class="o">=</span> <span class="n">head_size</span>
+</span><span id="DynamicQueryAttention-269"><a href="#DynamicQueryAttention-269"><span class="linenos">269</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">query_layer</span> <span class="o">=</span> <span class="n">nn</span><span class="o">.</span><span class="n">Linear</span><span class="p">(</span><span class="n">domain_dim</span><span class="p">,</span> <span class="n">head_size</span><span class="p">)</span>
+</span><span id="DynamicQueryAttention-270"><a href="#DynamicQueryAttention-270"><span class="linenos">270</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">key_layers</span> <span class="o">=</span> <span class="n">nn</span><span class="o">.</span><span class="n">ModuleDict</span><span class="p">(</span>
+</span><span id="DynamicQueryAttention-271"><a href="#DynamicQueryAttention-271"><span class="linenos">271</span></a>            <span class="p">{</span><span class="n">domain</span><span class="p">:</span> <span class="n">nn</span><span class="o">.</span><span class="n">Linear</span><span class="p">(</span><span class="n">domain_dim</span><span class="p">,</span> <span class="n">head_size</span><span class="p">)</span> <span class="k">for</span> <span class="n">domain</span> <span class="ow">in</span> <span class="n">domain_names</span><span class="p">}</span>
+</span><span id="DynamicQueryAttention-272"><a href="#DynamicQueryAttention-272"><span class="linenos">272</span></a>        <span class="p">)</span>
+</span><span id="DynamicQueryAttention-273"><a href="#DynamicQueryAttention-273"><span class="linenos">273</span></a>        <span class="c1"># Start with a random gw state</span>
+</span><span id="DynamicQueryAttention-274"><a href="#DynamicQueryAttention-274"><span class="linenos">274</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">register_buffer</span><span class="p">(</span><span class="s2">&quot;initial_gw_state&quot;</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">rand</span><span class="p">(</span><span class="n">domain_dim</span><span class="p">))</span>
+</span><span id="DynamicQueryAttention-275"><a href="#DynamicQueryAttention-275"><span class="linenos">275</span></a>
+</span><span id="DynamicQueryAttention-276"><a href="#DynamicQueryAttention-276"><span class="linenos">276</span></a>    <span class="k">def</span> <span class="nf">fuse_weighted_encodings</span><span class="p">(</span>
+</span><span id="DynamicQueryAttention-277"><a href="#DynamicQueryAttention-277"><span class="linenos">277</span></a>        <span class="bp">self</span><span class="p">,</span> <span class="n">encodings</span><span class="p">:</span> <span class="n">LatentsDomainGroupT</span><span class="p">,</span> <span class="n">attention_dict</span><span class="p">:</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]</span>
+</span><span id="DynamicQueryAttention-278"><a href="#DynamicQueryAttention-278"><span class="linenos">278</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">:</span>
+</span><span id="DynamicQueryAttention-279"><a href="#DynamicQueryAttention-279"><span class="linenos">279</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="DynamicQueryAttention-280"><a href="#DynamicQueryAttention-280"><span class="linenos">280</span></a><span class="sd">        Fuse the weighted encodings using the attention scores.</span>
+</span><span id="DynamicQueryAttention-281"><a href="#DynamicQueryAttention-281"><span class="linenos">281</span></a>
+</span><span id="DynamicQueryAttention-282"><a href="#DynamicQueryAttention-282"><span class="linenos">282</span></a><span class="sd">        Args:</span>
+</span><span id="DynamicQueryAttention-283"><a href="#DynamicQueryAttention-283"><span class="linenos">283</span></a><span class="sd">            encodings (`LatentsDomainGroupT`): Unimodal latent representation</span>
+</span><span id="DynamicQueryAttention-284"><a href="#DynamicQueryAttention-284"><span class="linenos">284</span></a><span class="sd">            attention_dict (`dict[str, torch.Tensor]`): The attention scores for each</span>
+</span><span id="DynamicQueryAttention-285"><a href="#DynamicQueryAttention-285"><span class="linenos">285</span></a><span class="sd">                domain in the group.</span>
+</span><span id="DynamicQueryAttention-286"><a href="#DynamicQueryAttention-286"><span class="linenos">286</span></a>
+</span><span id="DynamicQueryAttention-287"><a href="#DynamicQueryAttention-287"><span class="linenos">287</span></a><span class="sd">        Returns:</span>
+</span><span id="DynamicQueryAttention-288"><a href="#DynamicQueryAttention-288"><span class="linenos">288</span></a><span class="sd">            `torch.Tensor`: The fused tensor.</span>
+</span><span id="DynamicQueryAttention-289"><a href="#DynamicQueryAttention-289"><span class="linenos">289</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="DynamicQueryAttention-290"><a href="#DynamicQueryAttention-290"><span class="linenos">290</span></a>        <span class="c1"># Apply attention scores to the encodings</span>
+</span><span id="DynamicQueryAttention-291"><a href="#DynamicQueryAttention-291"><span class="linenos">291</span></a>        <span class="n">weighted_encodings</span> <span class="o">=</span> <span class="p">{}</span>
+</span><span id="DynamicQueryAttention-292"><a href="#DynamicQueryAttention-292"><span class="linenos">292</span></a>        <span class="k">for</span> <span class="n">key</span> <span class="ow">in</span> <span class="n">attention_dict</span><span class="p">:</span>
+</span><span id="DynamicQueryAttention-293"><a href="#DynamicQueryAttention-293"><span class="linenos">293</span></a>            <span class="k">if</span> <span class="n">key</span> <span class="ow">in</span> <span class="n">encodings</span><span class="p">:</span>
+</span><span id="DynamicQueryAttention-294"><a href="#DynamicQueryAttention-294"><span class="linenos">294</span></a>                <span class="c1"># Perform element-wise multiplication</span>
+</span><span id="DynamicQueryAttention-295"><a href="#DynamicQueryAttention-295"><span class="linenos">295</span></a>                <span class="n">weighted_encodings</span><span class="p">[</span><span class="n">key</span><span class="p">]</span> <span class="o">=</span> <span class="p">(</span>
+</span><span id="DynamicQueryAttention-296"><a href="#DynamicQueryAttention-296"><span class="linenos">296</span></a>                    <span class="n">attention_dict</span><span class="p">[</span><span class="n">key</span><span class="p">]</span><span class="o">.</span><span class="n">unsqueeze</span><span class="p">(</span><span class="mi">1</span><span class="p">)</span> <span class="o">*</span> <span class="n">encodings</span><span class="p">[</span><span class="n">key</span><span class="p">]</span>
+</span><span id="DynamicQueryAttention-297"><a href="#DynamicQueryAttention-297"><span class="linenos">297</span></a>                <span class="p">)</span>
+</span><span id="DynamicQueryAttention-298"><a href="#DynamicQueryAttention-298"><span class="linenos">298</span></a>
+</span><span id="DynamicQueryAttention-299"><a href="#DynamicQueryAttention-299"><span class="linenos">299</span></a>        <span class="c1"># Stack the tensors along a new dimension (dimension 0)</span>
+</span><span id="DynamicQueryAttention-300"><a href="#DynamicQueryAttention-300"><span class="linenos">300</span></a>        <span class="n">stacked_tensors</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">stack</span><span class="p">(</span><span class="nb">list</span><span class="p">(</span><span class="n">weighted_encodings</span><span class="o">.</span><span class="n">values</span><span class="p">()))</span>
+</span><span id="DynamicQueryAttention-301"><a href="#DynamicQueryAttention-301"><span class="linenos">301</span></a>
+</span><span id="DynamicQueryAttention-302"><a href="#DynamicQueryAttention-302"><span class="linenos">302</span></a>        <span class="c1"># Apply fusion by summing along the newly created dimension</span>
+</span><span id="DynamicQueryAttention-303"><a href="#DynamicQueryAttention-303"><span class="linenos">303</span></a>        <span class="n">summed_tensor</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">sum</span><span class="p">(</span><span class="n">stacked_tensors</span><span class="p">,</span> <span class="n">dim</span><span class="o">=</span><span class="mi">0</span><span class="p">)</span>
+</span><span id="DynamicQueryAttention-304"><a href="#DynamicQueryAttention-304"><span class="linenos">304</span></a>        <span class="k">return</span> <span class="n">summed_tensor</span>
+</span><span id="DynamicQueryAttention-305"><a href="#DynamicQueryAttention-305"><span class="linenos">305</span></a>
+</span><span id="DynamicQueryAttention-306"><a href="#DynamicQueryAttention-306"><span class="linenos">306</span></a>    <span class="k">def</span> <span class="nf">forward</span><span class="p">(</span>
+</span><span id="DynamicQueryAttention-307"><a href="#DynamicQueryAttention-307"><span class="linenos">307</span></a>        <span class="bp">self</span><span class="p">,</span> <span class="n">domains</span><span class="p">:</span> <span class="n">LatentsDomainGroupT</span><span class="p">,</span> <span class="n">encodings_pre_fusion</span><span class="p">:</span> <span class="n">LatentsDomainGroupT</span>
+</span><span id="DynamicQueryAttention-308"><a href="#DynamicQueryAttention-308"><span class="linenos">308</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]:</span>
+</span><span id="DynamicQueryAttention-309"><a href="#DynamicQueryAttention-309"><span class="linenos">309</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="DynamicQueryAttention-310"><a href="#DynamicQueryAttention-310"><span class="linenos">310</span></a><span class="sd">        Compute keys and queries, match them with dot product and softmax.</span>
+</span><span id="DynamicQueryAttention-311"><a href="#DynamicQueryAttention-311"><span class="linenos">311</span></a><span class="sd">        Does this twice, once with the static query and once with a dynamic query.</span>
+</span><span id="DynamicQueryAttention-312"><a href="#DynamicQueryAttention-312"><span class="linenos">312</span></a>
+</span><span id="DynamicQueryAttention-313"><a href="#DynamicQueryAttention-313"><span class="linenos">313</span></a><span class="sd">        Args:</span>
+</span><span id="DynamicQueryAttention-314"><a href="#DynamicQueryAttention-314"><span class="linenos">314</span></a><span class="sd">            domains (`LatentsDomainGroupT`): Group of unimodal latent representations.</span>
+</span><span id="DynamicQueryAttention-315"><a href="#DynamicQueryAttention-315"><span class="linenos">315</span></a><span class="sd">            encodings (`LatentsDomainGroupT`): Group of pre-fusion encodings.</span>
+</span><span id="DynamicQueryAttention-316"><a href="#DynamicQueryAttention-316"><span class="linenos">316</span></a>
+</span><span id="DynamicQueryAttention-317"><a href="#DynamicQueryAttention-317"><span class="linenos">317</span></a><span class="sd">        Returns:</span>
+</span><span id="DynamicQueryAttention-318"><a href="#DynamicQueryAttention-318"><span class="linenos">318</span></a><span class="sd">            `dict[str, torch.Tensor]`: the attention scores for each domain in the</span>
+</span><span id="DynamicQueryAttention-319"><a href="#DynamicQueryAttention-319"><span class="linenos">319</span></a><span class="sd">            group.</span>
+</span><span id="DynamicQueryAttention-320"><a href="#DynamicQueryAttention-320"><span class="linenos">320</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="DynamicQueryAttention-321"><a href="#DynamicQueryAttention-321"><span class="linenos">321</span></a>
+</span><span id="DynamicQueryAttention-322"><a href="#DynamicQueryAttention-322"><span class="linenos">322</span></a>        <span class="n">keys</span> <span class="o">=</span> <span class="p">{</span>
+</span><span id="DynamicQueryAttention-323"><a href="#DynamicQueryAttention-323"><span class="linenos">323</span></a>            <span class="n">domain</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">key_layers</span><span class="p">[</span><span class="n">domain</span><span class="p">](</span><span class="n">encoding</span><span class="p">)</span>
+</span><span id="DynamicQueryAttention-324"><a href="#DynamicQueryAttention-324"><span class="linenos">324</span></a>            <span class="k">for</span> <span class="n">domain</span><span class="p">,</span> <span class="n">encoding</span> <span class="ow">in</span> <span class="n">domains</span><span class="o">.</span><span class="n">items</span><span class="p">()</span>
+</span><span id="DynamicQueryAttention-325"><a href="#DynamicQueryAttention-325"><span class="linenos">325</span></a>        <span class="p">}</span>
+</span><span id="DynamicQueryAttention-326"><a href="#DynamicQueryAttention-326"><span class="linenos">326</span></a>
+</span><span id="DynamicQueryAttention-327"><a href="#DynamicQueryAttention-327"><span class="linenos">327</span></a>        <span class="n">batch_size</span> <span class="o">=</span> <span class="n">group_batch_size</span><span class="p">(</span><span class="n">domains</span><span class="p">)</span>
+</span><span id="DynamicQueryAttention-328"><a href="#DynamicQueryAttention-328"><span class="linenos">328</span></a>
+</span><span id="DynamicQueryAttention-329"><a href="#DynamicQueryAttention-329"><span class="linenos">329</span></a>        <span class="c1"># Retrieve random query</span>
+</span><span id="DynamicQueryAttention-330"><a href="#DynamicQueryAttention-330"><span class="linenos">330</span></a>        <span class="n">query</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">query_layer</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">initial_gw_state</span><span class="o">.</span><span class="n">expand</span><span class="p">(</span><span class="n">batch_size</span><span class="p">,</span> <span class="o">-</span><span class="mi">1</span><span class="p">))</span>
+</span><span id="DynamicQueryAttention-331"><a href="#DynamicQueryAttention-331"><span class="linenos">331</span></a>
+</span><span id="DynamicQueryAttention-332"><a href="#DynamicQueryAttention-332"><span class="linenos">332</span></a>        <span class="c1"># Calculate the attention scores</span>
+</span><span id="DynamicQueryAttention-333"><a href="#DynamicQueryAttention-333"><span class="linenos">333</span></a>        <span class="n">static_attention_dict</span> <span class="o">=</span> <span class="n">_calculate_attention_dict</span><span class="p">(</span><span class="n">domains</span><span class="p">,</span> <span class="n">keys</span><span class="p">,</span> <span class="n">query</span><span class="p">)</span>
+</span><span id="DynamicQueryAttention-334"><a href="#DynamicQueryAttention-334"><span class="linenos">334</span></a>
+</span><span id="DynamicQueryAttention-335"><a href="#DynamicQueryAttention-335"><span class="linenos">335</span></a>        <span class="c1"># Apply the attention scores to the encodings</span>
+</span><span id="DynamicQueryAttention-336"><a href="#DynamicQueryAttention-336"><span class="linenos">336</span></a>        <span class="n">summed_tensor</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">fuse_weighted_encodings</span><span class="p">(</span>
+</span><span id="DynamicQueryAttention-337"><a href="#DynamicQueryAttention-337"><span class="linenos">337</span></a>            <span class="n">encodings_pre_fusion</span><span class="p">,</span> <span class="n">static_attention_dict</span>
+</span><span id="DynamicQueryAttention-338"><a href="#DynamicQueryAttention-338"><span class="linenos">338</span></a>        <span class="p">)</span>
+</span><span id="DynamicQueryAttention-339"><a href="#DynamicQueryAttention-339"><span class="linenos">339</span></a>
+</span><span id="DynamicQueryAttention-340"><a href="#DynamicQueryAttention-340"><span class="linenos">340</span></a>        <span class="c1"># Retrieve query (now it is dependent on the new gw state)</span>
+</span><span id="DynamicQueryAttention-341"><a href="#DynamicQueryAttention-341"><span class="linenos">341</span></a>        <span class="n">query</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">query_layer</span><span class="p">(</span><span class="n">summed_tensor</span><span class="p">)</span>
+</span><span id="DynamicQueryAttention-342"><a href="#DynamicQueryAttention-342"><span class="linenos">342</span></a>
+</span><span id="DynamicQueryAttention-343"><a href="#DynamicQueryAttention-343"><span class="linenos">343</span></a>        <span class="c1"># Calculate the attention scores again</span>
+</span><span id="DynamicQueryAttention-344"><a href="#DynamicQueryAttention-344"><span class="linenos">344</span></a>        <span class="n">dynamic_attention_dict</span> <span class="o">=</span> <span class="n">_calculate_attention_dict</span><span class="p">(</span><span class="n">domains</span><span class="p">,</span> <span class="n">keys</span><span class="p">,</span> <span class="n">query</span><span class="p">)</span>
+</span><span id="DynamicQueryAttention-345"><a href="#DynamicQueryAttention-345"><span class="linenos">345</span></a>
+</span><span id="DynamicQueryAttention-346"><a href="#DynamicQueryAttention-346"><span class="linenos">346</span></a>        <span class="k">return</span> <span class="n">dynamic_attention_dict</span>
+</span></pre></div>
+
+
+            <div class="docstring"><p>Key-Query attention with a dynamic gw vector.
+The query is updated based on the scaled gw vector.</p>
+</div>
+
+
+                            <div id="DynamicQueryAttention.__init__" class="classattr">
+                                        <input id="DynamicQueryAttention.__init__-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
+<div class="attr function">
+            
+        <span class="name">DynamicQueryAttention</span><span class="signature pdoc-code multiline">(<span class="param">	<span class="n">head_size</span><span class="p">:</span> <span class="nb">int</span>,</span><span class="param">	<span class="n">domain_dim</span><span class="p">:</span> <span class="nb">int</span>,</span><span class="param">	<span class="n">domain_names</span><span class="p">:</span> <span class="n">collections</span><span class="o">.</span><span class="n">abc</span><span class="o">.</span><span class="n">Iterable</span><span class="p">[</span><span class="nb">str</span><span class="p">]</span></span>)</span>
+
+                <label class="view-source-button" for="DynamicQueryAttention.__init__-view-source"><span>View Source</span></label>
+
+    </div>
+    <a class="headerlink" href="#DynamicQueryAttention.__init__"></a>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="DynamicQueryAttention.__init__-259"><a href="#DynamicQueryAttention.__init__-259"><span class="linenos">259</span></a>    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">head_size</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span> <span class="n">domain_dim</span><span class="p">:</span> <span class="nb">int</span><span class="p">,</span> <span class="n">domain_names</span><span class="p">:</span> <span class="n">Iterable</span><span class="p">[</span><span class="nb">str</span><span class="p">]):</span>
+</span><span id="DynamicQueryAttention.__init__-260"><a href="#DynamicQueryAttention.__init__-260"><span class="linenos">260</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="DynamicQueryAttention.__init__-261"><a href="#DynamicQueryAttention.__init__-261"><span class="linenos">261</span></a><span class="sd">        Args:</span>
+</span><span id="DynamicQueryAttention.__init__-262"><a href="#DynamicQueryAttention.__init__-262"><span class="linenos">262</span></a><span class="sd">            head_size (`int`) : dimension of the key and query vectors.</span>
+</span><span id="DynamicQueryAttention.__init__-263"><a href="#DynamicQueryAttention.__init__-263"><span class="linenos">263</span></a><span class="sd">            domain_dim (`int`) : dimension of the input dims (assumed to be the same</span>
+</span><span id="DynamicQueryAttention.__init__-264"><a href="#DynamicQueryAttention.__init__-264"><span class="linenos">264</span></a><span class="sd">                for now)</span>
+</span><span id="DynamicQueryAttention.__init__-265"><a href="#DynamicQueryAttention.__init__-265"><span class="linenos">265</span></a><span class="sd">            domain_names  (`Iterable[str]`) : list of input domains</span>
+</span><span id="DynamicQueryAttention.__init__-266"><a href="#DynamicQueryAttention.__init__-266"><span class="linenos">266</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="DynamicQueryAttention.__init__-267"><a href="#DynamicQueryAttention.__init__-267"><span class="linenos">267</span></a>        <span class="nb">super</span><span class="p">()</span><span class="o">.</span><span class="fm">__init__</span><span class="p">()</span>
+</span><span id="DynamicQueryAttention.__init__-268"><a href="#DynamicQueryAttention.__init__-268"><span class="linenos">268</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">head_size</span> <span class="o">=</span> <span class="n">head_size</span>
+</span><span id="DynamicQueryAttention.__init__-269"><a href="#DynamicQueryAttention.__init__-269"><span class="linenos">269</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">query_layer</span> <span class="o">=</span> <span class="n">nn</span><span class="o">.</span><span class="n">Linear</span><span class="p">(</span><span class="n">domain_dim</span><span class="p">,</span> <span class="n">head_size</span><span class="p">)</span>
+</span><span id="DynamicQueryAttention.__init__-270"><a href="#DynamicQueryAttention.__init__-270"><span class="linenos">270</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">key_layers</span> <span class="o">=</span> <span class="n">nn</span><span class="o">.</span><span class="n">ModuleDict</span><span class="p">(</span>
+</span><span id="DynamicQueryAttention.__init__-271"><a href="#DynamicQueryAttention.__init__-271"><span class="linenos">271</span></a>            <span class="p">{</span><span class="n">domain</span><span class="p">:</span> <span class="n">nn</span><span class="o">.</span><span class="n">Linear</span><span class="p">(</span><span class="n">domain_dim</span><span class="p">,</span> <span class="n">head_size</span><span class="p">)</span> <span class="k">for</span> <span class="n">domain</span> <span class="ow">in</span> <span class="n">domain_names</span><span class="p">}</span>
+</span><span id="DynamicQueryAttention.__init__-272"><a href="#DynamicQueryAttention.__init__-272"><span class="linenos">272</span></a>        <span class="p">)</span>
+</span><span id="DynamicQueryAttention.__init__-273"><a href="#DynamicQueryAttention.__init__-273"><span class="linenos">273</span></a>        <span class="c1"># Start with a random gw state</span>
+</span><span id="DynamicQueryAttention.__init__-274"><a href="#DynamicQueryAttention.__init__-274"><span class="linenos">274</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">register_buffer</span><span class="p">(</span><span class="s2">&quot;initial_gw_state&quot;</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">rand</span><span class="p">(</span><span class="n">domain_dim</span><span class="p">))</span>
+</span></pre></div>
+
+
+            <div class="docstring"><h6 id="arguments">Arguments:</h6>
+
+<ul>
+<li><strong>head_size (<code>int</code>) :</strong>  dimension of the key and query vectors.</li>
+<li><strong>domain_dim (<code>int</code>) :</strong>  dimension of the input dims (assumed to be the same
+for now)</li>
+<li><strong>domain_names  (<code>Iterable[str]</code>) :</strong>  list of input domains</li>
+</ul>
+</div>
+
+
+                            </div>
+                            <div id="DynamicQueryAttention.head_size" class="classattr">
+                                <div class="attr variable">
+            <span class="name">head_size</span>
+
+        
+    </div>
+    <a class="headerlink" href="#DynamicQueryAttention.head_size"></a>
+    
+    
+
+                            </div>
+                            <div id="DynamicQueryAttention.query_layer" class="classattr">
+                                <div class="attr variable">
+            <span class="name">query_layer</span>
+
+        
+    </div>
+    <a class="headerlink" href="#DynamicQueryAttention.query_layer"></a>
+    
+    
+
+                            </div>
+                            <div id="DynamicQueryAttention.key_layers" class="classattr">
+                                <div class="attr variable">
+            <span class="name">key_layers</span>
+
+        
+    </div>
+    <a class="headerlink" href="#DynamicQueryAttention.key_layers"></a>
+    
+    
+
+                            </div>
+                            <div id="DynamicQueryAttention.fuse_weighted_encodings" class="classattr">
+                                        <input id="DynamicQueryAttention.fuse_weighted_encodings-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
+<div class="attr function">
+            
+        <span class="def">def</span>
+        <span class="name">fuse_weighted_encodings</span><span class="signature pdoc-code multiline">(<span class="param">	<span class="bp">self</span>,</span><span class="param">	<span class="n">encodings</span><span class="p">:</span> <span class="n">collections</span><span class="o">.</span><span class="n">abc</span><span class="o">.</span><span class="n">Mapping</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]</span>,</span><span class="param">	<span class="n">attention_dict</span><span class="p">:</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]</span></span><span class="return-annotation">) -> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span>:</span></span>
+
+                <label class="view-source-button" for="DynamicQueryAttention.fuse_weighted_encodings-view-source"><span>View Source</span></label>
+
+    </div>
+    <a class="headerlink" href="#DynamicQueryAttention.fuse_weighted_encodings"></a>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="DynamicQueryAttention.fuse_weighted_encodings-276"><a href="#DynamicQueryAttention.fuse_weighted_encodings-276"><span class="linenos">276</span></a>    <span class="k">def</span> <span class="nf">fuse_weighted_encodings</span><span class="p">(</span>
+</span><span id="DynamicQueryAttention.fuse_weighted_encodings-277"><a href="#DynamicQueryAttention.fuse_weighted_encodings-277"><span class="linenos">277</span></a>        <span class="bp">self</span><span class="p">,</span> <span class="n">encodings</span><span class="p">:</span> <span class="n">LatentsDomainGroupT</span><span class="p">,</span> <span class="n">attention_dict</span><span class="p">:</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]</span>
+</span><span id="DynamicQueryAttention.fuse_weighted_encodings-278"><a href="#DynamicQueryAttention.fuse_weighted_encodings-278"><span class="linenos">278</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">:</span>
+</span><span id="DynamicQueryAttention.fuse_weighted_encodings-279"><a href="#DynamicQueryAttention.fuse_weighted_encodings-279"><span class="linenos">279</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="DynamicQueryAttention.fuse_weighted_encodings-280"><a href="#DynamicQueryAttention.fuse_weighted_encodings-280"><span class="linenos">280</span></a><span class="sd">        Fuse the weighted encodings using the attention scores.</span>
+</span><span id="DynamicQueryAttention.fuse_weighted_encodings-281"><a href="#DynamicQueryAttention.fuse_weighted_encodings-281"><span class="linenos">281</span></a>
+</span><span id="DynamicQueryAttention.fuse_weighted_encodings-282"><a href="#DynamicQueryAttention.fuse_weighted_encodings-282"><span class="linenos">282</span></a><span class="sd">        Args:</span>
+</span><span id="DynamicQueryAttention.fuse_weighted_encodings-283"><a href="#DynamicQueryAttention.fuse_weighted_encodings-283"><span class="linenos">283</span></a><span class="sd">            encodings (`LatentsDomainGroupT`): Unimodal latent representation</span>
+</span><span id="DynamicQueryAttention.fuse_weighted_encodings-284"><a href="#DynamicQueryAttention.fuse_weighted_encodings-284"><span class="linenos">284</span></a><span class="sd">            attention_dict (`dict[str, torch.Tensor]`): The attention scores for each</span>
+</span><span id="DynamicQueryAttention.fuse_weighted_encodings-285"><a href="#DynamicQueryAttention.fuse_weighted_encodings-285"><span class="linenos">285</span></a><span class="sd">                domain in the group.</span>
+</span><span id="DynamicQueryAttention.fuse_weighted_encodings-286"><a href="#DynamicQueryAttention.fuse_weighted_encodings-286"><span class="linenos">286</span></a>
+</span><span id="DynamicQueryAttention.fuse_weighted_encodings-287"><a href="#DynamicQueryAttention.fuse_weighted_encodings-287"><span class="linenos">287</span></a><span class="sd">        Returns:</span>
+</span><span id="DynamicQueryAttention.fuse_weighted_encodings-288"><a href="#DynamicQueryAttention.fuse_weighted_encodings-288"><span class="linenos">288</span></a><span class="sd">            `torch.Tensor`: The fused tensor.</span>
+</span><span id="DynamicQueryAttention.fuse_weighted_encodings-289"><a href="#DynamicQueryAttention.fuse_weighted_encodings-289"><span class="linenos">289</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="DynamicQueryAttention.fuse_weighted_encodings-290"><a href="#DynamicQueryAttention.fuse_weighted_encodings-290"><span class="linenos">290</span></a>        <span class="c1"># Apply attention scores to the encodings</span>
+</span><span id="DynamicQueryAttention.fuse_weighted_encodings-291"><a href="#DynamicQueryAttention.fuse_weighted_encodings-291"><span class="linenos">291</span></a>        <span class="n">weighted_encodings</span> <span class="o">=</span> <span class="p">{}</span>
+</span><span id="DynamicQueryAttention.fuse_weighted_encodings-292"><a href="#DynamicQueryAttention.fuse_weighted_encodings-292"><span class="linenos">292</span></a>        <span class="k">for</span> <span class="n">key</span> <span class="ow">in</span> <span class="n">attention_dict</span><span class="p">:</span>
+</span><span id="DynamicQueryAttention.fuse_weighted_encodings-293"><a href="#DynamicQueryAttention.fuse_weighted_encodings-293"><span class="linenos">293</span></a>            <span class="k">if</span> <span class="n">key</span> <span class="ow">in</span> <span class="n">encodings</span><span class="p">:</span>
+</span><span id="DynamicQueryAttention.fuse_weighted_encodings-294"><a href="#DynamicQueryAttention.fuse_weighted_encodings-294"><span class="linenos">294</span></a>                <span class="c1"># Perform element-wise multiplication</span>
+</span><span id="DynamicQueryAttention.fuse_weighted_encodings-295"><a href="#DynamicQueryAttention.fuse_weighted_encodings-295"><span class="linenos">295</span></a>                <span class="n">weighted_encodings</span><span class="p">[</span><span class="n">key</span><span class="p">]</span> <span class="o">=</span> <span class="p">(</span>
+</span><span id="DynamicQueryAttention.fuse_weighted_encodings-296"><a href="#DynamicQueryAttention.fuse_weighted_encodings-296"><span class="linenos">296</span></a>                    <span class="n">attention_dict</span><span class="p">[</span><span class="n">key</span><span class="p">]</span><span class="o">.</span><span class="n">unsqueeze</span><span class="p">(</span><span class="mi">1</span><span class="p">)</span> <span class="o">*</span> <span class="n">encodings</span><span class="p">[</span><span class="n">key</span><span class="p">]</span>
+</span><span id="DynamicQueryAttention.fuse_weighted_encodings-297"><a href="#DynamicQueryAttention.fuse_weighted_encodings-297"><span class="linenos">297</span></a>                <span class="p">)</span>
+</span><span id="DynamicQueryAttention.fuse_weighted_encodings-298"><a href="#DynamicQueryAttention.fuse_weighted_encodings-298"><span class="linenos">298</span></a>
+</span><span id="DynamicQueryAttention.fuse_weighted_encodings-299"><a href="#DynamicQueryAttention.fuse_weighted_encodings-299"><span class="linenos">299</span></a>        <span class="c1"># Stack the tensors along a new dimension (dimension 0)</span>
+</span><span id="DynamicQueryAttention.fuse_weighted_encodings-300"><a href="#DynamicQueryAttention.fuse_weighted_encodings-300"><span class="linenos">300</span></a>        <span class="n">stacked_tensors</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">stack</span><span class="p">(</span><span class="nb">list</span><span class="p">(</span><span class="n">weighted_encodings</span><span class="o">.</span><span class="n">values</span><span class="p">()))</span>
+</span><span id="DynamicQueryAttention.fuse_weighted_encodings-301"><a href="#DynamicQueryAttention.fuse_weighted_encodings-301"><span class="linenos">301</span></a>
+</span><span id="DynamicQueryAttention.fuse_weighted_encodings-302"><a href="#DynamicQueryAttention.fuse_weighted_encodings-302"><span class="linenos">302</span></a>        <span class="c1"># Apply fusion by summing along the newly created dimension</span>
+</span><span id="DynamicQueryAttention.fuse_weighted_encodings-303"><a href="#DynamicQueryAttention.fuse_weighted_encodings-303"><span class="linenos">303</span></a>        <span class="n">summed_tensor</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">sum</span><span class="p">(</span><span class="n">stacked_tensors</span><span class="p">,</span> <span class="n">dim</span><span class="o">=</span><span class="mi">0</span><span class="p">)</span>
+</span><span id="DynamicQueryAttention.fuse_weighted_encodings-304"><a href="#DynamicQueryAttention.fuse_weighted_encodings-304"><span class="linenos">304</span></a>        <span class="k">return</span> <span class="n">summed_tensor</span>
+</span></pre></div>
+
+
+            <div class="docstring"><p>Fuse the weighted encodings using the attention scores.</p>
+
+<h6 id="arguments">Arguments:</h6>
+
+<ul>
+<li><strong>encodings (<code>LatentsDomainGroupT</code>):</strong>  Unimodal latent representation</li>
+<li><strong>attention_dict (<code>dict[str, torch.Tensor]</code>):</strong>  The attention scores for each
+domain in the group.</li>
+</ul>
+
+<h6 id="returns">Returns:</h6>
+
+<blockquote>
+  <p><code>torch.Tensor</code>: The fused tensor.</p>
+</blockquote>
+</div>
+
+
+                            </div>
+                            <div id="DynamicQueryAttention.forward" class="classattr">
+                                        <input id="DynamicQueryAttention.forward-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
+<div class="attr function">
+            
+        <span class="def">def</span>
+        <span class="name">forward</span><span class="signature pdoc-code multiline">(<span class="param">	<span class="bp">self</span>,</span><span class="param">	<span class="n">domains</span><span class="p">:</span> <span class="n">collections</span><span class="o">.</span><span class="n">abc</span><span class="o">.</span><span class="n">Mapping</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]</span>,</span><span class="param">	<span class="n">encodings_pre_fusion</span><span class="p">:</span> <span class="n">collections</span><span class="o">.</span><span class="n">abc</span><span class="o">.</span><span class="n">Mapping</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]</span></span><span class="return-annotation">) -> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]</span>:</span></span>
+
+                <label class="view-source-button" for="DynamicQueryAttention.forward-view-source"><span>View Source</span></label>
+
+    </div>
+    <a class="headerlink" href="#DynamicQueryAttention.forward"></a>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="DynamicQueryAttention.forward-306"><a href="#DynamicQueryAttention.forward-306"><span class="linenos">306</span></a>    <span class="k">def</span> <span class="nf">forward</span><span class="p">(</span>
+</span><span id="DynamicQueryAttention.forward-307"><a href="#DynamicQueryAttention.forward-307"><span class="linenos">307</span></a>        <span class="bp">self</span><span class="p">,</span> <span class="n">domains</span><span class="p">:</span> <span class="n">LatentsDomainGroupT</span><span class="p">,</span> <span class="n">encodings_pre_fusion</span><span class="p">:</span> <span class="n">LatentsDomainGroupT</span>
+</span><span id="DynamicQueryAttention.forward-308"><a href="#DynamicQueryAttention.forward-308"><span class="linenos">308</span></a>    <span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]:</span>
+</span><span id="DynamicQueryAttention.forward-309"><a href="#DynamicQueryAttention.forward-309"><span class="linenos">309</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="DynamicQueryAttention.forward-310"><a href="#DynamicQueryAttention.forward-310"><span class="linenos">310</span></a><span class="sd">        Compute keys and queries, match them with dot product and softmax.</span>
+</span><span id="DynamicQueryAttention.forward-311"><a href="#DynamicQueryAttention.forward-311"><span class="linenos">311</span></a><span class="sd">        Does this twice, once with the static query and once with a dynamic query.</span>
+</span><span id="DynamicQueryAttention.forward-312"><a href="#DynamicQueryAttention.forward-312"><span class="linenos">312</span></a>
+</span><span id="DynamicQueryAttention.forward-313"><a href="#DynamicQueryAttention.forward-313"><span class="linenos">313</span></a><span class="sd">        Args:</span>
+</span><span id="DynamicQueryAttention.forward-314"><a href="#DynamicQueryAttention.forward-314"><span class="linenos">314</span></a><span class="sd">            domains (`LatentsDomainGroupT`): Group of unimodal latent representations.</span>
+</span><span id="DynamicQueryAttention.forward-315"><a href="#DynamicQueryAttention.forward-315"><span class="linenos">315</span></a><span class="sd">            encodings (`LatentsDomainGroupT`): Group of pre-fusion encodings.</span>
+</span><span id="DynamicQueryAttention.forward-316"><a href="#DynamicQueryAttention.forward-316"><span class="linenos">316</span></a>
+</span><span id="DynamicQueryAttention.forward-317"><a href="#DynamicQueryAttention.forward-317"><span class="linenos">317</span></a><span class="sd">        Returns:</span>
+</span><span id="DynamicQueryAttention.forward-318"><a href="#DynamicQueryAttention.forward-318"><span class="linenos">318</span></a><span class="sd">            `dict[str, torch.Tensor]`: the attention scores for each domain in the</span>
+</span><span id="DynamicQueryAttention.forward-319"><a href="#DynamicQueryAttention.forward-319"><span class="linenos">319</span></a><span class="sd">            group.</span>
+</span><span id="DynamicQueryAttention.forward-320"><a href="#DynamicQueryAttention.forward-320"><span class="linenos">320</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="DynamicQueryAttention.forward-321"><a href="#DynamicQueryAttention.forward-321"><span class="linenos">321</span></a>
+</span><span id="DynamicQueryAttention.forward-322"><a href="#DynamicQueryAttention.forward-322"><span class="linenos">322</span></a>        <span class="n">keys</span> <span class="o">=</span> <span class="p">{</span>
+</span><span id="DynamicQueryAttention.forward-323"><a href="#DynamicQueryAttention.forward-323"><span class="linenos">323</span></a>            <span class="n">domain</span><span class="p">:</span> <span class="bp">self</span><span class="o">.</span><span class="n">key_layers</span><span class="p">[</span><span class="n">domain</span><span class="p">](</span><span class="n">encoding</span><span class="p">)</span>
+</span><span id="DynamicQueryAttention.forward-324"><a href="#DynamicQueryAttention.forward-324"><span class="linenos">324</span></a>            <span class="k">for</span> <span class="n">domain</span><span class="p">,</span> <span class="n">encoding</span> <span class="ow">in</span> <span class="n">domains</span><span class="o">.</span><span class="n">items</span><span class="p">()</span>
+</span><span id="DynamicQueryAttention.forward-325"><a href="#DynamicQueryAttention.forward-325"><span class="linenos">325</span></a>        <span class="p">}</span>
+</span><span id="DynamicQueryAttention.forward-326"><a href="#DynamicQueryAttention.forward-326"><span class="linenos">326</span></a>
+</span><span id="DynamicQueryAttention.forward-327"><a href="#DynamicQueryAttention.forward-327"><span class="linenos">327</span></a>        <span class="n">batch_size</span> <span class="o">=</span> <span class="n">group_batch_size</span><span class="p">(</span><span class="n">domains</span><span class="p">)</span>
+</span><span id="DynamicQueryAttention.forward-328"><a href="#DynamicQueryAttention.forward-328"><span class="linenos">328</span></a>
+</span><span id="DynamicQueryAttention.forward-329"><a href="#DynamicQueryAttention.forward-329"><span class="linenos">329</span></a>        <span class="c1"># Retrieve random query</span>
+</span><span id="DynamicQueryAttention.forward-330"><a href="#DynamicQueryAttention.forward-330"><span class="linenos">330</span></a>        <span class="n">query</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">query_layer</span><span class="p">(</span><span class="bp">self</span><span class="o">.</span><span class="n">initial_gw_state</span><span class="o">.</span><span class="n">expand</span><span class="p">(</span><span class="n">batch_size</span><span class="p">,</span> <span class="o">-</span><span class="mi">1</span><span class="p">))</span>
+</span><span id="DynamicQueryAttention.forward-331"><a href="#DynamicQueryAttention.forward-331"><span class="linenos">331</span></a>
+</span><span id="DynamicQueryAttention.forward-332"><a href="#DynamicQueryAttention.forward-332"><span class="linenos">332</span></a>        <span class="c1"># Calculate the attention scores</span>
+</span><span id="DynamicQueryAttention.forward-333"><a href="#DynamicQueryAttention.forward-333"><span class="linenos">333</span></a>        <span class="n">static_attention_dict</span> <span class="o">=</span> <span class="n">_calculate_attention_dict</span><span class="p">(</span><span class="n">domains</span><span class="p">,</span> <span class="n">keys</span><span class="p">,</span> <span class="n">query</span><span class="p">)</span>
+</span><span id="DynamicQueryAttention.forward-334"><a href="#DynamicQueryAttention.forward-334"><span class="linenos">334</span></a>
+</span><span id="DynamicQueryAttention.forward-335"><a href="#DynamicQueryAttention.forward-335"><span class="linenos">335</span></a>        <span class="c1"># Apply the attention scores to the encodings</span>
+</span><span id="DynamicQueryAttention.forward-336"><a href="#DynamicQueryAttention.forward-336"><span class="linenos">336</span></a>        <span class="n">summed_tensor</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">fuse_weighted_encodings</span><span class="p">(</span>
+</span><span id="DynamicQueryAttention.forward-337"><a href="#DynamicQueryAttention.forward-337"><span class="linenos">337</span></a>            <span class="n">encodings_pre_fusion</span><span class="p">,</span> <span class="n">static_attention_dict</span>
+</span><span id="DynamicQueryAttention.forward-338"><a href="#DynamicQueryAttention.forward-338"><span class="linenos">338</span></a>        <span class="p">)</span>
+</span><span id="DynamicQueryAttention.forward-339"><a href="#DynamicQueryAttention.forward-339"><span class="linenos">339</span></a>
+</span><span id="DynamicQueryAttention.forward-340"><a href="#DynamicQueryAttention.forward-340"><span class="linenos">340</span></a>        <span class="c1"># Retrieve query (now it is dependent on the new gw state)</span>
+</span><span id="DynamicQueryAttention.forward-341"><a href="#DynamicQueryAttention.forward-341"><span class="linenos">341</span></a>        <span class="n">query</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">query_layer</span><span class="p">(</span><span class="n">summed_tensor</span><span class="p">)</span>
+</span><span id="DynamicQueryAttention.forward-342"><a href="#DynamicQueryAttention.forward-342"><span class="linenos">342</span></a>
+</span><span id="DynamicQueryAttention.forward-343"><a href="#DynamicQueryAttention.forward-343"><span class="linenos">343</span></a>        <span class="c1"># Calculate the attention scores again</span>
+</span><span id="DynamicQueryAttention.forward-344"><a href="#DynamicQueryAttention.forward-344"><span class="linenos">344</span></a>        <span class="n">dynamic_attention_dict</span> <span class="o">=</span> <span class="n">_calculate_attention_dict</span><span class="p">(</span><span class="n">domains</span><span class="p">,</span> <span class="n">keys</span><span class="p">,</span> <span class="n">query</span><span class="p">)</span>
+</span><span id="DynamicQueryAttention.forward-345"><a href="#DynamicQueryAttention.forward-345"><span class="linenos">345</span></a>
+</span><span id="DynamicQueryAttention.forward-346"><a href="#DynamicQueryAttention.forward-346"><span class="linenos">346</span></a>        <span class="k">return</span> <span class="n">dynamic_attention_dict</span>
+</span></pre></div>
+
+
+            <div class="docstring"><p>Compute keys and queries, match them with dot product and softmax.
+Does this twice, once with the static query and once with a dynamic query.</p>
+
+<h6 id="arguments">Arguments:</h6>
+
+<ul>
+<li><strong>domains (<code>LatentsDomainGroupT</code>):</strong>  Group of unimodal latent representations.</li>
+<li><strong>encodings (<code>LatentsDomainGroupT</code>):</strong>  Group of pre-fusion encodings.</li>
+</ul>
+
+<h6 id="returns">Returns:</h6>
+
+<blockquote>
+  <p><code>dict[str, torch.Tensor]</code>: the attention scores for each domain in the
+  group.</p>
+</blockquote>
+</div>
+
+
+                            </div>
+                            <div class="inherited">
+                                <h5>Inherited Members</h5>
+                                <dl>
+                                    <div><dt><a href="#SelectionBase">SelectionBase</a></dt>
+                                <dd id="DynamicQueryAttention.update_gw_state" class="function"><a href="#SelectionBase.update_gw_state">update_gw_state</a></dd>
+
+            </div>
+            <div><dt>torch.nn.modules.module.Module</dt>
+                                <dd id="DynamicQueryAttention.dump_patches" class="variable">dump_patches</dd>
+                <dd id="DynamicQueryAttention.training" class="variable">training</dd>
+                <dd id="DynamicQueryAttention.call_super_init" class="variable">call_super_init</dd>
+                <dd id="DynamicQueryAttention.register_buffer" class="function">register_buffer</dd>
+                <dd id="DynamicQueryAttention.register_parameter" class="function">register_parameter</dd>
+                <dd id="DynamicQueryAttention.add_module" class="function">add_module</dd>
+                <dd id="DynamicQueryAttention.register_module" class="function">register_module</dd>
+                <dd id="DynamicQueryAttention.get_submodule" class="function">get_submodule</dd>
+                <dd id="DynamicQueryAttention.get_parameter" class="function">get_parameter</dd>
+                <dd id="DynamicQueryAttention.get_buffer" class="function">get_buffer</dd>
+                <dd id="DynamicQueryAttention.get_extra_state" class="function">get_extra_state</dd>
+                <dd id="DynamicQueryAttention.set_extra_state" class="function">set_extra_state</dd>
+                <dd id="DynamicQueryAttention.apply" class="function">apply</dd>
+                <dd id="DynamicQueryAttention.cuda" class="function">cuda</dd>
+                <dd id="DynamicQueryAttention.ipu" class="function">ipu</dd>
+                <dd id="DynamicQueryAttention.xpu" class="function">xpu</dd>
+                <dd id="DynamicQueryAttention.cpu" class="function">cpu</dd>
+                <dd id="DynamicQueryAttention.type" class="function">type</dd>
+                <dd id="DynamicQueryAttention.float" class="function">float</dd>
+                <dd id="DynamicQueryAttention.double" class="function">double</dd>
+                <dd id="DynamicQueryAttention.half" class="function">half</dd>
+                <dd id="DynamicQueryAttention.bfloat16" class="function">bfloat16</dd>
+                <dd id="DynamicQueryAttention.to_empty" class="function">to_empty</dd>
+                <dd id="DynamicQueryAttention.to" class="function">to</dd>
+                <dd id="DynamicQueryAttention.register_full_backward_pre_hook" class="function">register_full_backward_pre_hook</dd>
+                <dd id="DynamicQueryAttention.register_backward_hook" class="function">register_backward_hook</dd>
+                <dd id="DynamicQueryAttention.register_full_backward_hook" class="function">register_full_backward_hook</dd>
+                <dd id="DynamicQueryAttention.register_forward_pre_hook" class="function">register_forward_pre_hook</dd>
+                <dd id="DynamicQueryAttention.register_forward_hook" class="function">register_forward_hook</dd>
+                <dd id="DynamicQueryAttention.register_state_dict_pre_hook" class="function">register_state_dict_pre_hook</dd>
+                <dd id="DynamicQueryAttention.state_dict" class="function">state_dict</dd>
+                <dd id="DynamicQueryAttention.register_load_state_dict_post_hook" class="function">register_load_state_dict_post_hook</dd>
+                <dd id="DynamicQueryAttention.load_state_dict" class="function">load_state_dict</dd>
+                <dd id="DynamicQueryAttention.parameters" class="function">parameters</dd>
+                <dd id="DynamicQueryAttention.named_parameters" class="function">named_parameters</dd>
+                <dd id="DynamicQueryAttention.buffers" class="function">buffers</dd>
+                <dd id="DynamicQueryAttention.named_buffers" class="function">named_buffers</dd>
+                <dd id="DynamicQueryAttention.children" class="function">children</dd>
+                <dd id="DynamicQueryAttention.named_children" class="function">named_children</dd>
+                <dd id="DynamicQueryAttention.modules" class="function">modules</dd>
+                <dd id="DynamicQueryAttention.named_modules" class="function">named_modules</dd>
+                <dd id="DynamicQueryAttention.train" class="function">train</dd>
+                <dd id="DynamicQueryAttention.eval" class="function">eval</dd>
+                <dd id="DynamicQueryAttention.requires_grad_" class="function">requires_grad_</dd>
+                <dd id="DynamicQueryAttention.zero_grad" class="function">zero_grad</dd>
+                <dd id="DynamicQueryAttention.share_memory" class="function">share_memory</dd>
+                <dd id="DynamicQueryAttention.extra_repr" class="function">extra_repr</dd>
+                <dd id="DynamicQueryAttention.compile" class="function">compile</dd>
+
+            </div>
+                                </dl>
+                            </div>
+                </section>
+    </main>
+<script>
+    function escapeHTML(html) {
+        return document.createElement('div').appendChild(document.createTextNode(html)).parentNode.innerHTML;
+    }
+
+    const originalContent = document.querySelector("main.pdoc");
+    let currentContent = originalContent;
+
+    function setContent(innerHTML) {
+        let elem;
+        if (innerHTML) {
+            elem = document.createElement("main");
+            elem.classList.add("pdoc");
+            elem.innerHTML = innerHTML;
+        } else {
+            elem = originalContent;
+        }
+        if (currentContent !== elem) {
+            currentContent.replaceWith(elem);
+            currentContent = elem;
+        }
+    }
+
+    function getSearchTerm() {
+        return (new URL(window.location)).searchParams.get("search");
+    }
+
+    const searchBox = document.querySelector(".pdoc input[type=search]");
+    searchBox.addEventListener("input", function () {
+        let url = new URL(window.location);
+        if (searchBox.value.trim()) {
+            url.hash = "";
+            url.searchParams.set("search", searchBox.value);
+        } else {
+            url.searchParams.delete("search");
+        }
+        history.replaceState("", "", url.toString());
+        onInput();
+    });
+    window.addEventListener("popstate", onInput);
+
+
+    let search, searchErr;
+
+    async function initialize() {
+        try {
+            search = await new Promise((resolve, reject) => {
+                const script = document.createElement("script");
+                script.type = "text/javascript";
+                script.async = true;
+                script.onload = () => resolve(window.pdocSearch);
+                script.onerror = (e) => reject(e);
+                script.src = "../../search.js";
+                document.getElementsByTagName("head")[0].appendChild(script);
+            });
+        } catch (e) {
+            console.error("Cannot fetch pdoc search index");
+            searchErr = "Cannot fetch search index.";
+        }
+        onInput();
+
+        document.querySelector("nav.pdoc").addEventListener("click", e => {
+            if (e.target.hash) {
+                searchBox.value = "";
+                searchBox.dispatchEvent(new Event("input"));
+            }
+        });
+    }
+
+    function onInput() {
+        setContent((() => {
+            const term = getSearchTerm();
+            if (!term) {
+                return null
+            }
+            if (searchErr) {
+                return `<h3>Error: ${searchErr}</h3>`
+            }
+            if (!search) {
+                return "<h3>Searching...</h3>"
+            }
+
+            window.scrollTo({top: 0, left: 0, behavior: 'auto'});
+
+            const results = search(term);
+
+            let html;
+            if (results.length === 0) {
+                html = `No search results for '${escapeHTML(term)}'.`
+            } else {
+                html = `<h4>${results.length} search result${results.length > 1 ? "s" : ""} for '${escapeHTML(term)}'.</h4>`;
+            }
+            for (let result of results.slice(0, 10)) {
+                let doc = result.doc;
+                let url = `../../${doc.modulename.replaceAll(".", "/")}.html`;
+                if (doc.qualname) {
+                    url += `#${doc.qualname}`;
+                }
+
+                let heading;
+                switch (result.doc.kind) {
+                    case "function":
+                        if (doc.fullname.endsWith(".__init__")) {
+                            heading = `<span class="name">${doc.fullname.replace(/\.__init__$/, "")}</span>${doc.signature}`;
+                        } else {
+                            heading = `<span class="def">${doc.funcdef}</span> <span class="name">${doc.fullname}</span>${doc.signature}`;
+                        }
+                        break;
+                    case "class":
+                        heading = `<span class="def">class</span> <span class="name">${doc.fullname}</span>`;
+                        if (doc.bases)
+                            heading += `<wbr>(<span class="base">${doc.bases}</span>)`;
+                        heading += `:`;
+                        break;
+                    case "variable":
+                        heading = `<span class="name">${doc.fullname}</span>`;
+                        if (doc.annotation)
+                            heading += `<span class="annotation">${doc.annotation}</span>`;
+                        if (doc.default_value)
+                            heading += `<span class="default_value"> = ${doc.default_value}</span>`;
+                        break;
+                    default:
+                        heading = `<span class="name">${doc.fullname}</span>`;
+                        break;
+                }
+                html += `
+                        <section class="search-result">
+                        <a href="${url}" class="attr ${doc.kind}">${heading}</a>
+                        <div class="docstring">${doc.doc}</div>
+                        </section>
+                    `;
+
+            }
+            return html;
+        })());
+    }
+
+    if (getSearchTerm()) {
+        initialize();
+        searchBox.value = getSearchTerm();
+        onInput();
+    } else {
+        searchBox.addEventListener("focus", initialize, {once: true});
+    }
+
+    searchBox.addEventListener("keydown", e => {
+        if (["ArrowDown", "ArrowUp", "Enter"].includes(e.key)) {
+            let focused = currentContent.querySelector(".search-result.focused");
+            if (!focused) {
+                currentContent.querySelector(".search-result").classList.add("focused");
+            } else if (
+                e.key === "ArrowDown"
+                && focused.nextElementSibling
+                && focused.nextElementSibling.classList.contains("search-result")
+            ) {
+                focused.classList.remove("focused");
+                focused.nextElementSibling.classList.add("focused");
+                focused.nextElementSibling.scrollIntoView({
+                    behavior: "smooth",
+                    block: "nearest",
+                    inline: "nearest"
+                });
+            } else if (
+                e.key === "ArrowUp"
+                && focused.previousElementSibling
+                && focused.previousElementSibling.classList.contains("search-result")
+            ) {
+                focused.classList.remove("focused");
+                focused.previousElementSibling.classList.add("focused");
+                focused.previousElementSibling.scrollIntoView({
+                    behavior: "smooth",
+                    block: "nearest",
+                    inline: "nearest"
+                });
+            } else if (
+                e.key === "Enter"
+            ) {
+                focused.querySelector("a").click();
+            }
+        }
+    });
+</script></body>
+</html>
\ No newline at end of file
diff --git a/docs/api/v0.5.1/shimmer/modules/utils.html b/docs/api/v0.5.1/shimmer/modules/utils.html
new file mode 100644
index 00000000..790987da
--- /dev/null
+++ b/docs/api/v0.5.1/shimmer/modules/utils.html
@@ -0,0 +1,760 @@
+<!doctype html>
+<html lang="en">
+<head>
+    <meta charset="utf-8">
+    <meta name="viewport" content="width=device-width, initial-scale=1">
+    <meta name="generator" content="pdoc 14.4.0"/>
+    <title>shimmer.modules.utils API documentation</title>
+
+    <style>/*! * Bootstrap Reboot v5.0.0 (https://getbootstrap.com/) * Copyright 2011-2021 The Bootstrap Authors * Copyright 2011-2021 Twitter, Inc. * Licensed under MIT (https://github.com/twbs/bootstrap/blob/main/LICENSE) * Forked from Normalize.css, licensed MIT (https://github.com/necolas/normalize.css/blob/master/LICENSE.md) */*,::after,::before{box-sizing:border-box}@media (prefers-reduced-motion:no-preference){:root{scroll-behavior:smooth}}body{margin:0;font-family:system-ui,-apple-system,"Segoe UI",Roboto,"Helvetica Neue",Arial,"Noto Sans","Liberation Sans",sans-serif,"Apple Color Emoji","Segoe UI Emoji","Segoe UI Symbol","Noto Color Emoji";font-size:1rem;font-weight:400;line-height:1.5;color:#212529;background-color:#fff;-webkit-text-size-adjust:100%;-webkit-tap-highlight-color:transparent}hr{margin:1rem 0;color:inherit;background-color:currentColor;border:0;opacity:.25}hr:not([size]){height:1px}h1,h2,h3,h4,h5,h6{margin-top:0;margin-bottom:.5rem;font-weight:500;line-height:1.2}h1{font-size:calc(1.375rem + 1.5vw)}@media (min-width:1200px){h1{font-size:2.5rem}}h2{font-size:calc(1.325rem + .9vw)}@media (min-width:1200px){h2{font-size:2rem}}h3{font-size:calc(1.3rem + .6vw)}@media (min-width:1200px){h3{font-size:1.75rem}}h4{font-size:calc(1.275rem + .3vw)}@media (min-width:1200px){h4{font-size:1.5rem}}h5{font-size:1.25rem}h6{font-size:1rem}p{margin-top:0;margin-bottom:1rem}abbr[data-bs-original-title],abbr[title]{-webkit-text-decoration:underline dotted;text-decoration:underline dotted;cursor:help;-webkit-text-decoration-skip-ink:none;text-decoration-skip-ink:none}address{margin-bottom:1rem;font-style:normal;line-height:inherit}ol,ul{padding-left:2rem}dl,ol,ul{margin-top:0;margin-bottom:1rem}ol ol,ol ul,ul ol,ul ul{margin-bottom:0}dt{font-weight:700}dd{margin-bottom:.5rem;margin-left:0}blockquote{margin:0 0 1rem}b,strong{font-weight:bolder}small{font-size:.875em}mark{padding:.2em;background-color:#fcf8e3}sub,sup{position:relative;font-size:.75em;line-height:0;vertical-align:baseline}sub{bottom:-.25em}sup{top:-.5em}a{color:#0d6efd;text-decoration:underline}a:hover{color:#0a58ca}a:not([href]):not([class]),a:not([href]):not([class]):hover{color:inherit;text-decoration:none}code,kbd,pre,samp{font-family:SFMono-Regular,Menlo,Monaco,Consolas,"Liberation Mono","Courier New",monospace;font-size:1em;direction:ltr;unicode-bidi:bidi-override}pre{display:block;margin-top:0;margin-bottom:1rem;overflow:auto;font-size:.875em}pre code{font-size:inherit;color:inherit;word-break:normal}code{font-size:.875em;color:#d63384;word-wrap:break-word}a>code{color:inherit}kbd{padding:.2rem .4rem;font-size:.875em;color:#fff;background-color:#212529;border-radius:.2rem}kbd kbd{padding:0;font-size:1em;font-weight:700}figure{margin:0 0 1rem}img,svg{vertical-align:middle}table{caption-side:bottom;border-collapse:collapse}caption{padding-top:.5rem;padding-bottom:.5rem;color:#6c757d;text-align:left}th{text-align:inherit;text-align:-webkit-match-parent}tbody,td,tfoot,th,thead,tr{border-color:inherit;border-style:solid;border-width:0}label{display:inline-block}button{border-radius:0}button:focus:not(:focus-visible){outline:0}button,input,optgroup,select,textarea{margin:0;font-family:inherit;font-size:inherit;line-height:inherit}button,select{text-transform:none}[role=button]{cursor:pointer}select{word-wrap:normal}select:disabled{opacity:1}[list]::-webkit-calendar-picker-indicator{display:none}[type=button],[type=reset],[type=submit],button{-webkit-appearance:button}[type=button]:not(:disabled),[type=reset]:not(:disabled),[type=submit]:not(:disabled),button:not(:disabled){cursor:pointer}::-moz-focus-inner{padding:0;border-style:none}textarea{resize:vertical}fieldset{min-width:0;padding:0;margin:0;border:0}legend{float:left;width:100%;padding:0;margin-bottom:.5rem;font-size:calc(1.275rem + .3vw);line-height:inherit}@media (min-width:1200px){legend{font-size:1.5rem}}legend+*{clear:left}::-webkit-datetime-edit-day-field,::-webkit-datetime-edit-fields-wrapper,::-webkit-datetime-edit-hour-field,::-webkit-datetime-edit-minute,::-webkit-datetime-edit-month-field,::-webkit-datetime-edit-text,::-webkit-datetime-edit-year-field{padding:0}::-webkit-inner-spin-button{height:auto}[type=search]{outline-offset:-2px;-webkit-appearance:textfield}::-webkit-search-decoration{-webkit-appearance:none}::-webkit-color-swatch-wrapper{padding:0}::file-selector-button{font:inherit}::-webkit-file-upload-button{font:inherit;-webkit-appearance:button}output{display:inline-block}iframe{border:0}summary{display:list-item;cursor:pointer}progress{vertical-align:baseline}[hidden]{display:none!important}</style>
+    <style>/*! syntax-highlighting.css */pre{line-height:125%;}span.linenos{color:inherit; background-color:transparent; padding-left:5px; padding-right:20px;}.pdoc-code .hll{background-color:#ffffcc}.pdoc-code{background:#f8f8f8;}.pdoc-code .c{color:#3D7B7B; font-style:italic}.pdoc-code .err{border:1px solid #FF0000}.pdoc-code .k{color:#008000; font-weight:bold}.pdoc-code .o{color:#666666}.pdoc-code .ch{color:#3D7B7B; font-style:italic}.pdoc-code .cm{color:#3D7B7B; font-style:italic}.pdoc-code .cp{color:#9C6500}.pdoc-code .cpf{color:#3D7B7B; font-style:italic}.pdoc-code .c1{color:#3D7B7B; font-style:italic}.pdoc-code .cs{color:#3D7B7B; font-style:italic}.pdoc-code .gd{color:#A00000}.pdoc-code .ge{font-style:italic}.pdoc-code .gr{color:#E40000}.pdoc-code .gh{color:#000080; font-weight:bold}.pdoc-code .gi{color:#008400}.pdoc-code .go{color:#717171}.pdoc-code .gp{color:#000080; font-weight:bold}.pdoc-code .gs{font-weight:bold}.pdoc-code .gu{color:#800080; font-weight:bold}.pdoc-code .gt{color:#0044DD}.pdoc-code .kc{color:#008000; font-weight:bold}.pdoc-code .kd{color:#008000; font-weight:bold}.pdoc-code .kn{color:#008000; font-weight:bold}.pdoc-code .kp{color:#008000}.pdoc-code .kr{color:#008000; font-weight:bold}.pdoc-code .kt{color:#B00040}.pdoc-code .m{color:#666666}.pdoc-code .s{color:#BA2121}.pdoc-code .na{color:#687822}.pdoc-code .nb{color:#008000}.pdoc-code .nc{color:#0000FF; font-weight:bold}.pdoc-code .no{color:#880000}.pdoc-code .nd{color:#AA22FF}.pdoc-code .ni{color:#717171; font-weight:bold}.pdoc-code .ne{color:#CB3F38; font-weight:bold}.pdoc-code .nf{color:#0000FF}.pdoc-code .nl{color:#767600}.pdoc-code .nn{color:#0000FF; font-weight:bold}.pdoc-code .nt{color:#008000; font-weight:bold}.pdoc-code .nv{color:#19177C}.pdoc-code .ow{color:#AA22FF; font-weight:bold}.pdoc-code .w{color:#bbbbbb}.pdoc-code .mb{color:#666666}.pdoc-code .mf{color:#666666}.pdoc-code .mh{color:#666666}.pdoc-code .mi{color:#666666}.pdoc-code .mo{color:#666666}.pdoc-code .sa{color:#BA2121}.pdoc-code .sb{color:#BA2121}.pdoc-code .sc{color:#BA2121}.pdoc-code .dl{color:#BA2121}.pdoc-code .sd{color:#BA2121; font-style:italic}.pdoc-code .s2{color:#BA2121}.pdoc-code .se{color:#AA5D1F; font-weight:bold}.pdoc-code .sh{color:#BA2121}.pdoc-code .si{color:#A45A77; font-weight:bold}.pdoc-code .sx{color:#008000}.pdoc-code .sr{color:#A45A77}.pdoc-code .s1{color:#BA2121}.pdoc-code .ss{color:#19177C}.pdoc-code .bp{color:#008000}.pdoc-code .fm{color:#0000FF}.pdoc-code .vc{color:#19177C}.pdoc-code .vg{color:#19177C}.pdoc-code .vi{color:#19177C}.pdoc-code .vm{color:#19177C}.pdoc-code .il{color:#666666}</style>
+    <style>/*! theme.css */:root{--pdoc-background:#fff;}.pdoc{--text:#212529;--muted:#6c757d;--link:#3660a5;--link-hover:#1659c5;--code:#f8f8f8;--active:#fff598;--accent:#eee;--accent2:#c1c1c1;--nav-hover:rgba(255, 255, 255, 0.5);--name:#0066BB;--def:#008800;--annotation:#007020;}</style>
+    <style>/*! layout.css */html, body{width:100%;height:100%;}html, main{scroll-behavior:smooth;}body{background-color:var(--pdoc-background);}@media (max-width:769px){#navtoggle{cursor:pointer;position:absolute;width:50px;height:40px;top:1rem;right:1rem;border-color:var(--text);color:var(--text);display:flex;opacity:0.8;z-index:999;}#navtoggle:hover{opacity:1;}#togglestate + div{display:none;}#togglestate:checked + div{display:inherit;}main, header{padding:2rem 3vw;}header + main{margin-top:-3rem;}.git-button{display:none !important;}nav input[type="search"]{max-width:77%;}nav input[type="search"]:first-child{margin-top:-6px;}nav input[type="search"]:valid ~ *{display:none !important;}}@media (min-width:770px){:root{--sidebar-width:clamp(12.5rem, 28vw, 22rem);}nav{position:fixed;overflow:auto;height:100vh;width:var(--sidebar-width);}main, header{padding:3rem 2rem 3rem calc(var(--sidebar-width) + 3rem);width:calc(54rem + var(--sidebar-width));max-width:100%;}header + main{margin-top:-4rem;}#navtoggle{display:none;}}#togglestate{position:absolute;height:0;opacity:0;}nav.pdoc{--pad:clamp(0.5rem, 2vw, 1.75rem);--indent:1.5rem;background-color:var(--accent);border-right:1px solid var(--accent2);box-shadow:0 0 20px rgba(50, 50, 50, .2) inset;padding:0 0 0 var(--pad);overflow-wrap:anywhere;scrollbar-width:thin; scrollbar-color:var(--accent2) transparent; z-index:1}nav.pdoc::-webkit-scrollbar{width:.4rem; }nav.pdoc::-webkit-scrollbar-thumb{background-color:var(--accent2); }nav.pdoc > div{padding:var(--pad) 0;}nav.pdoc .module-list-button{display:inline-flex;align-items:center;color:var(--text);border-color:var(--muted);margin-bottom:1rem;}nav.pdoc .module-list-button:hover{border-color:var(--text);}nav.pdoc input[type=search]{display:block;outline-offset:0;width:calc(100% - var(--pad));}nav.pdoc .logo{max-width:calc(100% - var(--pad));max-height:35vh;display:block;margin:0 auto 1rem;transform:translate(calc(-.5 * var(--pad)), 0);}nav.pdoc ul{list-style:none;padding-left:0;}nav.pdoc > div > ul{margin-left:calc(0px - var(--pad));}nav.pdoc li a{padding:.2rem 0 .2rem calc(var(--pad) + var(--indent));}nav.pdoc > div > ul > li > a{padding-left:var(--pad);}nav.pdoc li{transition:all 100ms;}nav.pdoc li:hover{background-color:var(--nav-hover);}nav.pdoc a, nav.pdoc a:hover{color:var(--text);}nav.pdoc a{display:block;}nav.pdoc > h2:first-of-type{margin-top:1.5rem;}nav.pdoc .class:before{content:"class ";color:var(--muted);}nav.pdoc .function:after{content:"()";color:var(--muted);}nav.pdoc footer:before{content:"";display:block;width:calc(100% - var(--pad));border-top:solid var(--accent2) 1px;margin-top:1.5rem;padding-top:.5rem;}nav.pdoc footer{font-size:small;}</style>
+    <style>/*! content.css */.pdoc{color:var(--text);box-sizing:border-box;line-height:1.5;background:none;}.pdoc .pdoc-button{cursor:pointer;display:inline-block;border:solid black 1px;border-radius:2px;font-size:.75rem;padding:calc(0.5em - 1px) 1em;transition:100ms all;}.pdoc .pdoc-alert{padding:1rem 1rem 1rem calc(1.5rem + 24px);border:1px solid transparent;border-radius:.25rem;background-repeat:no-repeat;background-position:1rem center;margin-bottom:1rem;}.pdoc .pdoc-alert > *:last-child{margin-bottom:0;}.pdoc .pdoc-alert-note {color:#084298;background-color:#cfe2ff;border-color:#b6d4fe;background-image:url("data:image/svg+xml,%3Csvg%20xmlns%3D%22http%3A//www.w3.org/2000/svg%22%20width%3D%2224%22%20height%3D%2224%22%20fill%3D%22%23084298%22%20viewBox%3D%220%200%2016%2016%22%3E%3Cpath%20d%3D%22M8%2016A8%208%200%201%200%208%200a8%208%200%200%200%200%2016zm.93-9.412-1%204.705c-.07.34.029.533.304.533.194%200%20.487-.07.686-.246l-.088.416c-.287.346-.92.598-1.465.598-.703%200-1.002-.422-.808-1.319l.738-3.468c.064-.293.006-.399-.287-.47l-.451-.081.082-.381%202.29-.287zM8%205.5a1%201%200%201%201%200-2%201%201%200%200%201%200%202z%22/%3E%3C/svg%3E");}.pdoc .pdoc-alert-warning{color:#664d03;background-color:#fff3cd;border-color:#ffecb5;background-image:url("data:image/svg+xml,%3Csvg%20xmlns%3D%22http%3A//www.w3.org/2000/svg%22%20width%3D%2224%22%20height%3D%2224%22%20fill%3D%22%23664d03%22%20viewBox%3D%220%200%2016%2016%22%3E%3Cpath%20d%3D%22M8.982%201.566a1.13%201.13%200%200%200-1.96%200L.165%2013.233c-.457.778.091%201.767.98%201.767h13.713c.889%200%201.438-.99.98-1.767L8.982%201.566zM8%205c.535%200%20.954.462.9.995l-.35%203.507a.552.552%200%200%201-1.1%200L7.1%205.995A.905.905%200%200%201%208%205zm.002%206a1%201%200%201%201%200%202%201%201%200%200%201%200-2z%22/%3E%3C/svg%3E");}.pdoc .pdoc-alert-danger{color:#842029;background-color:#f8d7da;border-color:#f5c2c7;background-image:url("data:image/svg+xml,%3Csvg%20xmlns%3D%22http%3A//www.w3.org/2000/svg%22%20width%3D%2224%22%20height%3D%2224%22%20fill%3D%22%23842029%22%20viewBox%3D%220%200%2016%2016%22%3E%3Cpath%20d%3D%22M5.52.359A.5.5%200%200%201%206%200h4a.5.5%200%200%201%20.474.658L8.694%206H12.5a.5.5%200%200%201%20.395.807l-7%209a.5.5%200%200%201-.873-.454L6.823%209.5H3.5a.5.5%200%200%201-.48-.641l2.5-8.5z%22/%3E%3C/svg%3E");}.pdoc .visually-hidden{position:absolute !important;width:1px !important;height:1px !important;padding:0 !important;margin:-1px !important;overflow:hidden !important;clip:rect(0, 0, 0, 0) !important;white-space:nowrap !important;border:0 !important;}.pdoc h1, .pdoc h2, .pdoc h3{font-weight:300;margin:.3em 0;padding:.2em 0;}.pdoc > section:not(.module-info) h1{font-size:1.5rem;font-weight:500;}.pdoc > section:not(.module-info) h2{font-size:1.4rem;font-weight:500;}.pdoc > section:not(.module-info) h3{font-size:1.3rem;font-weight:500;}.pdoc > section:not(.module-info) h4{font-size:1.2rem;}.pdoc > section:not(.module-info) h5{font-size:1.1rem;}.pdoc a{text-decoration:none;color:var(--link);}.pdoc a:hover{color:var(--link-hover);}.pdoc blockquote{margin-left:2rem;}.pdoc pre{border-top:1px solid var(--accent2);border-bottom:1px solid var(--accent2);margin-top:0;margin-bottom:1em;padding:.5rem 0 .5rem .5rem;overflow-x:auto;background-color:var(--code);}.pdoc code{color:var(--text);padding:.2em .4em;margin:0;font-size:85%;background-color:var(--accent);border-radius:6px;}.pdoc a > code{color:inherit;}.pdoc pre > code{display:inline-block;font-size:inherit;background:none;border:none;padding:0;}.pdoc > section:not(.module-info){margin-bottom:1.5rem;}.pdoc .modulename{margin-top:0;font-weight:bold;}.pdoc .modulename a{color:var(--link);transition:100ms all;}.pdoc .git-button{float:right;border:solid var(--link) 1px;}.pdoc .git-button:hover{background-color:var(--link);color:var(--pdoc-background);}.view-source-toggle-state,.view-source-toggle-state ~ .pdoc-code{display:none;}.view-source-toggle-state:checked ~ .pdoc-code{display:block;}.view-source-button{display:inline-block;float:right;font-size:.75rem;line-height:1.5rem;color:var(--muted);padding:0 .4rem 0 1.3rem;cursor:pointer;text-indent:-2px;}.view-source-button > span{visibility:hidden;}.module-info .view-source-button{float:none;display:flex;justify-content:flex-end;margin:-1.2rem .4rem -.2rem 0;}.view-source-button::before{position:absolute;content:"View Source";display:list-item;list-style-type:disclosure-closed;}.view-source-toggle-state:checked ~ .attr .view-source-button::before,.view-source-toggle-state:checked ~ .view-source-button::before{list-style-type:disclosure-open;}.pdoc .docstring{margin-bottom:1.5rem;}.pdoc section:not(.module-info) .docstring{margin-left:clamp(0rem, 5vw - 2rem, 1rem);}.pdoc .docstring .pdoc-code{margin-left:1em;margin-right:1em;}.pdoc h1:target,.pdoc h2:target,.pdoc h3:target,.pdoc h4:target,.pdoc h5:target,.pdoc h6:target,.pdoc .pdoc-code > pre > span:target{background-color:var(--active);box-shadow:-1rem 0 0 0 var(--active);}.pdoc .pdoc-code > pre > span:target{display:block;}.pdoc div:target > .attr,.pdoc section:target > .attr,.pdoc dd:target > a{background-color:var(--active);}.pdoc *{scroll-margin:2rem;}.pdoc .pdoc-code .linenos{user-select:none;}.pdoc .attr:hover{filter:contrast(0.95);}.pdoc section, .pdoc .classattr{position:relative;}.pdoc .headerlink{--width:clamp(1rem, 3vw, 2rem);position:absolute;top:0;left:calc(0rem - var(--width));transition:all 100ms ease-in-out;opacity:0;}.pdoc .headerlink::before{content:"#";display:block;text-align:center;width:var(--width);height:2.3rem;line-height:2.3rem;font-size:1.5rem;}.pdoc .attr:hover ~ .headerlink,.pdoc *:target > .headerlink,.pdoc .headerlink:hover{opacity:1;}.pdoc .attr{display:block;margin:.5rem 0 .5rem;padding:.4rem .4rem .4rem 1rem;background-color:var(--accent);overflow-x:auto;}.pdoc .classattr{margin-left:2rem;}.pdoc .name{color:var(--name);font-weight:bold;}.pdoc .def{color:var(--def);font-weight:bold;}.pdoc .signature{background-color:transparent;}.pdoc .param, .pdoc .return-annotation{white-space:pre;}.pdoc .signature.multiline .param{display:block;}.pdoc .signature.condensed .param{display:inline-block;}.pdoc .annotation{color:var(--annotation);}.pdoc .view-value-toggle-state,.pdoc .view-value-toggle-state ~ .default_value{display:none;}.pdoc .view-value-toggle-state:checked ~ .default_value{display:inherit;}.pdoc .view-value-button{font-size:.5rem;vertical-align:middle;border-style:dashed;margin-top:-0.1rem;}.pdoc .view-value-button:hover{background:white;}.pdoc .view-value-button::before{content:"show";text-align:center;width:2.2em;display:inline-block;}.pdoc .view-value-toggle-state:checked ~ .view-value-button::before{content:"hide";}.pdoc .inherited{margin-left:2rem;}.pdoc .inherited dt{font-weight:700;}.pdoc .inherited dt, .pdoc .inherited dd{display:inline;margin-left:0;margin-bottom:.5rem;}.pdoc .inherited dd:not(:last-child):after{content:", ";}.pdoc .inherited .class:before{content:"class ";}.pdoc .inherited .function a:after{content:"()";}.pdoc .search-result .docstring{overflow:auto;max-height:25vh;}.pdoc .search-result.focused > .attr{background-color:var(--active);}.pdoc .attribution{margin-top:2rem;display:block;opacity:0.5;transition:all 200ms;filter:grayscale(100%);}.pdoc .attribution:hover{opacity:1;filter:grayscale(0%);}.pdoc .attribution img{margin-left:5px;height:35px;vertical-align:middle;width:70px;transition:all 200ms;}.pdoc table{display:block;width:max-content;max-width:100%;overflow:auto;margin-bottom:1rem;}.pdoc table th{font-weight:600;}.pdoc table th, .pdoc table td{padding:6px 13px;border:1px solid var(--accent2);}</style>
+    <style>/*! custom.css */</style><script>
+    window.MathJax = {
+        tex: {
+            inlineMath: [['$', '$'], ['\\(', '\\)']]
+        }
+    };
+</script>
+<script src="https://polyfill.io/v3/polyfill.min.js?features=es6"></script>
+<script id="MathJax-script" async src="https://cdn.jsdelivr.net/npm/mathjax@3/es5/tex-mml-chtml.js"></script>
+<script>
+    /* Re-invoke MathJax when DOM content changes, for example during search. */
+    document.addEventListener("DOMContentLoaded", () => {
+        new MutationObserver(() => MathJax.typeset()).observe(
+            document.querySelector("main.pdoc").parentNode,
+            {childList: true}
+        );
+    })
+</script>
+<style>
+    mjx-container {
+        overflow-x: auto;
+    }
+</style></head>
+<body>
+    <nav class="pdoc">
+        <label id="navtoggle" for="togglestate" class="pdoc-button"><svg xmlns='http://www.w3.org/2000/svg' viewBox='0 0 30 30'><path stroke-linecap='round' stroke="currentColor" stroke-miterlimit='10' stroke-width='2' d='M4 7h22M4 15h22M4 23h22'/></svg></label>
+        <input id="togglestate" type="checkbox" aria-hidden="true" tabindex="-1">
+        <div>            <a class="pdoc-button module-list-button" href="../../index.html">
+<svg xmlns="http://www.w3.org/2000/svg" width="16" height="16" fill="currentColor" class="bi bi-box-arrow-in-left" viewBox="0 0 16 16">
+  <path fill-rule="evenodd" d="M10 3.5a.5.5 0 0 0-.5-.5h-8a.5.5 0 0 0-.5.5v9a.5.5 0 0 0 .5.5h8a.5.5 0 0 0 .5-.5v-2a.5.5 0 0 1 1 0v2A1.5 1.5 0 0 1 9.5 14h-8A1.5 1.5 0 0 1 0 12.5v-9A1.5 1.5 0 0 1 1.5 2h8A1.5 1.5 0 0 1 11 3.5v2a.5.5 0 0 1-1 0v-2z"/>
+  <path fill-rule="evenodd" d="M4.146 8.354a.5.5 0 0 1 0-.708l3-3a.5.5 0 1 1 .708.708L5.707 7.5H14.5a.5.5 0 0 1 0 1H5.707l2.147 2.146a.5.5 0 0 1-.708.708l-3-3z"/>
+</svg>                &nbsp;
+                Module Index
+            </a>
+
+
+            <input type="search" placeholder="Search..." role="searchbox" aria-label="search"
+                   pattern=".+" required>
+
+
+
+            <h2>API Documentation</h2>
+                <ul class="memberlist">
+            <li>
+                    <a class="function" href="#translation">translation</a>
+            </li>
+            <li>
+                    <a class="function" href="#cycle">cycle</a>
+            </li>
+            <li>
+                    <a class="function" href="#batch_demi_cycles">batch_demi_cycles</a>
+            </li>
+            <li>
+                    <a class="function" href="#batch_cycles">batch_cycles</a>
+            </li>
+            <li>
+                    <a class="function" href="#batch_translations">batch_translations</a>
+            </li>
+    </ul>
+
+
+
+        <a class="attribution" title="pdoc: Python API documentation generator" href="https://pdoc.dev" target="_blank">
+            built with <span class="visually-hidden">pdoc</span><img
+                alt="pdoc logo"
+                src="data:image/svg+xml,%3Csvg%20xmlns%3D%22http%3A//www.w3.org/2000/svg%22%20role%3D%22img%22%20aria-label%3D%22pdoc%20logo%22%20width%3D%22300%22%20height%3D%22150%22%20viewBox%3D%22-1%200%2060%2030%22%3E%3Ctitle%3Epdoc%3C/title%3E%3Cpath%20d%3D%22M29.621%2021.293c-.011-.273-.214-.475-.511-.481a.5.5%200%200%200-.489.503l-.044%201.393c-.097.551-.695%201.215-1.566%201.704-.577.428-1.306.486-2.193.182-1.426-.617-2.467-1.654-3.304-2.487l-.173-.172a3.43%203.43%200%200%200-.365-.306.49.49%200%200%200-.286-.196c-1.718-1.06-4.931-1.47-7.353.191l-.219.15c-1.707%201.187-3.413%202.131-4.328%201.03-.02-.027-.49-.685-.141-1.763.233-.721.546-2.408.772-4.076.042-.09.067-.187.046-.288.166-1.347.277-2.625.241-3.351%201.378-1.008%202.271-2.586%202.271-4.362%200-.976-.272-1.935-.788-2.774-.057-.094-.122-.18-.184-.268.033-.167.052-.339.052-.516%200-1.477-1.202-2.679-2.679-2.679-.791%200-1.496.352-1.987.9a6.3%206.3%200%200%200-1.001.029c-.492-.564-1.207-.929-2.012-.929-1.477%200-2.679%201.202-2.679%202.679A2.65%202.65%200%200%200%20.97%206.554c-.383.747-.595%201.572-.595%202.41%200%202.311%201.507%204.29%203.635%205.107-.037.699-.147%202.27-.423%203.294l-.137.461c-.622%202.042-2.515%208.257%201.727%2010.643%201.614.908%203.06%201.248%204.317%201.248%202.665%200%204.492-1.524%205.322-2.401%201.476-1.559%202.886-1.854%206.491.82%201.877%201.393%203.514%201.753%204.861%201.068%202.223-1.713%202.811-3.867%203.399-6.374.077-.846.056-1.469.054-1.537zm-4.835%204.313c-.054.305-.156.586-.242.629-.034-.007-.131-.022-.307-.157-.145-.111-.314-.478-.456-.908.221.121.432.25.675.355.115.039.219.051.33.081zm-2.251-1.238c-.05.33-.158.648-.252.694-.022.001-.125-.018-.307-.157-.217-.166-.488-.906-.639-1.573.358.344.754.693%201.198%201.036zm-3.887-2.337c-.006-.116-.018-.231-.041-.342.635.145%201.189.368%201.599.625.097.231.166.481.174.642-.03.049-.055.101-.067.158-.046.013-.128.026-.298.004-.278-.037-.901-.57-1.367-1.087zm-1.127-.497c.116.306.176.625.12.71-.019.014-.117.045-.345.016-.206-.027-.604-.332-.986-.695.41-.051.816-.056%201.211-.031zm-4.535%201.535c.209.22.379.47.358.598-.006.041-.088.138-.351.234-.144.055-.539-.063-.979-.259a11.66%2011.66%200%200%200%20.972-.573zm.983-.664c.359-.237.738-.418%201.126-.554.25.237.479.548.457.694-.006.042-.087.138-.351.235-.174.064-.694-.105-1.232-.375zm-3.381%201.794c-.022.145-.061.29-.149.401-.133.166-.358.248-.69.251h-.002c-.133%200-.306-.26-.45-.621.417.091.854.07%201.291-.031zm-2.066-8.077a4.78%204.78%200%200%201-.775-.584c.172-.115.505-.254.88-.378l-.105.962zm-.331%202.302a10.32%2010.32%200%200%201-.828-.502c.202-.143.576-.328.984-.49l-.156.992zm-.45%202.157l-.701-.403c.214-.115.536-.249.891-.376a11.57%2011.57%200%200%201-.19.779zm-.181%201.716c.064.398.194.702.298.893-.194-.051-.435-.162-.736-.398.061-.119.224-.3.438-.495zM8.87%204.141c0%20.152-.123.276-.276.276s-.275-.124-.275-.276.123-.276.276-.276.275.124.275.276zm-.735-.389a1.15%201.15%200%200%200-.314.783%201.16%201.16%200%200%200%201.162%201.162c.457%200%20.842-.27%201.032-.653.026.117.042.238.042.362a1.68%201.68%200%200%201-1.679%201.679%201.68%201.68%200%200%201-1.679-1.679c0-.843.626-1.535%201.436-1.654zM5.059%205.406A1.68%201.68%200%200%201%203.38%207.085a1.68%201.68%200%200%201-1.679-1.679c0-.037.009-.072.011-.109.21.3.541.508.935.508a1.16%201.16%200%200%200%201.162-1.162%201.14%201.14%200%200%200-.474-.912c.015%200%20.03-.005.045-.005.926.001%201.679.754%201.679%201.68zM3.198%204.141c0%20.152-.123.276-.276.276s-.275-.124-.275-.276.123-.276.276-.276.275.124.275.276zM1.375%208.964c0-.52.103-1.035.288-1.52.466.394%201.06.64%201.717.64%201.144%200%202.116-.725%202.499-1.738.383%201.012%201.355%201.738%202.499%201.738.867%200%201.631-.421%202.121-1.062.307.605.478%201.267.478%201.942%200%202.486-2.153%204.51-4.801%204.51s-4.801-2.023-4.801-4.51zm24.342%2019.349c-.985.498-2.267.168-3.813-.979-3.073-2.281-5.453-3.199-7.813-.705-1.315%201.391-4.163%203.365-8.423.97-3.174-1.786-2.239-6.266-1.261-9.479l.146-.492c.276-1.02.395-2.457.444-3.268a6.11%206.11%200%200%200%201.18.115%206.01%206.01%200%200%200%202.536-.562l-.006.175c-.802.215-1.848.612-2.021%201.25-.079.295.021.601.274.837.219.203.415.364.598.501-.667.304-1.243.698-1.311%201.179-.02.144-.022.507.393.787.213.144.395.26.564.365-1.285.521-1.361.96-1.381%201.126-.018.142-.011.496.427.746l.854.489c-.473.389-.971.914-.999%201.429-.018.278.095.532.316.713.675.556%201.231.721%201.653.721.059%200%20.104-.014.158-.02.207.707.641%201.64%201.513%201.64h.013c.8-.008%201.236-.345%201.462-.626.173-.216.268-.457.325-.692.424.195.93.374%201.372.374.151%200%20.294-.021.423-.068.732-.27.944-.704.993-1.021.009-.061.003-.119.002-.179.266.086.538.147.789.147.15%200%20.294-.021.423-.069.542-.2.797-.489.914-.754.237.147.478.258.704.288.106.014.205.021.296.021.356%200%20.595-.101.767-.229.438.435%201.094.992%201.656%201.067.106.014.205.021.296.021a1.56%201.56%200%200%200%20.323-.035c.17.575.453%201.289.866%201.605.358.273.665.362.914.362a.99.99%200%200%200%20.421-.093%201.03%201.03%200%200%200%20.245-.164c.168.428.39.846.68%201.068.358.273.665.362.913.362a.99.99%200%200%200%20.421-.093c.317-.148.512-.448.639-.762.251.157.495.257.726.257.127%200%20.25-.024.37-.071.427-.17.706-.617.841-1.314.022-.015.047-.022.068-.038.067-.051.133-.104.196-.159-.443%201.486-1.107%202.761-2.086%203.257zM8.66%209.925a.5.5%200%201%200-1%200c0%20.653-.818%201.205-1.787%201.205s-1.787-.552-1.787-1.205a.5.5%200%201%200-1%200c0%201.216%201.25%202.205%202.787%202.205s2.787-.989%202.787-2.205zm4.4%2015.965l-.208.097c-2.661%201.258-4.708%201.436-6.086.527-1.542-1.017-1.88-3.19-1.844-4.198a.4.4%200%200%200-.385-.414c-.242-.029-.406.164-.414.385-.046%201.249.367%203.686%202.202%204.896.708.467%201.547.7%202.51.7%201.248%200%202.706-.392%204.362-1.174l.185-.086a.4.4%200%200%200%20.205-.527c-.089-.204-.326-.291-.527-.206zM9.547%202.292c.093.077.205.114.317.114a.5.5%200%200%200%20.318-.886L8.817.397a.5.5%200%200%200-.703.068.5.5%200%200%200%20.069.703l1.364%201.124zm-7.661-.065c.086%200%20.173-.022.253-.068l1.523-.893a.5.5%200%200%200-.506-.863l-1.523.892a.5.5%200%200%200-.179.685c.094.158.261.247.432.247z%22%20transform%3D%22matrix%28-1%200%200%201%2058%200%29%22%20fill%3D%22%233bb300%22/%3E%3Cpath%20d%3D%22M.3%2021.86V10.18q0-.46.02-.68.04-.22.18-.5.28-.54%201.34-.54%201.06%200%201.42.28.38.26.44.78.76-1.04%202.38-1.04%201.64%200%203.1%201.54%201.46%201.54%201.46%203.58%200%202.04-1.46%203.58-1.44%201.54-3.08%201.54-1.64%200-2.38-.92v4.04q0%20.46-.04.68-.02.22-.18.5-.14.3-.5.42-.36.12-.98.12-.62%200-1-.12-.36-.12-.52-.4-.14-.28-.18-.5-.02-.22-.02-.68zm3.96-9.42q-.46.54-.46%201.18%200%20.64.46%201.18.48.52%201.2.52.74%200%201.24-.52.52-.52.52-1.18%200-.66-.48-1.18-.48-.54-1.26-.54-.76%200-1.22.54zm14.741-8.36q.16-.3.54-.42.38-.12%201-.12.64%200%201.02.12.38.12.52.42.16.3.18.54.04.22.04.68v11.94q0%20.46-.04.7-.02.22-.18.5-.3.54-1.7.54-1.38%200-1.54-.98-.84.96-2.34.96-1.8%200-3.28-1.56-1.48-1.58-1.48-3.66%200-2.1%201.48-3.68%201.5-1.58%203.28-1.58%201.48%200%202.3%201v-4.2q0-.46.02-.68.04-.24.18-.52zm-3.24%2010.86q.52.54%201.26.54.74%200%201.22-.54.5-.54.5-1.18%200-.66-.48-1.22-.46-.56-1.26-.56-.8%200-1.28.56-.48.54-.48%201.2%200%20.66.52%201.2zm7.833-1.2q0-2.4%201.68-3.96%201.68-1.56%203.84-1.56%202.16%200%203.82%201.56%201.66%201.54%201.66%203.94%200%201.66-.86%202.96-.86%201.28-2.1%201.9-1.22.6-2.54.6-1.32%200-2.56-.64-1.24-.66-2.1-1.92-.84-1.28-.84-2.88zm4.18%201.44q.64.48%201.3.48.66%200%201.32-.5.66-.5.66-1.48%200-.98-.62-1.46-.62-.48-1.34-.48-.72%200-1.34.5-.62.5-.62%201.48%200%20.96.64%201.46zm11.412-1.44q0%20.84.56%201.32.56.46%201.18.46.64%200%201.18-.36.56-.38.9-.38.6%200%201.46%201.06.46.58.46%201.04%200%20.76-1.1%201.42-1.14.8-2.8.8-1.86%200-3.58-1.34-.82-.64-1.34-1.7-.52-1.08-.52-2.36%200-1.3.52-2.34.52-1.06%201.34-1.7%201.66-1.32%203.54-1.32.76%200%201.48.22.72.2%201.06.4l.32.2q.36.24.56.38.52.4.52.92%200%20.5-.42%201.14-.72%201.1-1.38%201.1-.38%200-1.08-.44-.36-.34-1.04-.34-.66%200-1.24.48-.58.48-.58%201.34z%22%20fill%3D%22green%22/%3E%3C/svg%3E"/>
+        </a>
+</div>
+    </nav>
+    <main class="pdoc">
+            <section class="module-info">
+                    <h1 class="modulename">
+shimmer<wbr>.modules<wbr>.utils    </h1>
+
+                
+                        <input id="mod-utils-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
+
+                        <label class="view-source-button" for="mod-utils-view-source"><span>View Source</span></label>
+
+                        <div class="pdoc-code codehilite"><pre><span></span><span id="L-1"><a href="#L-1"><span class="linenos">  1</span></a><span class="kn">from</span> <span class="nn">collections.abc</span> <span class="kn">import</span> <span class="n">Iterable</span>
+</span><span id="L-2"><a href="#L-2"><span class="linenos">  2</span></a>
+</span><span id="L-3"><a href="#L-3"><span class="linenos">  3</span></a><span class="kn">import</span> <span class="nn">torch</span>
+</span><span id="L-4"><a href="#L-4"><span class="linenos">  4</span></a>
+</span><span id="L-5"><a href="#L-5"><span class="linenos">  5</span></a><span class="kn">from</span> <span class="nn">shimmer.modules.gw_module</span> <span class="kn">import</span> <span class="n">GWModuleBase</span>
+</span><span id="L-6"><a href="#L-6"><span class="linenos">  6</span></a><span class="kn">from</span> <span class="nn">shimmer.modules.selection</span> <span class="kn">import</span> <span class="n">SelectionBase</span>
+</span><span id="L-7"><a href="#L-7"><span class="linenos">  7</span></a><span class="kn">from</span> <span class="nn">shimmer.types</span> <span class="kn">import</span> <span class="p">(</span>
+</span><span id="L-8"><a href="#L-8"><span class="linenos">  8</span></a>    <span class="n">LatentsDomainGroupDT</span><span class="p">,</span>
+</span><span id="L-9"><a href="#L-9"><span class="linenos">  9</span></a>    <span class="n">LatentsDomainGroupsT</span><span class="p">,</span>
+</span><span id="L-10"><a href="#L-10"><span class="linenos"> 10</span></a>    <span class="n">LatentsDomainGroupT</span><span class="p">,</span>
+</span><span id="L-11"><a href="#L-11"><span class="linenos"> 11</span></a><span class="p">)</span>
+</span><span id="L-12"><a href="#L-12"><span class="linenos"> 12</span></a>
+</span><span id="L-13"><a href="#L-13"><span class="linenos"> 13</span></a>
+</span><span id="L-14"><a href="#L-14"><span class="linenos"> 14</span></a><span class="k">def</span> <span class="nf">translation</span><span class="p">(</span>
+</span><span id="L-15"><a href="#L-15"><span class="linenos"> 15</span></a>    <span class="n">gw_module</span><span class="p">:</span> <span class="n">GWModuleBase</span><span class="p">,</span>
+</span><span id="L-16"><a href="#L-16"><span class="linenos"> 16</span></a>    <span class="n">selection_mod</span><span class="p">:</span> <span class="n">SelectionBase</span><span class="p">,</span>
+</span><span id="L-17"><a href="#L-17"><span class="linenos"> 17</span></a>    <span class="n">x</span><span class="p">:</span> <span class="n">LatentsDomainGroupT</span><span class="p">,</span>
+</span><span id="L-18"><a href="#L-18"><span class="linenos"> 18</span></a>    <span class="n">to</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span>
+</span><span id="L-19"><a href="#L-19"><span class="linenos"> 19</span></a><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">:</span>
+</span><span id="L-20"><a href="#L-20"><span class="linenos"> 20</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="L-21"><a href="#L-21"><span class="linenos"> 21</span></a><span class="sd">    Translate from multiple domains to one domain.</span>
+</span><span id="L-22"><a href="#L-22"><span class="linenos"> 22</span></a>
+</span><span id="L-23"><a href="#L-23"><span class="linenos"> 23</span></a><span class="sd">    Args:</span>
+</span><span id="L-24"><a href="#L-24"><span class="linenos"> 24</span></a><span class="sd">        gw_module (`GWModuleBase`): GWModule to perform the translation over</span>
+</span><span id="L-25"><a href="#L-25"><span class="linenos"> 25</span></a><span class="sd">        selection_mod (`SelectionBase`): selection module</span>
+</span><span id="L-26"><a href="#L-26"><span class="linenos"> 26</span></a><span class="sd">        x (`LatentsDomainGroupT`): the group of latent representations</span>
+</span><span id="L-27"><a href="#L-27"><span class="linenos"> 27</span></a><span class="sd">        to (`str`): the domain name to encode to</span>
+</span><span id="L-28"><a href="#L-28"><span class="linenos"> 28</span></a>
+</span><span id="L-29"><a href="#L-29"><span class="linenos"> 29</span></a><span class="sd">    Returns:</span>
+</span><span id="L-30"><a href="#L-30"><span class="linenos"> 30</span></a><span class="sd">        `torch.Tensor`: the translated unimodal representation</span>
+</span><span id="L-31"><a href="#L-31"><span class="linenos"> 31</span></a><span class="sd">            of the provided domain.</span>
+</span><span id="L-32"><a href="#L-32"><span class="linenos"> 32</span></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="L-33"><a href="#L-33"><span class="linenos"> 33</span></a>    <span class="k">return</span> <span class="n">gw_module</span><span class="o">.</span><span class="n">decode</span><span class="p">(</span><span class="n">gw_module</span><span class="o">.</span><span class="n">encode_and_fuse</span><span class="p">(</span><span class="n">x</span><span class="p">,</span> <span class="n">selection_mod</span><span class="p">),</span> <span class="n">domains</span><span class="o">=</span><span class="p">{</span><span class="n">to</span><span class="p">})[</span>
+</span><span id="L-34"><a href="#L-34"><span class="linenos"> 34</span></a>        <span class="n">to</span>
+</span><span id="L-35"><a href="#L-35"><span class="linenos"> 35</span></a>    <span class="p">]</span>
+</span><span id="L-36"><a href="#L-36"><span class="linenos"> 36</span></a>
+</span><span id="L-37"><a href="#L-37"><span class="linenos"> 37</span></a>
+</span><span id="L-38"><a href="#L-38"><span class="linenos"> 38</span></a><span class="k">def</span> <span class="nf">cycle</span><span class="p">(</span>
+</span><span id="L-39"><a href="#L-39"><span class="linenos"> 39</span></a>    <span class="n">gw_module</span><span class="p">:</span> <span class="n">GWModuleBase</span><span class="p">,</span>
+</span><span id="L-40"><a href="#L-40"><span class="linenos"> 40</span></a>    <span class="n">selection_mod</span><span class="p">:</span> <span class="n">SelectionBase</span><span class="p">,</span>
+</span><span id="L-41"><a href="#L-41"><span class="linenos"> 41</span></a>    <span class="n">x</span><span class="p">:</span> <span class="n">LatentsDomainGroupT</span><span class="p">,</span>
+</span><span id="L-42"><a href="#L-42"><span class="linenos"> 42</span></a>    <span class="n">through</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span>
+</span><span id="L-43"><a href="#L-43"><span class="linenos"> 43</span></a><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">LatentsDomainGroupDT</span><span class="p">:</span>
+</span><span id="L-44"><a href="#L-44"><span class="linenos"> 44</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="L-45"><a href="#L-45"><span class="linenos"> 45</span></a><span class="sd">    Do a full cycle from a group of representation through one domain.</span>
+</span><span id="L-46"><a href="#L-46"><span class="linenos"> 46</span></a>
+</span><span id="L-47"><a href="#L-47"><span class="linenos"> 47</span></a><span class="sd">    [Original domains] -&gt; [GW] -&gt; [through] -&gt; [GW] -&gt; [Original domains]</span>
+</span><span id="L-48"><a href="#L-48"><span class="linenos"> 48</span></a>
+</span><span id="L-49"><a href="#L-49"><span class="linenos"> 49</span></a><span class="sd">    Args:</span>
+</span><span id="L-50"><a href="#L-50"><span class="linenos"> 50</span></a><span class="sd">        gw_module (`GWModuleBase`): GWModule to perform the translation over</span>
+</span><span id="L-51"><a href="#L-51"><span class="linenos"> 51</span></a><span class="sd">        selection_mod (`SelectionBase`): selection module</span>
+</span><span id="L-52"><a href="#L-52"><span class="linenos"> 52</span></a><span class="sd">        x (`LatentsDomainGroupT`): group of unimodal latent representation</span>
+</span><span id="L-53"><a href="#L-53"><span class="linenos"> 53</span></a><span class="sd">        through (`str`): domain name to cycle through</span>
+</span><span id="L-54"><a href="#L-54"><span class="linenos"> 54</span></a><span class="sd">    Returns:</span>
+</span><span id="L-55"><a href="#L-55"><span class="linenos"> 55</span></a><span class="sd">        `LatentsDomainGroupDT`: group of unimodal latent representation after</span>
+</span><span id="L-56"><a href="#L-56"><span class="linenos"> 56</span></a><span class="sd">            cycling.</span>
+</span><span id="L-57"><a href="#L-57"><span class="linenos"> 57</span></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="L-58"><a href="#L-58"><span class="linenos"> 58</span></a>    <span class="k">return</span> <span class="p">{</span>
+</span><span id="L-59"><a href="#L-59"><span class="linenos"> 59</span></a>        <span class="n">domain</span><span class="p">:</span> <span class="n">translation</span><span class="p">(</span>
+</span><span id="L-60"><a href="#L-60"><span class="linenos"> 60</span></a>            <span class="n">gw_module</span><span class="p">,</span>
+</span><span id="L-61"><a href="#L-61"><span class="linenos"> 61</span></a>            <span class="n">selection_mod</span><span class="p">,</span>
+</span><span id="L-62"><a href="#L-62"><span class="linenos"> 62</span></a>            <span class="p">{</span><span class="n">through</span><span class="p">:</span> <span class="n">translation</span><span class="p">(</span><span class="n">gw_module</span><span class="p">,</span> <span class="n">selection_mod</span><span class="p">,</span> <span class="n">x</span><span class="p">,</span> <span class="n">through</span><span class="p">)},</span>
+</span><span id="L-63"><a href="#L-63"><span class="linenos"> 63</span></a>            <span class="n">domain</span><span class="p">,</span>
+</span><span id="L-64"><a href="#L-64"><span class="linenos"> 64</span></a>        <span class="p">)</span>
+</span><span id="L-65"><a href="#L-65"><span class="linenos"> 65</span></a>        <span class="k">for</span> <span class="n">domain</span> <span class="ow">in</span> <span class="n">x</span>
+</span><span id="L-66"><a href="#L-66"><span class="linenos"> 66</span></a>    <span class="p">}</span>
+</span><span id="L-67"><a href="#L-67"><span class="linenos"> 67</span></a>
+</span><span id="L-68"><a href="#L-68"><span class="linenos"> 68</span></a>
+</span><span id="L-69"><a href="#L-69"><span class="linenos"> 69</span></a><span class="k">def</span> <span class="nf">batch_demi_cycles</span><span class="p">(</span>
+</span><span id="L-70"><a href="#L-70"><span class="linenos"> 70</span></a>    <span class="n">gw_mod</span><span class="p">:</span> <span class="n">GWModuleBase</span><span class="p">,</span>
+</span><span id="L-71"><a href="#L-71"><span class="linenos"> 71</span></a>    <span class="n">selection_mod</span><span class="p">:</span> <span class="n">SelectionBase</span><span class="p">,</span>
+</span><span id="L-72"><a href="#L-72"><span class="linenos"> 72</span></a>    <span class="n">latent_domains</span><span class="p">:</span> <span class="n">LatentsDomainGroupsT</span><span class="p">,</span>
+</span><span id="L-73"><a href="#L-73"><span class="linenos"> 73</span></a><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]:</span>
+</span><span id="L-74"><a href="#L-74"><span class="linenos"> 74</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="L-75"><a href="#L-75"><span class="linenos"> 75</span></a><span class="sd">    Computes demi-cycles of a batch of groups of domains.</span>
+</span><span id="L-76"><a href="#L-76"><span class="linenos"> 76</span></a>
+</span><span id="L-77"><a href="#L-77"><span class="linenos"> 77</span></a><span class="sd">    Args:</span>
+</span><span id="L-78"><a href="#L-78"><span class="linenos"> 78</span></a><span class="sd">        gw_mod (`GWModuleBase`): the GWModuleBase</span>
+</span><span id="L-79"><a href="#L-79"><span class="linenos"> 79</span></a><span class="sd">        selection_mod (`SelectionBase`): selection module</span>
+</span><span id="L-80"><a href="#L-80"><span class="linenos"> 80</span></a><span class="sd">        latent_domains (`LatentsT`): the batch of groups of domains</span>
+</span><span id="L-81"><a href="#L-81"><span class="linenos"> 81</span></a>
+</span><span id="L-82"><a href="#L-82"><span class="linenos"> 82</span></a><span class="sd">    Returns:</span>
+</span><span id="L-83"><a href="#L-83"><span class="linenos"> 83</span></a><span class="sd">        `dict[str, torch.Tensor]`: demi-cycles predictions for each domain.</span>
+</span><span id="L-84"><a href="#L-84"><span class="linenos"> 84</span></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="L-85"><a href="#L-85"><span class="linenos"> 85</span></a>    <span class="n">predictions</span><span class="p">:</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]</span> <span class="o">=</span> <span class="p">{}</span>
+</span><span id="L-86"><a href="#L-86"><span class="linenos"> 86</span></a>    <span class="k">for</span> <span class="n">domains</span><span class="p">,</span> <span class="n">latents</span> <span class="ow">in</span> <span class="n">latent_domains</span><span class="o">.</span><span class="n">items</span><span class="p">():</span>
+</span><span id="L-87"><a href="#L-87"><span class="linenos"> 87</span></a>        <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">domains</span><span class="p">)</span> <span class="o">&gt;</span> <span class="mi">1</span><span class="p">:</span>
+</span><span id="L-88"><a href="#L-88"><span class="linenos"> 88</span></a>            <span class="k">continue</span>
+</span><span id="L-89"><a href="#L-89"><span class="linenos"> 89</span></a>        <span class="n">domain_name</span> <span class="o">=</span> <span class="nb">list</span><span class="p">(</span><span class="n">domains</span><span class="p">)[</span><span class="mi">0</span><span class="p">]</span>
+</span><span id="L-90"><a href="#L-90"><span class="linenos"> 90</span></a>        <span class="n">z</span> <span class="o">=</span> <span class="n">translation</span><span class="p">(</span><span class="n">gw_mod</span><span class="p">,</span> <span class="n">selection_mod</span><span class="p">,</span> <span class="n">latents</span><span class="p">,</span> <span class="n">to</span><span class="o">=</span><span class="n">domain_name</span><span class="p">)</span>
+</span><span id="L-91"><a href="#L-91"><span class="linenos"> 91</span></a>        <span class="n">predictions</span><span class="p">[</span><span class="n">domain_name</span><span class="p">]</span> <span class="o">=</span> <span class="n">z</span>
+</span><span id="L-92"><a href="#L-92"><span class="linenos"> 92</span></a>    <span class="k">return</span> <span class="n">predictions</span>
+</span><span id="L-93"><a href="#L-93"><span class="linenos"> 93</span></a>
+</span><span id="L-94"><a href="#L-94"><span class="linenos"> 94</span></a>
+</span><span id="L-95"><a href="#L-95"><span class="linenos"> 95</span></a><span class="k">def</span> <span class="nf">batch_cycles</span><span class="p">(</span>
+</span><span id="L-96"><a href="#L-96"><span class="linenos"> 96</span></a>    <span class="n">gw_mod</span><span class="p">:</span> <span class="n">GWModuleBase</span><span class="p">,</span>
+</span><span id="L-97"><a href="#L-97"><span class="linenos"> 97</span></a>    <span class="n">selection_mod</span><span class="p">:</span> <span class="n">SelectionBase</span><span class="p">,</span>
+</span><span id="L-98"><a href="#L-98"><span class="linenos"> 98</span></a>    <span class="n">latent_domains</span><span class="p">:</span> <span class="n">LatentsDomainGroupsT</span><span class="p">,</span>
+</span><span id="L-99"><a href="#L-99"><span class="linenos"> 99</span></a>    <span class="n">through_domains</span><span class="p">:</span> <span class="n">Iterable</span><span class="p">[</span><span class="nb">str</span><span class="p">],</span>
+</span><span id="L-100"><a href="#L-100"><span class="linenos">100</span></a><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">tuple</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="nb">str</span><span class="p">],</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]:</span>
+</span><span id="L-101"><a href="#L-101"><span class="linenos">101</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="L-102"><a href="#L-102"><span class="linenos">102</span></a><span class="sd">    Computes cycles of a batch of groups of domains.</span>
+</span><span id="L-103"><a href="#L-103"><span class="linenos">103</span></a>
+</span><span id="L-104"><a href="#L-104"><span class="linenos">104</span></a><span class="sd">    Args:</span>
+</span><span id="L-105"><a href="#L-105"><span class="linenos">105</span></a><span class="sd">        gw_mod (`GWModuleBase`): GWModule to use for the cycle</span>
+</span><span id="L-106"><a href="#L-106"><span class="linenos">106</span></a><span class="sd">        selection_mod (`SelectionBase`): selection module</span>
+</span><span id="L-107"><a href="#L-107"><span class="linenos">107</span></a><span class="sd">        latent_domains (`LatentsT`): the batch of groups of domains</span>
+</span><span id="L-108"><a href="#L-108"><span class="linenos">108</span></a><span class="sd">        out_domains (`Iterable[str]`): iterable of domain names to do the cycle through.</span>
+</span><span id="L-109"><a href="#L-109"><span class="linenos">109</span></a><span class="sd">            Each domain will be done separetely.</span>
+</span><span id="L-110"><a href="#L-110"><span class="linenos">110</span></a>
+</span><span id="L-111"><a href="#L-111"><span class="linenos">111</span></a><span class="sd">    Returns:</span>
+</span><span id="L-112"><a href="#L-112"><span class="linenos">112</span></a><span class="sd">        `dict[tuple[str, str], torch.Tensor]`: cycles predictions for each</span>
+</span><span id="L-113"><a href="#L-113"><span class="linenos">113</span></a><span class="sd">            couple of (start domain, intermediary domain).</span>
+</span><span id="L-114"><a href="#L-114"><span class="linenos">114</span></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="L-115"><a href="#L-115"><span class="linenos">115</span></a>    <span class="n">predictions</span><span class="p">:</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">tuple</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="nb">str</span><span class="p">],</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]</span> <span class="o">=</span> <span class="p">{}</span>
+</span><span id="L-116"><a href="#L-116"><span class="linenos">116</span></a>    <span class="k">for</span> <span class="n">domains_source</span><span class="p">,</span> <span class="n">latents_source</span> <span class="ow">in</span> <span class="n">latent_domains</span><span class="o">.</span><span class="n">items</span><span class="p">():</span>
+</span><span id="L-117"><a href="#L-117"><span class="linenos">117</span></a>        <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">domains_source</span><span class="p">)</span> <span class="o">&gt;</span> <span class="mi">1</span><span class="p">:</span>
+</span><span id="L-118"><a href="#L-118"><span class="linenos">118</span></a>            <span class="k">continue</span>
+</span><span id="L-119"><a href="#L-119"><span class="linenos">119</span></a>        <span class="n">domain_name_source</span> <span class="o">=</span> <span class="nb">next</span><span class="p">(</span><span class="nb">iter</span><span class="p">(</span><span class="n">domains_source</span><span class="p">))</span>
+</span><span id="L-120"><a href="#L-120"><span class="linenos">120</span></a>        <span class="k">for</span> <span class="n">domain_name_through</span> <span class="ow">in</span> <span class="n">through_domains</span><span class="p">:</span>
+</span><span id="L-121"><a href="#L-121"><span class="linenos">121</span></a>            <span class="k">if</span> <span class="n">domain_name_source</span> <span class="o">==</span> <span class="n">domain_name_through</span><span class="p">:</span>
+</span><span id="L-122"><a href="#L-122"><span class="linenos">122</span></a>                <span class="k">continue</span>
+</span><span id="L-123"><a href="#L-123"><span class="linenos">123</span></a>            <span class="n">z</span> <span class="o">=</span> <span class="n">cycle</span><span class="p">(</span>
+</span><span id="L-124"><a href="#L-124"><span class="linenos">124</span></a>                <span class="n">gw_mod</span><span class="p">,</span> <span class="n">selection_mod</span><span class="p">,</span> <span class="n">latents_source</span><span class="p">,</span> <span class="n">through</span><span class="o">=</span><span class="n">domain_name_through</span>
+</span><span id="L-125"><a href="#L-125"><span class="linenos">125</span></a>            <span class="p">)</span>
+</span><span id="L-126"><a href="#L-126"><span class="linenos">126</span></a>            <span class="n">domains</span> <span class="o">=</span> <span class="p">(</span><span class="n">domain_name_source</span><span class="p">,</span> <span class="n">domain_name_through</span><span class="p">)</span>
+</span><span id="L-127"><a href="#L-127"><span class="linenos">127</span></a>            <span class="n">predictions</span><span class="p">[</span><span class="n">domains</span><span class="p">]</span> <span class="o">=</span> <span class="n">z</span><span class="p">[</span><span class="n">domain_name_source</span><span class="p">]</span>
+</span><span id="L-128"><a href="#L-128"><span class="linenos">128</span></a>    <span class="k">return</span> <span class="n">predictions</span>
+</span><span id="L-129"><a href="#L-129"><span class="linenos">129</span></a>
+</span><span id="L-130"><a href="#L-130"><span class="linenos">130</span></a>
+</span><span id="L-131"><a href="#L-131"><span class="linenos">131</span></a><span class="k">def</span> <span class="nf">batch_translations</span><span class="p">(</span>
+</span><span id="L-132"><a href="#L-132"><span class="linenos">132</span></a>    <span class="n">gw_mod</span><span class="p">:</span> <span class="n">GWModuleBase</span><span class="p">,</span>
+</span><span id="L-133"><a href="#L-133"><span class="linenos">133</span></a>    <span class="n">selection_mod</span><span class="p">:</span> <span class="n">SelectionBase</span><span class="p">,</span>
+</span><span id="L-134"><a href="#L-134"><span class="linenos">134</span></a>    <span class="n">latent_domains</span><span class="p">:</span> <span class="n">LatentsDomainGroupsT</span><span class="p">,</span>
+</span><span id="L-135"><a href="#L-135"><span class="linenos">135</span></a><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">tuple</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="nb">str</span><span class="p">],</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]:</span>
+</span><span id="L-136"><a href="#L-136"><span class="linenos">136</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="L-137"><a href="#L-137"><span class="linenos">137</span></a><span class="sd">    Computes translations of a batch of groups of domains.</span>
+</span><span id="L-138"><a href="#L-138"><span class="linenos">138</span></a>
+</span><span id="L-139"><a href="#L-139"><span class="linenos">139</span></a><span class="sd">    Args:</span>
+</span><span id="L-140"><a href="#L-140"><span class="linenos">140</span></a><span class="sd">        gw_mod (`GWModuleBase`): GWModule to do the translation</span>
+</span><span id="L-141"><a href="#L-141"><span class="linenos">141</span></a><span class="sd">        selection_mod (`SelectionBase`): selection module</span>
+</span><span id="L-142"><a href="#L-142"><span class="linenos">142</span></a><span class="sd">        latent_domains (`LatentsT`): the batch of groups of domains</span>
+</span><span id="L-143"><a href="#L-143"><span class="linenos">143</span></a>
+</span><span id="L-144"><a href="#L-144"><span class="linenos">144</span></a><span class="sd">    Returns:</span>
+</span><span id="L-145"><a href="#L-145"><span class="linenos">145</span></a><span class="sd">        `dict[tuple[str, str], torch.Tensor]`: translation predictions for each</span>
+</span><span id="L-146"><a href="#L-146"><span class="linenos">146</span></a><span class="sd">            couple of (start domain, target domain).</span>
+</span><span id="L-147"><a href="#L-147"><span class="linenos">147</span></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="L-148"><a href="#L-148"><span class="linenos">148</span></a>    <span class="n">predictions</span><span class="p">:</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">tuple</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="nb">str</span><span class="p">],</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]</span> <span class="o">=</span> <span class="p">{}</span>
+</span><span id="L-149"><a href="#L-149"><span class="linenos">149</span></a>    <span class="k">for</span> <span class="n">domains</span><span class="p">,</span> <span class="n">latents</span> <span class="ow">in</span> <span class="n">latent_domains</span><span class="o">.</span><span class="n">items</span><span class="p">():</span>
+</span><span id="L-150"><a href="#L-150"><span class="linenos">150</span></a>        <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">domains</span><span class="p">)</span> <span class="o">&lt;</span> <span class="mi">2</span><span class="p">:</span>
+</span><span id="L-151"><a href="#L-151"><span class="linenos">151</span></a>            <span class="k">continue</span>
+</span><span id="L-152"><a href="#L-152"><span class="linenos">152</span></a>        <span class="k">for</span> <span class="n">domain_name_source</span> <span class="ow">in</span> <span class="n">domains</span><span class="p">:</span>
+</span><span id="L-153"><a href="#L-153"><span class="linenos">153</span></a>            <span class="k">for</span> <span class="n">domain_name_target</span> <span class="ow">in</span> <span class="n">domains</span><span class="p">:</span>
+</span><span id="L-154"><a href="#L-154"><span class="linenos">154</span></a>                <span class="k">if</span> <span class="n">domain_name_source</span> <span class="o">==</span> <span class="n">domain_name_target</span><span class="p">:</span>
+</span><span id="L-155"><a href="#L-155"><span class="linenos">155</span></a>                    <span class="k">continue</span>
+</span><span id="L-156"><a href="#L-156"><span class="linenos">156</span></a>                <span class="n">prediction</span> <span class="o">=</span> <span class="n">translation</span><span class="p">(</span>
+</span><span id="L-157"><a href="#L-157"><span class="linenos">157</span></a>                    <span class="n">gw_mod</span><span class="p">,</span>
+</span><span id="L-158"><a href="#L-158"><span class="linenos">158</span></a>                    <span class="n">selection_mod</span><span class="p">,</span>
+</span><span id="L-159"><a href="#L-159"><span class="linenos">159</span></a>                    <span class="p">{</span><span class="n">domain_name_source</span><span class="p">:</span> <span class="n">latents</span><span class="p">[</span><span class="n">domain_name_source</span><span class="p">]},</span>
+</span><span id="L-160"><a href="#L-160"><span class="linenos">160</span></a>                    <span class="n">to</span><span class="o">=</span><span class="n">domain_name_target</span><span class="p">,</span>
+</span><span id="L-161"><a href="#L-161"><span class="linenos">161</span></a>                <span class="p">)</span>
+</span><span id="L-162"><a href="#L-162"><span class="linenos">162</span></a>                <span class="n">predictions</span><span class="p">[(</span><span class="n">domain_name_source</span><span class="p">,</span> <span class="n">domain_name_target</span><span class="p">)]</span> <span class="o">=</span> <span class="n">prediction</span>
+</span><span id="L-163"><a href="#L-163"><span class="linenos">163</span></a>    <span class="k">return</span> <span class="n">predictions</span>
+</span></pre></div>
+
+
+            </section>
+                <section id="translation">
+                            <input id="translation-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
+<div class="attr function">
+            
+        <span class="def">def</span>
+        <span class="name">translation</span><span class="signature pdoc-code multiline">(<span class="param">	<span class="n">gw_module</span><span class="p">:</span> <span class="n"><a href="gw_module.html#GWModuleBase">shimmer.modules.gw_module.GWModuleBase</a></span>,</span><span class="param">	<span class="n">selection_mod</span><span class="p">:</span> <span class="n"><a href="selection.html#SelectionBase">shimmer.modules.selection.SelectionBase</a></span>,</span><span class="param">	<span class="n">x</span><span class="p">:</span> <span class="n">collections</span><span class="o">.</span><span class="n">abc</span><span class="o">.</span><span class="n">Mapping</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]</span>,</span><span class="param">	<span class="n">to</span><span class="p">:</span> <span class="nb">str</span></span><span class="return-annotation">) -> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span>:</span></span>
+
+                <label class="view-source-button" for="translation-view-source"><span>View Source</span></label>
+
+    </div>
+    <a class="headerlink" href="#translation"></a>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="translation-15"><a href="#translation-15"><span class="linenos">15</span></a><span class="k">def</span> <span class="nf">translation</span><span class="p">(</span>
+</span><span id="translation-16"><a href="#translation-16"><span class="linenos">16</span></a>    <span class="n">gw_module</span><span class="p">:</span> <span class="n">GWModuleBase</span><span class="p">,</span>
+</span><span id="translation-17"><a href="#translation-17"><span class="linenos">17</span></a>    <span class="n">selection_mod</span><span class="p">:</span> <span class="n">SelectionBase</span><span class="p">,</span>
+</span><span id="translation-18"><a href="#translation-18"><span class="linenos">18</span></a>    <span class="n">x</span><span class="p">:</span> <span class="n">LatentsDomainGroupT</span><span class="p">,</span>
+</span><span id="translation-19"><a href="#translation-19"><span class="linenos">19</span></a>    <span class="n">to</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span>
+</span><span id="translation-20"><a href="#translation-20"><span class="linenos">20</span></a><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">:</span>
+</span><span id="translation-21"><a href="#translation-21"><span class="linenos">21</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="translation-22"><a href="#translation-22"><span class="linenos">22</span></a><span class="sd">    Translate from multiple domains to one domain.</span>
+</span><span id="translation-23"><a href="#translation-23"><span class="linenos">23</span></a>
+</span><span id="translation-24"><a href="#translation-24"><span class="linenos">24</span></a><span class="sd">    Args:</span>
+</span><span id="translation-25"><a href="#translation-25"><span class="linenos">25</span></a><span class="sd">        gw_module (`GWModuleBase`): GWModule to perform the translation over</span>
+</span><span id="translation-26"><a href="#translation-26"><span class="linenos">26</span></a><span class="sd">        selection_mod (`SelectionBase`): selection module</span>
+</span><span id="translation-27"><a href="#translation-27"><span class="linenos">27</span></a><span class="sd">        x (`LatentsDomainGroupT`): the group of latent representations</span>
+</span><span id="translation-28"><a href="#translation-28"><span class="linenos">28</span></a><span class="sd">        to (`str`): the domain name to encode to</span>
+</span><span id="translation-29"><a href="#translation-29"><span class="linenos">29</span></a>
+</span><span id="translation-30"><a href="#translation-30"><span class="linenos">30</span></a><span class="sd">    Returns:</span>
+</span><span id="translation-31"><a href="#translation-31"><span class="linenos">31</span></a><span class="sd">        `torch.Tensor`: the translated unimodal representation</span>
+</span><span id="translation-32"><a href="#translation-32"><span class="linenos">32</span></a><span class="sd">            of the provided domain.</span>
+</span><span id="translation-33"><a href="#translation-33"><span class="linenos">33</span></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="translation-34"><a href="#translation-34"><span class="linenos">34</span></a>    <span class="k">return</span> <span class="n">gw_module</span><span class="o">.</span><span class="n">decode</span><span class="p">(</span><span class="n">gw_module</span><span class="o">.</span><span class="n">encode_and_fuse</span><span class="p">(</span><span class="n">x</span><span class="p">,</span> <span class="n">selection_mod</span><span class="p">),</span> <span class="n">domains</span><span class="o">=</span><span class="p">{</span><span class="n">to</span><span class="p">})[</span>
+</span><span id="translation-35"><a href="#translation-35"><span class="linenos">35</span></a>        <span class="n">to</span>
+</span><span id="translation-36"><a href="#translation-36"><span class="linenos">36</span></a>    <span class="p">]</span>
+</span></pre></div>
+
+
+            <div class="docstring"><p>Translate from multiple domains to one domain.</p>
+
+<h6 id="arguments">Arguments:</h6>
+
+<ul>
+<li><strong>gw_module (<code>GWModuleBase</code>):</strong>  GWModule to perform the translation over</li>
+<li><strong>selection_mod (<code>SelectionBase</code>):</strong>  selection module</li>
+<li><strong>x (<code>LatentsDomainGroupT</code>):</strong>  the group of latent representations</li>
+<li><strong>to (<code>str</code>):</strong>  the domain name to encode to</li>
+</ul>
+
+<h6 id="returns">Returns:</h6>
+
+<blockquote>
+  <p><code>torch.Tensor</code>: the translated unimodal representation
+      of the provided domain.</p>
+</blockquote>
+</div>
+
+
+                </section>
+                <section id="cycle">
+                            <input id="cycle-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
+<div class="attr function">
+            
+        <span class="def">def</span>
+        <span class="name">cycle</span><span class="signature pdoc-code multiline">(<span class="param">	<span class="n">gw_module</span><span class="p">:</span> <span class="n"><a href="gw_module.html#GWModuleBase">shimmer.modules.gw_module.GWModuleBase</a></span>,</span><span class="param">	<span class="n">selection_mod</span><span class="p">:</span> <span class="n"><a href="selection.html#SelectionBase">shimmer.modules.selection.SelectionBase</a></span>,</span><span class="param">	<span class="n">x</span><span class="p">:</span> <span class="n">collections</span><span class="o">.</span><span class="n">abc</span><span class="o">.</span><span class="n">Mapping</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]</span>,</span><span class="param">	<span class="n">through</span><span class="p">:</span> <span class="nb">str</span></span><span class="return-annotation">) -> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]</span>:</span></span>
+
+                <label class="view-source-button" for="cycle-view-source"><span>View Source</span></label>
+
+    </div>
+    <a class="headerlink" href="#cycle"></a>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="cycle-39"><a href="#cycle-39"><span class="linenos">39</span></a><span class="k">def</span> <span class="nf">cycle</span><span class="p">(</span>
+</span><span id="cycle-40"><a href="#cycle-40"><span class="linenos">40</span></a>    <span class="n">gw_module</span><span class="p">:</span> <span class="n">GWModuleBase</span><span class="p">,</span>
+</span><span id="cycle-41"><a href="#cycle-41"><span class="linenos">41</span></a>    <span class="n">selection_mod</span><span class="p">:</span> <span class="n">SelectionBase</span><span class="p">,</span>
+</span><span id="cycle-42"><a href="#cycle-42"><span class="linenos">42</span></a>    <span class="n">x</span><span class="p">:</span> <span class="n">LatentsDomainGroupT</span><span class="p">,</span>
+</span><span id="cycle-43"><a href="#cycle-43"><span class="linenos">43</span></a>    <span class="n">through</span><span class="p">:</span> <span class="nb">str</span><span class="p">,</span>
+</span><span id="cycle-44"><a href="#cycle-44"><span class="linenos">44</span></a><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">LatentsDomainGroupDT</span><span class="p">:</span>
+</span><span id="cycle-45"><a href="#cycle-45"><span class="linenos">45</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="cycle-46"><a href="#cycle-46"><span class="linenos">46</span></a><span class="sd">    Do a full cycle from a group of representation through one domain.</span>
+</span><span id="cycle-47"><a href="#cycle-47"><span class="linenos">47</span></a>
+</span><span id="cycle-48"><a href="#cycle-48"><span class="linenos">48</span></a><span class="sd">    [Original domains] -&gt; [GW] -&gt; [through] -&gt; [GW] -&gt; [Original domains]</span>
+</span><span id="cycle-49"><a href="#cycle-49"><span class="linenos">49</span></a>
+</span><span id="cycle-50"><a href="#cycle-50"><span class="linenos">50</span></a><span class="sd">    Args:</span>
+</span><span id="cycle-51"><a href="#cycle-51"><span class="linenos">51</span></a><span class="sd">        gw_module (`GWModuleBase`): GWModule to perform the translation over</span>
+</span><span id="cycle-52"><a href="#cycle-52"><span class="linenos">52</span></a><span class="sd">        selection_mod (`SelectionBase`): selection module</span>
+</span><span id="cycle-53"><a href="#cycle-53"><span class="linenos">53</span></a><span class="sd">        x (`LatentsDomainGroupT`): group of unimodal latent representation</span>
+</span><span id="cycle-54"><a href="#cycle-54"><span class="linenos">54</span></a><span class="sd">        through (`str`): domain name to cycle through</span>
+</span><span id="cycle-55"><a href="#cycle-55"><span class="linenos">55</span></a><span class="sd">    Returns:</span>
+</span><span id="cycle-56"><a href="#cycle-56"><span class="linenos">56</span></a><span class="sd">        `LatentsDomainGroupDT`: group of unimodal latent representation after</span>
+</span><span id="cycle-57"><a href="#cycle-57"><span class="linenos">57</span></a><span class="sd">            cycling.</span>
+</span><span id="cycle-58"><a href="#cycle-58"><span class="linenos">58</span></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="cycle-59"><a href="#cycle-59"><span class="linenos">59</span></a>    <span class="k">return</span> <span class="p">{</span>
+</span><span id="cycle-60"><a href="#cycle-60"><span class="linenos">60</span></a>        <span class="n">domain</span><span class="p">:</span> <span class="n">translation</span><span class="p">(</span>
+</span><span id="cycle-61"><a href="#cycle-61"><span class="linenos">61</span></a>            <span class="n">gw_module</span><span class="p">,</span>
+</span><span id="cycle-62"><a href="#cycle-62"><span class="linenos">62</span></a>            <span class="n">selection_mod</span><span class="p">,</span>
+</span><span id="cycle-63"><a href="#cycle-63"><span class="linenos">63</span></a>            <span class="p">{</span><span class="n">through</span><span class="p">:</span> <span class="n">translation</span><span class="p">(</span><span class="n">gw_module</span><span class="p">,</span> <span class="n">selection_mod</span><span class="p">,</span> <span class="n">x</span><span class="p">,</span> <span class="n">through</span><span class="p">)},</span>
+</span><span id="cycle-64"><a href="#cycle-64"><span class="linenos">64</span></a>            <span class="n">domain</span><span class="p">,</span>
+</span><span id="cycle-65"><a href="#cycle-65"><span class="linenos">65</span></a>        <span class="p">)</span>
+</span><span id="cycle-66"><a href="#cycle-66"><span class="linenos">66</span></a>        <span class="k">for</span> <span class="n">domain</span> <span class="ow">in</span> <span class="n">x</span>
+</span><span id="cycle-67"><a href="#cycle-67"><span class="linenos">67</span></a>    <span class="p">}</span>
+</span></pre></div>
+
+
+            <div class="docstring"><p>Do a full cycle from a group of representation through one domain.</p>
+
+<p>[Original domains] -> [GW] -> [through] -> [GW] -> [Original domains]</p>
+
+<h6 id="arguments">Arguments:</h6>
+
+<ul>
+<li><strong>gw_module (<code>GWModuleBase</code>):</strong>  GWModule to perform the translation over</li>
+<li><strong>selection_mod (<code>SelectionBase</code>):</strong>  selection module</li>
+<li><strong>x (<code>LatentsDomainGroupT</code>):</strong>  group of unimodal latent representation</li>
+<li><strong>through (<code>str</code>):</strong>  domain name to cycle through</li>
+</ul>
+
+<h6 id="returns">Returns:</h6>
+
+<blockquote>
+  <p><code>LatentsDomainGroupDT</code>: group of unimodal latent representation after
+      cycling.</p>
+</blockquote>
+</div>
+
+
+                </section>
+                <section id="batch_demi_cycles">
+                            <input id="batch_demi_cycles-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
+<div class="attr function">
+            
+        <span class="def">def</span>
+        <span class="name">batch_demi_cycles</span><span class="signature pdoc-code multiline">(<span class="param">	<span class="n">gw_mod</span><span class="p">:</span> <span class="n"><a href="gw_module.html#GWModuleBase">shimmer.modules.gw_module.GWModuleBase</a></span>,</span><span class="param">	<span class="n">selection_mod</span><span class="p">:</span> <span class="n"><a href="selection.html#SelectionBase">shimmer.modules.selection.SelectionBase</a></span>,</span><span class="param">	<span class="n">latent_domains</span><span class="p">:</span> <span class="n">collections</span><span class="o">.</span><span class="n">abc</span><span class="o">.</span><span class="n">Mapping</span><span class="p">[</span><span class="nb">frozenset</span><span class="p">[</span><span class="nb">str</span><span class="p">],</span> <span class="n">collections</span><span class="o">.</span><span class="n">abc</span><span class="o">.</span><span class="n">Mapping</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]]</span></span><span class="return-annotation">) -> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]</span>:</span></span>
+
+                <label class="view-source-button" for="batch_demi_cycles-view-source"><span>View Source</span></label>
+
+    </div>
+    <a class="headerlink" href="#batch_demi_cycles"></a>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="batch_demi_cycles-70"><a href="#batch_demi_cycles-70"><span class="linenos">70</span></a><span class="k">def</span> <span class="nf">batch_demi_cycles</span><span class="p">(</span>
+</span><span id="batch_demi_cycles-71"><a href="#batch_demi_cycles-71"><span class="linenos">71</span></a>    <span class="n">gw_mod</span><span class="p">:</span> <span class="n">GWModuleBase</span><span class="p">,</span>
+</span><span id="batch_demi_cycles-72"><a href="#batch_demi_cycles-72"><span class="linenos">72</span></a>    <span class="n">selection_mod</span><span class="p">:</span> <span class="n">SelectionBase</span><span class="p">,</span>
+</span><span id="batch_demi_cycles-73"><a href="#batch_demi_cycles-73"><span class="linenos">73</span></a>    <span class="n">latent_domains</span><span class="p">:</span> <span class="n">LatentsDomainGroupsT</span><span class="p">,</span>
+</span><span id="batch_demi_cycles-74"><a href="#batch_demi_cycles-74"><span class="linenos">74</span></a><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]:</span>
+</span><span id="batch_demi_cycles-75"><a href="#batch_demi_cycles-75"><span class="linenos">75</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="batch_demi_cycles-76"><a href="#batch_demi_cycles-76"><span class="linenos">76</span></a><span class="sd">    Computes demi-cycles of a batch of groups of domains.</span>
+</span><span id="batch_demi_cycles-77"><a href="#batch_demi_cycles-77"><span class="linenos">77</span></a>
+</span><span id="batch_demi_cycles-78"><a href="#batch_demi_cycles-78"><span class="linenos">78</span></a><span class="sd">    Args:</span>
+</span><span id="batch_demi_cycles-79"><a href="#batch_demi_cycles-79"><span class="linenos">79</span></a><span class="sd">        gw_mod (`GWModuleBase`): the GWModuleBase</span>
+</span><span id="batch_demi_cycles-80"><a href="#batch_demi_cycles-80"><span class="linenos">80</span></a><span class="sd">        selection_mod (`SelectionBase`): selection module</span>
+</span><span id="batch_demi_cycles-81"><a href="#batch_demi_cycles-81"><span class="linenos">81</span></a><span class="sd">        latent_domains (`LatentsT`): the batch of groups of domains</span>
+</span><span id="batch_demi_cycles-82"><a href="#batch_demi_cycles-82"><span class="linenos">82</span></a>
+</span><span id="batch_demi_cycles-83"><a href="#batch_demi_cycles-83"><span class="linenos">83</span></a><span class="sd">    Returns:</span>
+</span><span id="batch_demi_cycles-84"><a href="#batch_demi_cycles-84"><span class="linenos">84</span></a><span class="sd">        `dict[str, torch.Tensor]`: demi-cycles predictions for each domain.</span>
+</span><span id="batch_demi_cycles-85"><a href="#batch_demi_cycles-85"><span class="linenos">85</span></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="batch_demi_cycles-86"><a href="#batch_demi_cycles-86"><span class="linenos">86</span></a>    <span class="n">predictions</span><span class="p">:</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]</span> <span class="o">=</span> <span class="p">{}</span>
+</span><span id="batch_demi_cycles-87"><a href="#batch_demi_cycles-87"><span class="linenos">87</span></a>    <span class="k">for</span> <span class="n">domains</span><span class="p">,</span> <span class="n">latents</span> <span class="ow">in</span> <span class="n">latent_domains</span><span class="o">.</span><span class="n">items</span><span class="p">():</span>
+</span><span id="batch_demi_cycles-88"><a href="#batch_demi_cycles-88"><span class="linenos">88</span></a>        <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">domains</span><span class="p">)</span> <span class="o">&gt;</span> <span class="mi">1</span><span class="p">:</span>
+</span><span id="batch_demi_cycles-89"><a href="#batch_demi_cycles-89"><span class="linenos">89</span></a>            <span class="k">continue</span>
+</span><span id="batch_demi_cycles-90"><a href="#batch_demi_cycles-90"><span class="linenos">90</span></a>        <span class="n">domain_name</span> <span class="o">=</span> <span class="nb">list</span><span class="p">(</span><span class="n">domains</span><span class="p">)[</span><span class="mi">0</span><span class="p">]</span>
+</span><span id="batch_demi_cycles-91"><a href="#batch_demi_cycles-91"><span class="linenos">91</span></a>        <span class="n">z</span> <span class="o">=</span> <span class="n">translation</span><span class="p">(</span><span class="n">gw_mod</span><span class="p">,</span> <span class="n">selection_mod</span><span class="p">,</span> <span class="n">latents</span><span class="p">,</span> <span class="n">to</span><span class="o">=</span><span class="n">domain_name</span><span class="p">)</span>
+</span><span id="batch_demi_cycles-92"><a href="#batch_demi_cycles-92"><span class="linenos">92</span></a>        <span class="n">predictions</span><span class="p">[</span><span class="n">domain_name</span><span class="p">]</span> <span class="o">=</span> <span class="n">z</span>
+</span><span id="batch_demi_cycles-93"><a href="#batch_demi_cycles-93"><span class="linenos">93</span></a>    <span class="k">return</span> <span class="n">predictions</span>
+</span></pre></div>
+
+
+            <div class="docstring"><p>Computes demi-cycles of a batch of groups of domains.</p>
+
+<h6 id="arguments">Arguments:</h6>
+
+<ul>
+<li><strong>gw_mod (<code>GWModuleBase</code>):</strong>  the GWModuleBase</li>
+<li><strong>selection_mod (<code>SelectionBase</code>):</strong>  selection module</li>
+<li><strong>latent_domains (<code>LatentsT</code>):</strong>  the batch of groups of domains</li>
+</ul>
+
+<h6 id="returns">Returns:</h6>
+
+<blockquote>
+  <p><code>dict[str, torch.Tensor]</code>: demi-cycles predictions for each domain.</p>
+</blockquote>
+</div>
+
+
+                </section>
+                <section id="batch_cycles">
+                            <input id="batch_cycles-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
+<div class="attr function">
+            
+        <span class="def">def</span>
+        <span class="name">batch_cycles</span><span class="signature pdoc-code multiline">(<span class="param">	<span class="n">gw_mod</span><span class="p">:</span> <span class="n"><a href="gw_module.html#GWModuleBase">shimmer.modules.gw_module.GWModuleBase</a></span>,</span><span class="param">	<span class="n">selection_mod</span><span class="p">:</span> <span class="n"><a href="selection.html#SelectionBase">shimmer.modules.selection.SelectionBase</a></span>,</span><span class="param">	<span class="n">latent_domains</span><span class="p">:</span> <span class="n">collections</span><span class="o">.</span><span class="n">abc</span><span class="o">.</span><span class="n">Mapping</span><span class="p">[</span><span class="nb">frozenset</span><span class="p">[</span><span class="nb">str</span><span class="p">],</span> <span class="n">collections</span><span class="o">.</span><span class="n">abc</span><span class="o">.</span><span class="n">Mapping</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]]</span>,</span><span class="param">	<span class="n">through_domains</span><span class="p">:</span> <span class="n">collections</span><span class="o">.</span><span class="n">abc</span><span class="o">.</span><span class="n">Iterable</span><span class="p">[</span><span class="nb">str</span><span class="p">]</span></span><span class="return-annotation">) -> <span class="nb">dict</span><span class="p">[</span><span class="nb">tuple</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="nb">str</span><span class="p">],</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]</span>:</span></span>
+
+                <label class="view-source-button" for="batch_cycles-view-source"><span>View Source</span></label>
+
+    </div>
+    <a class="headerlink" href="#batch_cycles"></a>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="batch_cycles-96"><a href="#batch_cycles-96"><span class="linenos"> 96</span></a><span class="k">def</span> <span class="nf">batch_cycles</span><span class="p">(</span>
+</span><span id="batch_cycles-97"><a href="#batch_cycles-97"><span class="linenos"> 97</span></a>    <span class="n">gw_mod</span><span class="p">:</span> <span class="n">GWModuleBase</span><span class="p">,</span>
+</span><span id="batch_cycles-98"><a href="#batch_cycles-98"><span class="linenos"> 98</span></a>    <span class="n">selection_mod</span><span class="p">:</span> <span class="n">SelectionBase</span><span class="p">,</span>
+</span><span id="batch_cycles-99"><a href="#batch_cycles-99"><span class="linenos"> 99</span></a>    <span class="n">latent_domains</span><span class="p">:</span> <span class="n">LatentsDomainGroupsT</span><span class="p">,</span>
+</span><span id="batch_cycles-100"><a href="#batch_cycles-100"><span class="linenos">100</span></a>    <span class="n">through_domains</span><span class="p">:</span> <span class="n">Iterable</span><span class="p">[</span><span class="nb">str</span><span class="p">],</span>
+</span><span id="batch_cycles-101"><a href="#batch_cycles-101"><span class="linenos">101</span></a><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">tuple</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="nb">str</span><span class="p">],</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]:</span>
+</span><span id="batch_cycles-102"><a href="#batch_cycles-102"><span class="linenos">102</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="batch_cycles-103"><a href="#batch_cycles-103"><span class="linenos">103</span></a><span class="sd">    Computes cycles of a batch of groups of domains.</span>
+</span><span id="batch_cycles-104"><a href="#batch_cycles-104"><span class="linenos">104</span></a>
+</span><span id="batch_cycles-105"><a href="#batch_cycles-105"><span class="linenos">105</span></a><span class="sd">    Args:</span>
+</span><span id="batch_cycles-106"><a href="#batch_cycles-106"><span class="linenos">106</span></a><span class="sd">        gw_mod (`GWModuleBase`): GWModule to use for the cycle</span>
+</span><span id="batch_cycles-107"><a href="#batch_cycles-107"><span class="linenos">107</span></a><span class="sd">        selection_mod (`SelectionBase`): selection module</span>
+</span><span id="batch_cycles-108"><a href="#batch_cycles-108"><span class="linenos">108</span></a><span class="sd">        latent_domains (`LatentsT`): the batch of groups of domains</span>
+</span><span id="batch_cycles-109"><a href="#batch_cycles-109"><span class="linenos">109</span></a><span class="sd">        out_domains (`Iterable[str]`): iterable of domain names to do the cycle through.</span>
+</span><span id="batch_cycles-110"><a href="#batch_cycles-110"><span class="linenos">110</span></a><span class="sd">            Each domain will be done separetely.</span>
+</span><span id="batch_cycles-111"><a href="#batch_cycles-111"><span class="linenos">111</span></a>
+</span><span id="batch_cycles-112"><a href="#batch_cycles-112"><span class="linenos">112</span></a><span class="sd">    Returns:</span>
+</span><span id="batch_cycles-113"><a href="#batch_cycles-113"><span class="linenos">113</span></a><span class="sd">        `dict[tuple[str, str], torch.Tensor]`: cycles predictions for each</span>
+</span><span id="batch_cycles-114"><a href="#batch_cycles-114"><span class="linenos">114</span></a><span class="sd">            couple of (start domain, intermediary domain).</span>
+</span><span id="batch_cycles-115"><a href="#batch_cycles-115"><span class="linenos">115</span></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="batch_cycles-116"><a href="#batch_cycles-116"><span class="linenos">116</span></a>    <span class="n">predictions</span><span class="p">:</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">tuple</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="nb">str</span><span class="p">],</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]</span> <span class="o">=</span> <span class="p">{}</span>
+</span><span id="batch_cycles-117"><a href="#batch_cycles-117"><span class="linenos">117</span></a>    <span class="k">for</span> <span class="n">domains_source</span><span class="p">,</span> <span class="n">latents_source</span> <span class="ow">in</span> <span class="n">latent_domains</span><span class="o">.</span><span class="n">items</span><span class="p">():</span>
+</span><span id="batch_cycles-118"><a href="#batch_cycles-118"><span class="linenos">118</span></a>        <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">domains_source</span><span class="p">)</span> <span class="o">&gt;</span> <span class="mi">1</span><span class="p">:</span>
+</span><span id="batch_cycles-119"><a href="#batch_cycles-119"><span class="linenos">119</span></a>            <span class="k">continue</span>
+</span><span id="batch_cycles-120"><a href="#batch_cycles-120"><span class="linenos">120</span></a>        <span class="n">domain_name_source</span> <span class="o">=</span> <span class="nb">next</span><span class="p">(</span><span class="nb">iter</span><span class="p">(</span><span class="n">domains_source</span><span class="p">))</span>
+</span><span id="batch_cycles-121"><a href="#batch_cycles-121"><span class="linenos">121</span></a>        <span class="k">for</span> <span class="n">domain_name_through</span> <span class="ow">in</span> <span class="n">through_domains</span><span class="p">:</span>
+</span><span id="batch_cycles-122"><a href="#batch_cycles-122"><span class="linenos">122</span></a>            <span class="k">if</span> <span class="n">domain_name_source</span> <span class="o">==</span> <span class="n">domain_name_through</span><span class="p">:</span>
+</span><span id="batch_cycles-123"><a href="#batch_cycles-123"><span class="linenos">123</span></a>                <span class="k">continue</span>
+</span><span id="batch_cycles-124"><a href="#batch_cycles-124"><span class="linenos">124</span></a>            <span class="n">z</span> <span class="o">=</span> <span class="n">cycle</span><span class="p">(</span>
+</span><span id="batch_cycles-125"><a href="#batch_cycles-125"><span class="linenos">125</span></a>                <span class="n">gw_mod</span><span class="p">,</span> <span class="n">selection_mod</span><span class="p">,</span> <span class="n">latents_source</span><span class="p">,</span> <span class="n">through</span><span class="o">=</span><span class="n">domain_name_through</span>
+</span><span id="batch_cycles-126"><a href="#batch_cycles-126"><span class="linenos">126</span></a>            <span class="p">)</span>
+</span><span id="batch_cycles-127"><a href="#batch_cycles-127"><span class="linenos">127</span></a>            <span class="n">domains</span> <span class="o">=</span> <span class="p">(</span><span class="n">domain_name_source</span><span class="p">,</span> <span class="n">domain_name_through</span><span class="p">)</span>
+</span><span id="batch_cycles-128"><a href="#batch_cycles-128"><span class="linenos">128</span></a>            <span class="n">predictions</span><span class="p">[</span><span class="n">domains</span><span class="p">]</span> <span class="o">=</span> <span class="n">z</span><span class="p">[</span><span class="n">domain_name_source</span><span class="p">]</span>
+</span><span id="batch_cycles-129"><a href="#batch_cycles-129"><span class="linenos">129</span></a>    <span class="k">return</span> <span class="n">predictions</span>
+</span></pre></div>
+
+
+            <div class="docstring"><p>Computes cycles of a batch of groups of domains.</p>
+
+<h6 id="arguments">Arguments:</h6>
+
+<ul>
+<li><strong>gw_mod (<code>GWModuleBase</code>):</strong>  GWModule to use for the cycle</li>
+<li><strong>selection_mod (<code>SelectionBase</code>):</strong>  selection module</li>
+<li><strong>latent_domains (<code>LatentsT</code>):</strong>  the batch of groups of domains</li>
+<li><strong>out_domains (<code>Iterable[str]</code>):</strong>  iterable of domain names to do the cycle through.
+Each domain will be done separetely.</li>
+</ul>
+
+<h6 id="returns">Returns:</h6>
+
+<blockquote>
+  <p><code>dict[tuple[str, str], torch.Tensor]</code>: cycles predictions for each
+      couple of (start domain, intermediary domain).</p>
+</blockquote>
+</div>
+
+
+                </section>
+                <section id="batch_translations">
+                            <input id="batch_translations-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
+<div class="attr function">
+            
+        <span class="def">def</span>
+        <span class="name">batch_translations</span><span class="signature pdoc-code multiline">(<span class="param">	<span class="n">gw_mod</span><span class="p">:</span> <span class="n"><a href="gw_module.html#GWModuleBase">shimmer.modules.gw_module.GWModuleBase</a></span>,</span><span class="param">	<span class="n">selection_mod</span><span class="p">:</span> <span class="n"><a href="selection.html#SelectionBase">shimmer.modules.selection.SelectionBase</a></span>,</span><span class="param">	<span class="n">latent_domains</span><span class="p">:</span> <span class="n">collections</span><span class="o">.</span><span class="n">abc</span><span class="o">.</span><span class="n">Mapping</span><span class="p">[</span><span class="nb">frozenset</span><span class="p">[</span><span class="nb">str</span><span class="p">],</span> <span class="n">collections</span><span class="o">.</span><span class="n">abc</span><span class="o">.</span><span class="n">Mapping</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]]</span></span><span class="return-annotation">) -> <span class="nb">dict</span><span class="p">[</span><span class="nb">tuple</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="nb">str</span><span class="p">],</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]</span>:</span></span>
+
+                <label class="view-source-button" for="batch_translations-view-source"><span>View Source</span></label>
+
+    </div>
+    <a class="headerlink" href="#batch_translations"></a>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="batch_translations-132"><a href="#batch_translations-132"><span class="linenos">132</span></a><span class="k">def</span> <span class="nf">batch_translations</span><span class="p">(</span>
+</span><span id="batch_translations-133"><a href="#batch_translations-133"><span class="linenos">133</span></a>    <span class="n">gw_mod</span><span class="p">:</span> <span class="n">GWModuleBase</span><span class="p">,</span>
+</span><span id="batch_translations-134"><a href="#batch_translations-134"><span class="linenos">134</span></a>    <span class="n">selection_mod</span><span class="p">:</span> <span class="n">SelectionBase</span><span class="p">,</span>
+</span><span id="batch_translations-135"><a href="#batch_translations-135"><span class="linenos">135</span></a>    <span class="n">latent_domains</span><span class="p">:</span> <span class="n">LatentsDomainGroupsT</span><span class="p">,</span>
+</span><span id="batch_translations-136"><a href="#batch_translations-136"><span class="linenos">136</span></a><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">tuple</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="nb">str</span><span class="p">],</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]:</span>
+</span><span id="batch_translations-137"><a href="#batch_translations-137"><span class="linenos">137</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="batch_translations-138"><a href="#batch_translations-138"><span class="linenos">138</span></a><span class="sd">    Computes translations of a batch of groups of domains.</span>
+</span><span id="batch_translations-139"><a href="#batch_translations-139"><span class="linenos">139</span></a>
+</span><span id="batch_translations-140"><a href="#batch_translations-140"><span class="linenos">140</span></a><span class="sd">    Args:</span>
+</span><span id="batch_translations-141"><a href="#batch_translations-141"><span class="linenos">141</span></a><span class="sd">        gw_mod (`GWModuleBase`): GWModule to do the translation</span>
+</span><span id="batch_translations-142"><a href="#batch_translations-142"><span class="linenos">142</span></a><span class="sd">        selection_mod (`SelectionBase`): selection module</span>
+</span><span id="batch_translations-143"><a href="#batch_translations-143"><span class="linenos">143</span></a><span class="sd">        latent_domains (`LatentsT`): the batch of groups of domains</span>
+</span><span id="batch_translations-144"><a href="#batch_translations-144"><span class="linenos">144</span></a>
+</span><span id="batch_translations-145"><a href="#batch_translations-145"><span class="linenos">145</span></a><span class="sd">    Returns:</span>
+</span><span id="batch_translations-146"><a href="#batch_translations-146"><span class="linenos">146</span></a><span class="sd">        `dict[tuple[str, str], torch.Tensor]`: translation predictions for each</span>
+</span><span id="batch_translations-147"><a href="#batch_translations-147"><span class="linenos">147</span></a><span class="sd">            couple of (start domain, target domain).</span>
+</span><span id="batch_translations-148"><a href="#batch_translations-148"><span class="linenos">148</span></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="batch_translations-149"><a href="#batch_translations-149"><span class="linenos">149</span></a>    <span class="n">predictions</span><span class="p">:</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">tuple</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="nb">str</span><span class="p">],</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]</span> <span class="o">=</span> <span class="p">{}</span>
+</span><span id="batch_translations-150"><a href="#batch_translations-150"><span class="linenos">150</span></a>    <span class="k">for</span> <span class="n">domains</span><span class="p">,</span> <span class="n">latents</span> <span class="ow">in</span> <span class="n">latent_domains</span><span class="o">.</span><span class="n">items</span><span class="p">():</span>
+</span><span id="batch_translations-151"><a href="#batch_translations-151"><span class="linenos">151</span></a>        <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">domains</span><span class="p">)</span> <span class="o">&lt;</span> <span class="mi">2</span><span class="p">:</span>
+</span><span id="batch_translations-152"><a href="#batch_translations-152"><span class="linenos">152</span></a>            <span class="k">continue</span>
+</span><span id="batch_translations-153"><a href="#batch_translations-153"><span class="linenos">153</span></a>        <span class="k">for</span> <span class="n">domain_name_source</span> <span class="ow">in</span> <span class="n">domains</span><span class="p">:</span>
+</span><span id="batch_translations-154"><a href="#batch_translations-154"><span class="linenos">154</span></a>            <span class="k">for</span> <span class="n">domain_name_target</span> <span class="ow">in</span> <span class="n">domains</span><span class="p">:</span>
+</span><span id="batch_translations-155"><a href="#batch_translations-155"><span class="linenos">155</span></a>                <span class="k">if</span> <span class="n">domain_name_source</span> <span class="o">==</span> <span class="n">domain_name_target</span><span class="p">:</span>
+</span><span id="batch_translations-156"><a href="#batch_translations-156"><span class="linenos">156</span></a>                    <span class="k">continue</span>
+</span><span id="batch_translations-157"><a href="#batch_translations-157"><span class="linenos">157</span></a>                <span class="n">prediction</span> <span class="o">=</span> <span class="n">translation</span><span class="p">(</span>
+</span><span id="batch_translations-158"><a href="#batch_translations-158"><span class="linenos">158</span></a>                    <span class="n">gw_mod</span><span class="p">,</span>
+</span><span id="batch_translations-159"><a href="#batch_translations-159"><span class="linenos">159</span></a>                    <span class="n">selection_mod</span><span class="p">,</span>
+</span><span id="batch_translations-160"><a href="#batch_translations-160"><span class="linenos">160</span></a>                    <span class="p">{</span><span class="n">domain_name_source</span><span class="p">:</span> <span class="n">latents</span><span class="p">[</span><span class="n">domain_name_source</span><span class="p">]},</span>
+</span><span id="batch_translations-161"><a href="#batch_translations-161"><span class="linenos">161</span></a>                    <span class="n">to</span><span class="o">=</span><span class="n">domain_name_target</span><span class="p">,</span>
+</span><span id="batch_translations-162"><a href="#batch_translations-162"><span class="linenos">162</span></a>                <span class="p">)</span>
+</span><span id="batch_translations-163"><a href="#batch_translations-163"><span class="linenos">163</span></a>                <span class="n">predictions</span><span class="p">[(</span><span class="n">domain_name_source</span><span class="p">,</span> <span class="n">domain_name_target</span><span class="p">)]</span> <span class="o">=</span> <span class="n">prediction</span>
+</span><span id="batch_translations-164"><a href="#batch_translations-164"><span class="linenos">164</span></a>    <span class="k">return</span> <span class="n">predictions</span>
+</span></pre></div>
+
+
+            <div class="docstring"><p>Computes translations of a batch of groups of domains.</p>
+
+<h6 id="arguments">Arguments:</h6>
+
+<ul>
+<li><strong>gw_mod (<code>GWModuleBase</code>):</strong>  GWModule to do the translation</li>
+<li><strong>selection_mod (<code>SelectionBase</code>):</strong>  selection module</li>
+<li><strong>latent_domains (<code>LatentsT</code>):</strong>  the batch of groups of domains</li>
+</ul>
+
+<h6 id="returns">Returns:</h6>
+
+<blockquote>
+  <p><code>dict[tuple[str, str], torch.Tensor]</code>: translation predictions for each
+      couple of (start domain, target domain).</p>
+</blockquote>
+</div>
+
+
+                </section>
+    </main>
+<script>
+    function escapeHTML(html) {
+        return document.createElement('div').appendChild(document.createTextNode(html)).parentNode.innerHTML;
+    }
+
+    const originalContent = document.querySelector("main.pdoc");
+    let currentContent = originalContent;
+
+    function setContent(innerHTML) {
+        let elem;
+        if (innerHTML) {
+            elem = document.createElement("main");
+            elem.classList.add("pdoc");
+            elem.innerHTML = innerHTML;
+        } else {
+            elem = originalContent;
+        }
+        if (currentContent !== elem) {
+            currentContent.replaceWith(elem);
+            currentContent = elem;
+        }
+    }
+
+    function getSearchTerm() {
+        return (new URL(window.location)).searchParams.get("search");
+    }
+
+    const searchBox = document.querySelector(".pdoc input[type=search]");
+    searchBox.addEventListener("input", function () {
+        let url = new URL(window.location);
+        if (searchBox.value.trim()) {
+            url.hash = "";
+            url.searchParams.set("search", searchBox.value);
+        } else {
+            url.searchParams.delete("search");
+        }
+        history.replaceState("", "", url.toString());
+        onInput();
+    });
+    window.addEventListener("popstate", onInput);
+
+
+    let search, searchErr;
+
+    async function initialize() {
+        try {
+            search = await new Promise((resolve, reject) => {
+                const script = document.createElement("script");
+                script.type = "text/javascript";
+                script.async = true;
+                script.onload = () => resolve(window.pdocSearch);
+                script.onerror = (e) => reject(e);
+                script.src = "../../search.js";
+                document.getElementsByTagName("head")[0].appendChild(script);
+            });
+        } catch (e) {
+            console.error("Cannot fetch pdoc search index");
+            searchErr = "Cannot fetch search index.";
+        }
+        onInput();
+
+        document.querySelector("nav.pdoc").addEventListener("click", e => {
+            if (e.target.hash) {
+                searchBox.value = "";
+                searchBox.dispatchEvent(new Event("input"));
+            }
+        });
+    }
+
+    function onInput() {
+        setContent((() => {
+            const term = getSearchTerm();
+            if (!term) {
+                return null
+            }
+            if (searchErr) {
+                return `<h3>Error: ${searchErr}</h3>`
+            }
+            if (!search) {
+                return "<h3>Searching...</h3>"
+            }
+
+            window.scrollTo({top: 0, left: 0, behavior: 'auto'});
+
+            const results = search(term);
+
+            let html;
+            if (results.length === 0) {
+                html = `No search results for '${escapeHTML(term)}'.`
+            } else {
+                html = `<h4>${results.length} search result${results.length > 1 ? "s" : ""} for '${escapeHTML(term)}'.</h4>`;
+            }
+            for (let result of results.slice(0, 10)) {
+                let doc = result.doc;
+                let url = `../../${doc.modulename.replaceAll(".", "/")}.html`;
+                if (doc.qualname) {
+                    url += `#${doc.qualname}`;
+                }
+
+                let heading;
+                switch (result.doc.kind) {
+                    case "function":
+                        if (doc.fullname.endsWith(".__init__")) {
+                            heading = `<span class="name">${doc.fullname.replace(/\.__init__$/, "")}</span>${doc.signature}`;
+                        } else {
+                            heading = `<span class="def">${doc.funcdef}</span> <span class="name">${doc.fullname}</span>${doc.signature}`;
+                        }
+                        break;
+                    case "class":
+                        heading = `<span class="def">class</span> <span class="name">${doc.fullname}</span>`;
+                        if (doc.bases)
+                            heading += `<wbr>(<span class="base">${doc.bases}</span>)`;
+                        heading += `:`;
+                        break;
+                    case "variable":
+                        heading = `<span class="name">${doc.fullname}</span>`;
+                        if (doc.annotation)
+                            heading += `<span class="annotation">${doc.annotation}</span>`;
+                        if (doc.default_value)
+                            heading += `<span class="default_value"> = ${doc.default_value}</span>`;
+                        break;
+                    default:
+                        heading = `<span class="name">${doc.fullname}</span>`;
+                        break;
+                }
+                html += `
+                        <section class="search-result">
+                        <a href="${url}" class="attr ${doc.kind}">${heading}</a>
+                        <div class="docstring">${doc.doc}</div>
+                        </section>
+                    `;
+
+            }
+            return html;
+        })());
+    }
+
+    if (getSearchTerm()) {
+        initialize();
+        searchBox.value = getSearchTerm();
+        onInput();
+    } else {
+        searchBox.addEventListener("focus", initialize, {once: true});
+    }
+
+    searchBox.addEventListener("keydown", e => {
+        if (["ArrowDown", "ArrowUp", "Enter"].includes(e.key)) {
+            let focused = currentContent.querySelector(".search-result.focused");
+            if (!focused) {
+                currentContent.querySelector(".search-result").classList.add("focused");
+            } else if (
+                e.key === "ArrowDown"
+                && focused.nextElementSibling
+                && focused.nextElementSibling.classList.contains("search-result")
+            ) {
+                focused.classList.remove("focused");
+                focused.nextElementSibling.classList.add("focused");
+                focused.nextElementSibling.scrollIntoView({
+                    behavior: "smooth",
+                    block: "nearest",
+                    inline: "nearest"
+                });
+            } else if (
+                e.key === "ArrowUp"
+                && focused.previousElementSibling
+                && focused.previousElementSibling.classList.contains("search-result")
+            ) {
+                focused.classList.remove("focused");
+                focused.previousElementSibling.classList.add("focused");
+                focused.previousElementSibling.scrollIntoView({
+                    behavior: "smooth",
+                    block: "nearest",
+                    inline: "nearest"
+                });
+            } else if (
+                e.key === "Enter"
+            ) {
+                focused.querySelector("a").click();
+            }
+        }
+    });
+</script></body>
+</html>
\ No newline at end of file
diff --git a/docs/api/v0.5.1/shimmer/modules/vae.html b/docs/api/v0.5.1/shimmer/modules/vae.html
new file mode 100644
index 00000000..c251cdcb
--- /dev/null
+++ b/docs/api/v0.5.1/shimmer/modules/vae.html
@@ -0,0 +1,1288 @@
+<!doctype html>
+<html lang="en">
+<head>
+    <meta charset="utf-8">
+    <meta name="viewport" content="width=device-width, initial-scale=1">
+    <meta name="generator" content="pdoc 14.4.0"/>
+    <title>shimmer.modules.vae API documentation</title>
+
+    <style>/*! * Bootstrap Reboot v5.0.0 (https://getbootstrap.com/) * Copyright 2011-2021 The Bootstrap Authors * Copyright 2011-2021 Twitter, Inc. * Licensed under MIT (https://github.com/twbs/bootstrap/blob/main/LICENSE) * Forked from Normalize.css, licensed MIT (https://github.com/necolas/normalize.css/blob/master/LICENSE.md) */*,::after,::before{box-sizing:border-box}@media (prefers-reduced-motion:no-preference){:root{scroll-behavior:smooth}}body{margin:0;font-family:system-ui,-apple-system,"Segoe UI",Roboto,"Helvetica Neue",Arial,"Noto Sans","Liberation Sans",sans-serif,"Apple Color Emoji","Segoe UI Emoji","Segoe UI Symbol","Noto Color Emoji";font-size:1rem;font-weight:400;line-height:1.5;color:#212529;background-color:#fff;-webkit-text-size-adjust:100%;-webkit-tap-highlight-color:transparent}hr{margin:1rem 0;color:inherit;background-color:currentColor;border:0;opacity:.25}hr:not([size]){height:1px}h1,h2,h3,h4,h5,h6{margin-top:0;margin-bottom:.5rem;font-weight:500;line-height:1.2}h1{font-size:calc(1.375rem + 1.5vw)}@media (min-width:1200px){h1{font-size:2.5rem}}h2{font-size:calc(1.325rem + .9vw)}@media (min-width:1200px){h2{font-size:2rem}}h3{font-size:calc(1.3rem + .6vw)}@media (min-width:1200px){h3{font-size:1.75rem}}h4{font-size:calc(1.275rem + .3vw)}@media (min-width:1200px){h4{font-size:1.5rem}}h5{font-size:1.25rem}h6{font-size:1rem}p{margin-top:0;margin-bottom:1rem}abbr[data-bs-original-title],abbr[title]{-webkit-text-decoration:underline dotted;text-decoration:underline dotted;cursor:help;-webkit-text-decoration-skip-ink:none;text-decoration-skip-ink:none}address{margin-bottom:1rem;font-style:normal;line-height:inherit}ol,ul{padding-left:2rem}dl,ol,ul{margin-top:0;margin-bottom:1rem}ol ol,ol ul,ul ol,ul ul{margin-bottom:0}dt{font-weight:700}dd{margin-bottom:.5rem;margin-left:0}blockquote{margin:0 0 1rem}b,strong{font-weight:bolder}small{font-size:.875em}mark{padding:.2em;background-color:#fcf8e3}sub,sup{position:relative;font-size:.75em;line-height:0;vertical-align:baseline}sub{bottom:-.25em}sup{top:-.5em}a{color:#0d6efd;text-decoration:underline}a:hover{color:#0a58ca}a:not([href]):not([class]),a:not([href]):not([class]):hover{color:inherit;text-decoration:none}code,kbd,pre,samp{font-family:SFMono-Regular,Menlo,Monaco,Consolas,"Liberation Mono","Courier New",monospace;font-size:1em;direction:ltr;unicode-bidi:bidi-override}pre{display:block;margin-top:0;margin-bottom:1rem;overflow:auto;font-size:.875em}pre code{font-size:inherit;color:inherit;word-break:normal}code{font-size:.875em;color:#d63384;word-wrap:break-word}a>code{color:inherit}kbd{padding:.2rem .4rem;font-size:.875em;color:#fff;background-color:#212529;border-radius:.2rem}kbd kbd{padding:0;font-size:1em;font-weight:700}figure{margin:0 0 1rem}img,svg{vertical-align:middle}table{caption-side:bottom;border-collapse:collapse}caption{padding-top:.5rem;padding-bottom:.5rem;color:#6c757d;text-align:left}th{text-align:inherit;text-align:-webkit-match-parent}tbody,td,tfoot,th,thead,tr{border-color:inherit;border-style:solid;border-width:0}label{display:inline-block}button{border-radius:0}button:focus:not(:focus-visible){outline:0}button,input,optgroup,select,textarea{margin:0;font-family:inherit;font-size:inherit;line-height:inherit}button,select{text-transform:none}[role=button]{cursor:pointer}select{word-wrap:normal}select:disabled{opacity:1}[list]::-webkit-calendar-picker-indicator{display:none}[type=button],[type=reset],[type=submit],button{-webkit-appearance:button}[type=button]:not(:disabled),[type=reset]:not(:disabled),[type=submit]:not(:disabled),button:not(:disabled){cursor:pointer}::-moz-focus-inner{padding:0;border-style:none}textarea{resize:vertical}fieldset{min-width:0;padding:0;margin:0;border:0}legend{float:left;width:100%;padding:0;margin-bottom:.5rem;font-size:calc(1.275rem + .3vw);line-height:inherit}@media (min-width:1200px){legend{font-size:1.5rem}}legend+*{clear:left}::-webkit-datetime-edit-day-field,::-webkit-datetime-edit-fields-wrapper,::-webkit-datetime-edit-hour-field,::-webkit-datetime-edit-minute,::-webkit-datetime-edit-month-field,::-webkit-datetime-edit-text,::-webkit-datetime-edit-year-field{padding:0}::-webkit-inner-spin-button{height:auto}[type=search]{outline-offset:-2px;-webkit-appearance:textfield}::-webkit-search-decoration{-webkit-appearance:none}::-webkit-color-swatch-wrapper{padding:0}::file-selector-button{font:inherit}::-webkit-file-upload-button{font:inherit;-webkit-appearance:button}output{display:inline-block}iframe{border:0}summary{display:list-item;cursor:pointer}progress{vertical-align:baseline}[hidden]{display:none!important}</style>
+    <style>/*! syntax-highlighting.css */pre{line-height:125%;}span.linenos{color:inherit; background-color:transparent; padding-left:5px; padding-right:20px;}.pdoc-code .hll{background-color:#ffffcc}.pdoc-code{background:#f8f8f8;}.pdoc-code .c{color:#3D7B7B; font-style:italic}.pdoc-code .err{border:1px solid #FF0000}.pdoc-code .k{color:#008000; font-weight:bold}.pdoc-code .o{color:#666666}.pdoc-code .ch{color:#3D7B7B; font-style:italic}.pdoc-code .cm{color:#3D7B7B; font-style:italic}.pdoc-code .cp{color:#9C6500}.pdoc-code .cpf{color:#3D7B7B; font-style:italic}.pdoc-code .c1{color:#3D7B7B; font-style:italic}.pdoc-code .cs{color:#3D7B7B; font-style:italic}.pdoc-code .gd{color:#A00000}.pdoc-code .ge{font-style:italic}.pdoc-code .gr{color:#E40000}.pdoc-code .gh{color:#000080; font-weight:bold}.pdoc-code .gi{color:#008400}.pdoc-code .go{color:#717171}.pdoc-code .gp{color:#000080; font-weight:bold}.pdoc-code .gs{font-weight:bold}.pdoc-code .gu{color:#800080; font-weight:bold}.pdoc-code .gt{color:#0044DD}.pdoc-code .kc{color:#008000; font-weight:bold}.pdoc-code .kd{color:#008000; font-weight:bold}.pdoc-code .kn{color:#008000; font-weight:bold}.pdoc-code .kp{color:#008000}.pdoc-code .kr{color:#008000; font-weight:bold}.pdoc-code .kt{color:#B00040}.pdoc-code .m{color:#666666}.pdoc-code .s{color:#BA2121}.pdoc-code .na{color:#687822}.pdoc-code .nb{color:#008000}.pdoc-code .nc{color:#0000FF; font-weight:bold}.pdoc-code .no{color:#880000}.pdoc-code .nd{color:#AA22FF}.pdoc-code .ni{color:#717171; font-weight:bold}.pdoc-code .ne{color:#CB3F38; font-weight:bold}.pdoc-code .nf{color:#0000FF}.pdoc-code .nl{color:#767600}.pdoc-code .nn{color:#0000FF; font-weight:bold}.pdoc-code .nt{color:#008000; font-weight:bold}.pdoc-code .nv{color:#19177C}.pdoc-code .ow{color:#AA22FF; font-weight:bold}.pdoc-code .w{color:#bbbbbb}.pdoc-code .mb{color:#666666}.pdoc-code .mf{color:#666666}.pdoc-code .mh{color:#666666}.pdoc-code .mi{color:#666666}.pdoc-code .mo{color:#666666}.pdoc-code .sa{color:#BA2121}.pdoc-code .sb{color:#BA2121}.pdoc-code .sc{color:#BA2121}.pdoc-code .dl{color:#BA2121}.pdoc-code .sd{color:#BA2121; font-style:italic}.pdoc-code .s2{color:#BA2121}.pdoc-code .se{color:#AA5D1F; font-weight:bold}.pdoc-code .sh{color:#BA2121}.pdoc-code .si{color:#A45A77; font-weight:bold}.pdoc-code .sx{color:#008000}.pdoc-code .sr{color:#A45A77}.pdoc-code .s1{color:#BA2121}.pdoc-code .ss{color:#19177C}.pdoc-code .bp{color:#008000}.pdoc-code .fm{color:#0000FF}.pdoc-code .vc{color:#19177C}.pdoc-code .vg{color:#19177C}.pdoc-code .vi{color:#19177C}.pdoc-code .vm{color:#19177C}.pdoc-code .il{color:#666666}</style>
+    <style>/*! theme.css */:root{--pdoc-background:#fff;}.pdoc{--text:#212529;--muted:#6c757d;--link:#3660a5;--link-hover:#1659c5;--code:#f8f8f8;--active:#fff598;--accent:#eee;--accent2:#c1c1c1;--nav-hover:rgba(255, 255, 255, 0.5);--name:#0066BB;--def:#008800;--annotation:#007020;}</style>
+    <style>/*! layout.css */html, body{width:100%;height:100%;}html, main{scroll-behavior:smooth;}body{background-color:var(--pdoc-background);}@media (max-width:769px){#navtoggle{cursor:pointer;position:absolute;width:50px;height:40px;top:1rem;right:1rem;border-color:var(--text);color:var(--text);display:flex;opacity:0.8;z-index:999;}#navtoggle:hover{opacity:1;}#togglestate + div{display:none;}#togglestate:checked + div{display:inherit;}main, header{padding:2rem 3vw;}header + main{margin-top:-3rem;}.git-button{display:none !important;}nav input[type="search"]{max-width:77%;}nav input[type="search"]:first-child{margin-top:-6px;}nav input[type="search"]:valid ~ *{display:none !important;}}@media (min-width:770px){:root{--sidebar-width:clamp(12.5rem, 28vw, 22rem);}nav{position:fixed;overflow:auto;height:100vh;width:var(--sidebar-width);}main, header{padding:3rem 2rem 3rem calc(var(--sidebar-width) + 3rem);width:calc(54rem + var(--sidebar-width));max-width:100%;}header + main{margin-top:-4rem;}#navtoggle{display:none;}}#togglestate{position:absolute;height:0;opacity:0;}nav.pdoc{--pad:clamp(0.5rem, 2vw, 1.75rem);--indent:1.5rem;background-color:var(--accent);border-right:1px solid var(--accent2);box-shadow:0 0 20px rgba(50, 50, 50, .2) inset;padding:0 0 0 var(--pad);overflow-wrap:anywhere;scrollbar-width:thin; scrollbar-color:var(--accent2) transparent; z-index:1}nav.pdoc::-webkit-scrollbar{width:.4rem; }nav.pdoc::-webkit-scrollbar-thumb{background-color:var(--accent2); }nav.pdoc > div{padding:var(--pad) 0;}nav.pdoc .module-list-button{display:inline-flex;align-items:center;color:var(--text);border-color:var(--muted);margin-bottom:1rem;}nav.pdoc .module-list-button:hover{border-color:var(--text);}nav.pdoc input[type=search]{display:block;outline-offset:0;width:calc(100% - var(--pad));}nav.pdoc .logo{max-width:calc(100% - var(--pad));max-height:35vh;display:block;margin:0 auto 1rem;transform:translate(calc(-.5 * var(--pad)), 0);}nav.pdoc ul{list-style:none;padding-left:0;}nav.pdoc > div > ul{margin-left:calc(0px - var(--pad));}nav.pdoc li a{padding:.2rem 0 .2rem calc(var(--pad) + var(--indent));}nav.pdoc > div > ul > li > a{padding-left:var(--pad);}nav.pdoc li{transition:all 100ms;}nav.pdoc li:hover{background-color:var(--nav-hover);}nav.pdoc a, nav.pdoc a:hover{color:var(--text);}nav.pdoc a{display:block;}nav.pdoc > h2:first-of-type{margin-top:1.5rem;}nav.pdoc .class:before{content:"class ";color:var(--muted);}nav.pdoc .function:after{content:"()";color:var(--muted);}nav.pdoc footer:before{content:"";display:block;width:calc(100% - var(--pad));border-top:solid var(--accent2) 1px;margin-top:1.5rem;padding-top:.5rem;}nav.pdoc footer{font-size:small;}</style>
+    <style>/*! content.css */.pdoc{color:var(--text);box-sizing:border-box;line-height:1.5;background:none;}.pdoc .pdoc-button{cursor:pointer;display:inline-block;border:solid black 1px;border-radius:2px;font-size:.75rem;padding:calc(0.5em - 1px) 1em;transition:100ms all;}.pdoc .pdoc-alert{padding:1rem 1rem 1rem calc(1.5rem + 24px);border:1px solid transparent;border-radius:.25rem;background-repeat:no-repeat;background-position:1rem center;margin-bottom:1rem;}.pdoc .pdoc-alert > *:last-child{margin-bottom:0;}.pdoc .pdoc-alert-note {color:#084298;background-color:#cfe2ff;border-color:#b6d4fe;background-image:url("data:image/svg+xml,%3Csvg%20xmlns%3D%22http%3A//www.w3.org/2000/svg%22%20width%3D%2224%22%20height%3D%2224%22%20fill%3D%22%23084298%22%20viewBox%3D%220%200%2016%2016%22%3E%3Cpath%20d%3D%22M8%2016A8%208%200%201%200%208%200a8%208%200%200%200%200%2016zm.93-9.412-1%204.705c-.07.34.029.533.304.533.194%200%20.487-.07.686-.246l-.088.416c-.287.346-.92.598-1.465.598-.703%200-1.002-.422-.808-1.319l.738-3.468c.064-.293.006-.399-.287-.47l-.451-.081.082-.381%202.29-.287zM8%205.5a1%201%200%201%201%200-2%201%201%200%200%201%200%202z%22/%3E%3C/svg%3E");}.pdoc .pdoc-alert-warning{color:#664d03;background-color:#fff3cd;border-color:#ffecb5;background-image:url("data:image/svg+xml,%3Csvg%20xmlns%3D%22http%3A//www.w3.org/2000/svg%22%20width%3D%2224%22%20height%3D%2224%22%20fill%3D%22%23664d03%22%20viewBox%3D%220%200%2016%2016%22%3E%3Cpath%20d%3D%22M8.982%201.566a1.13%201.13%200%200%200-1.96%200L.165%2013.233c-.457.778.091%201.767.98%201.767h13.713c.889%200%201.438-.99.98-1.767L8.982%201.566zM8%205c.535%200%20.954.462.9.995l-.35%203.507a.552.552%200%200%201-1.1%200L7.1%205.995A.905.905%200%200%201%208%205zm.002%206a1%201%200%201%201%200%202%201%201%200%200%201%200-2z%22/%3E%3C/svg%3E");}.pdoc .pdoc-alert-danger{color:#842029;background-color:#f8d7da;border-color:#f5c2c7;background-image:url("data:image/svg+xml,%3Csvg%20xmlns%3D%22http%3A//www.w3.org/2000/svg%22%20width%3D%2224%22%20height%3D%2224%22%20fill%3D%22%23842029%22%20viewBox%3D%220%200%2016%2016%22%3E%3Cpath%20d%3D%22M5.52.359A.5.5%200%200%201%206%200h4a.5.5%200%200%201%20.474.658L8.694%206H12.5a.5.5%200%200%201%20.395.807l-7%209a.5.5%200%200%201-.873-.454L6.823%209.5H3.5a.5.5%200%200%201-.48-.641l2.5-8.5z%22/%3E%3C/svg%3E");}.pdoc .visually-hidden{position:absolute !important;width:1px !important;height:1px !important;padding:0 !important;margin:-1px !important;overflow:hidden !important;clip:rect(0, 0, 0, 0) !important;white-space:nowrap !important;border:0 !important;}.pdoc h1, .pdoc h2, .pdoc h3{font-weight:300;margin:.3em 0;padding:.2em 0;}.pdoc > section:not(.module-info) h1{font-size:1.5rem;font-weight:500;}.pdoc > section:not(.module-info) h2{font-size:1.4rem;font-weight:500;}.pdoc > section:not(.module-info) h3{font-size:1.3rem;font-weight:500;}.pdoc > section:not(.module-info) h4{font-size:1.2rem;}.pdoc > section:not(.module-info) h5{font-size:1.1rem;}.pdoc a{text-decoration:none;color:var(--link);}.pdoc a:hover{color:var(--link-hover);}.pdoc blockquote{margin-left:2rem;}.pdoc pre{border-top:1px solid var(--accent2);border-bottom:1px solid var(--accent2);margin-top:0;margin-bottom:1em;padding:.5rem 0 .5rem .5rem;overflow-x:auto;background-color:var(--code);}.pdoc code{color:var(--text);padding:.2em .4em;margin:0;font-size:85%;background-color:var(--accent);border-radius:6px;}.pdoc a > code{color:inherit;}.pdoc pre > code{display:inline-block;font-size:inherit;background:none;border:none;padding:0;}.pdoc > section:not(.module-info){margin-bottom:1.5rem;}.pdoc .modulename{margin-top:0;font-weight:bold;}.pdoc .modulename a{color:var(--link);transition:100ms all;}.pdoc .git-button{float:right;border:solid var(--link) 1px;}.pdoc .git-button:hover{background-color:var(--link);color:var(--pdoc-background);}.view-source-toggle-state,.view-source-toggle-state ~ .pdoc-code{display:none;}.view-source-toggle-state:checked ~ .pdoc-code{display:block;}.view-source-button{display:inline-block;float:right;font-size:.75rem;line-height:1.5rem;color:var(--muted);padding:0 .4rem 0 1.3rem;cursor:pointer;text-indent:-2px;}.view-source-button > span{visibility:hidden;}.module-info .view-source-button{float:none;display:flex;justify-content:flex-end;margin:-1.2rem .4rem -.2rem 0;}.view-source-button::before{position:absolute;content:"View Source";display:list-item;list-style-type:disclosure-closed;}.view-source-toggle-state:checked ~ .attr .view-source-button::before,.view-source-toggle-state:checked ~ .view-source-button::before{list-style-type:disclosure-open;}.pdoc .docstring{margin-bottom:1.5rem;}.pdoc section:not(.module-info) .docstring{margin-left:clamp(0rem, 5vw - 2rem, 1rem);}.pdoc .docstring .pdoc-code{margin-left:1em;margin-right:1em;}.pdoc h1:target,.pdoc h2:target,.pdoc h3:target,.pdoc h4:target,.pdoc h5:target,.pdoc h6:target,.pdoc .pdoc-code > pre > span:target{background-color:var(--active);box-shadow:-1rem 0 0 0 var(--active);}.pdoc .pdoc-code > pre > span:target{display:block;}.pdoc div:target > .attr,.pdoc section:target > .attr,.pdoc dd:target > a{background-color:var(--active);}.pdoc *{scroll-margin:2rem;}.pdoc .pdoc-code .linenos{user-select:none;}.pdoc .attr:hover{filter:contrast(0.95);}.pdoc section, .pdoc .classattr{position:relative;}.pdoc .headerlink{--width:clamp(1rem, 3vw, 2rem);position:absolute;top:0;left:calc(0rem - var(--width));transition:all 100ms ease-in-out;opacity:0;}.pdoc .headerlink::before{content:"#";display:block;text-align:center;width:var(--width);height:2.3rem;line-height:2.3rem;font-size:1.5rem;}.pdoc .attr:hover ~ .headerlink,.pdoc *:target > .headerlink,.pdoc .headerlink:hover{opacity:1;}.pdoc .attr{display:block;margin:.5rem 0 .5rem;padding:.4rem .4rem .4rem 1rem;background-color:var(--accent);overflow-x:auto;}.pdoc .classattr{margin-left:2rem;}.pdoc .name{color:var(--name);font-weight:bold;}.pdoc .def{color:var(--def);font-weight:bold;}.pdoc .signature{background-color:transparent;}.pdoc .param, .pdoc .return-annotation{white-space:pre;}.pdoc .signature.multiline .param{display:block;}.pdoc .signature.condensed .param{display:inline-block;}.pdoc .annotation{color:var(--annotation);}.pdoc .view-value-toggle-state,.pdoc .view-value-toggle-state ~ .default_value{display:none;}.pdoc .view-value-toggle-state:checked ~ .default_value{display:inherit;}.pdoc .view-value-button{font-size:.5rem;vertical-align:middle;border-style:dashed;margin-top:-0.1rem;}.pdoc .view-value-button:hover{background:white;}.pdoc .view-value-button::before{content:"show";text-align:center;width:2.2em;display:inline-block;}.pdoc .view-value-toggle-state:checked ~ .view-value-button::before{content:"hide";}.pdoc .inherited{margin-left:2rem;}.pdoc .inherited dt{font-weight:700;}.pdoc .inherited dt, .pdoc .inherited dd{display:inline;margin-left:0;margin-bottom:.5rem;}.pdoc .inherited dd:not(:last-child):after{content:", ";}.pdoc .inherited .class:before{content:"class ";}.pdoc .inherited .function a:after{content:"()";}.pdoc .search-result .docstring{overflow:auto;max-height:25vh;}.pdoc .search-result.focused > .attr{background-color:var(--active);}.pdoc .attribution{margin-top:2rem;display:block;opacity:0.5;transition:all 200ms;filter:grayscale(100%);}.pdoc .attribution:hover{opacity:1;filter:grayscale(0%);}.pdoc .attribution img{margin-left:5px;height:35px;vertical-align:middle;width:70px;transition:all 200ms;}.pdoc table{display:block;width:max-content;max-width:100%;overflow:auto;margin-bottom:1rem;}.pdoc table th{font-weight:600;}.pdoc table th, .pdoc table td{padding:6px 13px;border:1px solid var(--accent2);}</style>
+    <style>/*! custom.css */</style><script>
+    window.MathJax = {
+        tex: {
+            inlineMath: [['$', '$'], ['\\(', '\\)']]
+        }
+    };
+</script>
+<script src="https://polyfill.io/v3/polyfill.min.js?features=es6"></script>
+<script id="MathJax-script" async src="https://cdn.jsdelivr.net/npm/mathjax@3/es5/tex-mml-chtml.js"></script>
+<script>
+    /* Re-invoke MathJax when DOM content changes, for example during search. */
+    document.addEventListener("DOMContentLoaded", () => {
+        new MutationObserver(() => MathJax.typeset()).observe(
+            document.querySelector("main.pdoc").parentNode,
+            {childList: true}
+        );
+    })
+</script>
+<style>
+    mjx-container {
+        overflow-x: auto;
+    }
+</style></head>
+<body>
+    <nav class="pdoc">
+        <label id="navtoggle" for="togglestate" class="pdoc-button"><svg xmlns='http://www.w3.org/2000/svg' viewBox='0 0 30 30'><path stroke-linecap='round' stroke="currentColor" stroke-miterlimit='10' stroke-width='2' d='M4 7h22M4 15h22M4 23h22'/></svg></label>
+        <input id="togglestate" type="checkbox" aria-hidden="true" tabindex="-1">
+        <div>            <a class="pdoc-button module-list-button" href="../../index.html">
+<svg xmlns="http://www.w3.org/2000/svg" width="16" height="16" fill="currentColor" class="bi bi-box-arrow-in-left" viewBox="0 0 16 16">
+  <path fill-rule="evenodd" d="M10 3.5a.5.5 0 0 0-.5-.5h-8a.5.5 0 0 0-.5.5v9a.5.5 0 0 0 .5.5h8a.5.5 0 0 0 .5-.5v-2a.5.5 0 0 1 1 0v2A1.5 1.5 0 0 1 9.5 14h-8A1.5 1.5 0 0 1 0 12.5v-9A1.5 1.5 0 0 1 1.5 2h8A1.5 1.5 0 0 1 11 3.5v2a.5.5 0 0 1-1 0v-2z"/>
+  <path fill-rule="evenodd" d="M4.146 8.354a.5.5 0 0 1 0-.708l3-3a.5.5 0 1 1 .708.708L5.707 7.5H14.5a.5.5 0 0 1 0 1H5.707l2.147 2.146a.5.5 0 0 1-.708.708l-3-3z"/>
+</svg>                &nbsp;
+                Module Index
+            </a>
+
+
+            <input type="search" placeholder="Search..." role="searchbox" aria-label="search"
+                   pattern=".+" required>
+
+
+
+            <h2>API Documentation</h2>
+                <ul class="memberlist">
+            <li>
+                    <a class="function" href="#reparameterize">reparameterize</a>
+            </li>
+            <li>
+                    <a class="function" href="#kl_divergence_loss">kl_divergence_loss</a>
+            </li>
+            <li>
+                    <a class="function" href="#gaussian_nll">gaussian_nll</a>
+            </li>
+            <li>
+                    <a class="class" href="#VAEEncoder">VAEEncoder</a>
+                            <ul class="memberlist">
+                        <li>
+                                <a class="function" href="#VAEEncoder.forward">forward</a>
+                        </li>
+                </ul>
+
+            </li>
+            <li>
+                    <a class="class" href="#VAEDecoder">VAEDecoder</a>
+                            <ul class="memberlist">
+                        <li>
+                                <a class="function" href="#VAEDecoder.forward">forward</a>
+                        </li>
+                </ul>
+
+            </li>
+            <li>
+                    <a class="class" href="#VAE">VAE</a>
+                            <ul class="memberlist">
+                        <li>
+                                <a class="function" href="#VAE.__init__">VAE</a>
+                        </li>
+                        <li>
+                                <a class="variable" href="#VAE.beta">beta</a>
+                        </li>
+                        <li>
+                                <a class="variable" href="#VAE.encoder">encoder</a>
+                        </li>
+                        <li>
+                                <a class="variable" href="#VAE.decoder">decoder</a>
+                        </li>
+                        <li>
+                                <a class="function" href="#VAE.encode">encode</a>
+                        </li>
+                        <li>
+                                <a class="function" href="#VAE.decode">decode</a>
+                        </li>
+                        <li>
+                                <a class="function" href="#VAE.forward">forward</a>
+                        </li>
+                </ul>
+
+            </li>
+    </ul>
+
+
+
+        <a class="attribution" title="pdoc: Python API documentation generator" href="https://pdoc.dev" target="_blank">
+            built with <span class="visually-hidden">pdoc</span><img
+                alt="pdoc logo"
+                src="data:image/svg+xml,%3Csvg%20xmlns%3D%22http%3A//www.w3.org/2000/svg%22%20role%3D%22img%22%20aria-label%3D%22pdoc%20logo%22%20width%3D%22300%22%20height%3D%22150%22%20viewBox%3D%22-1%200%2060%2030%22%3E%3Ctitle%3Epdoc%3C/title%3E%3Cpath%20d%3D%22M29.621%2021.293c-.011-.273-.214-.475-.511-.481a.5.5%200%200%200-.489.503l-.044%201.393c-.097.551-.695%201.215-1.566%201.704-.577.428-1.306.486-2.193.182-1.426-.617-2.467-1.654-3.304-2.487l-.173-.172a3.43%203.43%200%200%200-.365-.306.49.49%200%200%200-.286-.196c-1.718-1.06-4.931-1.47-7.353.191l-.219.15c-1.707%201.187-3.413%202.131-4.328%201.03-.02-.027-.49-.685-.141-1.763.233-.721.546-2.408.772-4.076.042-.09.067-.187.046-.288.166-1.347.277-2.625.241-3.351%201.378-1.008%202.271-2.586%202.271-4.362%200-.976-.272-1.935-.788-2.774-.057-.094-.122-.18-.184-.268.033-.167.052-.339.052-.516%200-1.477-1.202-2.679-2.679-2.679-.791%200-1.496.352-1.987.9a6.3%206.3%200%200%200-1.001.029c-.492-.564-1.207-.929-2.012-.929-1.477%200-2.679%201.202-2.679%202.679A2.65%202.65%200%200%200%20.97%206.554c-.383.747-.595%201.572-.595%202.41%200%202.311%201.507%204.29%203.635%205.107-.037.699-.147%202.27-.423%203.294l-.137.461c-.622%202.042-2.515%208.257%201.727%2010.643%201.614.908%203.06%201.248%204.317%201.248%202.665%200%204.492-1.524%205.322-2.401%201.476-1.559%202.886-1.854%206.491.82%201.877%201.393%203.514%201.753%204.861%201.068%202.223-1.713%202.811-3.867%203.399-6.374.077-.846.056-1.469.054-1.537zm-4.835%204.313c-.054.305-.156.586-.242.629-.034-.007-.131-.022-.307-.157-.145-.111-.314-.478-.456-.908.221.121.432.25.675.355.115.039.219.051.33.081zm-2.251-1.238c-.05.33-.158.648-.252.694-.022.001-.125-.018-.307-.157-.217-.166-.488-.906-.639-1.573.358.344.754.693%201.198%201.036zm-3.887-2.337c-.006-.116-.018-.231-.041-.342.635.145%201.189.368%201.599.625.097.231.166.481.174.642-.03.049-.055.101-.067.158-.046.013-.128.026-.298.004-.278-.037-.901-.57-1.367-1.087zm-1.127-.497c.116.306.176.625.12.71-.019.014-.117.045-.345.016-.206-.027-.604-.332-.986-.695.41-.051.816-.056%201.211-.031zm-4.535%201.535c.209.22.379.47.358.598-.006.041-.088.138-.351.234-.144.055-.539-.063-.979-.259a11.66%2011.66%200%200%200%20.972-.573zm.983-.664c.359-.237.738-.418%201.126-.554.25.237.479.548.457.694-.006.042-.087.138-.351.235-.174.064-.694-.105-1.232-.375zm-3.381%201.794c-.022.145-.061.29-.149.401-.133.166-.358.248-.69.251h-.002c-.133%200-.306-.26-.45-.621.417.091.854.07%201.291-.031zm-2.066-8.077a4.78%204.78%200%200%201-.775-.584c.172-.115.505-.254.88-.378l-.105.962zm-.331%202.302a10.32%2010.32%200%200%201-.828-.502c.202-.143.576-.328.984-.49l-.156.992zm-.45%202.157l-.701-.403c.214-.115.536-.249.891-.376a11.57%2011.57%200%200%201-.19.779zm-.181%201.716c.064.398.194.702.298.893-.194-.051-.435-.162-.736-.398.061-.119.224-.3.438-.495zM8.87%204.141c0%20.152-.123.276-.276.276s-.275-.124-.275-.276.123-.276.276-.276.275.124.275.276zm-.735-.389a1.15%201.15%200%200%200-.314.783%201.16%201.16%200%200%200%201.162%201.162c.457%200%20.842-.27%201.032-.653.026.117.042.238.042.362a1.68%201.68%200%200%201-1.679%201.679%201.68%201.68%200%200%201-1.679-1.679c0-.843.626-1.535%201.436-1.654zM5.059%205.406A1.68%201.68%200%200%201%203.38%207.085a1.68%201.68%200%200%201-1.679-1.679c0-.037.009-.072.011-.109.21.3.541.508.935.508a1.16%201.16%200%200%200%201.162-1.162%201.14%201.14%200%200%200-.474-.912c.015%200%20.03-.005.045-.005.926.001%201.679.754%201.679%201.68zM3.198%204.141c0%20.152-.123.276-.276.276s-.275-.124-.275-.276.123-.276.276-.276.275.124.275.276zM1.375%208.964c0-.52.103-1.035.288-1.52.466.394%201.06.64%201.717.64%201.144%200%202.116-.725%202.499-1.738.383%201.012%201.355%201.738%202.499%201.738.867%200%201.631-.421%202.121-1.062.307.605.478%201.267.478%201.942%200%202.486-2.153%204.51-4.801%204.51s-4.801-2.023-4.801-4.51zm24.342%2019.349c-.985.498-2.267.168-3.813-.979-3.073-2.281-5.453-3.199-7.813-.705-1.315%201.391-4.163%203.365-8.423.97-3.174-1.786-2.239-6.266-1.261-9.479l.146-.492c.276-1.02.395-2.457.444-3.268a6.11%206.11%200%200%200%201.18.115%206.01%206.01%200%200%200%202.536-.562l-.006.175c-.802.215-1.848.612-2.021%201.25-.079.295.021.601.274.837.219.203.415.364.598.501-.667.304-1.243.698-1.311%201.179-.02.144-.022.507.393.787.213.144.395.26.564.365-1.285.521-1.361.96-1.381%201.126-.018.142-.011.496.427.746l.854.489c-.473.389-.971.914-.999%201.429-.018.278.095.532.316.713.675.556%201.231.721%201.653.721.059%200%20.104-.014.158-.02.207.707.641%201.64%201.513%201.64h.013c.8-.008%201.236-.345%201.462-.626.173-.216.268-.457.325-.692.424.195.93.374%201.372.374.151%200%20.294-.021.423-.068.732-.27.944-.704.993-1.021.009-.061.003-.119.002-.179.266.086.538.147.789.147.15%200%20.294-.021.423-.069.542-.2.797-.489.914-.754.237.147.478.258.704.288.106.014.205.021.296.021.356%200%20.595-.101.767-.229.438.435%201.094.992%201.656%201.067.106.014.205.021.296.021a1.56%201.56%200%200%200%20.323-.035c.17.575.453%201.289.866%201.605.358.273.665.362.914.362a.99.99%200%200%200%20.421-.093%201.03%201.03%200%200%200%20.245-.164c.168.428.39.846.68%201.068.358.273.665.362.913.362a.99.99%200%200%200%20.421-.093c.317-.148.512-.448.639-.762.251.157.495.257.726.257.127%200%20.25-.024.37-.071.427-.17.706-.617.841-1.314.022-.015.047-.022.068-.038.067-.051.133-.104.196-.159-.443%201.486-1.107%202.761-2.086%203.257zM8.66%209.925a.5.5%200%201%200-1%200c0%20.653-.818%201.205-1.787%201.205s-1.787-.552-1.787-1.205a.5.5%200%201%200-1%200c0%201.216%201.25%202.205%202.787%202.205s2.787-.989%202.787-2.205zm4.4%2015.965l-.208.097c-2.661%201.258-4.708%201.436-6.086.527-1.542-1.017-1.88-3.19-1.844-4.198a.4.4%200%200%200-.385-.414c-.242-.029-.406.164-.414.385-.046%201.249.367%203.686%202.202%204.896.708.467%201.547.7%202.51.7%201.248%200%202.706-.392%204.362-1.174l.185-.086a.4.4%200%200%200%20.205-.527c-.089-.204-.326-.291-.527-.206zM9.547%202.292c.093.077.205.114.317.114a.5.5%200%200%200%20.318-.886L8.817.397a.5.5%200%200%200-.703.068.5.5%200%200%200%20.069.703l1.364%201.124zm-7.661-.065c.086%200%20.173-.022.253-.068l1.523-.893a.5.5%200%200%200-.506-.863l-1.523.892a.5.5%200%200%200-.179.685c.094.158.261.247.432.247z%22%20transform%3D%22matrix%28-1%200%200%201%2058%200%29%22%20fill%3D%22%233bb300%22/%3E%3Cpath%20d%3D%22M.3%2021.86V10.18q0-.46.02-.68.04-.22.18-.5.28-.54%201.34-.54%201.06%200%201.42.28.38.26.44.78.76-1.04%202.38-1.04%201.64%200%203.1%201.54%201.46%201.54%201.46%203.58%200%202.04-1.46%203.58-1.44%201.54-3.08%201.54-1.64%200-2.38-.92v4.04q0%20.46-.04.68-.02.22-.18.5-.14.3-.5.42-.36.12-.98.12-.62%200-1-.12-.36-.12-.52-.4-.14-.28-.18-.5-.02-.22-.02-.68zm3.96-9.42q-.46.54-.46%201.18%200%20.64.46%201.18.48.52%201.2.52.74%200%201.24-.52.52-.52.52-1.18%200-.66-.48-1.18-.48-.54-1.26-.54-.76%200-1.22.54zm14.741-8.36q.16-.3.54-.42.38-.12%201-.12.64%200%201.02.12.38.12.52.42.16.3.18.54.04.22.04.68v11.94q0%20.46-.04.7-.02.22-.18.5-.3.54-1.7.54-1.38%200-1.54-.98-.84.96-2.34.96-1.8%200-3.28-1.56-1.48-1.58-1.48-3.66%200-2.1%201.48-3.68%201.5-1.58%203.28-1.58%201.48%200%202.3%201v-4.2q0-.46.02-.68.04-.24.18-.52zm-3.24%2010.86q.52.54%201.26.54.74%200%201.22-.54.5-.54.5-1.18%200-.66-.48-1.22-.46-.56-1.26-.56-.8%200-1.28.56-.48.54-.48%201.2%200%20.66.52%201.2zm7.833-1.2q0-2.4%201.68-3.96%201.68-1.56%203.84-1.56%202.16%200%203.82%201.56%201.66%201.54%201.66%203.94%200%201.66-.86%202.96-.86%201.28-2.1%201.9-1.22.6-2.54.6-1.32%200-2.56-.64-1.24-.66-2.1-1.92-.84-1.28-.84-2.88zm4.18%201.44q.64.48%201.3.48.66%200%201.32-.5.66-.5.66-1.48%200-.98-.62-1.46-.62-.48-1.34-.48-.72%200-1.34.5-.62.5-.62%201.48%200%20.96.64%201.46zm11.412-1.44q0%20.84.56%201.32.56.46%201.18.46.64%200%201.18-.36.56-.38.9-.38.6%200%201.46%201.06.46.58.46%201.04%200%20.76-1.1%201.42-1.14.8-2.8.8-1.86%200-3.58-1.34-.82-.64-1.34-1.7-.52-1.08-.52-2.36%200-1.3.52-2.34.52-1.06%201.34-1.7%201.66-1.32%203.54-1.32.76%200%201.48.22.72.2%201.06.4l.32.2q.36.24.56.38.52.4.52.92%200%20.5-.42%201.14-.72%201.1-1.38%201.1-.38%200-1.08-.44-.36-.34-1.04-.34-.66%200-1.24.48-.58.48-.58%201.34z%22%20fill%3D%22green%22/%3E%3C/svg%3E"/>
+        </a>
+</div>
+    </nav>
+    <main class="pdoc">
+            <section class="module-info">
+                    <h1 class="modulename">
+shimmer<wbr>.modules<wbr>.vae    </h1>
+
+                
+                        <input id="mod-vae-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
+
+                        <label class="view-source-button" for="mod-vae-view-source"><span>View Source</span></label>
+
+                        <div class="pdoc-code codehilite"><pre><span></span><span id="L-1"><a href="#L-1"><span class="linenos">  1</span></a><span class="kn">import</span> <span class="nn">math</span>
+</span><span id="L-2"><a href="#L-2"><span class="linenos">  2</span></a><span class="kn">from</span> <span class="nn">abc</span> <span class="kn">import</span> <span class="n">ABC</span><span class="p">,</span> <span class="n">abstractmethod</span>
+</span><span id="L-3"><a href="#L-3"><span class="linenos">  3</span></a><span class="kn">from</span> <span class="nn">typing</span> <span class="kn">import</span> <span class="n">Any</span>
+</span><span id="L-4"><a href="#L-4"><span class="linenos">  4</span></a>
+</span><span id="L-5"><a href="#L-5"><span class="linenos">  5</span></a><span class="kn">import</span> <span class="nn">torch</span>
+</span><span id="L-6"><a href="#L-6"><span class="linenos">  6</span></a><span class="kn">from</span> <span class="nn">torch</span> <span class="kn">import</span> <span class="n">nn</span>
+</span><span id="L-7"><a href="#L-7"><span class="linenos">  7</span></a>
+</span><span id="L-8"><a href="#L-8"><span class="linenos">  8</span></a>
+</span><span id="L-9"><a href="#L-9"><span class="linenos">  9</span></a><span class="k">def</span> <span class="nf">reparameterize</span><span class="p">(</span><span class="n">mean</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">,</span> <span class="n">logvar</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">:</span>
+</span><span id="L-10"><a href="#L-10"><span class="linenos"> 10</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="L-11"><a href="#L-11"><span class="linenos"> 11</span></a><span class="sd">    Reparameterization trick for VAE</span>
+</span><span id="L-12"><a href="#L-12"><span class="linenos"> 12</span></a>
+</span><span id="L-13"><a href="#L-13"><span class="linenos"> 13</span></a><span class="sd">    Args:</span>
+</span><span id="L-14"><a href="#L-14"><span class="linenos"> 14</span></a><span class="sd">        mean (`torch.Tensor`): predicted means</span>
+</span><span id="L-15"><a href="#L-15"><span class="linenos"> 15</span></a><span class="sd">        logvar (`torch.Tensor`): predicted log variance</span>
+</span><span id="L-16"><a href="#L-16"><span class="linenos"> 16</span></a>
+</span><span id="L-17"><a href="#L-17"><span class="linenos"> 17</span></a><span class="sd">    Returns:</span>
+</span><span id="L-18"><a href="#L-18"><span class="linenos"> 18</span></a><span class="sd">        `torch.Tensor`: a sample from normal distribution with provided</span>
+</span><span id="L-19"><a href="#L-19"><span class="linenos"> 19</span></a><span class="sd">            parameters, sampled using the reparameterization trick.</span>
+</span><span id="L-20"><a href="#L-20"><span class="linenos"> 20</span></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="L-21"><a href="#L-21"><span class="linenos"> 21</span></a>    <span class="n">std</span> <span class="o">=</span> <span class="p">(</span><span class="mf">0.5</span> <span class="o">*</span> <span class="n">logvar</span><span class="p">)</span><span class="o">.</span><span class="n">exp</span><span class="p">()</span>
+</span><span id="L-22"><a href="#L-22"><span class="linenos"> 22</span></a>    <span class="n">eps</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">randn_like</span><span class="p">(</span><span class="n">std</span><span class="p">)</span>
+</span><span id="L-23"><a href="#L-23"><span class="linenos"> 23</span></a>    <span class="k">return</span> <span class="n">std</span> <span class="o">*</span> <span class="n">eps</span> <span class="o">+</span> <span class="n">mean</span>
+</span><span id="L-24"><a href="#L-24"><span class="linenos"> 24</span></a>
+</span><span id="L-25"><a href="#L-25"><span class="linenos"> 25</span></a>
+</span><span id="L-26"><a href="#L-26"><span class="linenos"> 26</span></a><span class="k">def</span> <span class="nf">kl_divergence_loss</span><span class="p">(</span><span class="n">mean</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">,</span> <span class="n">logvar</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">:</span>
+</span><span id="L-27"><a href="#L-27"><span class="linenos"> 27</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="L-28"><a href="#L-28"><span class="linenos"> 28</span></a><span class="sd">    Computes the KL divergence loss used in VAE.</span>
+</span><span id="L-29"><a href="#L-29"><span class="linenos"> 29</span></a>
+</span><span id="L-30"><a href="#L-30"><span class="linenos"> 30</span></a><span class="sd">    Args:</span>
+</span><span id="L-31"><a href="#L-31"><span class="linenos"> 31</span></a><span class="sd">        mean (`torch.Tensor`): predicted means</span>
+</span><span id="L-32"><a href="#L-32"><span class="linenos"> 32</span></a><span class="sd">        logvar (`torch.Tensor`): predicted logvars</span>
+</span><span id="L-33"><a href="#L-33"><span class="linenos"> 33</span></a>
+</span><span id="L-34"><a href="#L-34"><span class="linenos"> 34</span></a><span class="sd">    Returns:</span>
+</span><span id="L-35"><a href="#L-35"><span class="linenos"> 35</span></a><span class="sd">        `torch.Tensor`: the loss</span>
+</span><span id="L-36"><a href="#L-36"><span class="linenos"> 36</span></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="L-37"><a href="#L-37"><span class="linenos"> 37</span></a>    <span class="n">kl</span> <span class="o">=</span> <span class="o">-</span><span class="mf">0.5</span> <span class="o">*</span> <span class="n">torch</span><span class="o">.</span><span class="n">sum</span><span class="p">(</span><span class="mi">1</span> <span class="o">+</span> <span class="n">logvar</span> <span class="o">-</span> <span class="n">mean</span><span class="o">.</span><span class="n">pow</span><span class="p">(</span><span class="mi">2</span><span class="p">)</span> <span class="o">-</span> <span class="n">logvar</span><span class="o">.</span><span class="n">exp</span><span class="p">())</span>
+</span><span id="L-38"><a href="#L-38"><span class="linenos"> 38</span></a>    <span class="k">return</span> <span class="n">kl</span>
+</span><span id="L-39"><a href="#L-39"><span class="linenos"> 39</span></a>
+</span><span id="L-40"><a href="#L-40"><span class="linenos"> 40</span></a>
+</span><span id="L-41"><a href="#L-41"><span class="linenos"> 41</span></a><span class="k">def</span> <span class="nf">gaussian_nll</span><span class="p">(</span>
+</span><span id="L-42"><a href="#L-42"><span class="linenos"> 42</span></a>    <span class="n">mu</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">,</span> <span class="n">log_sigma</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">,</span> <span class="n">x</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span>
+</span><span id="L-43"><a href="#L-43"><span class="linenos"> 43</span></a><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">:</span>
+</span><span id="L-44"><a href="#L-44"><span class="linenos"> 44</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="L-45"><a href="#L-45"><span class="linenos"> 45</span></a><span class="sd">    Computes gaussian nll loss used in VAE.</span>
+</span><span id="L-46"><a href="#L-46"><span class="linenos"> 46</span></a>
+</span><span id="L-47"><a href="#L-47"><span class="linenos"> 47</span></a><span class="sd">    Args:</span>
+</span><span id="L-48"><a href="#L-48"><span class="linenos"> 48</span></a><span class="sd">        mu (`torch.Tensor`): predictions</span>
+</span><span id="L-49"><a href="#L-49"><span class="linenos"> 49</span></a><span class="sd">        log_sigma (`torch.Tensor`): log sigma</span>
+</span><span id="L-50"><a href="#L-50"><span class="linenos"> 50</span></a><span class="sd">        x (`torch.Tensor`): targets</span>
+</span><span id="L-51"><a href="#L-51"><span class="linenos"> 51</span></a>
+</span><span id="L-52"><a href="#L-52"><span class="linenos"> 52</span></a><span class="sd">    Returns:</span>
+</span><span id="L-53"><a href="#L-53"><span class="linenos"> 53</span></a><span class="sd">        `torch.Tensor`: the Gaussian NLL loss</span>
+</span><span id="L-54"><a href="#L-54"><span class="linenos"> 54</span></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="L-55"><a href="#L-55"><span class="linenos"> 55</span></a>    <span class="k">return</span> <span class="p">(</span>
+</span><span id="L-56"><a href="#L-56"><span class="linenos"> 56</span></a>        <span class="mf">0.5</span> <span class="o">*</span> <span class="n">torch</span><span class="o">.</span><span class="n">pow</span><span class="p">((</span><span class="n">x</span> <span class="o">-</span> <span class="n">mu</span><span class="p">)</span> <span class="o">/</span> <span class="n">log_sigma</span><span class="o">.</span><span class="n">exp</span><span class="p">(),</span> <span class="mi">2</span><span class="p">)</span>
+</span><span id="L-57"><a href="#L-57"><span class="linenos"> 57</span></a>        <span class="o">+</span> <span class="n">log_sigma</span>
+</span><span id="L-58"><a href="#L-58"><span class="linenos"> 58</span></a>        <span class="o">+</span> <span class="mf">0.5</span> <span class="o">*</span> <span class="n">math</span><span class="o">.</span><span class="n">log</span><span class="p">(</span><span class="mi">2</span> <span class="o">*</span> <span class="n">math</span><span class="o">.</span><span class="n">pi</span><span class="p">)</span>
+</span><span id="L-59"><a href="#L-59"><span class="linenos"> 59</span></a>    <span class="p">)</span>
+</span><span id="L-60"><a href="#L-60"><span class="linenos"> 60</span></a>
+</span><span id="L-61"><a href="#L-61"><span class="linenos"> 61</span></a>
+</span><span id="L-62"><a href="#L-62"><span class="linenos"> 62</span></a><span class="k">class</span> <span class="nc">VAEEncoder</span><span class="p">(</span><span class="n">nn</span><span class="o">.</span><span class="n">Module</span><span class="p">,</span> <span class="n">ABC</span><span class="p">):</span>
+</span><span id="L-63"><a href="#L-63"><span class="linenos"> 63</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="L-64"><a href="#L-64"><span class="linenos"> 64</span></a><span class="sd">    Base class for a VAE encoder.</span>
+</span><span id="L-65"><a href="#L-65"><span class="linenos"> 65</span></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="L-66"><a href="#L-66"><span class="linenos"> 66</span></a>
+</span><span id="L-67"><a href="#L-67"><span class="linenos"> 67</span></a>    <span class="nd">@abstractmethod</span>
+</span><span id="L-68"><a href="#L-68"><span class="linenos"> 68</span></a>    <span class="k">def</span> <span class="nf">forward</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">x</span><span class="p">:</span> <span class="n">Any</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">tuple</span><span class="p">[</span><span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]:</span>
+</span><span id="L-69"><a href="#L-69"><span class="linenos"> 69</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="L-70"><a href="#L-70"><span class="linenos"> 70</span></a><span class="sd">        Encode representation with VAE.</span>
+</span><span id="L-71"><a href="#L-71"><span class="linenos"> 71</span></a>
+</span><span id="L-72"><a href="#L-72"><span class="linenos"> 72</span></a>
+</span><span id="L-73"><a href="#L-73"><span class="linenos"> 73</span></a><span class="sd">        Args:</span>
+</span><span id="L-74"><a href="#L-74"><span class="linenos"> 74</span></a><span class="sd">            x (`Any`): Some input value</span>
+</span><span id="L-75"><a href="#L-75"><span class="linenos"> 75</span></a>
+</span><span id="L-76"><a href="#L-76"><span class="linenos"> 76</span></a><span class="sd">        Returns:</span>
+</span><span id="L-77"><a href="#L-77"><span class="linenos"> 77</span></a><span class="sd">            `tuple[torch.Tensor, torch.Tensor]`: the mean and log variance</span>
+</span><span id="L-78"><a href="#L-78"><span class="linenos"> 78</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="L-79"><a href="#L-79"><span class="linenos"> 79</span></a>        <span class="o">...</span>
+</span><span id="L-80"><a href="#L-80"><span class="linenos"> 80</span></a>
+</span><span id="L-81"><a href="#L-81"><span class="linenos"> 81</span></a>
+</span><span id="L-82"><a href="#L-82"><span class="linenos"> 82</span></a><span class="k">class</span> <span class="nc">VAEDecoder</span><span class="p">(</span><span class="n">nn</span><span class="o">.</span><span class="n">Module</span><span class="p">,</span> <span class="n">ABC</span><span class="p">):</span>
+</span><span id="L-83"><a href="#L-83"><span class="linenos"> 83</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="L-84"><a href="#L-84"><span class="linenos"> 84</span></a><span class="sd">    Base class for a VAE decoder.</span>
+</span><span id="L-85"><a href="#L-85"><span class="linenos"> 85</span></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="L-86"><a href="#L-86"><span class="linenos"> 86</span></a>
+</span><span id="L-87"><a href="#L-87"><span class="linenos"> 87</span></a>    <span class="nd">@abstractmethod</span>
+</span><span id="L-88"><a href="#L-88"><span class="linenos"> 88</span></a>    <span class="k">def</span> <span class="nf">forward</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">x</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">Any</span><span class="p">:</span>
+</span><span id="L-89"><a href="#L-89"><span class="linenos"> 89</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="L-90"><a href="#L-90"><span class="linenos"> 90</span></a><span class="sd">        Decode representation with VAE</span>
+</span><span id="L-91"><a href="#L-91"><span class="linenos"> 91</span></a>
+</span><span id="L-92"><a href="#L-92"><span class="linenos"> 92</span></a><span class="sd">        Args:</span>
+</span><span id="L-93"><a href="#L-93"><span class="linenos"> 93</span></a><span class="sd">            x (`torch.Tensor`): VAE latent representation representation</span>
+</span><span id="L-94"><a href="#L-94"><span class="linenos"> 94</span></a>
+</span><span id="L-95"><a href="#L-95"><span class="linenos"> 95</span></a><span class="sd">        Returns:</span>
+</span><span id="L-96"><a href="#L-96"><span class="linenos"> 96</span></a><span class="sd">            `Any`: the reconstructed input</span>
+</span><span id="L-97"><a href="#L-97"><span class="linenos"> 97</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="L-98"><a href="#L-98"><span class="linenos"> 98</span></a>        <span class="o">...</span>
+</span><span id="L-99"><a href="#L-99"><span class="linenos"> 99</span></a>
+</span><span id="L-100"><a href="#L-100"><span class="linenos">100</span></a>
+</span><span id="L-101"><a href="#L-101"><span class="linenos">101</span></a><span class="k">class</span> <span class="nc">VAE</span><span class="p">(</span><span class="n">nn</span><span class="o">.</span><span class="n">Module</span><span class="p">):</span>
+</span><span id="L-102"><a href="#L-102"><span class="linenos">102</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;VAE module&quot;&quot;&quot;</span>
+</span><span id="L-103"><a href="#L-103"><span class="linenos">103</span></a>
+</span><span id="L-104"><a href="#L-104"><span class="linenos">104</span></a>    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span>
+</span><span id="L-105"><a href="#L-105"><span class="linenos">105</span></a>        <span class="bp">self</span><span class="p">,</span>
+</span><span id="L-106"><a href="#L-106"><span class="linenos">106</span></a>        <span class="n">encoder</span><span class="p">:</span> <span class="n">VAEEncoder</span><span class="p">,</span>
+</span><span id="L-107"><a href="#L-107"><span class="linenos">107</span></a>        <span class="n">decoder</span><span class="p">:</span> <span class="n">VAEDecoder</span><span class="p">,</span>
+</span><span id="L-108"><a href="#L-108"><span class="linenos">108</span></a>        <span class="n">beta</span><span class="p">:</span> <span class="nb">float</span> <span class="o">=</span> <span class="mi">1</span><span class="p">,</span>
+</span><span id="L-109"><a href="#L-109"><span class="linenos">109</span></a>    <span class="p">):</span>
+</span><span id="L-110"><a href="#L-110"><span class="linenos">110</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="L-111"><a href="#L-111"><span class="linenos">111</span></a><span class="sd">        Initializes a VAE.</span>
+</span><span id="L-112"><a href="#L-112"><span class="linenos">112</span></a>
+</span><span id="L-113"><a href="#L-113"><span class="linenos">113</span></a><span class="sd">        Args:</span>
+</span><span id="L-114"><a href="#L-114"><span class="linenos">114</span></a><span class="sd">            encoder (`VAEEncoder`): VAE encode</span>
+</span><span id="L-115"><a href="#L-115"><span class="linenos">115</span></a><span class="sd">            decoder (`VAEDecoder`): VAE decoder</span>
+</span><span id="L-116"><a href="#L-116"><span class="linenos">116</span></a><span class="sd">            beta (`float`): beta value for Beta-VAE. Defaults to 1.</span>
+</span><span id="L-117"><a href="#L-117"><span class="linenos">117</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="L-118"><a href="#L-118"><span class="linenos">118</span></a>        <span class="nb">super</span><span class="p">()</span><span class="o">.</span><span class="fm">__init__</span><span class="p">()</span>
+</span><span id="L-119"><a href="#L-119"><span class="linenos">119</span></a>
+</span><span id="L-120"><a href="#L-120"><span class="linenos">120</span></a>        <span class="k">assert</span> <span class="n">beta</span> <span class="o">&gt;=</span> <span class="mi">0</span>
+</span><span id="L-121"><a href="#L-121"><span class="linenos">121</span></a>
+</span><span id="L-122"><a href="#L-122"><span class="linenos">122</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">beta</span> <span class="o">=</span> <span class="n">beta</span>
+</span><span id="L-123"><a href="#L-123"><span class="linenos">123</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;Beta value for Beta-VAEs&quot;&quot;&quot;</span>
+</span><span id="L-124"><a href="#L-124"><span class="linenos">124</span></a>
+</span><span id="L-125"><a href="#L-125"><span class="linenos">125</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">encoder</span> <span class="o">=</span> <span class="n">encoder</span>
+</span><span id="L-126"><a href="#L-126"><span class="linenos">126</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;The encoder&quot;&quot;&quot;</span>
+</span><span id="L-127"><a href="#L-127"><span class="linenos">127</span></a>
+</span><span id="L-128"><a href="#L-128"><span class="linenos">128</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">decoder</span> <span class="o">=</span> <span class="n">decoder</span>
+</span><span id="L-129"><a href="#L-129"><span class="linenos">129</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;The decoder&quot;&quot;&quot;</span>
+</span><span id="L-130"><a href="#L-130"><span class="linenos">130</span></a>
+</span><span id="L-131"><a href="#L-131"><span class="linenos">131</span></a>    <span class="k">def</span> <span class="nf">encode</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">x</span><span class="p">:</span> <span class="n">Any</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">:</span>
+</span><span id="L-132"><a href="#L-132"><span class="linenos">132</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="L-133"><a href="#L-133"><span class="linenos">133</span></a><span class="sd">        Encode the representation and returns the mean prediction of VAE.</span>
+</span><span id="L-134"><a href="#L-134"><span class="linenos">134</span></a>
+</span><span id="L-135"><a href="#L-135"><span class="linenos">135</span></a><span class="sd">        Args:</span>
+</span><span id="L-136"><a href="#L-136"><span class="linenos">136</span></a><span class="sd">            x (`Any`): Some input value</span>
+</span><span id="L-137"><a href="#L-137"><span class="linenos">137</span></a>
+</span><span id="L-138"><a href="#L-138"><span class="linenos">138</span></a><span class="sd">        Returns:</span>
+</span><span id="L-139"><a href="#L-139"><span class="linenos">139</span></a><span class="sd">            `torch.Tensor`: The mean representation.</span>
+</span><span id="L-140"><a href="#L-140"><span class="linenos">140</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="L-141"><a href="#L-141"><span class="linenos">141</span></a>        <span class="n">mean_z</span><span class="p">,</span> <span class="n">_</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">encoder</span><span class="p">(</span><span class="n">x</span><span class="p">)</span>
+</span><span id="L-142"><a href="#L-142"><span class="linenos">142</span></a>        <span class="k">return</span> <span class="n">mean_z</span>
+</span><span id="L-143"><a href="#L-143"><span class="linenos">143</span></a>
+</span><span id="L-144"><a href="#L-144"><span class="linenos">144</span></a>    <span class="k">def</span> <span class="nf">decode</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">z</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">Any</span><span class="p">:</span>
+</span><span id="L-145"><a href="#L-145"><span class="linenos">145</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="L-146"><a href="#L-146"><span class="linenos">146</span></a><span class="sd">        Decode the VAE latent representation into input value.</span>
+</span><span id="L-147"><a href="#L-147"><span class="linenos">147</span></a>
+</span><span id="L-148"><a href="#L-148"><span class="linenos">148</span></a><span class="sd">        Args:</span>
+</span><span id="L-149"><a href="#L-149"><span class="linenos">149</span></a><span class="sd">            z (`torch.Tensor`): the VAE latent representation.</span>
+</span><span id="L-150"><a href="#L-150"><span class="linenos">150</span></a>
+</span><span id="L-151"><a href="#L-151"><span class="linenos">151</span></a><span class="sd">        Returns:</span>
+</span><span id="L-152"><a href="#L-152"><span class="linenos">152</span></a><span class="sd">            `Any`: the reconstructed input.</span>
+</span><span id="L-153"><a href="#L-153"><span class="linenos">153</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="L-154"><a href="#L-154"><span class="linenos">154</span></a>        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">decoder</span><span class="p">(</span><span class="n">z</span><span class="p">)</span>
+</span><span id="L-155"><a href="#L-155"><span class="linenos">155</span></a>
+</span><span id="L-156"><a href="#L-156"><span class="linenos">156</span></a>    <span class="k">def</span> <span class="nf">forward</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">x</span><span class="p">:</span> <span class="n">Any</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">tuple</span><span class="p">[</span><span class="nb">tuple</span><span class="p">[</span><span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">],</span> <span class="n">Any</span><span class="p">]:</span>
+</span><span id="L-157"><a href="#L-157"><span class="linenos">157</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="L-158"><a href="#L-158"><span class="linenos">158</span></a><span class="sd">        Encode and decodes from x.</span>
+</span><span id="L-159"><a href="#L-159"><span class="linenos">159</span></a>
+</span><span id="L-160"><a href="#L-160"><span class="linenos">160</span></a><span class="sd">        Args:</span>
+</span><span id="L-161"><a href="#L-161"><span class="linenos">161</span></a><span class="sd">            x (`Any`): the input data</span>
+</span><span id="L-162"><a href="#L-162"><span class="linenos">162</span></a>
+</span><span id="L-163"><a href="#L-163"><span class="linenos">163</span></a><span class="sd">        Returns:</span>
+</span><span id="L-164"><a href="#L-164"><span class="linenos">164</span></a><span class="sd">            `tuple[tuple[torch.Tensor, torch.Tensor], Any]`: The</span>
+</span><span id="L-165"><a href="#L-165"><span class="linenos">165</span></a><span class="sd">                first tuple contains the mean and logvar of the encoded input,</span>
+</span><span id="L-166"><a href="#L-166"><span class="linenos">166</span></a><span class="sd">                the second item is the reconstructed input.</span>
+</span><span id="L-167"><a href="#L-167"><span class="linenos">167</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="L-168"><a href="#L-168"><span class="linenos">168</span></a>        <span class="n">mean</span><span class="p">,</span> <span class="n">logvar</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">encoder</span><span class="p">(</span><span class="n">x</span><span class="p">)</span>
+</span><span id="L-169"><a href="#L-169"><span class="linenos">169</span></a>        <span class="n">z</span> <span class="o">=</span> <span class="n">reparameterize</span><span class="p">(</span><span class="n">mean</span><span class="p">,</span> <span class="n">logvar</span><span class="p">)</span>
+</span><span id="L-170"><a href="#L-170"><span class="linenos">170</span></a>
+</span><span id="L-171"><a href="#L-171"><span class="linenos">171</span></a>        <span class="n">x_reconstructed</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">decoder</span><span class="p">(</span><span class="n">z</span><span class="p">)</span>
+</span><span id="L-172"><a href="#L-172"><span class="linenos">172</span></a>
+</span><span id="L-173"><a href="#L-173"><span class="linenos">173</span></a>        <span class="k">return</span> <span class="p">(</span><span class="n">mean</span><span class="p">,</span> <span class="n">logvar</span><span class="p">),</span> <span class="n">x_reconstructed</span>
+</span></pre></div>
+
+
+            </section>
+                <section id="reparameterize">
+                            <input id="reparameterize-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
+<div class="attr function">
+            
+        <span class="def">def</span>
+        <span class="name">reparameterize</span><span class="signature pdoc-code condensed">(<span class="param"><span class="n">mean</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span>, </span><span class="param"><span class="n">logvar</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span></span><span class="return-annotation">) -> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span>:</span></span>
+
+                <label class="view-source-button" for="reparameterize-view-source"><span>View Source</span></label>
+
+    </div>
+    <a class="headerlink" href="#reparameterize"></a>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="reparameterize-10"><a href="#reparameterize-10"><span class="linenos">10</span></a><span class="k">def</span> <span class="nf">reparameterize</span><span class="p">(</span><span class="n">mean</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">,</span> <span class="n">logvar</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">:</span>
+</span><span id="reparameterize-11"><a href="#reparameterize-11"><span class="linenos">11</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="reparameterize-12"><a href="#reparameterize-12"><span class="linenos">12</span></a><span class="sd">    Reparameterization trick for VAE</span>
+</span><span id="reparameterize-13"><a href="#reparameterize-13"><span class="linenos">13</span></a>
+</span><span id="reparameterize-14"><a href="#reparameterize-14"><span class="linenos">14</span></a><span class="sd">    Args:</span>
+</span><span id="reparameterize-15"><a href="#reparameterize-15"><span class="linenos">15</span></a><span class="sd">        mean (`torch.Tensor`): predicted means</span>
+</span><span id="reparameterize-16"><a href="#reparameterize-16"><span class="linenos">16</span></a><span class="sd">        logvar (`torch.Tensor`): predicted log variance</span>
+</span><span id="reparameterize-17"><a href="#reparameterize-17"><span class="linenos">17</span></a>
+</span><span id="reparameterize-18"><a href="#reparameterize-18"><span class="linenos">18</span></a><span class="sd">    Returns:</span>
+</span><span id="reparameterize-19"><a href="#reparameterize-19"><span class="linenos">19</span></a><span class="sd">        `torch.Tensor`: a sample from normal distribution with provided</span>
+</span><span id="reparameterize-20"><a href="#reparameterize-20"><span class="linenos">20</span></a><span class="sd">            parameters, sampled using the reparameterization trick.</span>
+</span><span id="reparameterize-21"><a href="#reparameterize-21"><span class="linenos">21</span></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="reparameterize-22"><a href="#reparameterize-22"><span class="linenos">22</span></a>    <span class="n">std</span> <span class="o">=</span> <span class="p">(</span><span class="mf">0.5</span> <span class="o">*</span> <span class="n">logvar</span><span class="p">)</span><span class="o">.</span><span class="n">exp</span><span class="p">()</span>
+</span><span id="reparameterize-23"><a href="#reparameterize-23"><span class="linenos">23</span></a>    <span class="n">eps</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">randn_like</span><span class="p">(</span><span class="n">std</span><span class="p">)</span>
+</span><span id="reparameterize-24"><a href="#reparameterize-24"><span class="linenos">24</span></a>    <span class="k">return</span> <span class="n">std</span> <span class="o">*</span> <span class="n">eps</span> <span class="o">+</span> <span class="n">mean</span>
+</span></pre></div>
+
+
+            <div class="docstring"><p>Reparameterization trick for VAE</p>
+
+<h6 id="arguments">Arguments:</h6>
+
+<ul>
+<li><strong>mean (<code>torch.Tensor</code>):</strong>  predicted means</li>
+<li><strong>logvar (<code>torch.Tensor</code>):</strong>  predicted log variance</li>
+</ul>
+
+<h6 id="returns">Returns:</h6>
+
+<blockquote>
+  <p><code>torch.Tensor</code>: a sample from normal distribution with provided
+      parameters, sampled using the reparameterization trick.</p>
+</blockquote>
+</div>
+
+
+                </section>
+                <section id="kl_divergence_loss">
+                            <input id="kl_divergence_loss-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
+<div class="attr function">
+            
+        <span class="def">def</span>
+        <span class="name">kl_divergence_loss</span><span class="signature pdoc-code condensed">(<span class="param"><span class="n">mean</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span>, </span><span class="param"><span class="n">logvar</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span></span><span class="return-annotation">) -> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span>:</span></span>
+
+                <label class="view-source-button" for="kl_divergence_loss-view-source"><span>View Source</span></label>
+
+    </div>
+    <a class="headerlink" href="#kl_divergence_loss"></a>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="kl_divergence_loss-27"><a href="#kl_divergence_loss-27"><span class="linenos">27</span></a><span class="k">def</span> <span class="nf">kl_divergence_loss</span><span class="p">(</span><span class="n">mean</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">,</span> <span class="n">logvar</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">:</span>
+</span><span id="kl_divergence_loss-28"><a href="#kl_divergence_loss-28"><span class="linenos">28</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="kl_divergence_loss-29"><a href="#kl_divergence_loss-29"><span class="linenos">29</span></a><span class="sd">    Computes the KL divergence loss used in VAE.</span>
+</span><span id="kl_divergence_loss-30"><a href="#kl_divergence_loss-30"><span class="linenos">30</span></a>
+</span><span id="kl_divergence_loss-31"><a href="#kl_divergence_loss-31"><span class="linenos">31</span></a><span class="sd">    Args:</span>
+</span><span id="kl_divergence_loss-32"><a href="#kl_divergence_loss-32"><span class="linenos">32</span></a><span class="sd">        mean (`torch.Tensor`): predicted means</span>
+</span><span id="kl_divergence_loss-33"><a href="#kl_divergence_loss-33"><span class="linenos">33</span></a><span class="sd">        logvar (`torch.Tensor`): predicted logvars</span>
+</span><span id="kl_divergence_loss-34"><a href="#kl_divergence_loss-34"><span class="linenos">34</span></a>
+</span><span id="kl_divergence_loss-35"><a href="#kl_divergence_loss-35"><span class="linenos">35</span></a><span class="sd">    Returns:</span>
+</span><span id="kl_divergence_loss-36"><a href="#kl_divergence_loss-36"><span class="linenos">36</span></a><span class="sd">        `torch.Tensor`: the loss</span>
+</span><span id="kl_divergence_loss-37"><a href="#kl_divergence_loss-37"><span class="linenos">37</span></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="kl_divergence_loss-38"><a href="#kl_divergence_loss-38"><span class="linenos">38</span></a>    <span class="n">kl</span> <span class="o">=</span> <span class="o">-</span><span class="mf">0.5</span> <span class="o">*</span> <span class="n">torch</span><span class="o">.</span><span class="n">sum</span><span class="p">(</span><span class="mi">1</span> <span class="o">+</span> <span class="n">logvar</span> <span class="o">-</span> <span class="n">mean</span><span class="o">.</span><span class="n">pow</span><span class="p">(</span><span class="mi">2</span><span class="p">)</span> <span class="o">-</span> <span class="n">logvar</span><span class="o">.</span><span class="n">exp</span><span class="p">())</span>
+</span><span id="kl_divergence_loss-39"><a href="#kl_divergence_loss-39"><span class="linenos">39</span></a>    <span class="k">return</span> <span class="n">kl</span>
+</span></pre></div>
+
+
+            <div class="docstring"><p>Computes the KL divergence loss used in VAE.</p>
+
+<h6 id="arguments">Arguments:</h6>
+
+<ul>
+<li><strong>mean (<code>torch.Tensor</code>):</strong>  predicted means</li>
+<li><strong>logvar (<code>torch.Tensor</code>):</strong>  predicted logvars</li>
+</ul>
+
+<h6 id="returns">Returns:</h6>
+
+<blockquote>
+  <p><code>torch.Tensor</code>: the loss</p>
+</blockquote>
+</div>
+
+
+                </section>
+                <section id="gaussian_nll">
+                            <input id="gaussian_nll-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
+<div class="attr function">
+            
+        <span class="def">def</span>
+        <span class="name">gaussian_nll</span><span class="signature pdoc-code multiline">(<span class="param">	<span class="n">mu</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span>,</span><span class="param">	<span class="n">log_sigma</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span>,</span><span class="param">	<span class="n">x</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span></span><span class="return-annotation">) -> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span>:</span></span>
+
+                <label class="view-source-button" for="gaussian_nll-view-source"><span>View Source</span></label>
+
+    </div>
+    <a class="headerlink" href="#gaussian_nll"></a>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="gaussian_nll-42"><a href="#gaussian_nll-42"><span class="linenos">42</span></a><span class="k">def</span> <span class="nf">gaussian_nll</span><span class="p">(</span>
+</span><span id="gaussian_nll-43"><a href="#gaussian_nll-43"><span class="linenos">43</span></a>    <span class="n">mu</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">,</span> <span class="n">log_sigma</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">,</span> <span class="n">x</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span>
+</span><span id="gaussian_nll-44"><a href="#gaussian_nll-44"><span class="linenos">44</span></a><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">:</span>
+</span><span id="gaussian_nll-45"><a href="#gaussian_nll-45"><span class="linenos">45</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="gaussian_nll-46"><a href="#gaussian_nll-46"><span class="linenos">46</span></a><span class="sd">    Computes gaussian nll loss used in VAE.</span>
+</span><span id="gaussian_nll-47"><a href="#gaussian_nll-47"><span class="linenos">47</span></a>
+</span><span id="gaussian_nll-48"><a href="#gaussian_nll-48"><span class="linenos">48</span></a><span class="sd">    Args:</span>
+</span><span id="gaussian_nll-49"><a href="#gaussian_nll-49"><span class="linenos">49</span></a><span class="sd">        mu (`torch.Tensor`): predictions</span>
+</span><span id="gaussian_nll-50"><a href="#gaussian_nll-50"><span class="linenos">50</span></a><span class="sd">        log_sigma (`torch.Tensor`): log sigma</span>
+</span><span id="gaussian_nll-51"><a href="#gaussian_nll-51"><span class="linenos">51</span></a><span class="sd">        x (`torch.Tensor`): targets</span>
+</span><span id="gaussian_nll-52"><a href="#gaussian_nll-52"><span class="linenos">52</span></a>
+</span><span id="gaussian_nll-53"><a href="#gaussian_nll-53"><span class="linenos">53</span></a><span class="sd">    Returns:</span>
+</span><span id="gaussian_nll-54"><a href="#gaussian_nll-54"><span class="linenos">54</span></a><span class="sd">        `torch.Tensor`: the Gaussian NLL loss</span>
+</span><span id="gaussian_nll-55"><a href="#gaussian_nll-55"><span class="linenos">55</span></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="gaussian_nll-56"><a href="#gaussian_nll-56"><span class="linenos">56</span></a>    <span class="k">return</span> <span class="p">(</span>
+</span><span id="gaussian_nll-57"><a href="#gaussian_nll-57"><span class="linenos">57</span></a>        <span class="mf">0.5</span> <span class="o">*</span> <span class="n">torch</span><span class="o">.</span><span class="n">pow</span><span class="p">((</span><span class="n">x</span> <span class="o">-</span> <span class="n">mu</span><span class="p">)</span> <span class="o">/</span> <span class="n">log_sigma</span><span class="o">.</span><span class="n">exp</span><span class="p">(),</span> <span class="mi">2</span><span class="p">)</span>
+</span><span id="gaussian_nll-58"><a href="#gaussian_nll-58"><span class="linenos">58</span></a>        <span class="o">+</span> <span class="n">log_sigma</span>
+</span><span id="gaussian_nll-59"><a href="#gaussian_nll-59"><span class="linenos">59</span></a>        <span class="o">+</span> <span class="mf">0.5</span> <span class="o">*</span> <span class="n">math</span><span class="o">.</span><span class="n">log</span><span class="p">(</span><span class="mi">2</span> <span class="o">*</span> <span class="n">math</span><span class="o">.</span><span class="n">pi</span><span class="p">)</span>
+</span><span id="gaussian_nll-60"><a href="#gaussian_nll-60"><span class="linenos">60</span></a>    <span class="p">)</span>
+</span></pre></div>
+
+
+            <div class="docstring"><p>Computes gaussian nll loss used in VAE.</p>
+
+<h6 id="arguments">Arguments:</h6>
+
+<ul>
+<li><strong>mu (<code>torch.Tensor</code>):</strong>  predictions</li>
+<li><strong>log_sigma (<code>torch.Tensor</code>):</strong>  log sigma</li>
+<li><strong>x (<code>torch.Tensor</code>):</strong>  targets</li>
+</ul>
+
+<h6 id="returns">Returns:</h6>
+
+<blockquote>
+  <p><code>torch.Tensor</code>: the Gaussian NLL loss</p>
+</blockquote>
+</div>
+
+
+                </section>
+                <section id="VAEEncoder">
+                            <input id="VAEEncoder-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
+<div class="attr class">
+            
+    <span class="def">class</span>
+    <span class="name">VAEEncoder</span><wbr>(<span class="base">torch.nn.modules.module.Module</span>, <span class="base">abc.ABC</span>):
+
+                <label class="view-source-button" for="VAEEncoder-view-source"><span>View Source</span></label>
+
+    </div>
+    <a class="headerlink" href="#VAEEncoder"></a>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="VAEEncoder-63"><a href="#VAEEncoder-63"><span class="linenos">63</span></a><span class="k">class</span> <span class="nc">VAEEncoder</span><span class="p">(</span><span class="n">nn</span><span class="o">.</span><span class="n">Module</span><span class="p">,</span> <span class="n">ABC</span><span class="p">):</span>
+</span><span id="VAEEncoder-64"><a href="#VAEEncoder-64"><span class="linenos">64</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="VAEEncoder-65"><a href="#VAEEncoder-65"><span class="linenos">65</span></a><span class="sd">    Base class for a VAE encoder.</span>
+</span><span id="VAEEncoder-66"><a href="#VAEEncoder-66"><span class="linenos">66</span></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="VAEEncoder-67"><a href="#VAEEncoder-67"><span class="linenos">67</span></a>
+</span><span id="VAEEncoder-68"><a href="#VAEEncoder-68"><span class="linenos">68</span></a>    <span class="nd">@abstractmethod</span>
+</span><span id="VAEEncoder-69"><a href="#VAEEncoder-69"><span class="linenos">69</span></a>    <span class="k">def</span> <span class="nf">forward</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">x</span><span class="p">:</span> <span class="n">Any</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">tuple</span><span class="p">[</span><span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]:</span>
+</span><span id="VAEEncoder-70"><a href="#VAEEncoder-70"><span class="linenos">70</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="VAEEncoder-71"><a href="#VAEEncoder-71"><span class="linenos">71</span></a><span class="sd">        Encode representation with VAE.</span>
+</span><span id="VAEEncoder-72"><a href="#VAEEncoder-72"><span class="linenos">72</span></a>
+</span><span id="VAEEncoder-73"><a href="#VAEEncoder-73"><span class="linenos">73</span></a>
+</span><span id="VAEEncoder-74"><a href="#VAEEncoder-74"><span class="linenos">74</span></a><span class="sd">        Args:</span>
+</span><span id="VAEEncoder-75"><a href="#VAEEncoder-75"><span class="linenos">75</span></a><span class="sd">            x (`Any`): Some input value</span>
+</span><span id="VAEEncoder-76"><a href="#VAEEncoder-76"><span class="linenos">76</span></a>
+</span><span id="VAEEncoder-77"><a href="#VAEEncoder-77"><span class="linenos">77</span></a><span class="sd">        Returns:</span>
+</span><span id="VAEEncoder-78"><a href="#VAEEncoder-78"><span class="linenos">78</span></a><span class="sd">            `tuple[torch.Tensor, torch.Tensor]`: the mean and log variance</span>
+</span><span id="VAEEncoder-79"><a href="#VAEEncoder-79"><span class="linenos">79</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="VAEEncoder-80"><a href="#VAEEncoder-80"><span class="linenos">80</span></a>        <span class="o">...</span>
+</span></pre></div>
+
+
+            <div class="docstring"><p>Base class for a VAE encoder.</p>
+</div>
+
+
+                            <div id="VAEEncoder.forward" class="classattr">
+                                        <input id="VAEEncoder.forward-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
+<div class="attr function">
+                    <div class="decorator">@abstractmethod</div>
+
+        <span class="def">def</span>
+        <span class="name">forward</span><span class="signature pdoc-code condensed">(<span class="param"><span class="bp">self</span>, </span><span class="param"><span class="n">x</span><span class="p">:</span> <span class="n">Any</span></span><span class="return-annotation">) -> <span class="nb">tuple</span><span class="p">[</span><span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]</span>:</span></span>
+
+                <label class="view-source-button" for="VAEEncoder.forward-view-source"><span>View Source</span></label>
+
+    </div>
+    <a class="headerlink" href="#VAEEncoder.forward"></a>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="VAEEncoder.forward-68"><a href="#VAEEncoder.forward-68"><span class="linenos">68</span></a>    <span class="nd">@abstractmethod</span>
+</span><span id="VAEEncoder.forward-69"><a href="#VAEEncoder.forward-69"><span class="linenos">69</span></a>    <span class="k">def</span> <span class="nf">forward</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">x</span><span class="p">:</span> <span class="n">Any</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">tuple</span><span class="p">[</span><span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]:</span>
+</span><span id="VAEEncoder.forward-70"><a href="#VAEEncoder.forward-70"><span class="linenos">70</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="VAEEncoder.forward-71"><a href="#VAEEncoder.forward-71"><span class="linenos">71</span></a><span class="sd">        Encode representation with VAE.</span>
+</span><span id="VAEEncoder.forward-72"><a href="#VAEEncoder.forward-72"><span class="linenos">72</span></a>
+</span><span id="VAEEncoder.forward-73"><a href="#VAEEncoder.forward-73"><span class="linenos">73</span></a>
+</span><span id="VAEEncoder.forward-74"><a href="#VAEEncoder.forward-74"><span class="linenos">74</span></a><span class="sd">        Args:</span>
+</span><span id="VAEEncoder.forward-75"><a href="#VAEEncoder.forward-75"><span class="linenos">75</span></a><span class="sd">            x (`Any`): Some input value</span>
+</span><span id="VAEEncoder.forward-76"><a href="#VAEEncoder.forward-76"><span class="linenos">76</span></a>
+</span><span id="VAEEncoder.forward-77"><a href="#VAEEncoder.forward-77"><span class="linenos">77</span></a><span class="sd">        Returns:</span>
+</span><span id="VAEEncoder.forward-78"><a href="#VAEEncoder.forward-78"><span class="linenos">78</span></a><span class="sd">            `tuple[torch.Tensor, torch.Tensor]`: the mean and log variance</span>
+</span><span id="VAEEncoder.forward-79"><a href="#VAEEncoder.forward-79"><span class="linenos">79</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="VAEEncoder.forward-80"><a href="#VAEEncoder.forward-80"><span class="linenos">80</span></a>        <span class="o">...</span>
+</span></pre></div>
+
+
+            <div class="docstring"><p>Encode representation with VAE.</p>
+
+<h6 id="arguments">Arguments:</h6>
+
+<ul>
+<li><strong>x (<code>Any</code>):</strong>  Some input value</li>
+</ul>
+
+<h6 id="returns">Returns:</h6>
+
+<blockquote>
+  <p><code>tuple[torch.Tensor, torch.Tensor]</code>: the mean and log variance</p>
+</blockquote>
+</div>
+
+
+                            </div>
+                            <div class="inherited">
+                                <h5>Inherited Members</h5>
+                                <dl>
+                                    <div><dt>torch.nn.modules.module.Module</dt>
+                                <dd id="VAEEncoder.__init__" class="function">Module</dd>
+                <dd id="VAEEncoder.dump_patches" class="variable">dump_patches</dd>
+                <dd id="VAEEncoder.training" class="variable">training</dd>
+                <dd id="VAEEncoder.call_super_init" class="variable">call_super_init</dd>
+                <dd id="VAEEncoder.register_buffer" class="function">register_buffer</dd>
+                <dd id="VAEEncoder.register_parameter" class="function">register_parameter</dd>
+                <dd id="VAEEncoder.add_module" class="function">add_module</dd>
+                <dd id="VAEEncoder.register_module" class="function">register_module</dd>
+                <dd id="VAEEncoder.get_submodule" class="function">get_submodule</dd>
+                <dd id="VAEEncoder.get_parameter" class="function">get_parameter</dd>
+                <dd id="VAEEncoder.get_buffer" class="function">get_buffer</dd>
+                <dd id="VAEEncoder.get_extra_state" class="function">get_extra_state</dd>
+                <dd id="VAEEncoder.set_extra_state" class="function">set_extra_state</dd>
+                <dd id="VAEEncoder.apply" class="function">apply</dd>
+                <dd id="VAEEncoder.cuda" class="function">cuda</dd>
+                <dd id="VAEEncoder.ipu" class="function">ipu</dd>
+                <dd id="VAEEncoder.xpu" class="function">xpu</dd>
+                <dd id="VAEEncoder.cpu" class="function">cpu</dd>
+                <dd id="VAEEncoder.type" class="function">type</dd>
+                <dd id="VAEEncoder.float" class="function">float</dd>
+                <dd id="VAEEncoder.double" class="function">double</dd>
+                <dd id="VAEEncoder.half" class="function">half</dd>
+                <dd id="VAEEncoder.bfloat16" class="function">bfloat16</dd>
+                <dd id="VAEEncoder.to_empty" class="function">to_empty</dd>
+                <dd id="VAEEncoder.to" class="function">to</dd>
+                <dd id="VAEEncoder.register_full_backward_pre_hook" class="function">register_full_backward_pre_hook</dd>
+                <dd id="VAEEncoder.register_backward_hook" class="function">register_backward_hook</dd>
+                <dd id="VAEEncoder.register_full_backward_hook" class="function">register_full_backward_hook</dd>
+                <dd id="VAEEncoder.register_forward_pre_hook" class="function">register_forward_pre_hook</dd>
+                <dd id="VAEEncoder.register_forward_hook" class="function">register_forward_hook</dd>
+                <dd id="VAEEncoder.register_state_dict_pre_hook" class="function">register_state_dict_pre_hook</dd>
+                <dd id="VAEEncoder.state_dict" class="function">state_dict</dd>
+                <dd id="VAEEncoder.register_load_state_dict_post_hook" class="function">register_load_state_dict_post_hook</dd>
+                <dd id="VAEEncoder.load_state_dict" class="function">load_state_dict</dd>
+                <dd id="VAEEncoder.parameters" class="function">parameters</dd>
+                <dd id="VAEEncoder.named_parameters" class="function">named_parameters</dd>
+                <dd id="VAEEncoder.buffers" class="function">buffers</dd>
+                <dd id="VAEEncoder.named_buffers" class="function">named_buffers</dd>
+                <dd id="VAEEncoder.children" class="function">children</dd>
+                <dd id="VAEEncoder.named_children" class="function">named_children</dd>
+                <dd id="VAEEncoder.modules" class="function">modules</dd>
+                <dd id="VAEEncoder.named_modules" class="function">named_modules</dd>
+                <dd id="VAEEncoder.train" class="function">train</dd>
+                <dd id="VAEEncoder.eval" class="function">eval</dd>
+                <dd id="VAEEncoder.requires_grad_" class="function">requires_grad_</dd>
+                <dd id="VAEEncoder.zero_grad" class="function">zero_grad</dd>
+                <dd id="VAEEncoder.share_memory" class="function">share_memory</dd>
+                <dd id="VAEEncoder.extra_repr" class="function">extra_repr</dd>
+                <dd id="VAEEncoder.compile" class="function">compile</dd>
+
+            </div>
+                                </dl>
+                            </div>
+                </section>
+                <section id="VAEDecoder">
+                            <input id="VAEDecoder-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
+<div class="attr class">
+            
+    <span class="def">class</span>
+    <span class="name">VAEDecoder</span><wbr>(<span class="base">torch.nn.modules.module.Module</span>, <span class="base">abc.ABC</span>):
+
+                <label class="view-source-button" for="VAEDecoder-view-source"><span>View Source</span></label>
+
+    </div>
+    <a class="headerlink" href="#VAEDecoder"></a>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="VAEDecoder-83"><a href="#VAEDecoder-83"><span class="linenos">83</span></a><span class="k">class</span> <span class="nc">VAEDecoder</span><span class="p">(</span><span class="n">nn</span><span class="o">.</span><span class="n">Module</span><span class="p">,</span> <span class="n">ABC</span><span class="p">):</span>
+</span><span id="VAEDecoder-84"><a href="#VAEDecoder-84"><span class="linenos">84</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="VAEDecoder-85"><a href="#VAEDecoder-85"><span class="linenos">85</span></a><span class="sd">    Base class for a VAE decoder.</span>
+</span><span id="VAEDecoder-86"><a href="#VAEDecoder-86"><span class="linenos">86</span></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="VAEDecoder-87"><a href="#VAEDecoder-87"><span class="linenos">87</span></a>
+</span><span id="VAEDecoder-88"><a href="#VAEDecoder-88"><span class="linenos">88</span></a>    <span class="nd">@abstractmethod</span>
+</span><span id="VAEDecoder-89"><a href="#VAEDecoder-89"><span class="linenos">89</span></a>    <span class="k">def</span> <span class="nf">forward</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">x</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">Any</span><span class="p">:</span>
+</span><span id="VAEDecoder-90"><a href="#VAEDecoder-90"><span class="linenos">90</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="VAEDecoder-91"><a href="#VAEDecoder-91"><span class="linenos">91</span></a><span class="sd">        Decode representation with VAE</span>
+</span><span id="VAEDecoder-92"><a href="#VAEDecoder-92"><span class="linenos">92</span></a>
+</span><span id="VAEDecoder-93"><a href="#VAEDecoder-93"><span class="linenos">93</span></a><span class="sd">        Args:</span>
+</span><span id="VAEDecoder-94"><a href="#VAEDecoder-94"><span class="linenos">94</span></a><span class="sd">            x (`torch.Tensor`): VAE latent representation representation</span>
+</span><span id="VAEDecoder-95"><a href="#VAEDecoder-95"><span class="linenos">95</span></a>
+</span><span id="VAEDecoder-96"><a href="#VAEDecoder-96"><span class="linenos">96</span></a><span class="sd">        Returns:</span>
+</span><span id="VAEDecoder-97"><a href="#VAEDecoder-97"><span class="linenos">97</span></a><span class="sd">            `Any`: the reconstructed input</span>
+</span><span id="VAEDecoder-98"><a href="#VAEDecoder-98"><span class="linenos">98</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="VAEDecoder-99"><a href="#VAEDecoder-99"><span class="linenos">99</span></a>        <span class="o">...</span>
+</span></pre></div>
+
+
+            <div class="docstring"><p>Base class for a VAE decoder.</p>
+</div>
+
+
+                            <div id="VAEDecoder.forward" class="classattr">
+                                        <input id="VAEDecoder.forward-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
+<div class="attr function">
+                    <div class="decorator">@abstractmethod</div>
+
+        <span class="def">def</span>
+        <span class="name">forward</span><span class="signature pdoc-code condensed">(<span class="param"><span class="bp">self</span>, </span><span class="param"><span class="n">x</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span></span><span class="return-annotation">) -> <span class="n">Any</span>:</span></span>
+
+                <label class="view-source-button" for="VAEDecoder.forward-view-source"><span>View Source</span></label>
+
+    </div>
+    <a class="headerlink" href="#VAEDecoder.forward"></a>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="VAEDecoder.forward-88"><a href="#VAEDecoder.forward-88"><span class="linenos">88</span></a>    <span class="nd">@abstractmethod</span>
+</span><span id="VAEDecoder.forward-89"><a href="#VAEDecoder.forward-89"><span class="linenos">89</span></a>    <span class="k">def</span> <span class="nf">forward</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">x</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">Any</span><span class="p">:</span>
+</span><span id="VAEDecoder.forward-90"><a href="#VAEDecoder.forward-90"><span class="linenos">90</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="VAEDecoder.forward-91"><a href="#VAEDecoder.forward-91"><span class="linenos">91</span></a><span class="sd">        Decode representation with VAE</span>
+</span><span id="VAEDecoder.forward-92"><a href="#VAEDecoder.forward-92"><span class="linenos">92</span></a>
+</span><span id="VAEDecoder.forward-93"><a href="#VAEDecoder.forward-93"><span class="linenos">93</span></a><span class="sd">        Args:</span>
+</span><span id="VAEDecoder.forward-94"><a href="#VAEDecoder.forward-94"><span class="linenos">94</span></a><span class="sd">            x (`torch.Tensor`): VAE latent representation representation</span>
+</span><span id="VAEDecoder.forward-95"><a href="#VAEDecoder.forward-95"><span class="linenos">95</span></a>
+</span><span id="VAEDecoder.forward-96"><a href="#VAEDecoder.forward-96"><span class="linenos">96</span></a><span class="sd">        Returns:</span>
+</span><span id="VAEDecoder.forward-97"><a href="#VAEDecoder.forward-97"><span class="linenos">97</span></a><span class="sd">            `Any`: the reconstructed input</span>
+</span><span id="VAEDecoder.forward-98"><a href="#VAEDecoder.forward-98"><span class="linenos">98</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="VAEDecoder.forward-99"><a href="#VAEDecoder.forward-99"><span class="linenos">99</span></a>        <span class="o">...</span>
+</span></pre></div>
+
+
+            <div class="docstring"><p>Decode representation with VAE</p>
+
+<h6 id="arguments">Arguments:</h6>
+
+<ul>
+<li><strong>x (<code>torch.Tensor</code>):</strong>  VAE latent representation representation</li>
+</ul>
+
+<h6 id="returns">Returns:</h6>
+
+<blockquote>
+  <p><code>Any</code>: the reconstructed input</p>
+</blockquote>
+</div>
+
+
+                            </div>
+                            <div class="inherited">
+                                <h5>Inherited Members</h5>
+                                <dl>
+                                    <div><dt>torch.nn.modules.module.Module</dt>
+                                <dd id="VAEDecoder.__init__" class="function">Module</dd>
+                <dd id="VAEDecoder.dump_patches" class="variable">dump_patches</dd>
+                <dd id="VAEDecoder.training" class="variable">training</dd>
+                <dd id="VAEDecoder.call_super_init" class="variable">call_super_init</dd>
+                <dd id="VAEDecoder.register_buffer" class="function">register_buffer</dd>
+                <dd id="VAEDecoder.register_parameter" class="function">register_parameter</dd>
+                <dd id="VAEDecoder.add_module" class="function">add_module</dd>
+                <dd id="VAEDecoder.register_module" class="function">register_module</dd>
+                <dd id="VAEDecoder.get_submodule" class="function">get_submodule</dd>
+                <dd id="VAEDecoder.get_parameter" class="function">get_parameter</dd>
+                <dd id="VAEDecoder.get_buffer" class="function">get_buffer</dd>
+                <dd id="VAEDecoder.get_extra_state" class="function">get_extra_state</dd>
+                <dd id="VAEDecoder.set_extra_state" class="function">set_extra_state</dd>
+                <dd id="VAEDecoder.apply" class="function">apply</dd>
+                <dd id="VAEDecoder.cuda" class="function">cuda</dd>
+                <dd id="VAEDecoder.ipu" class="function">ipu</dd>
+                <dd id="VAEDecoder.xpu" class="function">xpu</dd>
+                <dd id="VAEDecoder.cpu" class="function">cpu</dd>
+                <dd id="VAEDecoder.type" class="function">type</dd>
+                <dd id="VAEDecoder.float" class="function">float</dd>
+                <dd id="VAEDecoder.double" class="function">double</dd>
+                <dd id="VAEDecoder.half" class="function">half</dd>
+                <dd id="VAEDecoder.bfloat16" class="function">bfloat16</dd>
+                <dd id="VAEDecoder.to_empty" class="function">to_empty</dd>
+                <dd id="VAEDecoder.to" class="function">to</dd>
+                <dd id="VAEDecoder.register_full_backward_pre_hook" class="function">register_full_backward_pre_hook</dd>
+                <dd id="VAEDecoder.register_backward_hook" class="function">register_backward_hook</dd>
+                <dd id="VAEDecoder.register_full_backward_hook" class="function">register_full_backward_hook</dd>
+                <dd id="VAEDecoder.register_forward_pre_hook" class="function">register_forward_pre_hook</dd>
+                <dd id="VAEDecoder.register_forward_hook" class="function">register_forward_hook</dd>
+                <dd id="VAEDecoder.register_state_dict_pre_hook" class="function">register_state_dict_pre_hook</dd>
+                <dd id="VAEDecoder.state_dict" class="function">state_dict</dd>
+                <dd id="VAEDecoder.register_load_state_dict_post_hook" class="function">register_load_state_dict_post_hook</dd>
+                <dd id="VAEDecoder.load_state_dict" class="function">load_state_dict</dd>
+                <dd id="VAEDecoder.parameters" class="function">parameters</dd>
+                <dd id="VAEDecoder.named_parameters" class="function">named_parameters</dd>
+                <dd id="VAEDecoder.buffers" class="function">buffers</dd>
+                <dd id="VAEDecoder.named_buffers" class="function">named_buffers</dd>
+                <dd id="VAEDecoder.children" class="function">children</dd>
+                <dd id="VAEDecoder.named_children" class="function">named_children</dd>
+                <dd id="VAEDecoder.modules" class="function">modules</dd>
+                <dd id="VAEDecoder.named_modules" class="function">named_modules</dd>
+                <dd id="VAEDecoder.train" class="function">train</dd>
+                <dd id="VAEDecoder.eval" class="function">eval</dd>
+                <dd id="VAEDecoder.requires_grad_" class="function">requires_grad_</dd>
+                <dd id="VAEDecoder.zero_grad" class="function">zero_grad</dd>
+                <dd id="VAEDecoder.share_memory" class="function">share_memory</dd>
+                <dd id="VAEDecoder.extra_repr" class="function">extra_repr</dd>
+                <dd id="VAEDecoder.compile" class="function">compile</dd>
+
+            </div>
+                                </dl>
+                            </div>
+                </section>
+                <section id="VAE">
+                            <input id="VAE-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
+<div class="attr class">
+            
+    <span class="def">class</span>
+    <span class="name">VAE</span><wbr>(<span class="base">torch.nn.modules.module.Module</span>):
+
+                <label class="view-source-button" for="VAE-view-source"><span>View Source</span></label>
+
+    </div>
+    <a class="headerlink" href="#VAE"></a>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="VAE-102"><a href="#VAE-102"><span class="linenos">102</span></a><span class="k">class</span> <span class="nc">VAE</span><span class="p">(</span><span class="n">nn</span><span class="o">.</span><span class="n">Module</span><span class="p">):</span>
+</span><span id="VAE-103"><a href="#VAE-103"><span class="linenos">103</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;VAE module&quot;&quot;&quot;</span>
+</span><span id="VAE-104"><a href="#VAE-104"><span class="linenos">104</span></a>
+</span><span id="VAE-105"><a href="#VAE-105"><span class="linenos">105</span></a>    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span>
+</span><span id="VAE-106"><a href="#VAE-106"><span class="linenos">106</span></a>        <span class="bp">self</span><span class="p">,</span>
+</span><span id="VAE-107"><a href="#VAE-107"><span class="linenos">107</span></a>        <span class="n">encoder</span><span class="p">:</span> <span class="n">VAEEncoder</span><span class="p">,</span>
+</span><span id="VAE-108"><a href="#VAE-108"><span class="linenos">108</span></a>        <span class="n">decoder</span><span class="p">:</span> <span class="n">VAEDecoder</span><span class="p">,</span>
+</span><span id="VAE-109"><a href="#VAE-109"><span class="linenos">109</span></a>        <span class="n">beta</span><span class="p">:</span> <span class="nb">float</span> <span class="o">=</span> <span class="mi">1</span><span class="p">,</span>
+</span><span id="VAE-110"><a href="#VAE-110"><span class="linenos">110</span></a>    <span class="p">):</span>
+</span><span id="VAE-111"><a href="#VAE-111"><span class="linenos">111</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="VAE-112"><a href="#VAE-112"><span class="linenos">112</span></a><span class="sd">        Initializes a VAE.</span>
+</span><span id="VAE-113"><a href="#VAE-113"><span class="linenos">113</span></a>
+</span><span id="VAE-114"><a href="#VAE-114"><span class="linenos">114</span></a><span class="sd">        Args:</span>
+</span><span id="VAE-115"><a href="#VAE-115"><span class="linenos">115</span></a><span class="sd">            encoder (`VAEEncoder`): VAE encode</span>
+</span><span id="VAE-116"><a href="#VAE-116"><span class="linenos">116</span></a><span class="sd">            decoder (`VAEDecoder`): VAE decoder</span>
+</span><span id="VAE-117"><a href="#VAE-117"><span class="linenos">117</span></a><span class="sd">            beta (`float`): beta value for Beta-VAE. Defaults to 1.</span>
+</span><span id="VAE-118"><a href="#VAE-118"><span class="linenos">118</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="VAE-119"><a href="#VAE-119"><span class="linenos">119</span></a>        <span class="nb">super</span><span class="p">()</span><span class="o">.</span><span class="fm">__init__</span><span class="p">()</span>
+</span><span id="VAE-120"><a href="#VAE-120"><span class="linenos">120</span></a>
+</span><span id="VAE-121"><a href="#VAE-121"><span class="linenos">121</span></a>        <span class="k">assert</span> <span class="n">beta</span> <span class="o">&gt;=</span> <span class="mi">0</span>
+</span><span id="VAE-122"><a href="#VAE-122"><span class="linenos">122</span></a>
+</span><span id="VAE-123"><a href="#VAE-123"><span class="linenos">123</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">beta</span> <span class="o">=</span> <span class="n">beta</span>
+</span><span id="VAE-124"><a href="#VAE-124"><span class="linenos">124</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;Beta value for Beta-VAEs&quot;&quot;&quot;</span>
+</span><span id="VAE-125"><a href="#VAE-125"><span class="linenos">125</span></a>
+</span><span id="VAE-126"><a href="#VAE-126"><span class="linenos">126</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">encoder</span> <span class="o">=</span> <span class="n">encoder</span>
+</span><span id="VAE-127"><a href="#VAE-127"><span class="linenos">127</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;The encoder&quot;&quot;&quot;</span>
+</span><span id="VAE-128"><a href="#VAE-128"><span class="linenos">128</span></a>
+</span><span id="VAE-129"><a href="#VAE-129"><span class="linenos">129</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">decoder</span> <span class="o">=</span> <span class="n">decoder</span>
+</span><span id="VAE-130"><a href="#VAE-130"><span class="linenos">130</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;The decoder&quot;&quot;&quot;</span>
+</span><span id="VAE-131"><a href="#VAE-131"><span class="linenos">131</span></a>
+</span><span id="VAE-132"><a href="#VAE-132"><span class="linenos">132</span></a>    <span class="k">def</span> <span class="nf">encode</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">x</span><span class="p">:</span> <span class="n">Any</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">:</span>
+</span><span id="VAE-133"><a href="#VAE-133"><span class="linenos">133</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="VAE-134"><a href="#VAE-134"><span class="linenos">134</span></a><span class="sd">        Encode the representation and returns the mean prediction of VAE.</span>
+</span><span id="VAE-135"><a href="#VAE-135"><span class="linenos">135</span></a>
+</span><span id="VAE-136"><a href="#VAE-136"><span class="linenos">136</span></a><span class="sd">        Args:</span>
+</span><span id="VAE-137"><a href="#VAE-137"><span class="linenos">137</span></a><span class="sd">            x (`Any`): Some input value</span>
+</span><span id="VAE-138"><a href="#VAE-138"><span class="linenos">138</span></a>
+</span><span id="VAE-139"><a href="#VAE-139"><span class="linenos">139</span></a><span class="sd">        Returns:</span>
+</span><span id="VAE-140"><a href="#VAE-140"><span class="linenos">140</span></a><span class="sd">            `torch.Tensor`: The mean representation.</span>
+</span><span id="VAE-141"><a href="#VAE-141"><span class="linenos">141</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="VAE-142"><a href="#VAE-142"><span class="linenos">142</span></a>        <span class="n">mean_z</span><span class="p">,</span> <span class="n">_</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">encoder</span><span class="p">(</span><span class="n">x</span><span class="p">)</span>
+</span><span id="VAE-143"><a href="#VAE-143"><span class="linenos">143</span></a>        <span class="k">return</span> <span class="n">mean_z</span>
+</span><span id="VAE-144"><a href="#VAE-144"><span class="linenos">144</span></a>
+</span><span id="VAE-145"><a href="#VAE-145"><span class="linenos">145</span></a>    <span class="k">def</span> <span class="nf">decode</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">z</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">Any</span><span class="p">:</span>
+</span><span id="VAE-146"><a href="#VAE-146"><span class="linenos">146</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="VAE-147"><a href="#VAE-147"><span class="linenos">147</span></a><span class="sd">        Decode the VAE latent representation into input value.</span>
+</span><span id="VAE-148"><a href="#VAE-148"><span class="linenos">148</span></a>
+</span><span id="VAE-149"><a href="#VAE-149"><span class="linenos">149</span></a><span class="sd">        Args:</span>
+</span><span id="VAE-150"><a href="#VAE-150"><span class="linenos">150</span></a><span class="sd">            z (`torch.Tensor`): the VAE latent representation.</span>
+</span><span id="VAE-151"><a href="#VAE-151"><span class="linenos">151</span></a>
+</span><span id="VAE-152"><a href="#VAE-152"><span class="linenos">152</span></a><span class="sd">        Returns:</span>
+</span><span id="VAE-153"><a href="#VAE-153"><span class="linenos">153</span></a><span class="sd">            `Any`: the reconstructed input.</span>
+</span><span id="VAE-154"><a href="#VAE-154"><span class="linenos">154</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="VAE-155"><a href="#VAE-155"><span class="linenos">155</span></a>        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">decoder</span><span class="p">(</span><span class="n">z</span><span class="p">)</span>
+</span><span id="VAE-156"><a href="#VAE-156"><span class="linenos">156</span></a>
+</span><span id="VAE-157"><a href="#VAE-157"><span class="linenos">157</span></a>    <span class="k">def</span> <span class="nf">forward</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">x</span><span class="p">:</span> <span class="n">Any</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">tuple</span><span class="p">[</span><span class="nb">tuple</span><span class="p">[</span><span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">],</span> <span class="n">Any</span><span class="p">]:</span>
+</span><span id="VAE-158"><a href="#VAE-158"><span class="linenos">158</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="VAE-159"><a href="#VAE-159"><span class="linenos">159</span></a><span class="sd">        Encode and decodes from x.</span>
+</span><span id="VAE-160"><a href="#VAE-160"><span class="linenos">160</span></a>
+</span><span id="VAE-161"><a href="#VAE-161"><span class="linenos">161</span></a><span class="sd">        Args:</span>
+</span><span id="VAE-162"><a href="#VAE-162"><span class="linenos">162</span></a><span class="sd">            x (`Any`): the input data</span>
+</span><span id="VAE-163"><a href="#VAE-163"><span class="linenos">163</span></a>
+</span><span id="VAE-164"><a href="#VAE-164"><span class="linenos">164</span></a><span class="sd">        Returns:</span>
+</span><span id="VAE-165"><a href="#VAE-165"><span class="linenos">165</span></a><span class="sd">            `tuple[tuple[torch.Tensor, torch.Tensor], Any]`: The</span>
+</span><span id="VAE-166"><a href="#VAE-166"><span class="linenos">166</span></a><span class="sd">                first tuple contains the mean and logvar of the encoded input,</span>
+</span><span id="VAE-167"><a href="#VAE-167"><span class="linenos">167</span></a><span class="sd">                the second item is the reconstructed input.</span>
+</span><span id="VAE-168"><a href="#VAE-168"><span class="linenos">168</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="VAE-169"><a href="#VAE-169"><span class="linenos">169</span></a>        <span class="n">mean</span><span class="p">,</span> <span class="n">logvar</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">encoder</span><span class="p">(</span><span class="n">x</span><span class="p">)</span>
+</span><span id="VAE-170"><a href="#VAE-170"><span class="linenos">170</span></a>        <span class="n">z</span> <span class="o">=</span> <span class="n">reparameterize</span><span class="p">(</span><span class="n">mean</span><span class="p">,</span> <span class="n">logvar</span><span class="p">)</span>
+</span><span id="VAE-171"><a href="#VAE-171"><span class="linenos">171</span></a>
+</span><span id="VAE-172"><a href="#VAE-172"><span class="linenos">172</span></a>        <span class="n">x_reconstructed</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">decoder</span><span class="p">(</span><span class="n">z</span><span class="p">)</span>
+</span><span id="VAE-173"><a href="#VAE-173"><span class="linenos">173</span></a>
+</span><span id="VAE-174"><a href="#VAE-174"><span class="linenos">174</span></a>        <span class="k">return</span> <span class="p">(</span><span class="n">mean</span><span class="p">,</span> <span class="n">logvar</span><span class="p">),</span> <span class="n">x_reconstructed</span>
+</span></pre></div>
+
+
+            <div class="docstring"><p>VAE module</p>
+</div>
+
+
+                            <div id="VAE.__init__" class="classattr">
+                                        <input id="VAE.__init__-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
+<div class="attr function">
+            
+        <span class="name">VAE</span><span class="signature pdoc-code multiline">(<span class="param">	<span class="n">encoder</span><span class="p">:</span> <span class="n"><a href="#VAEEncoder">VAEEncoder</a></span>,</span><span class="param">	<span class="n">decoder</span><span class="p">:</span> <span class="n"><a href="#VAEDecoder">VAEDecoder</a></span>,</span><span class="param">	<span class="n">beta</span><span class="p">:</span> <span class="nb">float</span> <span class="o">=</span> <span class="mi">1</span></span>)</span>
+
+                <label class="view-source-button" for="VAE.__init__-view-source"><span>View Source</span></label>
+
+    </div>
+    <a class="headerlink" href="#VAE.__init__"></a>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="VAE.__init__-105"><a href="#VAE.__init__-105"><span class="linenos">105</span></a>    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span>
+</span><span id="VAE.__init__-106"><a href="#VAE.__init__-106"><span class="linenos">106</span></a>        <span class="bp">self</span><span class="p">,</span>
+</span><span id="VAE.__init__-107"><a href="#VAE.__init__-107"><span class="linenos">107</span></a>        <span class="n">encoder</span><span class="p">:</span> <span class="n">VAEEncoder</span><span class="p">,</span>
+</span><span id="VAE.__init__-108"><a href="#VAE.__init__-108"><span class="linenos">108</span></a>        <span class="n">decoder</span><span class="p">:</span> <span class="n">VAEDecoder</span><span class="p">,</span>
+</span><span id="VAE.__init__-109"><a href="#VAE.__init__-109"><span class="linenos">109</span></a>        <span class="n">beta</span><span class="p">:</span> <span class="nb">float</span> <span class="o">=</span> <span class="mi">1</span><span class="p">,</span>
+</span><span id="VAE.__init__-110"><a href="#VAE.__init__-110"><span class="linenos">110</span></a>    <span class="p">):</span>
+</span><span id="VAE.__init__-111"><a href="#VAE.__init__-111"><span class="linenos">111</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="VAE.__init__-112"><a href="#VAE.__init__-112"><span class="linenos">112</span></a><span class="sd">        Initializes a VAE.</span>
+</span><span id="VAE.__init__-113"><a href="#VAE.__init__-113"><span class="linenos">113</span></a>
+</span><span id="VAE.__init__-114"><a href="#VAE.__init__-114"><span class="linenos">114</span></a><span class="sd">        Args:</span>
+</span><span id="VAE.__init__-115"><a href="#VAE.__init__-115"><span class="linenos">115</span></a><span class="sd">            encoder (`VAEEncoder`): VAE encode</span>
+</span><span id="VAE.__init__-116"><a href="#VAE.__init__-116"><span class="linenos">116</span></a><span class="sd">            decoder (`VAEDecoder`): VAE decoder</span>
+</span><span id="VAE.__init__-117"><a href="#VAE.__init__-117"><span class="linenos">117</span></a><span class="sd">            beta (`float`): beta value for Beta-VAE. Defaults to 1.</span>
+</span><span id="VAE.__init__-118"><a href="#VAE.__init__-118"><span class="linenos">118</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="VAE.__init__-119"><a href="#VAE.__init__-119"><span class="linenos">119</span></a>        <span class="nb">super</span><span class="p">()</span><span class="o">.</span><span class="fm">__init__</span><span class="p">()</span>
+</span><span id="VAE.__init__-120"><a href="#VAE.__init__-120"><span class="linenos">120</span></a>
+</span><span id="VAE.__init__-121"><a href="#VAE.__init__-121"><span class="linenos">121</span></a>        <span class="k">assert</span> <span class="n">beta</span> <span class="o">&gt;=</span> <span class="mi">0</span>
+</span><span id="VAE.__init__-122"><a href="#VAE.__init__-122"><span class="linenos">122</span></a>
+</span><span id="VAE.__init__-123"><a href="#VAE.__init__-123"><span class="linenos">123</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">beta</span> <span class="o">=</span> <span class="n">beta</span>
+</span><span id="VAE.__init__-124"><a href="#VAE.__init__-124"><span class="linenos">124</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;Beta value for Beta-VAEs&quot;&quot;&quot;</span>
+</span><span id="VAE.__init__-125"><a href="#VAE.__init__-125"><span class="linenos">125</span></a>
+</span><span id="VAE.__init__-126"><a href="#VAE.__init__-126"><span class="linenos">126</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">encoder</span> <span class="o">=</span> <span class="n">encoder</span>
+</span><span id="VAE.__init__-127"><a href="#VAE.__init__-127"><span class="linenos">127</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;The encoder&quot;&quot;&quot;</span>
+</span><span id="VAE.__init__-128"><a href="#VAE.__init__-128"><span class="linenos">128</span></a>
+</span><span id="VAE.__init__-129"><a href="#VAE.__init__-129"><span class="linenos">129</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">decoder</span> <span class="o">=</span> <span class="n">decoder</span>
+</span><span id="VAE.__init__-130"><a href="#VAE.__init__-130"><span class="linenos">130</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;The decoder&quot;&quot;&quot;</span>
+</span></pre></div>
+
+
+            <div class="docstring"><p>Initializes a VAE.</p>
+
+<h6 id="arguments">Arguments:</h6>
+
+<ul>
+<li><strong>encoder (<code><a href="#VAEEncoder">VAEEncoder</a></code>):</strong>  VAE encode</li>
+<li><strong>decoder (<code><a href="#VAEDecoder">VAEDecoder</a></code>):</strong>  VAE decoder</li>
+<li><strong>beta (<code><a href="#VAE.float">float</a></code>):</strong>  beta value for Beta-VAE. Defaults to 1.</li>
+</ul>
+</div>
+
+
+                            </div>
+                            <div id="VAE.beta" class="classattr">
+                                <div class="attr variable">
+            <span class="name">beta</span>
+
+        
+    </div>
+    <a class="headerlink" href="#VAE.beta"></a>
+    
+            <div class="docstring"><p>Beta value for Beta-VAEs</p>
+</div>
+
+
+                            </div>
+                            <div id="VAE.encoder" class="classattr">
+                                <div class="attr variable">
+            <span class="name">encoder</span>
+
+        
+    </div>
+    <a class="headerlink" href="#VAE.encoder"></a>
+    
+            <div class="docstring"><p>The encoder</p>
+</div>
+
+
+                            </div>
+                            <div id="VAE.decoder" class="classattr">
+                                <div class="attr variable">
+            <span class="name">decoder</span>
+
+        
+    </div>
+    <a class="headerlink" href="#VAE.decoder"></a>
+    
+            <div class="docstring"><p>The decoder</p>
+</div>
+
+
+                            </div>
+                            <div id="VAE.encode" class="classattr">
+                                        <input id="VAE.encode-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
+<div class="attr function">
+            
+        <span class="def">def</span>
+        <span class="name">encode</span><span class="signature pdoc-code condensed">(<span class="param"><span class="bp">self</span>, </span><span class="param"><span class="n">x</span><span class="p">:</span> <span class="n">Any</span></span><span class="return-annotation">) -> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span>:</span></span>
+
+                <label class="view-source-button" for="VAE.encode-view-source"><span>View Source</span></label>
+
+    </div>
+    <a class="headerlink" href="#VAE.encode"></a>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="VAE.encode-132"><a href="#VAE.encode-132"><span class="linenos">132</span></a>    <span class="k">def</span> <span class="nf">encode</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">x</span><span class="p">:</span> <span class="n">Any</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">:</span>
+</span><span id="VAE.encode-133"><a href="#VAE.encode-133"><span class="linenos">133</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="VAE.encode-134"><a href="#VAE.encode-134"><span class="linenos">134</span></a><span class="sd">        Encode the representation and returns the mean prediction of VAE.</span>
+</span><span id="VAE.encode-135"><a href="#VAE.encode-135"><span class="linenos">135</span></a>
+</span><span id="VAE.encode-136"><a href="#VAE.encode-136"><span class="linenos">136</span></a><span class="sd">        Args:</span>
+</span><span id="VAE.encode-137"><a href="#VAE.encode-137"><span class="linenos">137</span></a><span class="sd">            x (`Any`): Some input value</span>
+</span><span id="VAE.encode-138"><a href="#VAE.encode-138"><span class="linenos">138</span></a>
+</span><span id="VAE.encode-139"><a href="#VAE.encode-139"><span class="linenos">139</span></a><span class="sd">        Returns:</span>
+</span><span id="VAE.encode-140"><a href="#VAE.encode-140"><span class="linenos">140</span></a><span class="sd">            `torch.Tensor`: The mean representation.</span>
+</span><span id="VAE.encode-141"><a href="#VAE.encode-141"><span class="linenos">141</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="VAE.encode-142"><a href="#VAE.encode-142"><span class="linenos">142</span></a>        <span class="n">mean_z</span><span class="p">,</span> <span class="n">_</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">encoder</span><span class="p">(</span><span class="n">x</span><span class="p">)</span>
+</span><span id="VAE.encode-143"><a href="#VAE.encode-143"><span class="linenos">143</span></a>        <span class="k">return</span> <span class="n">mean_z</span>
+</span></pre></div>
+
+
+            <div class="docstring"><p>Encode the representation and returns the mean prediction of VAE.</p>
+
+<h6 id="arguments">Arguments:</h6>
+
+<ul>
+<li><strong>x (<code>Any</code>):</strong>  Some input value</li>
+</ul>
+
+<h6 id="returns">Returns:</h6>
+
+<blockquote>
+  <p><code>torch.Tensor</code>: The mean representation.</p>
+</blockquote>
+</div>
+
+
+                            </div>
+                            <div id="VAE.decode" class="classattr">
+                                        <input id="VAE.decode-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
+<div class="attr function">
+            
+        <span class="def">def</span>
+        <span class="name">decode</span><span class="signature pdoc-code condensed">(<span class="param"><span class="bp">self</span>, </span><span class="param"><span class="n">z</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span></span><span class="return-annotation">) -> <span class="n">Any</span>:</span></span>
+
+                <label class="view-source-button" for="VAE.decode-view-source"><span>View Source</span></label>
+
+    </div>
+    <a class="headerlink" href="#VAE.decode"></a>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="VAE.decode-145"><a href="#VAE.decode-145"><span class="linenos">145</span></a>    <span class="k">def</span> <span class="nf">decode</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">z</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">Any</span><span class="p">:</span>
+</span><span id="VAE.decode-146"><a href="#VAE.decode-146"><span class="linenos">146</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="VAE.decode-147"><a href="#VAE.decode-147"><span class="linenos">147</span></a><span class="sd">        Decode the VAE latent representation into input value.</span>
+</span><span id="VAE.decode-148"><a href="#VAE.decode-148"><span class="linenos">148</span></a>
+</span><span id="VAE.decode-149"><a href="#VAE.decode-149"><span class="linenos">149</span></a><span class="sd">        Args:</span>
+</span><span id="VAE.decode-150"><a href="#VAE.decode-150"><span class="linenos">150</span></a><span class="sd">            z (`torch.Tensor`): the VAE latent representation.</span>
+</span><span id="VAE.decode-151"><a href="#VAE.decode-151"><span class="linenos">151</span></a>
+</span><span id="VAE.decode-152"><a href="#VAE.decode-152"><span class="linenos">152</span></a><span class="sd">        Returns:</span>
+</span><span id="VAE.decode-153"><a href="#VAE.decode-153"><span class="linenos">153</span></a><span class="sd">            `Any`: the reconstructed input.</span>
+</span><span id="VAE.decode-154"><a href="#VAE.decode-154"><span class="linenos">154</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="VAE.decode-155"><a href="#VAE.decode-155"><span class="linenos">155</span></a>        <span class="k">return</span> <span class="bp">self</span><span class="o">.</span><span class="n">decoder</span><span class="p">(</span><span class="n">z</span><span class="p">)</span>
+</span></pre></div>
+
+
+            <div class="docstring"><p>Decode the VAE latent representation into input value.</p>
+
+<h6 id="arguments">Arguments:</h6>
+
+<ul>
+<li><strong>z (<code>torch.Tensor</code>):</strong>  the VAE latent representation.</li>
+</ul>
+
+<h6 id="returns">Returns:</h6>
+
+<blockquote>
+  <p><code>Any</code>: the reconstructed input.</p>
+</blockquote>
+</div>
+
+
+                            </div>
+                            <div id="VAE.forward" class="classattr">
+                                        <input id="VAE.forward-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
+<div class="attr function">
+            
+        <span class="def">def</span>
+        <span class="name">forward</span><span class="signature pdoc-code condensed">(<span class="param"><span class="bp">self</span>, </span><span class="param"><span class="n">x</span><span class="p">:</span> <span class="n">Any</span></span><span class="return-annotation">) -> <span class="nb">tuple</span><span class="p">[</span><span class="nb">tuple</span><span class="p">[</span><span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">],</span> <span class="n">typing</span><span class="o">.</span><span class="n">Any</span><span class="p">]</span>:</span></span>
+
+                <label class="view-source-button" for="VAE.forward-view-source"><span>View Source</span></label>
+
+    </div>
+    <a class="headerlink" href="#VAE.forward"></a>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="VAE.forward-157"><a href="#VAE.forward-157"><span class="linenos">157</span></a>    <span class="k">def</span> <span class="nf">forward</span><span class="p">(</span><span class="bp">self</span><span class="p">,</span> <span class="n">x</span><span class="p">:</span> <span class="n">Any</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">tuple</span><span class="p">[</span><span class="nb">tuple</span><span class="p">[</span><span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">],</span> <span class="n">Any</span><span class="p">]:</span>
+</span><span id="VAE.forward-158"><a href="#VAE.forward-158"><span class="linenos">158</span></a><span class="w">        </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="VAE.forward-159"><a href="#VAE.forward-159"><span class="linenos">159</span></a><span class="sd">        Encode and decodes from x.</span>
+</span><span id="VAE.forward-160"><a href="#VAE.forward-160"><span class="linenos">160</span></a>
+</span><span id="VAE.forward-161"><a href="#VAE.forward-161"><span class="linenos">161</span></a><span class="sd">        Args:</span>
+</span><span id="VAE.forward-162"><a href="#VAE.forward-162"><span class="linenos">162</span></a><span class="sd">            x (`Any`): the input data</span>
+</span><span id="VAE.forward-163"><a href="#VAE.forward-163"><span class="linenos">163</span></a>
+</span><span id="VAE.forward-164"><a href="#VAE.forward-164"><span class="linenos">164</span></a><span class="sd">        Returns:</span>
+</span><span id="VAE.forward-165"><a href="#VAE.forward-165"><span class="linenos">165</span></a><span class="sd">            `tuple[tuple[torch.Tensor, torch.Tensor], Any]`: The</span>
+</span><span id="VAE.forward-166"><a href="#VAE.forward-166"><span class="linenos">166</span></a><span class="sd">                first tuple contains the mean and logvar of the encoded input,</span>
+</span><span id="VAE.forward-167"><a href="#VAE.forward-167"><span class="linenos">167</span></a><span class="sd">                the second item is the reconstructed input.</span>
+</span><span id="VAE.forward-168"><a href="#VAE.forward-168"><span class="linenos">168</span></a><span class="sd">        &quot;&quot;&quot;</span>
+</span><span id="VAE.forward-169"><a href="#VAE.forward-169"><span class="linenos">169</span></a>        <span class="n">mean</span><span class="p">,</span> <span class="n">logvar</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">encoder</span><span class="p">(</span><span class="n">x</span><span class="p">)</span>
+</span><span id="VAE.forward-170"><a href="#VAE.forward-170"><span class="linenos">170</span></a>        <span class="n">z</span> <span class="o">=</span> <span class="n">reparameterize</span><span class="p">(</span><span class="n">mean</span><span class="p">,</span> <span class="n">logvar</span><span class="p">)</span>
+</span><span id="VAE.forward-171"><a href="#VAE.forward-171"><span class="linenos">171</span></a>
+</span><span id="VAE.forward-172"><a href="#VAE.forward-172"><span class="linenos">172</span></a>        <span class="n">x_reconstructed</span> <span class="o">=</span> <span class="bp">self</span><span class="o">.</span><span class="n">decoder</span><span class="p">(</span><span class="n">z</span><span class="p">)</span>
+</span><span id="VAE.forward-173"><a href="#VAE.forward-173"><span class="linenos">173</span></a>
+</span><span id="VAE.forward-174"><a href="#VAE.forward-174"><span class="linenos">174</span></a>        <span class="k">return</span> <span class="p">(</span><span class="n">mean</span><span class="p">,</span> <span class="n">logvar</span><span class="p">),</span> <span class="n">x_reconstructed</span>
+</span></pre></div>
+
+
+            <div class="docstring"><p>Encode and decodes from x.</p>
+
+<h6 id="arguments">Arguments:</h6>
+
+<ul>
+<li><strong>x (<code>Any</code>):</strong>  the input data</li>
+</ul>
+
+<h6 id="returns">Returns:</h6>
+
+<blockquote>
+  <p><code>tuple[tuple[torch.Tensor, torch.Tensor], Any]</code>: The
+      first tuple contains the mean and logvar of the encoded input,
+      the second item is the reconstructed input.</p>
+</blockquote>
+</div>
+
+
+                            </div>
+                            <div class="inherited">
+                                <h5>Inherited Members</h5>
+                                <dl>
+                                    <div><dt>torch.nn.modules.module.Module</dt>
+                                <dd id="VAE.dump_patches" class="variable">dump_patches</dd>
+                <dd id="VAE.training" class="variable">training</dd>
+                <dd id="VAE.call_super_init" class="variable">call_super_init</dd>
+                <dd id="VAE.register_buffer" class="function">register_buffer</dd>
+                <dd id="VAE.register_parameter" class="function">register_parameter</dd>
+                <dd id="VAE.add_module" class="function">add_module</dd>
+                <dd id="VAE.register_module" class="function">register_module</dd>
+                <dd id="VAE.get_submodule" class="function">get_submodule</dd>
+                <dd id="VAE.get_parameter" class="function">get_parameter</dd>
+                <dd id="VAE.get_buffer" class="function">get_buffer</dd>
+                <dd id="VAE.get_extra_state" class="function">get_extra_state</dd>
+                <dd id="VAE.set_extra_state" class="function">set_extra_state</dd>
+                <dd id="VAE.apply" class="function">apply</dd>
+                <dd id="VAE.cuda" class="function">cuda</dd>
+                <dd id="VAE.ipu" class="function">ipu</dd>
+                <dd id="VAE.xpu" class="function">xpu</dd>
+                <dd id="VAE.cpu" class="function">cpu</dd>
+                <dd id="VAE.type" class="function">type</dd>
+                <dd id="VAE.float" class="function">float</dd>
+                <dd id="VAE.double" class="function">double</dd>
+                <dd id="VAE.half" class="function">half</dd>
+                <dd id="VAE.bfloat16" class="function">bfloat16</dd>
+                <dd id="VAE.to_empty" class="function">to_empty</dd>
+                <dd id="VAE.to" class="function">to</dd>
+                <dd id="VAE.register_full_backward_pre_hook" class="function">register_full_backward_pre_hook</dd>
+                <dd id="VAE.register_backward_hook" class="function">register_backward_hook</dd>
+                <dd id="VAE.register_full_backward_hook" class="function">register_full_backward_hook</dd>
+                <dd id="VAE.register_forward_pre_hook" class="function">register_forward_pre_hook</dd>
+                <dd id="VAE.register_forward_hook" class="function">register_forward_hook</dd>
+                <dd id="VAE.register_state_dict_pre_hook" class="function">register_state_dict_pre_hook</dd>
+                <dd id="VAE.state_dict" class="function">state_dict</dd>
+                <dd id="VAE.register_load_state_dict_post_hook" class="function">register_load_state_dict_post_hook</dd>
+                <dd id="VAE.load_state_dict" class="function">load_state_dict</dd>
+                <dd id="VAE.parameters" class="function">parameters</dd>
+                <dd id="VAE.named_parameters" class="function">named_parameters</dd>
+                <dd id="VAE.buffers" class="function">buffers</dd>
+                <dd id="VAE.named_buffers" class="function">named_buffers</dd>
+                <dd id="VAE.children" class="function">children</dd>
+                <dd id="VAE.named_children" class="function">named_children</dd>
+                <dd id="VAE.modules" class="function">modules</dd>
+                <dd id="VAE.named_modules" class="function">named_modules</dd>
+                <dd id="VAE.train" class="function">train</dd>
+                <dd id="VAE.eval" class="function">eval</dd>
+                <dd id="VAE.requires_grad_" class="function">requires_grad_</dd>
+                <dd id="VAE.zero_grad" class="function">zero_grad</dd>
+                <dd id="VAE.share_memory" class="function">share_memory</dd>
+                <dd id="VAE.extra_repr" class="function">extra_repr</dd>
+                <dd id="VAE.compile" class="function">compile</dd>
+
+            </div>
+                                </dl>
+                            </div>
+                </section>
+    </main>
+<script>
+    function escapeHTML(html) {
+        return document.createElement('div').appendChild(document.createTextNode(html)).parentNode.innerHTML;
+    }
+
+    const originalContent = document.querySelector("main.pdoc");
+    let currentContent = originalContent;
+
+    function setContent(innerHTML) {
+        let elem;
+        if (innerHTML) {
+            elem = document.createElement("main");
+            elem.classList.add("pdoc");
+            elem.innerHTML = innerHTML;
+        } else {
+            elem = originalContent;
+        }
+        if (currentContent !== elem) {
+            currentContent.replaceWith(elem);
+            currentContent = elem;
+        }
+    }
+
+    function getSearchTerm() {
+        return (new URL(window.location)).searchParams.get("search");
+    }
+
+    const searchBox = document.querySelector(".pdoc input[type=search]");
+    searchBox.addEventListener("input", function () {
+        let url = new URL(window.location);
+        if (searchBox.value.trim()) {
+            url.hash = "";
+            url.searchParams.set("search", searchBox.value);
+        } else {
+            url.searchParams.delete("search");
+        }
+        history.replaceState("", "", url.toString());
+        onInput();
+    });
+    window.addEventListener("popstate", onInput);
+
+
+    let search, searchErr;
+
+    async function initialize() {
+        try {
+            search = await new Promise((resolve, reject) => {
+                const script = document.createElement("script");
+                script.type = "text/javascript";
+                script.async = true;
+                script.onload = () => resolve(window.pdocSearch);
+                script.onerror = (e) => reject(e);
+                script.src = "../../search.js";
+                document.getElementsByTagName("head")[0].appendChild(script);
+            });
+        } catch (e) {
+            console.error("Cannot fetch pdoc search index");
+            searchErr = "Cannot fetch search index.";
+        }
+        onInput();
+
+        document.querySelector("nav.pdoc").addEventListener("click", e => {
+            if (e.target.hash) {
+                searchBox.value = "";
+                searchBox.dispatchEvent(new Event("input"));
+            }
+        });
+    }
+
+    function onInput() {
+        setContent((() => {
+            const term = getSearchTerm();
+            if (!term) {
+                return null
+            }
+            if (searchErr) {
+                return `<h3>Error: ${searchErr}</h3>`
+            }
+            if (!search) {
+                return "<h3>Searching...</h3>"
+            }
+
+            window.scrollTo({top: 0, left: 0, behavior: 'auto'});
+
+            const results = search(term);
+
+            let html;
+            if (results.length === 0) {
+                html = `No search results for '${escapeHTML(term)}'.`
+            } else {
+                html = `<h4>${results.length} search result${results.length > 1 ? "s" : ""} for '${escapeHTML(term)}'.</h4>`;
+            }
+            for (let result of results.slice(0, 10)) {
+                let doc = result.doc;
+                let url = `../../${doc.modulename.replaceAll(".", "/")}.html`;
+                if (doc.qualname) {
+                    url += `#${doc.qualname}`;
+                }
+
+                let heading;
+                switch (result.doc.kind) {
+                    case "function":
+                        if (doc.fullname.endsWith(".__init__")) {
+                            heading = `<span class="name">${doc.fullname.replace(/\.__init__$/, "")}</span>${doc.signature}`;
+                        } else {
+                            heading = `<span class="def">${doc.funcdef}</span> <span class="name">${doc.fullname}</span>${doc.signature}`;
+                        }
+                        break;
+                    case "class":
+                        heading = `<span class="def">class</span> <span class="name">${doc.fullname}</span>`;
+                        if (doc.bases)
+                            heading += `<wbr>(<span class="base">${doc.bases}</span>)`;
+                        heading += `:`;
+                        break;
+                    case "variable":
+                        heading = `<span class="name">${doc.fullname}</span>`;
+                        if (doc.annotation)
+                            heading += `<span class="annotation">${doc.annotation}</span>`;
+                        if (doc.default_value)
+                            heading += `<span class="default_value"> = ${doc.default_value}</span>`;
+                        break;
+                    default:
+                        heading = `<span class="name">${doc.fullname}</span>`;
+                        break;
+                }
+                html += `
+                        <section class="search-result">
+                        <a href="${url}" class="attr ${doc.kind}">${heading}</a>
+                        <div class="docstring">${doc.doc}</div>
+                        </section>
+                    `;
+
+            }
+            return html;
+        })());
+    }
+
+    if (getSearchTerm()) {
+        initialize();
+        searchBox.value = getSearchTerm();
+        onInput();
+    } else {
+        searchBox.addEventListener("focus", initialize, {once: true});
+    }
+
+    searchBox.addEventListener("keydown", e => {
+        if (["ArrowDown", "ArrowUp", "Enter"].includes(e.key)) {
+            let focused = currentContent.querySelector(".search-result.focused");
+            if (!focused) {
+                currentContent.querySelector(".search-result").classList.add("focused");
+            } else if (
+                e.key === "ArrowDown"
+                && focused.nextElementSibling
+                && focused.nextElementSibling.classList.contains("search-result")
+            ) {
+                focused.classList.remove("focused");
+                focused.nextElementSibling.classList.add("focused");
+                focused.nextElementSibling.scrollIntoView({
+                    behavior: "smooth",
+                    block: "nearest",
+                    inline: "nearest"
+                });
+            } else if (
+                e.key === "ArrowUp"
+                && focused.previousElementSibling
+                && focused.previousElementSibling.classList.contains("search-result")
+            ) {
+                focused.classList.remove("focused");
+                focused.previousElementSibling.classList.add("focused");
+                focused.previousElementSibling.scrollIntoView({
+                    behavior: "smooth",
+                    block: "nearest",
+                    inline: "nearest"
+                });
+            } else if (
+                e.key === "Enter"
+            ) {
+                focused.querySelector("a").click();
+            }
+        }
+    });
+</script></body>
+</html>
\ No newline at end of file
diff --git a/docs/api/v0.5.1/shimmer/types.html b/docs/api/v0.5.1/shimmer/types.html
new file mode 100644
index 00000000..a1057714
--- /dev/null
+++ b/docs/api/v0.5.1/shimmer/types.html
@@ -0,0 +1,872 @@
+<!doctype html>
+<html lang="en">
+<head>
+    <meta charset="utf-8">
+    <meta name="viewport" content="width=device-width, initial-scale=1">
+    <meta name="generator" content="pdoc 14.4.0"/>
+    <title>shimmer.types API documentation</title>
+
+    <style>/*! * Bootstrap Reboot v5.0.0 (https://getbootstrap.com/) * Copyright 2011-2021 The Bootstrap Authors * Copyright 2011-2021 Twitter, Inc. * Licensed under MIT (https://github.com/twbs/bootstrap/blob/main/LICENSE) * Forked from Normalize.css, licensed MIT (https://github.com/necolas/normalize.css/blob/master/LICENSE.md) */*,::after,::before{box-sizing:border-box}@media (prefers-reduced-motion:no-preference){:root{scroll-behavior:smooth}}body{margin:0;font-family:system-ui,-apple-system,"Segoe UI",Roboto,"Helvetica Neue",Arial,"Noto Sans","Liberation Sans",sans-serif,"Apple Color Emoji","Segoe UI Emoji","Segoe UI Symbol","Noto Color Emoji";font-size:1rem;font-weight:400;line-height:1.5;color:#212529;background-color:#fff;-webkit-text-size-adjust:100%;-webkit-tap-highlight-color:transparent}hr{margin:1rem 0;color:inherit;background-color:currentColor;border:0;opacity:.25}hr:not([size]){height:1px}h1,h2,h3,h4,h5,h6{margin-top:0;margin-bottom:.5rem;font-weight:500;line-height:1.2}h1{font-size:calc(1.375rem + 1.5vw)}@media (min-width:1200px){h1{font-size:2.5rem}}h2{font-size:calc(1.325rem + .9vw)}@media (min-width:1200px){h2{font-size:2rem}}h3{font-size:calc(1.3rem + .6vw)}@media (min-width:1200px){h3{font-size:1.75rem}}h4{font-size:calc(1.275rem + .3vw)}@media (min-width:1200px){h4{font-size:1.5rem}}h5{font-size:1.25rem}h6{font-size:1rem}p{margin-top:0;margin-bottom:1rem}abbr[data-bs-original-title],abbr[title]{-webkit-text-decoration:underline dotted;text-decoration:underline dotted;cursor:help;-webkit-text-decoration-skip-ink:none;text-decoration-skip-ink:none}address{margin-bottom:1rem;font-style:normal;line-height:inherit}ol,ul{padding-left:2rem}dl,ol,ul{margin-top:0;margin-bottom:1rem}ol ol,ol ul,ul ol,ul ul{margin-bottom:0}dt{font-weight:700}dd{margin-bottom:.5rem;margin-left:0}blockquote{margin:0 0 1rem}b,strong{font-weight:bolder}small{font-size:.875em}mark{padding:.2em;background-color:#fcf8e3}sub,sup{position:relative;font-size:.75em;line-height:0;vertical-align:baseline}sub{bottom:-.25em}sup{top:-.5em}a{color:#0d6efd;text-decoration:underline}a:hover{color:#0a58ca}a:not([href]):not([class]),a:not([href]):not([class]):hover{color:inherit;text-decoration:none}code,kbd,pre,samp{font-family:SFMono-Regular,Menlo,Monaco,Consolas,"Liberation Mono","Courier New",monospace;font-size:1em;direction:ltr;unicode-bidi:bidi-override}pre{display:block;margin-top:0;margin-bottom:1rem;overflow:auto;font-size:.875em}pre code{font-size:inherit;color:inherit;word-break:normal}code{font-size:.875em;color:#d63384;word-wrap:break-word}a>code{color:inherit}kbd{padding:.2rem .4rem;font-size:.875em;color:#fff;background-color:#212529;border-radius:.2rem}kbd kbd{padding:0;font-size:1em;font-weight:700}figure{margin:0 0 1rem}img,svg{vertical-align:middle}table{caption-side:bottom;border-collapse:collapse}caption{padding-top:.5rem;padding-bottom:.5rem;color:#6c757d;text-align:left}th{text-align:inherit;text-align:-webkit-match-parent}tbody,td,tfoot,th,thead,tr{border-color:inherit;border-style:solid;border-width:0}label{display:inline-block}button{border-radius:0}button:focus:not(:focus-visible){outline:0}button,input,optgroup,select,textarea{margin:0;font-family:inherit;font-size:inherit;line-height:inherit}button,select{text-transform:none}[role=button]{cursor:pointer}select{word-wrap:normal}select:disabled{opacity:1}[list]::-webkit-calendar-picker-indicator{display:none}[type=button],[type=reset],[type=submit],button{-webkit-appearance:button}[type=button]:not(:disabled),[type=reset]:not(:disabled),[type=submit]:not(:disabled),button:not(:disabled){cursor:pointer}::-moz-focus-inner{padding:0;border-style:none}textarea{resize:vertical}fieldset{min-width:0;padding:0;margin:0;border:0}legend{float:left;width:100%;padding:0;margin-bottom:.5rem;font-size:calc(1.275rem + .3vw);line-height:inherit}@media (min-width:1200px){legend{font-size:1.5rem}}legend+*{clear:left}::-webkit-datetime-edit-day-field,::-webkit-datetime-edit-fields-wrapper,::-webkit-datetime-edit-hour-field,::-webkit-datetime-edit-minute,::-webkit-datetime-edit-month-field,::-webkit-datetime-edit-text,::-webkit-datetime-edit-year-field{padding:0}::-webkit-inner-spin-button{height:auto}[type=search]{outline-offset:-2px;-webkit-appearance:textfield}::-webkit-search-decoration{-webkit-appearance:none}::-webkit-color-swatch-wrapper{padding:0}::file-selector-button{font:inherit}::-webkit-file-upload-button{font:inherit;-webkit-appearance:button}output{display:inline-block}iframe{border:0}summary{display:list-item;cursor:pointer}progress{vertical-align:baseline}[hidden]{display:none!important}</style>
+    <style>/*! syntax-highlighting.css */pre{line-height:125%;}span.linenos{color:inherit; background-color:transparent; padding-left:5px; padding-right:20px;}.pdoc-code .hll{background-color:#ffffcc}.pdoc-code{background:#f8f8f8;}.pdoc-code .c{color:#3D7B7B; font-style:italic}.pdoc-code .err{border:1px solid #FF0000}.pdoc-code .k{color:#008000; font-weight:bold}.pdoc-code .o{color:#666666}.pdoc-code .ch{color:#3D7B7B; font-style:italic}.pdoc-code .cm{color:#3D7B7B; font-style:italic}.pdoc-code .cp{color:#9C6500}.pdoc-code .cpf{color:#3D7B7B; font-style:italic}.pdoc-code .c1{color:#3D7B7B; font-style:italic}.pdoc-code .cs{color:#3D7B7B; font-style:italic}.pdoc-code .gd{color:#A00000}.pdoc-code .ge{font-style:italic}.pdoc-code .gr{color:#E40000}.pdoc-code .gh{color:#000080; font-weight:bold}.pdoc-code .gi{color:#008400}.pdoc-code .go{color:#717171}.pdoc-code .gp{color:#000080; font-weight:bold}.pdoc-code .gs{font-weight:bold}.pdoc-code .gu{color:#800080; font-weight:bold}.pdoc-code .gt{color:#0044DD}.pdoc-code .kc{color:#008000; font-weight:bold}.pdoc-code .kd{color:#008000; font-weight:bold}.pdoc-code .kn{color:#008000; font-weight:bold}.pdoc-code .kp{color:#008000}.pdoc-code .kr{color:#008000; font-weight:bold}.pdoc-code .kt{color:#B00040}.pdoc-code .m{color:#666666}.pdoc-code .s{color:#BA2121}.pdoc-code .na{color:#687822}.pdoc-code .nb{color:#008000}.pdoc-code .nc{color:#0000FF; font-weight:bold}.pdoc-code .no{color:#880000}.pdoc-code .nd{color:#AA22FF}.pdoc-code .ni{color:#717171; font-weight:bold}.pdoc-code .ne{color:#CB3F38; font-weight:bold}.pdoc-code .nf{color:#0000FF}.pdoc-code .nl{color:#767600}.pdoc-code .nn{color:#0000FF; font-weight:bold}.pdoc-code .nt{color:#008000; font-weight:bold}.pdoc-code .nv{color:#19177C}.pdoc-code .ow{color:#AA22FF; font-weight:bold}.pdoc-code .w{color:#bbbbbb}.pdoc-code .mb{color:#666666}.pdoc-code .mf{color:#666666}.pdoc-code .mh{color:#666666}.pdoc-code .mi{color:#666666}.pdoc-code .mo{color:#666666}.pdoc-code .sa{color:#BA2121}.pdoc-code .sb{color:#BA2121}.pdoc-code .sc{color:#BA2121}.pdoc-code .dl{color:#BA2121}.pdoc-code .sd{color:#BA2121; font-style:italic}.pdoc-code .s2{color:#BA2121}.pdoc-code .se{color:#AA5D1F; font-weight:bold}.pdoc-code .sh{color:#BA2121}.pdoc-code .si{color:#A45A77; font-weight:bold}.pdoc-code .sx{color:#008000}.pdoc-code .sr{color:#A45A77}.pdoc-code .s1{color:#BA2121}.pdoc-code .ss{color:#19177C}.pdoc-code .bp{color:#008000}.pdoc-code .fm{color:#0000FF}.pdoc-code .vc{color:#19177C}.pdoc-code .vg{color:#19177C}.pdoc-code .vi{color:#19177C}.pdoc-code .vm{color:#19177C}.pdoc-code .il{color:#666666}</style>
+    <style>/*! theme.css */:root{--pdoc-background:#fff;}.pdoc{--text:#212529;--muted:#6c757d;--link:#3660a5;--link-hover:#1659c5;--code:#f8f8f8;--active:#fff598;--accent:#eee;--accent2:#c1c1c1;--nav-hover:rgba(255, 255, 255, 0.5);--name:#0066BB;--def:#008800;--annotation:#007020;}</style>
+    <style>/*! layout.css */html, body{width:100%;height:100%;}html, main{scroll-behavior:smooth;}body{background-color:var(--pdoc-background);}@media (max-width:769px){#navtoggle{cursor:pointer;position:absolute;width:50px;height:40px;top:1rem;right:1rem;border-color:var(--text);color:var(--text);display:flex;opacity:0.8;z-index:999;}#navtoggle:hover{opacity:1;}#togglestate + div{display:none;}#togglestate:checked + div{display:inherit;}main, header{padding:2rem 3vw;}header + main{margin-top:-3rem;}.git-button{display:none !important;}nav input[type="search"]{max-width:77%;}nav input[type="search"]:first-child{margin-top:-6px;}nav input[type="search"]:valid ~ *{display:none !important;}}@media (min-width:770px){:root{--sidebar-width:clamp(12.5rem, 28vw, 22rem);}nav{position:fixed;overflow:auto;height:100vh;width:var(--sidebar-width);}main, header{padding:3rem 2rem 3rem calc(var(--sidebar-width) + 3rem);width:calc(54rem + var(--sidebar-width));max-width:100%;}header + main{margin-top:-4rem;}#navtoggle{display:none;}}#togglestate{position:absolute;height:0;opacity:0;}nav.pdoc{--pad:clamp(0.5rem, 2vw, 1.75rem);--indent:1.5rem;background-color:var(--accent);border-right:1px solid var(--accent2);box-shadow:0 0 20px rgba(50, 50, 50, .2) inset;padding:0 0 0 var(--pad);overflow-wrap:anywhere;scrollbar-width:thin; scrollbar-color:var(--accent2) transparent; z-index:1}nav.pdoc::-webkit-scrollbar{width:.4rem; }nav.pdoc::-webkit-scrollbar-thumb{background-color:var(--accent2); }nav.pdoc > div{padding:var(--pad) 0;}nav.pdoc .module-list-button{display:inline-flex;align-items:center;color:var(--text);border-color:var(--muted);margin-bottom:1rem;}nav.pdoc .module-list-button:hover{border-color:var(--text);}nav.pdoc input[type=search]{display:block;outline-offset:0;width:calc(100% - var(--pad));}nav.pdoc .logo{max-width:calc(100% - var(--pad));max-height:35vh;display:block;margin:0 auto 1rem;transform:translate(calc(-.5 * var(--pad)), 0);}nav.pdoc ul{list-style:none;padding-left:0;}nav.pdoc > div > ul{margin-left:calc(0px - var(--pad));}nav.pdoc li a{padding:.2rem 0 .2rem calc(var(--pad) + var(--indent));}nav.pdoc > div > ul > li > a{padding-left:var(--pad);}nav.pdoc li{transition:all 100ms;}nav.pdoc li:hover{background-color:var(--nav-hover);}nav.pdoc a, nav.pdoc a:hover{color:var(--text);}nav.pdoc a{display:block;}nav.pdoc > h2:first-of-type{margin-top:1.5rem;}nav.pdoc .class:before{content:"class ";color:var(--muted);}nav.pdoc .function:after{content:"()";color:var(--muted);}nav.pdoc footer:before{content:"";display:block;width:calc(100% - var(--pad));border-top:solid var(--accent2) 1px;margin-top:1.5rem;padding-top:.5rem;}nav.pdoc footer{font-size:small;}</style>
+    <style>/*! content.css */.pdoc{color:var(--text);box-sizing:border-box;line-height:1.5;background:none;}.pdoc .pdoc-button{cursor:pointer;display:inline-block;border:solid black 1px;border-radius:2px;font-size:.75rem;padding:calc(0.5em - 1px) 1em;transition:100ms all;}.pdoc .pdoc-alert{padding:1rem 1rem 1rem calc(1.5rem + 24px);border:1px solid transparent;border-radius:.25rem;background-repeat:no-repeat;background-position:1rem center;margin-bottom:1rem;}.pdoc .pdoc-alert > *:last-child{margin-bottom:0;}.pdoc .pdoc-alert-note {color:#084298;background-color:#cfe2ff;border-color:#b6d4fe;background-image:url("data:image/svg+xml,%3Csvg%20xmlns%3D%22http%3A//www.w3.org/2000/svg%22%20width%3D%2224%22%20height%3D%2224%22%20fill%3D%22%23084298%22%20viewBox%3D%220%200%2016%2016%22%3E%3Cpath%20d%3D%22M8%2016A8%208%200%201%200%208%200a8%208%200%200%200%200%2016zm.93-9.412-1%204.705c-.07.34.029.533.304.533.194%200%20.487-.07.686-.246l-.088.416c-.287.346-.92.598-1.465.598-.703%200-1.002-.422-.808-1.319l.738-3.468c.064-.293.006-.399-.287-.47l-.451-.081.082-.381%202.29-.287zM8%205.5a1%201%200%201%201%200-2%201%201%200%200%201%200%202z%22/%3E%3C/svg%3E");}.pdoc .pdoc-alert-warning{color:#664d03;background-color:#fff3cd;border-color:#ffecb5;background-image:url("data:image/svg+xml,%3Csvg%20xmlns%3D%22http%3A//www.w3.org/2000/svg%22%20width%3D%2224%22%20height%3D%2224%22%20fill%3D%22%23664d03%22%20viewBox%3D%220%200%2016%2016%22%3E%3Cpath%20d%3D%22M8.982%201.566a1.13%201.13%200%200%200-1.96%200L.165%2013.233c-.457.778.091%201.767.98%201.767h13.713c.889%200%201.438-.99.98-1.767L8.982%201.566zM8%205c.535%200%20.954.462.9.995l-.35%203.507a.552.552%200%200%201-1.1%200L7.1%205.995A.905.905%200%200%201%208%205zm.002%206a1%201%200%201%201%200%202%201%201%200%200%201%200-2z%22/%3E%3C/svg%3E");}.pdoc .pdoc-alert-danger{color:#842029;background-color:#f8d7da;border-color:#f5c2c7;background-image:url("data:image/svg+xml,%3Csvg%20xmlns%3D%22http%3A//www.w3.org/2000/svg%22%20width%3D%2224%22%20height%3D%2224%22%20fill%3D%22%23842029%22%20viewBox%3D%220%200%2016%2016%22%3E%3Cpath%20d%3D%22M5.52.359A.5.5%200%200%201%206%200h4a.5.5%200%200%201%20.474.658L8.694%206H12.5a.5.5%200%200%201%20.395.807l-7%209a.5.5%200%200%201-.873-.454L6.823%209.5H3.5a.5.5%200%200%201-.48-.641l2.5-8.5z%22/%3E%3C/svg%3E");}.pdoc .visually-hidden{position:absolute !important;width:1px !important;height:1px !important;padding:0 !important;margin:-1px !important;overflow:hidden !important;clip:rect(0, 0, 0, 0) !important;white-space:nowrap !important;border:0 !important;}.pdoc h1, .pdoc h2, .pdoc h3{font-weight:300;margin:.3em 0;padding:.2em 0;}.pdoc > section:not(.module-info) h1{font-size:1.5rem;font-weight:500;}.pdoc > section:not(.module-info) h2{font-size:1.4rem;font-weight:500;}.pdoc > section:not(.module-info) h3{font-size:1.3rem;font-weight:500;}.pdoc > section:not(.module-info) h4{font-size:1.2rem;}.pdoc > section:not(.module-info) h5{font-size:1.1rem;}.pdoc a{text-decoration:none;color:var(--link);}.pdoc a:hover{color:var(--link-hover);}.pdoc blockquote{margin-left:2rem;}.pdoc pre{border-top:1px solid var(--accent2);border-bottom:1px solid var(--accent2);margin-top:0;margin-bottom:1em;padding:.5rem 0 .5rem .5rem;overflow-x:auto;background-color:var(--code);}.pdoc code{color:var(--text);padding:.2em .4em;margin:0;font-size:85%;background-color:var(--accent);border-radius:6px;}.pdoc a > code{color:inherit;}.pdoc pre > code{display:inline-block;font-size:inherit;background:none;border:none;padding:0;}.pdoc > section:not(.module-info){margin-bottom:1.5rem;}.pdoc .modulename{margin-top:0;font-weight:bold;}.pdoc .modulename a{color:var(--link);transition:100ms all;}.pdoc .git-button{float:right;border:solid var(--link) 1px;}.pdoc .git-button:hover{background-color:var(--link);color:var(--pdoc-background);}.view-source-toggle-state,.view-source-toggle-state ~ .pdoc-code{display:none;}.view-source-toggle-state:checked ~ .pdoc-code{display:block;}.view-source-button{display:inline-block;float:right;font-size:.75rem;line-height:1.5rem;color:var(--muted);padding:0 .4rem 0 1.3rem;cursor:pointer;text-indent:-2px;}.view-source-button > span{visibility:hidden;}.module-info .view-source-button{float:none;display:flex;justify-content:flex-end;margin:-1.2rem .4rem -.2rem 0;}.view-source-button::before{position:absolute;content:"View Source";display:list-item;list-style-type:disclosure-closed;}.view-source-toggle-state:checked ~ .attr .view-source-button::before,.view-source-toggle-state:checked ~ .view-source-button::before{list-style-type:disclosure-open;}.pdoc .docstring{margin-bottom:1.5rem;}.pdoc section:not(.module-info) .docstring{margin-left:clamp(0rem, 5vw - 2rem, 1rem);}.pdoc .docstring .pdoc-code{margin-left:1em;margin-right:1em;}.pdoc h1:target,.pdoc h2:target,.pdoc h3:target,.pdoc h4:target,.pdoc h5:target,.pdoc h6:target,.pdoc .pdoc-code > pre > span:target{background-color:var(--active);box-shadow:-1rem 0 0 0 var(--active);}.pdoc .pdoc-code > pre > span:target{display:block;}.pdoc div:target > .attr,.pdoc section:target > .attr,.pdoc dd:target > a{background-color:var(--active);}.pdoc *{scroll-margin:2rem;}.pdoc .pdoc-code .linenos{user-select:none;}.pdoc .attr:hover{filter:contrast(0.95);}.pdoc section, .pdoc .classattr{position:relative;}.pdoc .headerlink{--width:clamp(1rem, 3vw, 2rem);position:absolute;top:0;left:calc(0rem - var(--width));transition:all 100ms ease-in-out;opacity:0;}.pdoc .headerlink::before{content:"#";display:block;text-align:center;width:var(--width);height:2.3rem;line-height:2.3rem;font-size:1.5rem;}.pdoc .attr:hover ~ .headerlink,.pdoc *:target > .headerlink,.pdoc .headerlink:hover{opacity:1;}.pdoc .attr{display:block;margin:.5rem 0 .5rem;padding:.4rem .4rem .4rem 1rem;background-color:var(--accent);overflow-x:auto;}.pdoc .classattr{margin-left:2rem;}.pdoc .name{color:var(--name);font-weight:bold;}.pdoc .def{color:var(--def);font-weight:bold;}.pdoc .signature{background-color:transparent;}.pdoc .param, .pdoc .return-annotation{white-space:pre;}.pdoc .signature.multiline .param{display:block;}.pdoc .signature.condensed .param{display:inline-block;}.pdoc .annotation{color:var(--annotation);}.pdoc .view-value-toggle-state,.pdoc .view-value-toggle-state ~ .default_value{display:none;}.pdoc .view-value-toggle-state:checked ~ .default_value{display:inherit;}.pdoc .view-value-button{font-size:.5rem;vertical-align:middle;border-style:dashed;margin-top:-0.1rem;}.pdoc .view-value-button:hover{background:white;}.pdoc .view-value-button::before{content:"show";text-align:center;width:2.2em;display:inline-block;}.pdoc .view-value-toggle-state:checked ~ .view-value-button::before{content:"hide";}.pdoc .inherited{margin-left:2rem;}.pdoc .inherited dt{font-weight:700;}.pdoc .inherited dt, .pdoc .inherited dd{display:inline;margin-left:0;margin-bottom:.5rem;}.pdoc .inherited dd:not(:last-child):after{content:", ";}.pdoc .inherited .class:before{content:"class ";}.pdoc .inherited .function a:after{content:"()";}.pdoc .search-result .docstring{overflow:auto;max-height:25vh;}.pdoc .search-result.focused > .attr{background-color:var(--active);}.pdoc .attribution{margin-top:2rem;display:block;opacity:0.5;transition:all 200ms;filter:grayscale(100%);}.pdoc .attribution:hover{opacity:1;filter:grayscale(0%);}.pdoc .attribution img{margin-left:5px;height:35px;vertical-align:middle;width:70px;transition:all 200ms;}.pdoc table{display:block;width:max-content;max-width:100%;overflow:auto;margin-bottom:1rem;}.pdoc table th{font-weight:600;}.pdoc table th, .pdoc table td{padding:6px 13px;border:1px solid var(--accent2);}</style>
+    <style>/*! custom.css */</style><script>
+    window.MathJax = {
+        tex: {
+            inlineMath: [['$', '$'], ['\\(', '\\)']]
+        }
+    };
+</script>
+<script src="https://polyfill.io/v3/polyfill.min.js?features=es6"></script>
+<script id="MathJax-script" async src="https://cdn.jsdelivr.net/npm/mathjax@3/es5/tex-mml-chtml.js"></script>
+<script>
+    /* Re-invoke MathJax when DOM content changes, for example during search. */
+    document.addEventListener("DOMContentLoaded", () => {
+        new MutationObserver(() => MathJax.typeset()).observe(
+            document.querySelector("main.pdoc").parentNode,
+            {childList: true}
+        );
+    })
+</script>
+<style>
+    mjx-container {
+        overflow-x: auto;
+    }
+</style></head>
+<body>
+    <nav class="pdoc">
+        <label id="navtoggle" for="togglestate" class="pdoc-button"><svg xmlns='http://www.w3.org/2000/svg' viewBox='0 0 30 30'><path stroke-linecap='round' stroke="currentColor" stroke-miterlimit='10' stroke-width='2' d='M4 7h22M4 15h22M4 23h22'/></svg></label>
+        <input id="togglestate" type="checkbox" aria-hidden="true" tabindex="-1">
+        <div>            <a class="pdoc-button module-list-button" href="../index.html">
+<svg xmlns="http://www.w3.org/2000/svg" width="16" height="16" fill="currentColor" class="bi bi-box-arrow-in-left" viewBox="0 0 16 16">
+  <path fill-rule="evenodd" d="M10 3.5a.5.5 0 0 0-.5-.5h-8a.5.5 0 0 0-.5.5v9a.5.5 0 0 0 .5.5h8a.5.5 0 0 0 .5-.5v-2a.5.5 0 0 1 1 0v2A1.5 1.5 0 0 1 9.5 14h-8A1.5 1.5 0 0 1 0 12.5v-9A1.5 1.5 0 0 1 1.5 2h8A1.5 1.5 0 0 1 11 3.5v2a.5.5 0 0 1-1 0v-2z"/>
+  <path fill-rule="evenodd" d="M4.146 8.354a.5.5 0 0 1 0-.708l3-3a.5.5 0 1 1 .708.708L5.707 7.5H14.5a.5.5 0 0 1 0 1H5.707l2.147 2.146a.5.5 0 0 1-.708.708l-3-3z"/>
+</svg>                &nbsp;
+                Module Index
+            </a>
+
+
+            <input type="search" placeholder="Search..." role="searchbox" aria-label="search"
+                   pattern=".+" required>
+
+
+
+            <h2>API Documentation</h2>
+                <ul class="memberlist">
+            <li>
+                    <a class="variable" href="#RawDomainGroupT">RawDomainGroupT</a>
+            </li>
+            <li>
+                    <a class="variable" href="#RawDomainGroupDT">RawDomainGroupDT</a>
+            </li>
+            <li>
+                    <a class="variable" href="#LatentsDomainGroupT">LatentsDomainGroupT</a>
+            </li>
+            <li>
+                    <a class="variable" href="#LatentsDomainGroupDT">LatentsDomainGroupDT</a>
+            </li>
+            <li>
+                    <a class="variable" href="#RawDomainGroupsT">RawDomainGroupsT</a>
+            </li>
+            <li>
+                    <a class="variable" href="#RawDomainGroupsDT">RawDomainGroupsDT</a>
+            </li>
+            <li>
+                    <a class="variable" href="#LatentsDomainGroupsT">LatentsDomainGroupsT</a>
+            </li>
+            <li>
+                    <a class="variable" href="#LatentsDomainGroupsDT">LatentsDomainGroupsDT</a>
+            </li>
+            <li>
+                    <a class="variable" href="#ModelModeT">ModelModeT</a>
+            </li>
+    </ul>
+
+
+
+        <a class="attribution" title="pdoc: Python API documentation generator" href="https://pdoc.dev" target="_blank">
+            built with <span class="visually-hidden">pdoc</span><img
+                alt="pdoc logo"
+                src="data:image/svg+xml,%3Csvg%20xmlns%3D%22http%3A//www.w3.org/2000/svg%22%20role%3D%22img%22%20aria-label%3D%22pdoc%20logo%22%20width%3D%22300%22%20height%3D%22150%22%20viewBox%3D%22-1%200%2060%2030%22%3E%3Ctitle%3Epdoc%3C/title%3E%3Cpath%20d%3D%22M29.621%2021.293c-.011-.273-.214-.475-.511-.481a.5.5%200%200%200-.489.503l-.044%201.393c-.097.551-.695%201.215-1.566%201.704-.577.428-1.306.486-2.193.182-1.426-.617-2.467-1.654-3.304-2.487l-.173-.172a3.43%203.43%200%200%200-.365-.306.49.49%200%200%200-.286-.196c-1.718-1.06-4.931-1.47-7.353.191l-.219.15c-1.707%201.187-3.413%202.131-4.328%201.03-.02-.027-.49-.685-.141-1.763.233-.721.546-2.408.772-4.076.042-.09.067-.187.046-.288.166-1.347.277-2.625.241-3.351%201.378-1.008%202.271-2.586%202.271-4.362%200-.976-.272-1.935-.788-2.774-.057-.094-.122-.18-.184-.268.033-.167.052-.339.052-.516%200-1.477-1.202-2.679-2.679-2.679-.791%200-1.496.352-1.987.9a6.3%206.3%200%200%200-1.001.029c-.492-.564-1.207-.929-2.012-.929-1.477%200-2.679%201.202-2.679%202.679A2.65%202.65%200%200%200%20.97%206.554c-.383.747-.595%201.572-.595%202.41%200%202.311%201.507%204.29%203.635%205.107-.037.699-.147%202.27-.423%203.294l-.137.461c-.622%202.042-2.515%208.257%201.727%2010.643%201.614.908%203.06%201.248%204.317%201.248%202.665%200%204.492-1.524%205.322-2.401%201.476-1.559%202.886-1.854%206.491.82%201.877%201.393%203.514%201.753%204.861%201.068%202.223-1.713%202.811-3.867%203.399-6.374.077-.846.056-1.469.054-1.537zm-4.835%204.313c-.054.305-.156.586-.242.629-.034-.007-.131-.022-.307-.157-.145-.111-.314-.478-.456-.908.221.121.432.25.675.355.115.039.219.051.33.081zm-2.251-1.238c-.05.33-.158.648-.252.694-.022.001-.125-.018-.307-.157-.217-.166-.488-.906-.639-1.573.358.344.754.693%201.198%201.036zm-3.887-2.337c-.006-.116-.018-.231-.041-.342.635.145%201.189.368%201.599.625.097.231.166.481.174.642-.03.049-.055.101-.067.158-.046.013-.128.026-.298.004-.278-.037-.901-.57-1.367-1.087zm-1.127-.497c.116.306.176.625.12.71-.019.014-.117.045-.345.016-.206-.027-.604-.332-.986-.695.41-.051.816-.056%201.211-.031zm-4.535%201.535c.209.22.379.47.358.598-.006.041-.088.138-.351.234-.144.055-.539-.063-.979-.259a11.66%2011.66%200%200%200%20.972-.573zm.983-.664c.359-.237.738-.418%201.126-.554.25.237.479.548.457.694-.006.042-.087.138-.351.235-.174.064-.694-.105-1.232-.375zm-3.381%201.794c-.022.145-.061.29-.149.401-.133.166-.358.248-.69.251h-.002c-.133%200-.306-.26-.45-.621.417.091.854.07%201.291-.031zm-2.066-8.077a4.78%204.78%200%200%201-.775-.584c.172-.115.505-.254.88-.378l-.105.962zm-.331%202.302a10.32%2010.32%200%200%201-.828-.502c.202-.143.576-.328.984-.49l-.156.992zm-.45%202.157l-.701-.403c.214-.115.536-.249.891-.376a11.57%2011.57%200%200%201-.19.779zm-.181%201.716c.064.398.194.702.298.893-.194-.051-.435-.162-.736-.398.061-.119.224-.3.438-.495zM8.87%204.141c0%20.152-.123.276-.276.276s-.275-.124-.275-.276.123-.276.276-.276.275.124.275.276zm-.735-.389a1.15%201.15%200%200%200-.314.783%201.16%201.16%200%200%200%201.162%201.162c.457%200%20.842-.27%201.032-.653.026.117.042.238.042.362a1.68%201.68%200%200%201-1.679%201.679%201.68%201.68%200%200%201-1.679-1.679c0-.843.626-1.535%201.436-1.654zM5.059%205.406A1.68%201.68%200%200%201%203.38%207.085a1.68%201.68%200%200%201-1.679-1.679c0-.037.009-.072.011-.109.21.3.541.508.935.508a1.16%201.16%200%200%200%201.162-1.162%201.14%201.14%200%200%200-.474-.912c.015%200%20.03-.005.045-.005.926.001%201.679.754%201.679%201.68zM3.198%204.141c0%20.152-.123.276-.276.276s-.275-.124-.275-.276.123-.276.276-.276.275.124.275.276zM1.375%208.964c0-.52.103-1.035.288-1.52.466.394%201.06.64%201.717.64%201.144%200%202.116-.725%202.499-1.738.383%201.012%201.355%201.738%202.499%201.738.867%200%201.631-.421%202.121-1.062.307.605.478%201.267.478%201.942%200%202.486-2.153%204.51-4.801%204.51s-4.801-2.023-4.801-4.51zm24.342%2019.349c-.985.498-2.267.168-3.813-.979-3.073-2.281-5.453-3.199-7.813-.705-1.315%201.391-4.163%203.365-8.423.97-3.174-1.786-2.239-6.266-1.261-9.479l.146-.492c.276-1.02.395-2.457.444-3.268a6.11%206.11%200%200%200%201.18.115%206.01%206.01%200%200%200%202.536-.562l-.006.175c-.802.215-1.848.612-2.021%201.25-.079.295.021.601.274.837.219.203.415.364.598.501-.667.304-1.243.698-1.311%201.179-.02.144-.022.507.393.787.213.144.395.26.564.365-1.285.521-1.361.96-1.381%201.126-.018.142-.011.496.427.746l.854.489c-.473.389-.971.914-.999%201.429-.018.278.095.532.316.713.675.556%201.231.721%201.653.721.059%200%20.104-.014.158-.02.207.707.641%201.64%201.513%201.64h.013c.8-.008%201.236-.345%201.462-.626.173-.216.268-.457.325-.692.424.195.93.374%201.372.374.151%200%20.294-.021.423-.068.732-.27.944-.704.993-1.021.009-.061.003-.119.002-.179.266.086.538.147.789.147.15%200%20.294-.021.423-.069.542-.2.797-.489.914-.754.237.147.478.258.704.288.106.014.205.021.296.021.356%200%20.595-.101.767-.229.438.435%201.094.992%201.656%201.067.106.014.205.021.296.021a1.56%201.56%200%200%200%20.323-.035c.17.575.453%201.289.866%201.605.358.273.665.362.914.362a.99.99%200%200%200%20.421-.093%201.03%201.03%200%200%200%20.245-.164c.168.428.39.846.68%201.068.358.273.665.362.913.362a.99.99%200%200%200%20.421-.093c.317-.148.512-.448.639-.762.251.157.495.257.726.257.127%200%20.25-.024.37-.071.427-.17.706-.617.841-1.314.022-.015.047-.022.068-.038.067-.051.133-.104.196-.159-.443%201.486-1.107%202.761-2.086%203.257zM8.66%209.925a.5.5%200%201%200-1%200c0%20.653-.818%201.205-1.787%201.205s-1.787-.552-1.787-1.205a.5.5%200%201%200-1%200c0%201.216%201.25%202.205%202.787%202.205s2.787-.989%202.787-2.205zm4.4%2015.965l-.208.097c-2.661%201.258-4.708%201.436-6.086.527-1.542-1.017-1.88-3.19-1.844-4.198a.4.4%200%200%200-.385-.414c-.242-.029-.406.164-.414.385-.046%201.249.367%203.686%202.202%204.896.708.467%201.547.7%202.51.7%201.248%200%202.706-.392%204.362-1.174l.185-.086a.4.4%200%200%200%20.205-.527c-.089-.204-.326-.291-.527-.206zM9.547%202.292c.093.077.205.114.317.114a.5.5%200%200%200%20.318-.886L8.817.397a.5.5%200%200%200-.703.068.5.5%200%200%200%20.069.703l1.364%201.124zm-7.661-.065c.086%200%20.173-.022.253-.068l1.523-.893a.5.5%200%200%200-.506-.863l-1.523.892a.5.5%200%200%200-.179.685c.094.158.261.247.432.247z%22%20transform%3D%22matrix%28-1%200%200%201%2058%200%29%22%20fill%3D%22%233bb300%22/%3E%3Cpath%20d%3D%22M.3%2021.86V10.18q0-.46.02-.68.04-.22.18-.5.28-.54%201.34-.54%201.06%200%201.42.28.38.26.44.78.76-1.04%202.38-1.04%201.64%200%203.1%201.54%201.46%201.54%201.46%203.58%200%202.04-1.46%203.58-1.44%201.54-3.08%201.54-1.64%200-2.38-.92v4.04q0%20.46-.04.68-.02.22-.18.5-.14.3-.5.42-.36.12-.98.12-.62%200-1-.12-.36-.12-.52-.4-.14-.28-.18-.5-.02-.22-.02-.68zm3.96-9.42q-.46.54-.46%201.18%200%20.64.46%201.18.48.52%201.2.52.74%200%201.24-.52.52-.52.52-1.18%200-.66-.48-1.18-.48-.54-1.26-.54-.76%200-1.22.54zm14.741-8.36q.16-.3.54-.42.38-.12%201-.12.64%200%201.02.12.38.12.52.42.16.3.18.54.04.22.04.68v11.94q0%20.46-.04.7-.02.22-.18.5-.3.54-1.7.54-1.38%200-1.54-.98-.84.96-2.34.96-1.8%200-3.28-1.56-1.48-1.58-1.48-3.66%200-2.1%201.48-3.68%201.5-1.58%203.28-1.58%201.48%200%202.3%201v-4.2q0-.46.02-.68.04-.24.18-.52zm-3.24%2010.86q.52.54%201.26.54.74%200%201.22-.54.5-.54.5-1.18%200-.66-.48-1.22-.46-.56-1.26-.56-.8%200-1.28.56-.48.54-.48%201.2%200%20.66.52%201.2zm7.833-1.2q0-2.4%201.68-3.96%201.68-1.56%203.84-1.56%202.16%200%203.82%201.56%201.66%201.54%201.66%203.94%200%201.66-.86%202.96-.86%201.28-2.1%201.9-1.22.6-2.54.6-1.32%200-2.56-.64-1.24-.66-2.1-1.92-.84-1.28-.84-2.88zm4.18%201.44q.64.48%201.3.48.66%200%201.32-.5.66-.5.66-1.48%200-.98-.62-1.46-.62-.48-1.34-.48-.72%200-1.34.5-.62.5-.62%201.48%200%20.96.64%201.46zm11.412-1.44q0%20.84.56%201.32.56.46%201.18.46.64%200%201.18-.36.56-.38.9-.38.6%200%201.46%201.06.46.58.46%201.04%200%20.76-1.1%201.42-1.14.8-2.8.8-1.86%200-3.58-1.34-.82-.64-1.34-1.7-.52-1.08-.52-2.36%200-1.3.52-2.34.52-1.06%201.34-1.7%201.66-1.32%203.54-1.32.76%200%201.48.22.72.2%201.06.4l.32.2q.36.24.56.38.52.4.52.92%200%20.5-.42%201.14-.72%201.1-1.38%201.1-.38%200-1.08-.44-.36-.34-1.04-.34-.66%200-1.24.48-.58.48-.58%201.34z%22%20fill%3D%22green%22/%3E%3C/svg%3E"/>
+        </a>
+</div>
+    </nav>
+    <main class="pdoc">
+            <section class="module-info">
+                    <h1 class="modulename">
+shimmer<wbr>.types    </h1>
+
+                
+                        <input id="mod-types-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
+
+                        <label class="view-source-button" for="mod-types-view-source"><span>View Source</span></label>
+
+                        <div class="pdoc-code codehilite"><pre><span></span><span id="L-1"><a href="#L-1"><span class="linenos">  1</span></a><span class="kn">from</span> <span class="nn">collections.abc</span> <span class="kn">import</span> <span class="n">Mapping</span>
+</span><span id="L-2"><a href="#L-2"><span class="linenos">  2</span></a><span class="kn">from</span> <span class="nn">typing</span> <span class="kn">import</span> <span class="n">Any</span><span class="p">,</span> <span class="n">Literal</span>
+</span><span id="L-3"><a href="#L-3"><span class="linenos">  3</span></a>
+</span><span id="L-4"><a href="#L-4"><span class="linenos">  4</span></a><span class="kn">import</span> <span class="nn">torch</span>
+</span><span id="L-5"><a href="#L-5"><span class="linenos">  5</span></a>
+</span><span id="L-6"><a href="#L-6"><span class="linenos">  6</span></a><span class="n">RawDomainGroupT</span> <span class="o">=</span> <span class="n">Mapping</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">Any</span><span class="p">]</span>
+</span><span id="L-7"><a href="#L-7"><span class="linenos">  7</span></a><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="L-8"><a href="#L-8"><span class="linenos">  8</span></a><span class="sd">Matched raw unimodal data from multiple domains.</span>
+</span><span id="L-9"><a href="#L-9"><span class="linenos">  9</span></a><span class="sd">Keys of the mapping are domains names and values are the domain data.</span>
+</span><span id="L-10"><a href="#L-10"><span class="linenos"> 10</span></a>
+</span><span id="L-11"><a href="#L-11"><span class="linenos"> 11</span></a><span class="sd">All values in the mapping should be matched and represent the same information.</span>
+</span><span id="L-12"><a href="#L-12"><span class="linenos"> 12</span></a>
+</span><span id="L-13"><a href="#L-13"><span class="linenos"> 13</span></a><span class="sd">Example:</span>
+</span><span id="L-14"><a href="#L-14"><span class="linenos"> 14</span></a><span class="sd">    ```python</span>
+</span><span id="L-15"><a href="#L-15"><span class="linenos"> 15</span></a><span class="sd">    def fun(domain_group: RawDomainGroupT): ...</span>
+</span><span id="L-16"><a href="#L-16"><span class="linenos"> 16</span></a>
+</span><span id="L-17"><a href="#L-17"><span class="linenos"> 17</span></a>
+</span><span id="L-18"><a href="#L-18"><span class="linenos"> 18</span></a><span class="sd">    x = {</span>
+</span><span id="L-19"><a href="#L-19"><span class="linenos"> 19</span></a><span class="sd">        &quot;vision&quot;: PIL.Image.Image(&quot;path/to/dog/picture.png&quot;),</span>
+</span><span id="L-20"><a href="#L-20"><span class="linenos"> 20</span></a><span class="sd">        &quot;language&quot;: &quot;This is a picture of a dog.&quot;,</span>
+</span><span id="L-21"><a href="#L-21"><span class="linenos"> 21</span></a><span class="sd">    }</span>
+</span><span id="L-22"><a href="#L-22"><span class="linenos"> 22</span></a>
+</span><span id="L-23"><a href="#L-23"><span class="linenos"> 23</span></a><span class="sd">    fun(x)</span>
+</span><span id="L-24"><a href="#L-24"><span class="linenos"> 24</span></a><span class="sd">    ```</span>
+</span><span id="L-25"><a href="#L-25"><span class="linenos"> 25</span></a>
+</span><span id="L-26"><a href="#L-26"><span class="linenos"> 26</span></a><span class="sd">Note:</span>
+</span><span id="L-27"><a href="#L-27"><span class="linenos"> 27</span></a><span class="sd">    This type uses `collections.abc.Mapping` and is used for functions&#39; inputs.</span>
+</span><span id="L-28"><a href="#L-28"><span class="linenos"> 28</span></a><span class="sd">    Use `RawDomainGroupDT` for functions&#39; outputs.</span>
+</span><span id="L-29"><a href="#L-29"><span class="linenos"> 29</span></a>
+</span><span id="L-30"><a href="#L-30"><span class="linenos"> 30</span></a><span class="sd">    This allows to be more generic and allow passing other mappings.</span>
+</span><span id="L-31"><a href="#L-31"><span class="linenos"> 31</span></a><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="L-32"><a href="#L-32"><span class="linenos"> 32</span></a>
+</span><span id="L-33"><a href="#L-33"><span class="linenos"> 33</span></a><span class="n">RawDomainGroupDT</span> <span class="o">=</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">Any</span><span class="p">]</span>
+</span><span id="L-34"><a href="#L-34"><span class="linenos"> 34</span></a><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="L-35"><a href="#L-35"><span class="linenos"> 35</span></a><span class="sd">Output type version of `RawDomainGroupT`.</span>
+</span><span id="L-36"><a href="#L-36"><span class="linenos"> 36</span></a><span class="sd">Matched raw unimodal data from multiple domains.</span>
+</span><span id="L-37"><a href="#L-37"><span class="linenos"> 37</span></a><span class="sd">Keys of the mapping are domains names and values are the domain data.</span>
+</span><span id="L-38"><a href="#L-38"><span class="linenos"> 38</span></a>
+</span><span id="L-39"><a href="#L-39"><span class="linenos"> 39</span></a><span class="sd">Example:</span>
+</span><span id="L-40"><a href="#L-40"><span class="linenos"> 40</span></a><span class="sd">    ```python</span>
+</span><span id="L-41"><a href="#L-41"><span class="linenos"> 41</span></a><span class="sd">    def fun() -&gt; RawDomainGroupDT:</span>
+</span><span id="L-42"><a href="#L-42"><span class="linenos"> 42</span></a><span class="sd">        return {</span>
+</span><span id="L-43"><a href="#L-43"><span class="linenos"> 43</span></a><span class="sd">            &quot;vision&quot;: PIL.Image.Image(&quot;path/to/dog/picture.png&quot;),</span>
+</span><span id="L-44"><a href="#L-44"><span class="linenos"> 44</span></a><span class="sd">            &quot;language&quot;: &quot;This is a picture of a dog.&quot;,</span>
+</span><span id="L-45"><a href="#L-45"><span class="linenos"> 45</span></a><span class="sd">        }</span>
+</span><span id="L-46"><a href="#L-46"><span class="linenos"> 46</span></a>
+</span><span id="L-47"><a href="#L-47"><span class="linenos"> 47</span></a><span class="sd">    ```</span>
+</span><span id="L-48"><a href="#L-48"><span class="linenos"> 48</span></a>
+</span><span id="L-49"><a href="#L-49"><span class="linenos"> 49</span></a><span class="sd">Note:</span>
+</span><span id="L-50"><a href="#L-50"><span class="linenos"> 50</span></a><span class="sd">    This type uses `dict`s and is used for functions&#39; outputs.</span>
+</span><span id="L-51"><a href="#L-51"><span class="linenos"> 51</span></a><span class="sd">    Use `RawDomainGroupT` for functions&#39; inputs.</span>
+</span><span id="L-52"><a href="#L-52"><span class="linenos"> 52</span></a>
+</span><span id="L-53"><a href="#L-53"><span class="linenos"> 53</span></a><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="L-54"><a href="#L-54"><span class="linenos"> 54</span></a>
+</span><span id="L-55"><a href="#L-55"><span class="linenos"> 55</span></a><span class="n">LatentsDomainGroupT</span> <span class="o">=</span> <span class="n">Mapping</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]</span>
+</span><span id="L-56"><a href="#L-56"><span class="linenos"> 56</span></a><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="L-57"><a href="#L-57"><span class="linenos"> 57</span></a><span class="sd">Matched unimodal latent representations from multiple domains.</span>
+</span><span id="L-58"><a href="#L-58"><span class="linenos"> 58</span></a><span class="sd">Keys of the mapping are domains names and values are `torch.Tensor` latent</span>
+</span><span id="L-59"><a href="#L-59"><span class="linenos"> 59</span></a><span class="sd">representation of the domain.</span>
+</span><span id="L-60"><a href="#L-60"><span class="linenos"> 60</span></a>
+</span><span id="L-61"><a href="#L-61"><span class="linenos"> 61</span></a><span class="sd">Example:</span>
+</span><span id="L-62"><a href="#L-62"><span class="linenos"> 62</span></a><span class="sd">    ```python</span>
+</span><span id="L-63"><a href="#L-63"><span class="linenos"> 63</span></a><span class="sd">    def fun(domain_group: LatentsDomainGroupT): ...</span>
+</span><span id="L-64"><a href="#L-64"><span class="linenos"> 64</span></a>
+</span><span id="L-65"><a href="#L-65"><span class="linenos"> 65</span></a>
+</span><span id="L-66"><a href="#L-66"><span class="linenos"> 66</span></a><span class="sd">    x = {</span>
+</span><span id="L-67"><a href="#L-67"><span class="linenos"> 67</span></a><span class="sd">        &quot;vision&quot;: torch.Tensor([0.0, 1.0, 0.0, ...]),</span>
+</span><span id="L-68"><a href="#L-68"><span class="linenos"> 68</span></a><span class="sd">        &quot;language&quot;: torch.Tensor([0.0, 0.3, 0.2, ...]),</span>
+</span><span id="L-69"><a href="#L-69"><span class="linenos"> 69</span></a><span class="sd">    }</span>
+</span><span id="L-70"><a href="#L-70"><span class="linenos"> 70</span></a>
+</span><span id="L-71"><a href="#L-71"><span class="linenos"> 71</span></a><span class="sd">    fun(x)</span>
+</span><span id="L-72"><a href="#L-72"><span class="linenos"> 72</span></a><span class="sd">    ```</span>
+</span><span id="L-73"><a href="#L-73"><span class="linenos"> 73</span></a>
+</span><span id="L-74"><a href="#L-74"><span class="linenos"> 74</span></a><span class="sd">Note:</span>
+</span><span id="L-75"><a href="#L-75"><span class="linenos"> 75</span></a><span class="sd">    This type uses `collections.abc.Mapping` and is used for functions&#39; inputs.</span>
+</span><span id="L-76"><a href="#L-76"><span class="linenos"> 76</span></a><span class="sd">    Use `LatentsDomainGroupDT` for functions&#39; outputs.</span>
+</span><span id="L-77"><a href="#L-77"><span class="linenos"> 77</span></a>
+</span><span id="L-78"><a href="#L-78"><span class="linenos"> 78</span></a><span class="sd">    This allows to be more generic and allow passing other mappings.</span>
+</span><span id="L-79"><a href="#L-79"><span class="linenos"> 79</span></a><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="L-80"><a href="#L-80"><span class="linenos"> 80</span></a>
+</span><span id="L-81"><a href="#L-81"><span class="linenos"> 81</span></a><span class="n">LatentsDomainGroupDT</span> <span class="o">=</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]</span>
+</span><span id="L-82"><a href="#L-82"><span class="linenos"> 82</span></a><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="L-83"><a href="#L-83"><span class="linenos"> 83</span></a><span class="sd">Matched unimodal latent representations from multiple domains.</span>
+</span><span id="L-84"><a href="#L-84"><span class="linenos"> 84</span></a><span class="sd">Keys of the dict are domains names and values are `torch.Tensor` latent</span>
+</span><span id="L-85"><a href="#L-85"><span class="linenos"> 85</span></a><span class="sd">representation of the domain.</span>
+</span><span id="L-86"><a href="#L-86"><span class="linenos"> 86</span></a>
+</span><span id="L-87"><a href="#L-87"><span class="linenos"> 87</span></a><span class="sd">Example:</span>
+</span><span id="L-88"><a href="#L-88"><span class="linenos"> 88</span></a><span class="sd">    ```python</span>
+</span><span id="L-89"><a href="#L-89"><span class="linenos"> 89</span></a><span class="sd">    def fun() -&gt; LatentsDomainGroupDT:</span>
+</span><span id="L-90"><a href="#L-90"><span class="linenos"> 90</span></a><span class="sd">        return {</span>
+</span><span id="L-91"><a href="#L-91"><span class="linenos"> 91</span></a><span class="sd">            &quot;vision&quot;: torch.Tensor([0.0, 1.0, 0.0, ...]),</span>
+</span><span id="L-92"><a href="#L-92"><span class="linenos"> 92</span></a><span class="sd">            &quot;language&quot;: torch.Tensor([0.0, 0.3, 0.2, ...]),</span>
+</span><span id="L-93"><a href="#L-93"><span class="linenos"> 93</span></a><span class="sd">        }</span>
+</span><span id="L-94"><a href="#L-94"><span class="linenos"> 94</span></a>
+</span><span id="L-95"><a href="#L-95"><span class="linenos"> 95</span></a><span class="sd">    ```</span>
+</span><span id="L-96"><a href="#L-96"><span class="linenos"> 96</span></a>
+</span><span id="L-97"><a href="#L-97"><span class="linenos"> 97</span></a><span class="sd">Note:</span>
+</span><span id="L-98"><a href="#L-98"><span class="linenos"> 98</span></a><span class="sd">    This type uses `dict`s and is used for functions&#39; outputs.</span>
+</span><span id="L-99"><a href="#L-99"><span class="linenos"> 99</span></a><span class="sd">    Use `LatentsDomainGroupT` for functions&#39; inputs.</span>
+</span><span id="L-100"><a href="#L-100"><span class="linenos">100</span></a><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="L-101"><a href="#L-101"><span class="linenos">101</span></a>
+</span><span id="L-102"><a href="#L-102"><span class="linenos">102</span></a><span class="n">RawDomainGroupsT</span> <span class="o">=</span> <span class="n">Mapping</span><span class="p">[</span><span class="nb">frozenset</span><span class="p">[</span><span class="nb">str</span><span class="p">],</span> <span class="n">RawDomainGroupT</span><span class="p">]</span>
+</span><span id="L-103"><a href="#L-103"><span class="linenos">103</span></a><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="L-104"><a href="#L-104"><span class="linenos">104</span></a><span class="sd">Mapping of `RawDomainGroupT`. Keys are frozenset of domains matched in the group.</span>
+</span><span id="L-105"><a href="#L-105"><span class="linenos">105</span></a><span class="sd">Each group is independent and contains different data (unpaired).</span>
+</span><span id="L-106"><a href="#L-106"><span class="linenos">106</span></a>
+</span><span id="L-107"><a href="#L-107"><span class="linenos">107</span></a><span class="sd">Example:</span>
+</span><span id="L-108"><a href="#L-108"><span class="linenos">108</span></a><span class="sd">    ```python</span>
+</span><span id="L-109"><a href="#L-109"><span class="linenos">109</span></a><span class="sd">    def fun() -&gt; RawDomainGroupsDT:</span>
+</span><span id="L-110"><a href="#L-110"><span class="linenos">110</span></a><span class="sd">        return {</span>
+</span><span id="L-111"><a href="#L-111"><span class="linenos">111</span></a><span class="sd">            frozenset([&quot;vision&quot;]): {</span>
+</span><span id="L-112"><a href="#L-112"><span class="linenos">112</span></a><span class="sd">                &quot;vision&quot;: PIL.Image.Image(&quot;path/to/cat/picture.png&quot;),</span>
+</span><span id="L-113"><a href="#L-113"><span class="linenos">113</span></a><span class="sd">            },</span>
+</span><span id="L-114"><a href="#L-114"><span class="linenos">114</span></a><span class="sd">            frozenset([&quot;language&quot;]): {</span>
+</span><span id="L-115"><a href="#L-115"><span class="linenos">115</span></a><span class="sd">                &quot;language&quot;: &quot;This is a picture of a rabbit.&quot;,</span>
+</span><span id="L-116"><a href="#L-116"><span class="linenos">116</span></a><span class="sd">            },</span>
+</span><span id="L-117"><a href="#L-117"><span class="linenos">117</span></a><span class="sd">            frozenset([&quot;vision&quot;, &quot;language&quot;]): {</span>
+</span><span id="L-118"><a href="#L-118"><span class="linenos">118</span></a><span class="sd">                &quot;vision&quot;: PIL.Image.Image(&quot;path/to/dog/picture.png&quot;),</span>
+</span><span id="L-119"><a href="#L-119"><span class="linenos">119</span></a><span class="sd">                &quot;language&quot;: &quot;This is a picture of a dog.&quot;,</span>
+</span><span id="L-120"><a href="#L-120"><span class="linenos">120</span></a><span class="sd">            },</span>
+</span><span id="L-121"><a href="#L-121"><span class="linenos">121</span></a><span class="sd">        }</span>
+</span><span id="L-122"><a href="#L-122"><span class="linenos">122</span></a>
+</span><span id="L-123"><a href="#L-123"><span class="linenos">123</span></a><span class="sd">    ```</span>
+</span><span id="L-124"><a href="#L-124"><span class="linenos">124</span></a>
+</span><span id="L-125"><a href="#L-125"><span class="linenos">125</span></a><span class="sd">Note:</span>
+</span><span id="L-126"><a href="#L-126"><span class="linenos">126</span></a><span class="sd">    This type uses `dict`s and is used for functions&#39; outputs.</span>
+</span><span id="L-127"><a href="#L-127"><span class="linenos">127</span></a><span class="sd">    Use `RawDomainGroupsT` for functions&#39; inputs.</span>
+</span><span id="L-128"><a href="#L-128"><span class="linenos">128</span></a><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="L-129"><a href="#L-129"><span class="linenos">129</span></a>
+</span><span id="L-130"><a href="#L-130"><span class="linenos">130</span></a><span class="n">RawDomainGroupsDT</span> <span class="o">=</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">frozenset</span><span class="p">[</span><span class="nb">str</span><span class="p">],</span> <span class="n">RawDomainGroupDT</span><span class="p">]</span>
+</span><span id="L-131"><a href="#L-131"><span class="linenos">131</span></a><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="L-132"><a href="#L-132"><span class="linenos">132</span></a><span class="sd">Mapping of `RawDomainGroupT`. Keys are frozenset of domains matched in the group.</span>
+</span><span id="L-133"><a href="#L-133"><span class="linenos">133</span></a><span class="sd">Each group is independent and contains different data (unpaired).</span>
+</span><span id="L-134"><a href="#L-134"><span class="linenos">134</span></a>
+</span><span id="L-135"><a href="#L-135"><span class="linenos">135</span></a><span class="sd">Example:</span>
+</span><span id="L-136"><a href="#L-136"><span class="linenos">136</span></a><span class="sd">    ```python</span>
+</span><span id="L-137"><a href="#L-137"><span class="linenos">137</span></a><span class="sd">    def fun() -&gt; RawDomainGroupsDT:</span>
+</span><span id="L-138"><a href="#L-138"><span class="linenos">138</span></a><span class="sd">        return {</span>
+</span><span id="L-139"><a href="#L-139"><span class="linenos">139</span></a><span class="sd">            frozenset([&quot;vision&quot;]): {</span>
+</span><span id="L-140"><a href="#L-140"><span class="linenos">140</span></a><span class="sd">                &quot;vision&quot;: PIL.Image.Image(&quot;path/to/cat/picture.png&quot;),</span>
+</span><span id="L-141"><a href="#L-141"><span class="linenos">141</span></a><span class="sd">            },</span>
+</span><span id="L-142"><a href="#L-142"><span class="linenos">142</span></a><span class="sd">            frozenset([&quot;language&quot;]): {</span>
+</span><span id="L-143"><a href="#L-143"><span class="linenos">143</span></a><span class="sd">                &quot;language&quot;: &quot;This is a picture of a rabbit.&quot;,</span>
+</span><span id="L-144"><a href="#L-144"><span class="linenos">144</span></a><span class="sd">            },</span>
+</span><span id="L-145"><a href="#L-145"><span class="linenos">145</span></a><span class="sd">            frozenset([&quot;vision&quot;, &quot;language&quot;]): {</span>
+</span><span id="L-146"><a href="#L-146"><span class="linenos">146</span></a><span class="sd">                &quot;vision&quot;: PIL.Image.Image(&quot;path/to/dog/picture.png&quot;),</span>
+</span><span id="L-147"><a href="#L-147"><span class="linenos">147</span></a><span class="sd">                &quot;language&quot;: &quot;This is a picture of a dog.&quot;,</span>
+</span><span id="L-148"><a href="#L-148"><span class="linenos">148</span></a><span class="sd">            },</span>
+</span><span id="L-149"><a href="#L-149"><span class="linenos">149</span></a><span class="sd">        }</span>
+</span><span id="L-150"><a href="#L-150"><span class="linenos">150</span></a>
+</span><span id="L-151"><a href="#L-151"><span class="linenos">151</span></a><span class="sd">    ```</span>
+</span><span id="L-152"><a href="#L-152"><span class="linenos">152</span></a>
+</span><span id="L-153"><a href="#L-153"><span class="linenos">153</span></a><span class="sd">Note:</span>
+</span><span id="L-154"><a href="#L-154"><span class="linenos">154</span></a><span class="sd">    This type uses `dict`s and is used for functions&#39; outputs.</span>
+</span><span id="L-155"><a href="#L-155"><span class="linenos">155</span></a><span class="sd">    Use `RawDomainGroupsT` for functions&#39; inputs.</span>
+</span><span id="L-156"><a href="#L-156"><span class="linenos">156</span></a><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="L-157"><a href="#L-157"><span class="linenos">157</span></a>
+</span><span id="L-158"><a href="#L-158"><span class="linenos">158</span></a><span class="n">LatentsDomainGroupsT</span> <span class="o">=</span> <span class="n">Mapping</span><span class="p">[</span><span class="nb">frozenset</span><span class="p">[</span><span class="nb">str</span><span class="p">],</span> <span class="n">LatentsDomainGroupT</span><span class="p">]</span>
+</span><span id="L-159"><a href="#L-159"><span class="linenos">159</span></a><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="L-160"><a href="#L-160"><span class="linenos">160</span></a><span class="sd">Mapping of `LatentsDomainGroupT`. Keys are frozenset of domains matched in the group.</span>
+</span><span id="L-161"><a href="#L-161"><span class="linenos">161</span></a><span class="sd">Each group is independent and contains different data (unpaired).</span>
+</span><span id="L-162"><a href="#L-162"><span class="linenos">162</span></a>
+</span><span id="L-163"><a href="#L-163"><span class="linenos">163</span></a><span class="sd">Example:</span>
+</span><span id="L-164"><a href="#L-164"><span class="linenos">164</span></a><span class="sd">    ```python</span>
+</span><span id="L-165"><a href="#L-165"><span class="linenos">165</span></a><span class="sd">    def fun(domain_group: LatentsDomainGroupsT): ...</span>
+</span><span id="L-166"><a href="#L-166"><span class="linenos">166</span></a>
+</span><span id="L-167"><a href="#L-167"><span class="linenos">167</span></a>
+</span><span id="L-168"><a href="#L-168"><span class="linenos">168</span></a><span class="sd">    x = {</span>
+</span><span id="L-169"><a href="#L-169"><span class="linenos">169</span></a><span class="sd">        frozenset([&quot;vision&quot;]): {</span>
+</span><span id="L-170"><a href="#L-170"><span class="linenos">170</span></a><span class="sd">            &quot;vision&quot;: torch.Tensor([1.0, 0.0, 0.3, ...]),</span>
+</span><span id="L-171"><a href="#L-171"><span class="linenos">171</span></a><span class="sd">        },</span>
+</span><span id="L-172"><a href="#L-172"><span class="linenos">172</span></a><span class="sd">        frozenset([&quot;language&quot;]): {</span>
+</span><span id="L-173"><a href="#L-173"><span class="linenos">173</span></a><span class="sd">            &quot;language&quot;: torch.Tensor([1.0, 0.2, 0.9, ...]),</span>
+</span><span id="L-174"><a href="#L-174"><span class="linenos">174</span></a><span class="sd">        },</span>
+</span><span id="L-175"><a href="#L-175"><span class="linenos">175</span></a><span class="sd">        frozenset([&quot;vision&quot;, &quot;language&quot;]): {</span>
+</span><span id="L-176"><a href="#L-176"><span class="linenos">176</span></a><span class="sd">            &quot;vision&quot;: torch.Tensor([0.0, 1.0, 0.0, ...]),</span>
+</span><span id="L-177"><a href="#L-177"><span class="linenos">177</span></a><span class="sd">            &quot;language&quot;: torch.Tensor([0.0, 0.3, 0.2, ...]),</span>
+</span><span id="L-178"><a href="#L-178"><span class="linenos">178</span></a><span class="sd">        },</span>
+</span><span id="L-179"><a href="#L-179"><span class="linenos">179</span></a><span class="sd">    }</span>
+</span><span id="L-180"><a href="#L-180"><span class="linenos">180</span></a>
+</span><span id="L-181"><a href="#L-181"><span class="linenos">181</span></a><span class="sd">    fun(x)</span>
+</span><span id="L-182"><a href="#L-182"><span class="linenos">182</span></a><span class="sd">    ```</span>
+</span><span id="L-183"><a href="#L-183"><span class="linenos">183</span></a><span class="sd">Note:</span>
+</span><span id="L-184"><a href="#L-184"><span class="linenos">184</span></a><span class="sd">    This type uses `collections.abc.Mapping` and is used for functions&#39; inputs.</span>
+</span><span id="L-185"><a href="#L-185"><span class="linenos">185</span></a><span class="sd">    Use `LatentsDomainGroupsDT` for functions&#39; outputs.</span>
+</span><span id="L-186"><a href="#L-186"><span class="linenos">186</span></a>
+</span><span id="L-187"><a href="#L-187"><span class="linenos">187</span></a><span class="sd">    This allows to be more generic and allow passing other mappings.</span>
+</span><span id="L-188"><a href="#L-188"><span class="linenos">188</span></a>
+</span><span id="L-189"><a href="#L-189"><span class="linenos">189</span></a><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="L-190"><a href="#L-190"><span class="linenos">190</span></a>
+</span><span id="L-191"><a href="#L-191"><span class="linenos">191</span></a><span class="n">LatentsDomainGroupsDT</span> <span class="o">=</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">frozenset</span><span class="p">[</span><span class="nb">str</span><span class="p">],</span> <span class="n">LatentsDomainGroupDT</span><span class="p">]</span>
+</span><span id="L-192"><a href="#L-192"><span class="linenos">192</span></a><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="L-193"><a href="#L-193"><span class="linenos">193</span></a><span class="sd">Mapping of `LatentsDomainGroupDT`.</span>
+</span><span id="L-194"><a href="#L-194"><span class="linenos">194</span></a><span class="sd">Keys are frozenset of domains matched in the group.</span>
+</span><span id="L-195"><a href="#L-195"><span class="linenos">195</span></a><span class="sd">Each group is independent and contains different data (unpaired).</span>
+</span><span id="L-196"><a href="#L-196"><span class="linenos">196</span></a>
+</span><span id="L-197"><a href="#L-197"><span class="linenos">197</span></a><span class="sd">Example:</span>
+</span><span id="L-198"><a href="#L-198"><span class="linenos">198</span></a><span class="sd">    ```python</span>
+</span><span id="L-199"><a href="#L-199"><span class="linenos">199</span></a><span class="sd">    def fun() -&gt; LatentsDomainGroupsDT:</span>
+</span><span id="L-200"><a href="#L-200"><span class="linenos">200</span></a><span class="sd">        return {</span>
+</span><span id="L-201"><a href="#L-201"><span class="linenos">201</span></a><span class="sd">            frozenset([&quot;vision&quot;]): {</span>
+</span><span id="L-202"><a href="#L-202"><span class="linenos">202</span></a><span class="sd">                &quot;vision&quot;: torch.Tensor([1.0, 0.0, 0.3, ...]),</span>
+</span><span id="L-203"><a href="#L-203"><span class="linenos">203</span></a><span class="sd">            },</span>
+</span><span id="L-204"><a href="#L-204"><span class="linenos">204</span></a><span class="sd">            frozenset([&quot;language&quot;]): {</span>
+</span><span id="L-205"><a href="#L-205"><span class="linenos">205</span></a><span class="sd">                &quot;language&quot;: torch.Tensor([1.0, 0.2, 0.9, ...]),</span>
+</span><span id="L-206"><a href="#L-206"><span class="linenos">206</span></a><span class="sd">            },</span>
+</span><span id="L-207"><a href="#L-207"><span class="linenos">207</span></a><span class="sd">            frozenset([&quot;vision&quot;, &quot;language&quot;]): {</span>
+</span><span id="L-208"><a href="#L-208"><span class="linenos">208</span></a><span class="sd">                &quot;vision&quot;: torch.Tensor([0.0, 1.0, 0.0, ...]),</span>
+</span><span id="L-209"><a href="#L-209"><span class="linenos">209</span></a><span class="sd">                &quot;language&quot;: torch.Tensor([0.0, 0.3, 0.2, ...]),</span>
+</span><span id="L-210"><a href="#L-210"><span class="linenos">210</span></a><span class="sd">            },</span>
+</span><span id="L-211"><a href="#L-211"><span class="linenos">211</span></a><span class="sd">        }</span>
+</span><span id="L-212"><a href="#L-212"><span class="linenos">212</span></a>
+</span><span id="L-213"><a href="#L-213"><span class="linenos">213</span></a><span class="sd">    ```</span>
+</span><span id="L-214"><a href="#L-214"><span class="linenos">214</span></a>
+</span><span id="L-215"><a href="#L-215"><span class="linenos">215</span></a><span class="sd">Note:</span>
+</span><span id="L-216"><a href="#L-216"><span class="linenos">216</span></a><span class="sd">    This type uses `dict`s and is used for functions&#39; outputs.</span>
+</span><span id="L-217"><a href="#L-217"><span class="linenos">217</span></a><span class="sd">    Use `LatentsDomainGroupT` for functions&#39; inputs.</span>
+</span><span id="L-218"><a href="#L-218"><span class="linenos">218</span></a><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="L-219"><a href="#L-219"><span class="linenos">219</span></a>
+</span><span id="L-220"><a href="#L-220"><span class="linenos">220</span></a>
+</span><span id="L-221"><a href="#L-221"><span class="linenos">221</span></a><span class="n">ModelModeT</span> <span class="o">=</span> <span class="n">Literal</span><span class="p">[</span><span class="s2">&quot;train&quot;</span><span class="p">,</span> <span class="s2">&quot;val&quot;</span><span class="p">,</span> <span class="s2">&quot;test&quot;</span><span class="p">,</span> <span class="s2">&quot;val/ood&quot;</span><span class="p">,</span> <span class="s2">&quot;test/ood&quot;</span><span class="p">]</span>
+</span><span id="L-222"><a href="#L-222"><span class="linenos">222</span></a><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="L-223"><a href="#L-223"><span class="linenos">223</span></a><span class="sd">Mode used by pytorch lightning (train/val, ...).</span>
+</span><span id="L-224"><a href="#L-224"><span class="linenos">224</span></a>
+</span><span id="L-225"><a href="#L-225"><span class="linenos">225</span></a><span class="sd">When validating or testing in out-of-distribution data, &quot;val/ood&quot; or &quot;test/ood&quot; mode is</span>
+</span><span id="L-226"><a href="#L-226"><span class="linenos">226</span></a><span class="sd">used.</span>
+</span><span id="L-227"><a href="#L-227"><span class="linenos">227</span></a><span class="sd">&quot;&quot;&quot;</span>
+</span></pre></div>
+
+
+            </section>
+                <section id="RawDomainGroupT">
+                    <div class="attr variable">
+            <span class="name">RawDomainGroupT</span>        =
+<span class="default_value">collections.abc.Mapping[str, typing.Any]</span>
+
+        
+    </div>
+    <a class="headerlink" href="#RawDomainGroupT"></a>
+    
+            <div class="docstring"><p>Matched raw unimodal data from multiple domains.
+Keys of the mapping are domains names and values are the domain data.</p>
+
+<p>All values in the mapping should be matched and represent the same information.</p>
+
+<h6 id="example">Example:</h6>
+
+<blockquote>
+  <div class="pdoc-code codehilite">
+<pre><span></span><code><span class="k">def</span> <span class="nf">fun</span><span class="p">(</span><span class="n">domain_group</span><span class="p">:</span> <span class="n">RawDomainGroupT</span><span class="p">):</span> <span class="o">...</span>
+
+
+<span class="n">x</span> <span class="o">=</span> <span class="p">{</span>
+    <span class="s2">&quot;vision&quot;</span><span class="p">:</span> <span class="n">PIL</span><span class="o">.</span><span class="n">Image</span><span class="o">.</span><span class="n">Image</span><span class="p">(</span><span class="s2">&quot;path/to/dog/picture.png&quot;</span><span class="p">),</span>
+    <span class="s2">&quot;language&quot;</span><span class="p">:</span> <span class="s2">&quot;This is a picture of a dog.&quot;</span><span class="p">,</span>
+<span class="p">}</span>
+
+<span class="n">fun</span><span class="p">(</span><span class="n">x</span><span class="p">)</span>
+</code></pre>
+  </div>
+</blockquote>
+
+<h6 id="note">Note:</h6>
+
+<blockquote>
+  <p>This type uses <code>collections.abc.Mapping</code> and is used for functions' inputs.
+  Use <code><a href="#RawDomainGroupDT">RawDomainGroupDT</a></code> for functions' outputs.</p>
+  
+  <p>This allows to be more generic and allow passing other mappings.</p>
+</blockquote>
+</div>
+
+
+                </section>
+                <section id="RawDomainGroupDT">
+                    <div class="attr variable">
+            <span class="name">RawDomainGroupDT</span>        =
+<span class="default_value">dict[str, typing.Any]</span>
+
+        
+    </div>
+    <a class="headerlink" href="#RawDomainGroupDT"></a>
+    
+            <div class="docstring"><p>Output type version of <code><a href="#RawDomainGroupT">RawDomainGroupT</a></code>.
+Matched raw unimodal data from multiple domains.
+Keys of the mapping are domains names and values are the domain data.</p>
+
+<h6 id="example">Example:</h6>
+
+<blockquote>
+  <div class="pdoc-code codehilite">
+<pre><span></span><code><span class="k">def</span> <span class="nf">fun</span><span class="p">()</span> <span class="o">-&gt;</span> <span class="n">RawDomainGroupDT</span><span class="p">:</span>
+    <span class="k">return</span> <span class="p">{</span>
+        <span class="s2">&quot;vision&quot;</span><span class="p">:</span> <span class="n">PIL</span><span class="o">.</span><span class="n">Image</span><span class="o">.</span><span class="n">Image</span><span class="p">(</span><span class="s2">&quot;path/to/dog/picture.png&quot;</span><span class="p">),</span>
+        <span class="s2">&quot;language&quot;</span><span class="p">:</span> <span class="s2">&quot;This is a picture of a dog.&quot;</span><span class="p">,</span>
+    <span class="p">}</span>
+</code></pre>
+  </div>
+</blockquote>
+
+<h6 id="note">Note:</h6>
+
+<blockquote>
+  <p>This type uses <code>dict</code>s and is used for functions' outputs.
+  Use <code><a href="#RawDomainGroupT">RawDomainGroupT</a></code> for functions' inputs.</p>
+</blockquote>
+</div>
+
+
+                </section>
+                <section id="LatentsDomainGroupT">
+                    <div class="attr variable">
+            <span class="name">LatentsDomainGroupT</span>        =
+<span class="default_value">collections.abc.Mapping[str, torch.Tensor]</span>
+
+        
+    </div>
+    <a class="headerlink" href="#LatentsDomainGroupT"></a>
+    
+            <div class="docstring"><p>Matched unimodal latent representations from multiple domains.
+Keys of the mapping are domains names and values are <code>torch.Tensor</code> latent
+representation of the domain.</p>
+
+<h6 id="example">Example:</h6>
+
+<blockquote>
+  <div class="pdoc-code codehilite">
+<pre><span></span><code><span class="k">def</span> <span class="nf">fun</span><span class="p">(</span><span class="n">domain_group</span><span class="p">:</span> <span class="n">LatentsDomainGroupT</span><span class="p">):</span> <span class="o">...</span>
+
+
+<span class="n">x</span> <span class="o">=</span> <span class="p">{</span>
+    <span class="s2">&quot;vision&quot;</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">([</span><span class="mf">0.0</span><span class="p">,</span> <span class="mf">1.0</span><span class="p">,</span> <span class="mf">0.0</span><span class="p">,</span> <span class="o">...</span><span class="p">]),</span>
+    <span class="s2">&quot;language&quot;</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">([</span><span class="mf">0.0</span><span class="p">,</span> <span class="mf">0.3</span><span class="p">,</span> <span class="mf">0.2</span><span class="p">,</span> <span class="o">...</span><span class="p">]),</span>
+<span class="p">}</span>
+
+<span class="n">fun</span><span class="p">(</span><span class="n">x</span><span class="p">)</span>
+</code></pre>
+  </div>
+</blockquote>
+
+<h6 id="note">Note:</h6>
+
+<blockquote>
+  <p>This type uses <code>collections.abc.Mapping</code> and is used for functions' inputs.
+  Use <code><a href="#LatentsDomainGroupDT">LatentsDomainGroupDT</a></code> for functions' outputs.</p>
+  
+  <p>This allows to be more generic and allow passing other mappings.</p>
+</blockquote>
+</div>
+
+
+                </section>
+                <section id="LatentsDomainGroupDT">
+                    <div class="attr variable">
+            <span class="name">LatentsDomainGroupDT</span>        =
+<span class="default_value">dict[str, torch.Tensor]</span>
+
+        
+    </div>
+    <a class="headerlink" href="#LatentsDomainGroupDT"></a>
+    
+            <div class="docstring"><p>Matched unimodal latent representations from multiple domains.
+Keys of the dict are domains names and values are <code>torch.Tensor</code> latent
+representation of the domain.</p>
+
+<h6 id="example">Example:</h6>
+
+<blockquote>
+  <div class="pdoc-code codehilite">
+<pre><span></span><code><span class="k">def</span> <span class="nf">fun</span><span class="p">()</span> <span class="o">-&gt;</span> <span class="n">LatentsDomainGroupDT</span><span class="p">:</span>
+    <span class="k">return</span> <span class="p">{</span>
+        <span class="s2">&quot;vision&quot;</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">([</span><span class="mf">0.0</span><span class="p">,</span> <span class="mf">1.0</span><span class="p">,</span> <span class="mf">0.0</span><span class="p">,</span> <span class="o">...</span><span class="p">]),</span>
+        <span class="s2">&quot;language&quot;</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">([</span><span class="mf">0.0</span><span class="p">,</span> <span class="mf">0.3</span><span class="p">,</span> <span class="mf">0.2</span><span class="p">,</span> <span class="o">...</span><span class="p">]),</span>
+    <span class="p">}</span>
+</code></pre>
+  </div>
+</blockquote>
+
+<h6 id="note">Note:</h6>
+
+<blockquote>
+  <p>This type uses <code>dict</code>s and is used for functions' outputs.
+  Use <code><a href="#LatentsDomainGroupT">LatentsDomainGroupT</a></code> for functions' inputs.</p>
+</blockquote>
+</div>
+
+
+                </section>
+                <section id="RawDomainGroupsT">
+                    <div class="attr variable">
+            <span class="name">RawDomainGroupsT</span>        =
+<span class="default_value">collections.abc.Mapping[frozenset[str], collections.abc.Mapping[str, typing.Any]]</span>
+
+        
+    </div>
+    <a class="headerlink" href="#RawDomainGroupsT"></a>
+    
+            <div class="docstring"><p>Mapping of <code><a href="#RawDomainGroupT">RawDomainGroupT</a></code>. Keys are frozenset of domains matched in the group.
+Each group is independent and contains different data (unpaired).</p>
+
+<h6 id="example">Example:</h6>
+
+<blockquote>
+  <div class="pdoc-code codehilite">
+<pre><span></span><code><span class="k">def</span> <span class="nf">fun</span><span class="p">()</span> <span class="o">-&gt;</span> <span class="n">RawDomainGroupsDT</span><span class="p">:</span>
+    <span class="k">return</span> <span class="p">{</span>
+        <span class="nb">frozenset</span><span class="p">([</span><span class="s2">&quot;vision&quot;</span><span class="p">]):</span> <span class="p">{</span>
+            <span class="s2">&quot;vision&quot;</span><span class="p">:</span> <span class="n">PIL</span><span class="o">.</span><span class="n">Image</span><span class="o">.</span><span class="n">Image</span><span class="p">(</span><span class="s2">&quot;path/to/cat/picture.png&quot;</span><span class="p">),</span>
+        <span class="p">},</span>
+        <span class="nb">frozenset</span><span class="p">([</span><span class="s2">&quot;language&quot;</span><span class="p">]):</span> <span class="p">{</span>
+            <span class="s2">&quot;language&quot;</span><span class="p">:</span> <span class="s2">&quot;This is a picture of a rabbit.&quot;</span><span class="p">,</span>
+        <span class="p">},</span>
+        <span class="nb">frozenset</span><span class="p">([</span><span class="s2">&quot;vision&quot;</span><span class="p">,</span> <span class="s2">&quot;language&quot;</span><span class="p">]):</span> <span class="p">{</span>
+            <span class="s2">&quot;vision&quot;</span><span class="p">:</span> <span class="n">PIL</span><span class="o">.</span><span class="n">Image</span><span class="o">.</span><span class="n">Image</span><span class="p">(</span><span class="s2">&quot;path/to/dog/picture.png&quot;</span><span class="p">),</span>
+            <span class="s2">&quot;language&quot;</span><span class="p">:</span> <span class="s2">&quot;This is a picture of a dog.&quot;</span><span class="p">,</span>
+        <span class="p">},</span>
+    <span class="p">}</span>
+</code></pre>
+  </div>
+</blockquote>
+
+<h6 id="note">Note:</h6>
+
+<blockquote>
+  <p>This type uses <code>dict</code>s and is used for functions' outputs.
+  Use <code><a href="#RawDomainGroupsT">RawDomainGroupsT</a></code> for functions' inputs.</p>
+</blockquote>
+</div>
+
+
+                </section>
+                <section id="RawDomainGroupsDT">
+                    <div class="attr variable">
+            <span class="name">RawDomainGroupsDT</span>        =
+<span class="default_value">dict[frozenset[str], dict[str, typing.Any]]</span>
+
+        
+    </div>
+    <a class="headerlink" href="#RawDomainGroupsDT"></a>
+    
+            <div class="docstring"><p>Mapping of <code><a href="#RawDomainGroupT">RawDomainGroupT</a></code>. Keys are frozenset of domains matched in the group.
+Each group is independent and contains different data (unpaired).</p>
+
+<h6 id="example">Example:</h6>
+
+<blockquote>
+  <div class="pdoc-code codehilite">
+<pre><span></span><code><span class="k">def</span> <span class="nf">fun</span><span class="p">()</span> <span class="o">-&gt;</span> <span class="n">RawDomainGroupsDT</span><span class="p">:</span>
+    <span class="k">return</span> <span class="p">{</span>
+        <span class="nb">frozenset</span><span class="p">([</span><span class="s2">&quot;vision&quot;</span><span class="p">]):</span> <span class="p">{</span>
+            <span class="s2">&quot;vision&quot;</span><span class="p">:</span> <span class="n">PIL</span><span class="o">.</span><span class="n">Image</span><span class="o">.</span><span class="n">Image</span><span class="p">(</span><span class="s2">&quot;path/to/cat/picture.png&quot;</span><span class="p">),</span>
+        <span class="p">},</span>
+        <span class="nb">frozenset</span><span class="p">([</span><span class="s2">&quot;language&quot;</span><span class="p">]):</span> <span class="p">{</span>
+            <span class="s2">&quot;language&quot;</span><span class="p">:</span> <span class="s2">&quot;This is a picture of a rabbit.&quot;</span><span class="p">,</span>
+        <span class="p">},</span>
+        <span class="nb">frozenset</span><span class="p">([</span><span class="s2">&quot;vision&quot;</span><span class="p">,</span> <span class="s2">&quot;language&quot;</span><span class="p">]):</span> <span class="p">{</span>
+            <span class="s2">&quot;vision&quot;</span><span class="p">:</span> <span class="n">PIL</span><span class="o">.</span><span class="n">Image</span><span class="o">.</span><span class="n">Image</span><span class="p">(</span><span class="s2">&quot;path/to/dog/picture.png&quot;</span><span class="p">),</span>
+            <span class="s2">&quot;language&quot;</span><span class="p">:</span> <span class="s2">&quot;This is a picture of a dog.&quot;</span><span class="p">,</span>
+        <span class="p">},</span>
+    <span class="p">}</span>
+</code></pre>
+  </div>
+</blockquote>
+
+<h6 id="note">Note:</h6>
+
+<blockquote>
+  <p>This type uses <code>dict</code>s and is used for functions' outputs.
+  Use <code><a href="#RawDomainGroupsT">RawDomainGroupsT</a></code> for functions' inputs.</p>
+</blockquote>
+</div>
+
+
+                </section>
+                <section id="LatentsDomainGroupsT">
+                    <div class="attr variable">
+            <span class="name">LatentsDomainGroupsT</span>        =
+<span class="default_value">collections.abc.Mapping[frozenset[str], collections.abc.Mapping[str, torch.Tensor]]</span>
+
+        
+    </div>
+    <a class="headerlink" href="#LatentsDomainGroupsT"></a>
+    
+            <div class="docstring"><p>Mapping of <code><a href="#LatentsDomainGroupT">LatentsDomainGroupT</a></code>. Keys are frozenset of domains matched in the group.
+Each group is independent and contains different data (unpaired).</p>
+
+<h6 id="example">Example:</h6>
+
+<blockquote>
+  <div class="pdoc-code codehilite">
+<pre><span></span><code><span class="k">def</span> <span class="nf">fun</span><span class="p">(</span><span class="n">domain_group</span><span class="p">:</span> <span class="n">LatentsDomainGroupsT</span><span class="p">):</span> <span class="o">...</span>
+
+
+<span class="n">x</span> <span class="o">=</span> <span class="p">{</span>
+    <span class="nb">frozenset</span><span class="p">([</span><span class="s2">&quot;vision&quot;</span><span class="p">]):</span> <span class="p">{</span>
+        <span class="s2">&quot;vision&quot;</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">([</span><span class="mf">1.0</span><span class="p">,</span> <span class="mf">0.0</span><span class="p">,</span> <span class="mf">0.3</span><span class="p">,</span> <span class="o">...</span><span class="p">]),</span>
+    <span class="p">},</span>
+    <span class="nb">frozenset</span><span class="p">([</span><span class="s2">&quot;language&quot;</span><span class="p">]):</span> <span class="p">{</span>
+        <span class="s2">&quot;language&quot;</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">([</span><span class="mf">1.0</span><span class="p">,</span> <span class="mf">0.2</span><span class="p">,</span> <span class="mf">0.9</span><span class="p">,</span> <span class="o">...</span><span class="p">]),</span>
+    <span class="p">},</span>
+    <span class="nb">frozenset</span><span class="p">([</span><span class="s2">&quot;vision&quot;</span><span class="p">,</span> <span class="s2">&quot;language&quot;</span><span class="p">]):</span> <span class="p">{</span>
+        <span class="s2">&quot;vision&quot;</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">([</span><span class="mf">0.0</span><span class="p">,</span> <span class="mf">1.0</span><span class="p">,</span> <span class="mf">0.0</span><span class="p">,</span> <span class="o">...</span><span class="p">]),</span>
+        <span class="s2">&quot;language&quot;</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">([</span><span class="mf">0.0</span><span class="p">,</span> <span class="mf">0.3</span><span class="p">,</span> <span class="mf">0.2</span><span class="p">,</span> <span class="o">...</span><span class="p">]),</span>
+    <span class="p">},</span>
+<span class="p">}</span>
+
+<span class="n">fun</span><span class="p">(</span><span class="n">x</span><span class="p">)</span>
+</code></pre>
+  </div>
+</blockquote>
+
+<h6 id="note">Note:</h6>
+
+<blockquote>
+  <p>This type uses <code>collections.abc.Mapping</code> and is used for functions' inputs.
+  Use <code><a href="#LatentsDomainGroupsDT">LatentsDomainGroupsDT</a></code> for functions' outputs.</p>
+  
+  <p>This allows to be more generic and allow passing other mappings.</p>
+</blockquote>
+</div>
+
+
+                </section>
+                <section id="LatentsDomainGroupsDT">
+                    <div class="attr variable">
+            <span class="name">LatentsDomainGroupsDT</span>        =
+<span class="default_value">dict[frozenset[str], dict[str, torch.Tensor]]</span>
+
+        
+    </div>
+    <a class="headerlink" href="#LatentsDomainGroupsDT"></a>
+    
+            <div class="docstring"><p>Mapping of <code><a href="#LatentsDomainGroupDT">LatentsDomainGroupDT</a></code>.
+Keys are frozenset of domains matched in the group.
+Each group is independent and contains different data (unpaired).</p>
+
+<h6 id="example">Example:</h6>
+
+<blockquote>
+  <div class="pdoc-code codehilite">
+<pre><span></span><code><span class="k">def</span> <span class="nf">fun</span><span class="p">()</span> <span class="o">-&gt;</span> <span class="n">LatentsDomainGroupsDT</span><span class="p">:</span>
+    <span class="k">return</span> <span class="p">{</span>
+        <span class="nb">frozenset</span><span class="p">([</span><span class="s2">&quot;vision&quot;</span><span class="p">]):</span> <span class="p">{</span>
+            <span class="s2">&quot;vision&quot;</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">([</span><span class="mf">1.0</span><span class="p">,</span> <span class="mf">0.0</span><span class="p">,</span> <span class="mf">0.3</span><span class="p">,</span> <span class="o">...</span><span class="p">]),</span>
+        <span class="p">},</span>
+        <span class="nb">frozenset</span><span class="p">([</span><span class="s2">&quot;language&quot;</span><span class="p">]):</span> <span class="p">{</span>
+            <span class="s2">&quot;language&quot;</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">([</span><span class="mf">1.0</span><span class="p">,</span> <span class="mf">0.2</span><span class="p">,</span> <span class="mf">0.9</span><span class="p">,</span> <span class="o">...</span><span class="p">]),</span>
+        <span class="p">},</span>
+        <span class="nb">frozenset</span><span class="p">([</span><span class="s2">&quot;vision&quot;</span><span class="p">,</span> <span class="s2">&quot;language&quot;</span><span class="p">]):</span> <span class="p">{</span>
+            <span class="s2">&quot;vision&quot;</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">([</span><span class="mf">0.0</span><span class="p">,</span> <span class="mf">1.0</span><span class="p">,</span> <span class="mf">0.0</span><span class="p">,</span> <span class="o">...</span><span class="p">]),</span>
+            <span class="s2">&quot;language&quot;</span><span class="p">:</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">([</span><span class="mf">0.0</span><span class="p">,</span> <span class="mf">0.3</span><span class="p">,</span> <span class="mf">0.2</span><span class="p">,</span> <span class="o">...</span><span class="p">]),</span>
+        <span class="p">},</span>
+    <span class="p">}</span>
+</code></pre>
+  </div>
+</blockquote>
+
+<h6 id="note">Note:</h6>
+
+<blockquote>
+  <p>This type uses <code>dict</code>s and is used for functions' outputs.
+  Use <code><a href="#LatentsDomainGroupT">LatentsDomainGroupT</a></code> for functions' inputs.</p>
+</blockquote>
+</div>
+
+
+                </section>
+                <section id="ModelModeT">
+                    <div class="attr variable">
+            <span class="name">ModelModeT</span>        =
+<span class="default_value">typing.Literal[&#39;train&#39;, &#39;val&#39;, &#39;test&#39;, &#39;val/ood&#39;, &#39;test/ood&#39;]</span>
+
+        
+    </div>
+    <a class="headerlink" href="#ModelModeT"></a>
+    
+            <div class="docstring"><p>Mode used by pytorch lightning (train/val, ...).</p>
+
+<p>When validating or testing in out-of-distribution data, "val/ood" or "test/ood" mode is
+used.</p>
+</div>
+
+
+                </section>
+    </main>
+<script>
+    function escapeHTML(html) {
+        return document.createElement('div').appendChild(document.createTextNode(html)).parentNode.innerHTML;
+    }
+
+    const originalContent = document.querySelector("main.pdoc");
+    let currentContent = originalContent;
+
+    function setContent(innerHTML) {
+        let elem;
+        if (innerHTML) {
+            elem = document.createElement("main");
+            elem.classList.add("pdoc");
+            elem.innerHTML = innerHTML;
+        } else {
+            elem = originalContent;
+        }
+        if (currentContent !== elem) {
+            currentContent.replaceWith(elem);
+            currentContent = elem;
+        }
+    }
+
+    function getSearchTerm() {
+        return (new URL(window.location)).searchParams.get("search");
+    }
+
+    const searchBox = document.querySelector(".pdoc input[type=search]");
+    searchBox.addEventListener("input", function () {
+        let url = new URL(window.location);
+        if (searchBox.value.trim()) {
+            url.hash = "";
+            url.searchParams.set("search", searchBox.value);
+        } else {
+            url.searchParams.delete("search");
+        }
+        history.replaceState("", "", url.toString());
+        onInput();
+    });
+    window.addEventListener("popstate", onInput);
+
+
+    let search, searchErr;
+
+    async function initialize() {
+        try {
+            search = await new Promise((resolve, reject) => {
+                const script = document.createElement("script");
+                script.type = "text/javascript";
+                script.async = true;
+                script.onload = () => resolve(window.pdocSearch);
+                script.onerror = (e) => reject(e);
+                script.src = "../search.js";
+                document.getElementsByTagName("head")[0].appendChild(script);
+            });
+        } catch (e) {
+            console.error("Cannot fetch pdoc search index");
+            searchErr = "Cannot fetch search index.";
+        }
+        onInput();
+
+        document.querySelector("nav.pdoc").addEventListener("click", e => {
+            if (e.target.hash) {
+                searchBox.value = "";
+                searchBox.dispatchEvent(new Event("input"));
+            }
+        });
+    }
+
+    function onInput() {
+        setContent((() => {
+            const term = getSearchTerm();
+            if (!term) {
+                return null
+            }
+            if (searchErr) {
+                return `<h3>Error: ${searchErr}</h3>`
+            }
+            if (!search) {
+                return "<h3>Searching...</h3>"
+            }
+
+            window.scrollTo({top: 0, left: 0, behavior: 'auto'});
+
+            const results = search(term);
+
+            let html;
+            if (results.length === 0) {
+                html = `No search results for '${escapeHTML(term)}'.`
+            } else {
+                html = `<h4>${results.length} search result${results.length > 1 ? "s" : ""} for '${escapeHTML(term)}'.</h4>`;
+            }
+            for (let result of results.slice(0, 10)) {
+                let doc = result.doc;
+                let url = `../${doc.modulename.replaceAll(".", "/")}.html`;
+                if (doc.qualname) {
+                    url += `#${doc.qualname}`;
+                }
+
+                let heading;
+                switch (result.doc.kind) {
+                    case "function":
+                        if (doc.fullname.endsWith(".__init__")) {
+                            heading = `<span class="name">${doc.fullname.replace(/\.__init__$/, "")}</span>${doc.signature}`;
+                        } else {
+                            heading = `<span class="def">${doc.funcdef}</span> <span class="name">${doc.fullname}</span>${doc.signature}`;
+                        }
+                        break;
+                    case "class":
+                        heading = `<span class="def">class</span> <span class="name">${doc.fullname}</span>`;
+                        if (doc.bases)
+                            heading += `<wbr>(<span class="base">${doc.bases}</span>)`;
+                        heading += `:`;
+                        break;
+                    case "variable":
+                        heading = `<span class="name">${doc.fullname}</span>`;
+                        if (doc.annotation)
+                            heading += `<span class="annotation">${doc.annotation}</span>`;
+                        if (doc.default_value)
+                            heading += `<span class="default_value"> = ${doc.default_value}</span>`;
+                        break;
+                    default:
+                        heading = `<span class="name">${doc.fullname}</span>`;
+                        break;
+                }
+                html += `
+                        <section class="search-result">
+                        <a href="${url}" class="attr ${doc.kind}">${heading}</a>
+                        <div class="docstring">${doc.doc}</div>
+                        </section>
+                    `;
+
+            }
+            return html;
+        })());
+    }
+
+    if (getSearchTerm()) {
+        initialize();
+        searchBox.value = getSearchTerm();
+        onInput();
+    } else {
+        searchBox.addEventListener("focus", initialize, {once: true});
+    }
+
+    searchBox.addEventListener("keydown", e => {
+        if (["ArrowDown", "ArrowUp", "Enter"].includes(e.key)) {
+            let focused = currentContent.querySelector(".search-result.focused");
+            if (!focused) {
+                currentContent.querySelector(".search-result").classList.add("focused");
+            } else if (
+                e.key === "ArrowDown"
+                && focused.nextElementSibling
+                && focused.nextElementSibling.classList.contains("search-result")
+            ) {
+                focused.classList.remove("focused");
+                focused.nextElementSibling.classList.add("focused");
+                focused.nextElementSibling.scrollIntoView({
+                    behavior: "smooth",
+                    block: "nearest",
+                    inline: "nearest"
+                });
+            } else if (
+                e.key === "ArrowUp"
+                && focused.previousElementSibling
+                && focused.previousElementSibling.classList.contains("search-result")
+            ) {
+                focused.classList.remove("focused");
+                focused.previousElementSibling.classList.add("focused");
+                focused.previousElementSibling.scrollIntoView({
+                    behavior: "smooth",
+                    block: "nearest",
+                    inline: "nearest"
+                });
+            } else if (
+                e.key === "Enter"
+            ) {
+                focused.querySelector("a").click();
+            }
+        }
+    });
+</script></body>
+</html>
\ No newline at end of file
diff --git a/docs/api/v0.5.1/shimmer/utils.html b/docs/api/v0.5.1/shimmer/utils.html
new file mode 100644
index 00000000..87a2b3bd
--- /dev/null
+++ b/docs/api/v0.5.1/shimmer/utils.html
@@ -0,0 +1,701 @@
+<!doctype html>
+<html lang="en">
+<head>
+    <meta charset="utf-8">
+    <meta name="viewport" content="width=device-width, initial-scale=1">
+    <meta name="generator" content="pdoc 14.4.0"/>
+    <title>shimmer.utils API documentation</title>
+
+    <style>/*! * Bootstrap Reboot v5.0.0 (https://getbootstrap.com/) * Copyright 2011-2021 The Bootstrap Authors * Copyright 2011-2021 Twitter, Inc. * Licensed under MIT (https://github.com/twbs/bootstrap/blob/main/LICENSE) * Forked from Normalize.css, licensed MIT (https://github.com/necolas/normalize.css/blob/master/LICENSE.md) */*,::after,::before{box-sizing:border-box}@media (prefers-reduced-motion:no-preference){:root{scroll-behavior:smooth}}body{margin:0;font-family:system-ui,-apple-system,"Segoe UI",Roboto,"Helvetica Neue",Arial,"Noto Sans","Liberation Sans",sans-serif,"Apple Color Emoji","Segoe UI Emoji","Segoe UI Symbol","Noto Color Emoji";font-size:1rem;font-weight:400;line-height:1.5;color:#212529;background-color:#fff;-webkit-text-size-adjust:100%;-webkit-tap-highlight-color:transparent}hr{margin:1rem 0;color:inherit;background-color:currentColor;border:0;opacity:.25}hr:not([size]){height:1px}h1,h2,h3,h4,h5,h6{margin-top:0;margin-bottom:.5rem;font-weight:500;line-height:1.2}h1{font-size:calc(1.375rem + 1.5vw)}@media (min-width:1200px){h1{font-size:2.5rem}}h2{font-size:calc(1.325rem + .9vw)}@media (min-width:1200px){h2{font-size:2rem}}h3{font-size:calc(1.3rem + .6vw)}@media (min-width:1200px){h3{font-size:1.75rem}}h4{font-size:calc(1.275rem + .3vw)}@media (min-width:1200px){h4{font-size:1.5rem}}h5{font-size:1.25rem}h6{font-size:1rem}p{margin-top:0;margin-bottom:1rem}abbr[data-bs-original-title],abbr[title]{-webkit-text-decoration:underline dotted;text-decoration:underline dotted;cursor:help;-webkit-text-decoration-skip-ink:none;text-decoration-skip-ink:none}address{margin-bottom:1rem;font-style:normal;line-height:inherit}ol,ul{padding-left:2rem}dl,ol,ul{margin-top:0;margin-bottom:1rem}ol ol,ol ul,ul ol,ul ul{margin-bottom:0}dt{font-weight:700}dd{margin-bottom:.5rem;margin-left:0}blockquote{margin:0 0 1rem}b,strong{font-weight:bolder}small{font-size:.875em}mark{padding:.2em;background-color:#fcf8e3}sub,sup{position:relative;font-size:.75em;line-height:0;vertical-align:baseline}sub{bottom:-.25em}sup{top:-.5em}a{color:#0d6efd;text-decoration:underline}a:hover{color:#0a58ca}a:not([href]):not([class]),a:not([href]):not([class]):hover{color:inherit;text-decoration:none}code,kbd,pre,samp{font-family:SFMono-Regular,Menlo,Monaco,Consolas,"Liberation Mono","Courier New",monospace;font-size:1em;direction:ltr;unicode-bidi:bidi-override}pre{display:block;margin-top:0;margin-bottom:1rem;overflow:auto;font-size:.875em}pre code{font-size:inherit;color:inherit;word-break:normal}code{font-size:.875em;color:#d63384;word-wrap:break-word}a>code{color:inherit}kbd{padding:.2rem .4rem;font-size:.875em;color:#fff;background-color:#212529;border-radius:.2rem}kbd kbd{padding:0;font-size:1em;font-weight:700}figure{margin:0 0 1rem}img,svg{vertical-align:middle}table{caption-side:bottom;border-collapse:collapse}caption{padding-top:.5rem;padding-bottom:.5rem;color:#6c757d;text-align:left}th{text-align:inherit;text-align:-webkit-match-parent}tbody,td,tfoot,th,thead,tr{border-color:inherit;border-style:solid;border-width:0}label{display:inline-block}button{border-radius:0}button:focus:not(:focus-visible){outline:0}button,input,optgroup,select,textarea{margin:0;font-family:inherit;font-size:inherit;line-height:inherit}button,select{text-transform:none}[role=button]{cursor:pointer}select{word-wrap:normal}select:disabled{opacity:1}[list]::-webkit-calendar-picker-indicator{display:none}[type=button],[type=reset],[type=submit],button{-webkit-appearance:button}[type=button]:not(:disabled),[type=reset]:not(:disabled),[type=submit]:not(:disabled),button:not(:disabled){cursor:pointer}::-moz-focus-inner{padding:0;border-style:none}textarea{resize:vertical}fieldset{min-width:0;padding:0;margin:0;border:0}legend{float:left;width:100%;padding:0;margin-bottom:.5rem;font-size:calc(1.275rem + .3vw);line-height:inherit}@media (min-width:1200px){legend{font-size:1.5rem}}legend+*{clear:left}::-webkit-datetime-edit-day-field,::-webkit-datetime-edit-fields-wrapper,::-webkit-datetime-edit-hour-field,::-webkit-datetime-edit-minute,::-webkit-datetime-edit-month-field,::-webkit-datetime-edit-text,::-webkit-datetime-edit-year-field{padding:0}::-webkit-inner-spin-button{height:auto}[type=search]{outline-offset:-2px;-webkit-appearance:textfield}::-webkit-search-decoration{-webkit-appearance:none}::-webkit-color-swatch-wrapper{padding:0}::file-selector-button{font:inherit}::-webkit-file-upload-button{font:inherit;-webkit-appearance:button}output{display:inline-block}iframe{border:0}summary{display:list-item;cursor:pointer}progress{vertical-align:baseline}[hidden]{display:none!important}</style>
+    <style>/*! syntax-highlighting.css */pre{line-height:125%;}span.linenos{color:inherit; background-color:transparent; padding-left:5px; padding-right:20px;}.pdoc-code .hll{background-color:#ffffcc}.pdoc-code{background:#f8f8f8;}.pdoc-code .c{color:#3D7B7B; font-style:italic}.pdoc-code .err{border:1px solid #FF0000}.pdoc-code .k{color:#008000; font-weight:bold}.pdoc-code .o{color:#666666}.pdoc-code .ch{color:#3D7B7B; font-style:italic}.pdoc-code .cm{color:#3D7B7B; font-style:italic}.pdoc-code .cp{color:#9C6500}.pdoc-code .cpf{color:#3D7B7B; font-style:italic}.pdoc-code .c1{color:#3D7B7B; font-style:italic}.pdoc-code .cs{color:#3D7B7B; font-style:italic}.pdoc-code .gd{color:#A00000}.pdoc-code .ge{font-style:italic}.pdoc-code .gr{color:#E40000}.pdoc-code .gh{color:#000080; font-weight:bold}.pdoc-code .gi{color:#008400}.pdoc-code .go{color:#717171}.pdoc-code .gp{color:#000080; font-weight:bold}.pdoc-code .gs{font-weight:bold}.pdoc-code .gu{color:#800080; font-weight:bold}.pdoc-code .gt{color:#0044DD}.pdoc-code .kc{color:#008000; font-weight:bold}.pdoc-code .kd{color:#008000; font-weight:bold}.pdoc-code .kn{color:#008000; font-weight:bold}.pdoc-code .kp{color:#008000}.pdoc-code .kr{color:#008000; font-weight:bold}.pdoc-code .kt{color:#B00040}.pdoc-code .m{color:#666666}.pdoc-code .s{color:#BA2121}.pdoc-code .na{color:#687822}.pdoc-code .nb{color:#008000}.pdoc-code .nc{color:#0000FF; font-weight:bold}.pdoc-code .no{color:#880000}.pdoc-code .nd{color:#AA22FF}.pdoc-code .ni{color:#717171; font-weight:bold}.pdoc-code .ne{color:#CB3F38; font-weight:bold}.pdoc-code .nf{color:#0000FF}.pdoc-code .nl{color:#767600}.pdoc-code .nn{color:#0000FF; font-weight:bold}.pdoc-code .nt{color:#008000; font-weight:bold}.pdoc-code .nv{color:#19177C}.pdoc-code .ow{color:#AA22FF; font-weight:bold}.pdoc-code .w{color:#bbbbbb}.pdoc-code .mb{color:#666666}.pdoc-code .mf{color:#666666}.pdoc-code .mh{color:#666666}.pdoc-code .mi{color:#666666}.pdoc-code .mo{color:#666666}.pdoc-code .sa{color:#BA2121}.pdoc-code .sb{color:#BA2121}.pdoc-code .sc{color:#BA2121}.pdoc-code .dl{color:#BA2121}.pdoc-code .sd{color:#BA2121; font-style:italic}.pdoc-code .s2{color:#BA2121}.pdoc-code .se{color:#AA5D1F; font-weight:bold}.pdoc-code .sh{color:#BA2121}.pdoc-code .si{color:#A45A77; font-weight:bold}.pdoc-code .sx{color:#008000}.pdoc-code .sr{color:#A45A77}.pdoc-code .s1{color:#BA2121}.pdoc-code .ss{color:#19177C}.pdoc-code .bp{color:#008000}.pdoc-code .fm{color:#0000FF}.pdoc-code .vc{color:#19177C}.pdoc-code .vg{color:#19177C}.pdoc-code .vi{color:#19177C}.pdoc-code .vm{color:#19177C}.pdoc-code .il{color:#666666}</style>
+    <style>/*! theme.css */:root{--pdoc-background:#fff;}.pdoc{--text:#212529;--muted:#6c757d;--link:#3660a5;--link-hover:#1659c5;--code:#f8f8f8;--active:#fff598;--accent:#eee;--accent2:#c1c1c1;--nav-hover:rgba(255, 255, 255, 0.5);--name:#0066BB;--def:#008800;--annotation:#007020;}</style>
+    <style>/*! layout.css */html, body{width:100%;height:100%;}html, main{scroll-behavior:smooth;}body{background-color:var(--pdoc-background);}@media (max-width:769px){#navtoggle{cursor:pointer;position:absolute;width:50px;height:40px;top:1rem;right:1rem;border-color:var(--text);color:var(--text);display:flex;opacity:0.8;z-index:999;}#navtoggle:hover{opacity:1;}#togglestate + div{display:none;}#togglestate:checked + div{display:inherit;}main, header{padding:2rem 3vw;}header + main{margin-top:-3rem;}.git-button{display:none !important;}nav input[type="search"]{max-width:77%;}nav input[type="search"]:first-child{margin-top:-6px;}nav input[type="search"]:valid ~ *{display:none !important;}}@media (min-width:770px){:root{--sidebar-width:clamp(12.5rem, 28vw, 22rem);}nav{position:fixed;overflow:auto;height:100vh;width:var(--sidebar-width);}main, header{padding:3rem 2rem 3rem calc(var(--sidebar-width) + 3rem);width:calc(54rem + var(--sidebar-width));max-width:100%;}header + main{margin-top:-4rem;}#navtoggle{display:none;}}#togglestate{position:absolute;height:0;opacity:0;}nav.pdoc{--pad:clamp(0.5rem, 2vw, 1.75rem);--indent:1.5rem;background-color:var(--accent);border-right:1px solid var(--accent2);box-shadow:0 0 20px rgba(50, 50, 50, .2) inset;padding:0 0 0 var(--pad);overflow-wrap:anywhere;scrollbar-width:thin; scrollbar-color:var(--accent2) transparent; z-index:1}nav.pdoc::-webkit-scrollbar{width:.4rem; }nav.pdoc::-webkit-scrollbar-thumb{background-color:var(--accent2); }nav.pdoc > div{padding:var(--pad) 0;}nav.pdoc .module-list-button{display:inline-flex;align-items:center;color:var(--text);border-color:var(--muted);margin-bottom:1rem;}nav.pdoc .module-list-button:hover{border-color:var(--text);}nav.pdoc input[type=search]{display:block;outline-offset:0;width:calc(100% - var(--pad));}nav.pdoc .logo{max-width:calc(100% - var(--pad));max-height:35vh;display:block;margin:0 auto 1rem;transform:translate(calc(-.5 * var(--pad)), 0);}nav.pdoc ul{list-style:none;padding-left:0;}nav.pdoc > div > ul{margin-left:calc(0px - var(--pad));}nav.pdoc li a{padding:.2rem 0 .2rem calc(var(--pad) + var(--indent));}nav.pdoc > div > ul > li > a{padding-left:var(--pad);}nav.pdoc li{transition:all 100ms;}nav.pdoc li:hover{background-color:var(--nav-hover);}nav.pdoc a, nav.pdoc a:hover{color:var(--text);}nav.pdoc a{display:block;}nav.pdoc > h2:first-of-type{margin-top:1.5rem;}nav.pdoc .class:before{content:"class ";color:var(--muted);}nav.pdoc .function:after{content:"()";color:var(--muted);}nav.pdoc footer:before{content:"";display:block;width:calc(100% - var(--pad));border-top:solid var(--accent2) 1px;margin-top:1.5rem;padding-top:.5rem;}nav.pdoc footer{font-size:small;}</style>
+    <style>/*! content.css */.pdoc{color:var(--text);box-sizing:border-box;line-height:1.5;background:none;}.pdoc .pdoc-button{cursor:pointer;display:inline-block;border:solid black 1px;border-radius:2px;font-size:.75rem;padding:calc(0.5em - 1px) 1em;transition:100ms all;}.pdoc .pdoc-alert{padding:1rem 1rem 1rem calc(1.5rem + 24px);border:1px solid transparent;border-radius:.25rem;background-repeat:no-repeat;background-position:1rem center;margin-bottom:1rem;}.pdoc .pdoc-alert > *:last-child{margin-bottom:0;}.pdoc .pdoc-alert-note {color:#084298;background-color:#cfe2ff;border-color:#b6d4fe;background-image:url("data:image/svg+xml,%3Csvg%20xmlns%3D%22http%3A//www.w3.org/2000/svg%22%20width%3D%2224%22%20height%3D%2224%22%20fill%3D%22%23084298%22%20viewBox%3D%220%200%2016%2016%22%3E%3Cpath%20d%3D%22M8%2016A8%208%200%201%200%208%200a8%208%200%200%200%200%2016zm.93-9.412-1%204.705c-.07.34.029.533.304.533.194%200%20.487-.07.686-.246l-.088.416c-.287.346-.92.598-1.465.598-.703%200-1.002-.422-.808-1.319l.738-3.468c.064-.293.006-.399-.287-.47l-.451-.081.082-.381%202.29-.287zM8%205.5a1%201%200%201%201%200-2%201%201%200%200%201%200%202z%22/%3E%3C/svg%3E");}.pdoc .pdoc-alert-warning{color:#664d03;background-color:#fff3cd;border-color:#ffecb5;background-image:url("data:image/svg+xml,%3Csvg%20xmlns%3D%22http%3A//www.w3.org/2000/svg%22%20width%3D%2224%22%20height%3D%2224%22%20fill%3D%22%23664d03%22%20viewBox%3D%220%200%2016%2016%22%3E%3Cpath%20d%3D%22M8.982%201.566a1.13%201.13%200%200%200-1.96%200L.165%2013.233c-.457.778.091%201.767.98%201.767h13.713c.889%200%201.438-.99.98-1.767L8.982%201.566zM8%205c.535%200%20.954.462.9.995l-.35%203.507a.552.552%200%200%201-1.1%200L7.1%205.995A.905.905%200%200%201%208%205zm.002%206a1%201%200%201%201%200%202%201%201%200%200%201%200-2z%22/%3E%3C/svg%3E");}.pdoc .pdoc-alert-danger{color:#842029;background-color:#f8d7da;border-color:#f5c2c7;background-image:url("data:image/svg+xml,%3Csvg%20xmlns%3D%22http%3A//www.w3.org/2000/svg%22%20width%3D%2224%22%20height%3D%2224%22%20fill%3D%22%23842029%22%20viewBox%3D%220%200%2016%2016%22%3E%3Cpath%20d%3D%22M5.52.359A.5.5%200%200%201%206%200h4a.5.5%200%200%201%20.474.658L8.694%206H12.5a.5.5%200%200%201%20.395.807l-7%209a.5.5%200%200%201-.873-.454L6.823%209.5H3.5a.5.5%200%200%201-.48-.641l2.5-8.5z%22/%3E%3C/svg%3E");}.pdoc .visually-hidden{position:absolute !important;width:1px !important;height:1px !important;padding:0 !important;margin:-1px !important;overflow:hidden !important;clip:rect(0, 0, 0, 0) !important;white-space:nowrap !important;border:0 !important;}.pdoc h1, .pdoc h2, .pdoc h3{font-weight:300;margin:.3em 0;padding:.2em 0;}.pdoc > section:not(.module-info) h1{font-size:1.5rem;font-weight:500;}.pdoc > section:not(.module-info) h2{font-size:1.4rem;font-weight:500;}.pdoc > section:not(.module-info) h3{font-size:1.3rem;font-weight:500;}.pdoc > section:not(.module-info) h4{font-size:1.2rem;}.pdoc > section:not(.module-info) h5{font-size:1.1rem;}.pdoc a{text-decoration:none;color:var(--link);}.pdoc a:hover{color:var(--link-hover);}.pdoc blockquote{margin-left:2rem;}.pdoc pre{border-top:1px solid var(--accent2);border-bottom:1px solid var(--accent2);margin-top:0;margin-bottom:1em;padding:.5rem 0 .5rem .5rem;overflow-x:auto;background-color:var(--code);}.pdoc code{color:var(--text);padding:.2em .4em;margin:0;font-size:85%;background-color:var(--accent);border-radius:6px;}.pdoc a > code{color:inherit;}.pdoc pre > code{display:inline-block;font-size:inherit;background:none;border:none;padding:0;}.pdoc > section:not(.module-info){margin-bottom:1.5rem;}.pdoc .modulename{margin-top:0;font-weight:bold;}.pdoc .modulename a{color:var(--link);transition:100ms all;}.pdoc .git-button{float:right;border:solid var(--link) 1px;}.pdoc .git-button:hover{background-color:var(--link);color:var(--pdoc-background);}.view-source-toggle-state,.view-source-toggle-state ~ .pdoc-code{display:none;}.view-source-toggle-state:checked ~ .pdoc-code{display:block;}.view-source-button{display:inline-block;float:right;font-size:.75rem;line-height:1.5rem;color:var(--muted);padding:0 .4rem 0 1.3rem;cursor:pointer;text-indent:-2px;}.view-source-button > span{visibility:hidden;}.module-info .view-source-button{float:none;display:flex;justify-content:flex-end;margin:-1.2rem .4rem -.2rem 0;}.view-source-button::before{position:absolute;content:"View Source";display:list-item;list-style-type:disclosure-closed;}.view-source-toggle-state:checked ~ .attr .view-source-button::before,.view-source-toggle-state:checked ~ .view-source-button::before{list-style-type:disclosure-open;}.pdoc .docstring{margin-bottom:1.5rem;}.pdoc section:not(.module-info) .docstring{margin-left:clamp(0rem, 5vw - 2rem, 1rem);}.pdoc .docstring .pdoc-code{margin-left:1em;margin-right:1em;}.pdoc h1:target,.pdoc h2:target,.pdoc h3:target,.pdoc h4:target,.pdoc h5:target,.pdoc h6:target,.pdoc .pdoc-code > pre > span:target{background-color:var(--active);box-shadow:-1rem 0 0 0 var(--active);}.pdoc .pdoc-code > pre > span:target{display:block;}.pdoc div:target > .attr,.pdoc section:target > .attr,.pdoc dd:target > a{background-color:var(--active);}.pdoc *{scroll-margin:2rem;}.pdoc .pdoc-code .linenos{user-select:none;}.pdoc .attr:hover{filter:contrast(0.95);}.pdoc section, .pdoc .classattr{position:relative;}.pdoc .headerlink{--width:clamp(1rem, 3vw, 2rem);position:absolute;top:0;left:calc(0rem - var(--width));transition:all 100ms ease-in-out;opacity:0;}.pdoc .headerlink::before{content:"#";display:block;text-align:center;width:var(--width);height:2.3rem;line-height:2.3rem;font-size:1.5rem;}.pdoc .attr:hover ~ .headerlink,.pdoc *:target > .headerlink,.pdoc .headerlink:hover{opacity:1;}.pdoc .attr{display:block;margin:.5rem 0 .5rem;padding:.4rem .4rem .4rem 1rem;background-color:var(--accent);overflow-x:auto;}.pdoc .classattr{margin-left:2rem;}.pdoc .name{color:var(--name);font-weight:bold;}.pdoc .def{color:var(--def);font-weight:bold;}.pdoc .signature{background-color:transparent;}.pdoc .param, .pdoc .return-annotation{white-space:pre;}.pdoc .signature.multiline .param{display:block;}.pdoc .signature.condensed .param{display:inline-block;}.pdoc .annotation{color:var(--annotation);}.pdoc .view-value-toggle-state,.pdoc .view-value-toggle-state ~ .default_value{display:none;}.pdoc .view-value-toggle-state:checked ~ .default_value{display:inherit;}.pdoc .view-value-button{font-size:.5rem;vertical-align:middle;border-style:dashed;margin-top:-0.1rem;}.pdoc .view-value-button:hover{background:white;}.pdoc .view-value-button::before{content:"show";text-align:center;width:2.2em;display:inline-block;}.pdoc .view-value-toggle-state:checked ~ .view-value-button::before{content:"hide";}.pdoc .inherited{margin-left:2rem;}.pdoc .inherited dt{font-weight:700;}.pdoc .inherited dt, .pdoc .inherited dd{display:inline;margin-left:0;margin-bottom:.5rem;}.pdoc .inherited dd:not(:last-child):after{content:", ";}.pdoc .inherited .class:before{content:"class ";}.pdoc .inherited .function a:after{content:"()";}.pdoc .search-result .docstring{overflow:auto;max-height:25vh;}.pdoc .search-result.focused > .attr{background-color:var(--active);}.pdoc .attribution{margin-top:2rem;display:block;opacity:0.5;transition:all 200ms;filter:grayscale(100%);}.pdoc .attribution:hover{opacity:1;filter:grayscale(0%);}.pdoc .attribution img{margin-left:5px;height:35px;vertical-align:middle;width:70px;transition:all 200ms;}.pdoc table{display:block;width:max-content;max-width:100%;overflow:auto;margin-bottom:1rem;}.pdoc table th{font-weight:600;}.pdoc table th, .pdoc table td{padding:6px 13px;border:1px solid var(--accent2);}</style>
+    <style>/*! custom.css */</style><script>
+    window.MathJax = {
+        tex: {
+            inlineMath: [['$', '$'], ['\\(', '\\)']]
+        }
+    };
+</script>
+<script src="https://polyfill.io/v3/polyfill.min.js?features=es6"></script>
+<script id="MathJax-script" async src="https://cdn.jsdelivr.net/npm/mathjax@3/es5/tex-mml-chtml.js"></script>
+<script>
+    /* Re-invoke MathJax when DOM content changes, for example during search. */
+    document.addEventListener("DOMContentLoaded", () => {
+        new MutationObserver(() => MathJax.typeset()).observe(
+            document.querySelector("main.pdoc").parentNode,
+            {childList: true}
+        );
+    })
+</script>
+<style>
+    mjx-container {
+        overflow-x: auto;
+    }
+</style></head>
+<body>
+    <nav class="pdoc">
+        <label id="navtoggle" for="togglestate" class="pdoc-button"><svg xmlns='http://www.w3.org/2000/svg' viewBox='0 0 30 30'><path stroke-linecap='round' stroke="currentColor" stroke-miterlimit='10' stroke-width='2' d='M4 7h22M4 15h22M4 23h22'/></svg></label>
+        <input id="togglestate" type="checkbox" aria-hidden="true" tabindex="-1">
+        <div>            <a class="pdoc-button module-list-button" href="../index.html">
+<svg xmlns="http://www.w3.org/2000/svg" width="16" height="16" fill="currentColor" class="bi bi-box-arrow-in-left" viewBox="0 0 16 16">
+  <path fill-rule="evenodd" d="M10 3.5a.5.5 0 0 0-.5-.5h-8a.5.5 0 0 0-.5.5v9a.5.5 0 0 0 .5.5h8a.5.5 0 0 0 .5-.5v-2a.5.5 0 0 1 1 0v2A1.5 1.5 0 0 1 9.5 14h-8A1.5 1.5 0 0 1 0 12.5v-9A1.5 1.5 0 0 1 1.5 2h8A1.5 1.5 0 0 1 11 3.5v2a.5.5 0 0 1-1 0v-2z"/>
+  <path fill-rule="evenodd" d="M4.146 8.354a.5.5 0 0 1 0-.708l3-3a.5.5 0 1 1 .708.708L5.707 7.5H14.5a.5.5 0 0 1 0 1H5.707l2.147 2.146a.5.5 0 0 1-.708.708l-3-3z"/>
+</svg>                &nbsp;
+                Module Index
+            </a>
+
+
+            <input type="search" placeholder="Search..." role="searchbox" aria-label="search"
+                   pattern=".+" required>
+
+
+
+            <h2>API Documentation</h2>
+                <ul class="memberlist">
+            <li>
+                    <a class="variable" href="#MIGRATION_DIR">MIGRATION_DIR</a>
+            </li>
+            <li>
+                    <a class="function" href="#group_batch_size">group_batch_size</a>
+            </li>
+            <li>
+                    <a class="function" href="#groups_batch_size">groups_batch_size</a>
+            </li>
+            <li>
+                    <a class="function" href="#groups_device">groups_device</a>
+            </li>
+            <li>
+                    <a class="function" href="#group_device">group_device</a>
+            </li>
+            <li>
+                    <a class="function" href="#migrate_model">migrate_model</a>
+            </li>
+            <li>
+                    <a class="class" href="#SaveMigrations">SaveMigrations</a>
+                            <ul class="memberlist">
+                        <li>
+                                <a class="variable" href="#SaveMigrations.migrations">migrations</a>
+                        </li>
+                        <li>
+                                <a class="function" href="#SaveMigrations.on_save_checkpoint">on_save_checkpoint</a>
+                        </li>
+                </ul>
+
+            </li>
+    </ul>
+
+
+
+        <a class="attribution" title="pdoc: Python API documentation generator" href="https://pdoc.dev" target="_blank">
+            built with <span class="visually-hidden">pdoc</span><img
+                alt="pdoc logo"
+                src="data:image/svg+xml,%3Csvg%20xmlns%3D%22http%3A//www.w3.org/2000/svg%22%20role%3D%22img%22%20aria-label%3D%22pdoc%20logo%22%20width%3D%22300%22%20height%3D%22150%22%20viewBox%3D%22-1%200%2060%2030%22%3E%3Ctitle%3Epdoc%3C/title%3E%3Cpath%20d%3D%22M29.621%2021.293c-.011-.273-.214-.475-.511-.481a.5.5%200%200%200-.489.503l-.044%201.393c-.097.551-.695%201.215-1.566%201.704-.577.428-1.306.486-2.193.182-1.426-.617-2.467-1.654-3.304-2.487l-.173-.172a3.43%203.43%200%200%200-.365-.306.49.49%200%200%200-.286-.196c-1.718-1.06-4.931-1.47-7.353.191l-.219.15c-1.707%201.187-3.413%202.131-4.328%201.03-.02-.027-.49-.685-.141-1.763.233-.721.546-2.408.772-4.076.042-.09.067-.187.046-.288.166-1.347.277-2.625.241-3.351%201.378-1.008%202.271-2.586%202.271-4.362%200-.976-.272-1.935-.788-2.774-.057-.094-.122-.18-.184-.268.033-.167.052-.339.052-.516%200-1.477-1.202-2.679-2.679-2.679-.791%200-1.496.352-1.987.9a6.3%206.3%200%200%200-1.001.029c-.492-.564-1.207-.929-2.012-.929-1.477%200-2.679%201.202-2.679%202.679A2.65%202.65%200%200%200%20.97%206.554c-.383.747-.595%201.572-.595%202.41%200%202.311%201.507%204.29%203.635%205.107-.037.699-.147%202.27-.423%203.294l-.137.461c-.622%202.042-2.515%208.257%201.727%2010.643%201.614.908%203.06%201.248%204.317%201.248%202.665%200%204.492-1.524%205.322-2.401%201.476-1.559%202.886-1.854%206.491.82%201.877%201.393%203.514%201.753%204.861%201.068%202.223-1.713%202.811-3.867%203.399-6.374.077-.846.056-1.469.054-1.537zm-4.835%204.313c-.054.305-.156.586-.242.629-.034-.007-.131-.022-.307-.157-.145-.111-.314-.478-.456-.908.221.121.432.25.675.355.115.039.219.051.33.081zm-2.251-1.238c-.05.33-.158.648-.252.694-.022.001-.125-.018-.307-.157-.217-.166-.488-.906-.639-1.573.358.344.754.693%201.198%201.036zm-3.887-2.337c-.006-.116-.018-.231-.041-.342.635.145%201.189.368%201.599.625.097.231.166.481.174.642-.03.049-.055.101-.067.158-.046.013-.128.026-.298.004-.278-.037-.901-.57-1.367-1.087zm-1.127-.497c.116.306.176.625.12.71-.019.014-.117.045-.345.016-.206-.027-.604-.332-.986-.695.41-.051.816-.056%201.211-.031zm-4.535%201.535c.209.22.379.47.358.598-.006.041-.088.138-.351.234-.144.055-.539-.063-.979-.259a11.66%2011.66%200%200%200%20.972-.573zm.983-.664c.359-.237.738-.418%201.126-.554.25.237.479.548.457.694-.006.042-.087.138-.351.235-.174.064-.694-.105-1.232-.375zm-3.381%201.794c-.022.145-.061.29-.149.401-.133.166-.358.248-.69.251h-.002c-.133%200-.306-.26-.45-.621.417.091.854.07%201.291-.031zm-2.066-8.077a4.78%204.78%200%200%201-.775-.584c.172-.115.505-.254.88-.378l-.105.962zm-.331%202.302a10.32%2010.32%200%200%201-.828-.502c.202-.143.576-.328.984-.49l-.156.992zm-.45%202.157l-.701-.403c.214-.115.536-.249.891-.376a11.57%2011.57%200%200%201-.19.779zm-.181%201.716c.064.398.194.702.298.893-.194-.051-.435-.162-.736-.398.061-.119.224-.3.438-.495zM8.87%204.141c0%20.152-.123.276-.276.276s-.275-.124-.275-.276.123-.276.276-.276.275.124.275.276zm-.735-.389a1.15%201.15%200%200%200-.314.783%201.16%201.16%200%200%200%201.162%201.162c.457%200%20.842-.27%201.032-.653.026.117.042.238.042.362a1.68%201.68%200%200%201-1.679%201.679%201.68%201.68%200%200%201-1.679-1.679c0-.843.626-1.535%201.436-1.654zM5.059%205.406A1.68%201.68%200%200%201%203.38%207.085a1.68%201.68%200%200%201-1.679-1.679c0-.037.009-.072.011-.109.21.3.541.508.935.508a1.16%201.16%200%200%200%201.162-1.162%201.14%201.14%200%200%200-.474-.912c.015%200%20.03-.005.045-.005.926.001%201.679.754%201.679%201.68zM3.198%204.141c0%20.152-.123.276-.276.276s-.275-.124-.275-.276.123-.276.276-.276.275.124.275.276zM1.375%208.964c0-.52.103-1.035.288-1.52.466.394%201.06.64%201.717.64%201.144%200%202.116-.725%202.499-1.738.383%201.012%201.355%201.738%202.499%201.738.867%200%201.631-.421%202.121-1.062.307.605.478%201.267.478%201.942%200%202.486-2.153%204.51-4.801%204.51s-4.801-2.023-4.801-4.51zm24.342%2019.349c-.985.498-2.267.168-3.813-.979-3.073-2.281-5.453-3.199-7.813-.705-1.315%201.391-4.163%203.365-8.423.97-3.174-1.786-2.239-6.266-1.261-9.479l.146-.492c.276-1.02.395-2.457.444-3.268a6.11%206.11%200%200%200%201.18.115%206.01%206.01%200%200%200%202.536-.562l-.006.175c-.802.215-1.848.612-2.021%201.25-.079.295.021.601.274.837.219.203.415.364.598.501-.667.304-1.243.698-1.311%201.179-.02.144-.022.507.393.787.213.144.395.26.564.365-1.285.521-1.361.96-1.381%201.126-.018.142-.011.496.427.746l.854.489c-.473.389-.971.914-.999%201.429-.018.278.095.532.316.713.675.556%201.231.721%201.653.721.059%200%20.104-.014.158-.02.207.707.641%201.64%201.513%201.64h.013c.8-.008%201.236-.345%201.462-.626.173-.216.268-.457.325-.692.424.195.93.374%201.372.374.151%200%20.294-.021.423-.068.732-.27.944-.704.993-1.021.009-.061.003-.119.002-.179.266.086.538.147.789.147.15%200%20.294-.021.423-.069.542-.2.797-.489.914-.754.237.147.478.258.704.288.106.014.205.021.296.021.356%200%20.595-.101.767-.229.438.435%201.094.992%201.656%201.067.106.014.205.021.296.021a1.56%201.56%200%200%200%20.323-.035c.17.575.453%201.289.866%201.605.358.273.665.362.914.362a.99.99%200%200%200%20.421-.093%201.03%201.03%200%200%200%20.245-.164c.168.428.39.846.68%201.068.358.273.665.362.913.362a.99.99%200%200%200%20.421-.093c.317-.148.512-.448.639-.762.251.157.495.257.726.257.127%200%20.25-.024.37-.071.427-.17.706-.617.841-1.314.022-.015.047-.022.068-.038.067-.051.133-.104.196-.159-.443%201.486-1.107%202.761-2.086%203.257zM8.66%209.925a.5.5%200%201%200-1%200c0%20.653-.818%201.205-1.787%201.205s-1.787-.552-1.787-1.205a.5.5%200%201%200-1%200c0%201.216%201.25%202.205%202.787%202.205s2.787-.989%202.787-2.205zm4.4%2015.965l-.208.097c-2.661%201.258-4.708%201.436-6.086.527-1.542-1.017-1.88-3.19-1.844-4.198a.4.4%200%200%200-.385-.414c-.242-.029-.406.164-.414.385-.046%201.249.367%203.686%202.202%204.896.708.467%201.547.7%202.51.7%201.248%200%202.706-.392%204.362-1.174l.185-.086a.4.4%200%200%200%20.205-.527c-.089-.204-.326-.291-.527-.206zM9.547%202.292c.093.077.205.114.317.114a.5.5%200%200%200%20.318-.886L8.817.397a.5.5%200%200%200-.703.068.5.5%200%200%200%20.069.703l1.364%201.124zm-7.661-.065c.086%200%20.173-.022.253-.068l1.523-.893a.5.5%200%200%200-.506-.863l-1.523.892a.5.5%200%200%200-.179.685c.094.158.261.247.432.247z%22%20transform%3D%22matrix%28-1%200%200%201%2058%200%29%22%20fill%3D%22%233bb300%22/%3E%3Cpath%20d%3D%22M.3%2021.86V10.18q0-.46.02-.68.04-.22.18-.5.28-.54%201.34-.54%201.06%200%201.42.28.38.26.44.78.76-1.04%202.38-1.04%201.64%200%203.1%201.54%201.46%201.54%201.46%203.58%200%202.04-1.46%203.58-1.44%201.54-3.08%201.54-1.64%200-2.38-.92v4.04q0%20.46-.04.68-.02.22-.18.5-.14.3-.5.42-.36.12-.98.12-.62%200-1-.12-.36-.12-.52-.4-.14-.28-.18-.5-.02-.22-.02-.68zm3.96-9.42q-.46.54-.46%201.18%200%20.64.46%201.18.48.52%201.2.52.74%200%201.24-.52.52-.52.52-1.18%200-.66-.48-1.18-.48-.54-1.26-.54-.76%200-1.22.54zm14.741-8.36q.16-.3.54-.42.38-.12%201-.12.64%200%201.02.12.38.12.52.42.16.3.18.54.04.22.04.68v11.94q0%20.46-.04.7-.02.22-.18.5-.3.54-1.7.54-1.38%200-1.54-.98-.84.96-2.34.96-1.8%200-3.28-1.56-1.48-1.58-1.48-3.66%200-2.1%201.48-3.68%201.5-1.58%203.28-1.58%201.48%200%202.3%201v-4.2q0-.46.02-.68.04-.24.18-.52zm-3.24%2010.86q.52.54%201.26.54.74%200%201.22-.54.5-.54.5-1.18%200-.66-.48-1.22-.46-.56-1.26-.56-.8%200-1.28.56-.48.54-.48%201.2%200%20.66.52%201.2zm7.833-1.2q0-2.4%201.68-3.96%201.68-1.56%203.84-1.56%202.16%200%203.82%201.56%201.66%201.54%201.66%203.94%200%201.66-.86%202.96-.86%201.28-2.1%201.9-1.22.6-2.54.6-1.32%200-2.56-.64-1.24-.66-2.1-1.92-.84-1.28-.84-2.88zm4.18%201.44q.64.48%201.3.48.66%200%201.32-.5.66-.5.66-1.48%200-.98-.62-1.46-.62-.48-1.34-.48-.72%200-1.34.5-.62.5-.62%201.48%200%20.96.64%201.46zm11.412-1.44q0%20.84.56%201.32.56.46%201.18.46.64%200%201.18-.36.56-.38.9-.38.6%200%201.46%201.06.46.58.46%201.04%200%20.76-1.1%201.42-1.14.8-2.8.8-1.86%200-3.58-1.34-.82-.64-1.34-1.7-.52-1.08-.52-2.36%200-1.3.52-2.34.52-1.06%201.34-1.7%201.66-1.32%203.54-1.32.76%200%201.48.22.72.2%201.06.4l.32.2q.36.24.56.38.52.4.52.92%200%20.5-.42%201.14-.72%201.1-1.38%201.1-.38%200-1.08-.44-.36-.34-1.04-.34-.66%200-1.24.48-.58.48-.58%201.34z%22%20fill%3D%22green%22/%3E%3C/svg%3E"/>
+        </a>
+</div>
+    </nav>
+    <main class="pdoc">
+            <section class="module-info">
+                    <h1 class="modulename">
+shimmer<wbr>.utils    </h1>
+
+                
+                        <input id="mod-utils-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
+
+                        <label class="view-source-button" for="mod-utils-view-source"><span>View Source</span></label>
+
+                        <div class="pdoc-code codehilite"><pre><span></span><span id="L-1"><a href="#L-1"><span class="linenos"> 1</span></a><span class="kn">from</span> <span class="nn">os</span> <span class="kn">import</span> <span class="n">PathLike</span>
+</span><span id="L-2"><a href="#L-2"><span class="linenos"> 2</span></a><span class="kn">from</span> <span class="nn">pathlib</span> <span class="kn">import</span> <span class="n">Path</span>
+</span><span id="L-3"><a href="#L-3"><span class="linenos"> 3</span></a><span class="kn">from</span> <span class="nn">typing</span> <span class="kn">import</span> <span class="n">Any</span>
+</span><span id="L-4"><a href="#L-4"><span class="linenos"> 4</span></a>
+</span><span id="L-5"><a href="#L-5"><span class="linenos"> 5</span></a><span class="kn">import</span> <span class="nn">torch</span>
+</span><span id="L-6"><a href="#L-6"><span class="linenos"> 6</span></a><span class="kn">from</span> <span class="nn">lightning.pytorch</span> <span class="kn">import</span> <span class="n">Callback</span><span class="p">,</span> <span class="n">LightningModule</span><span class="p">,</span> <span class="n">Trainer</span>
+</span><span id="L-7"><a href="#L-7"><span class="linenos"> 7</span></a><span class="kn">from</span> <span class="nn">migrate_ckpt</span> <span class="kn">import</span> <span class="p">(</span>
+</span><span id="L-8"><a href="#L-8"><span class="linenos"> 8</span></a>    <span class="n">ckpt_migration_key</span><span class="p">,</span>
+</span><span id="L-9"><a href="#L-9"><span class="linenos"> 9</span></a>    <span class="n">get_folder_migrations</span><span class="p">,</span>
+</span><span id="L-10"><a href="#L-10"><span class="linenos">10</span></a>    <span class="n">migrate_from_folder</span><span class="p">,</span>
+</span><span id="L-11"><a href="#L-11"><span class="linenos">11</span></a><span class="p">)</span>
+</span><span id="L-12"><a href="#L-12"><span class="linenos">12</span></a>
+</span><span id="L-13"><a href="#L-13"><span class="linenos">13</span></a><span class="kn">from</span> <span class="nn">shimmer.types</span> <span class="kn">import</span> <span class="n">LatentsDomainGroupsT</span><span class="p">,</span> <span class="n">LatentsDomainGroupT</span>
+</span><span id="L-14"><a href="#L-14"><span class="linenos">14</span></a>
+</span><span id="L-15"><a href="#L-15"><span class="linenos">15</span></a><span class="n">MIGRATION_DIR</span> <span class="o">=</span> <span class="n">Path</span><span class="p">(</span><span class="vm">__file__</span><span class="p">)</span><span class="o">.</span><span class="n">parent</span> <span class="o">/</span> <span class="s2">&quot;ckpt_migrations&quot;</span>
+</span><span id="L-16"><a href="#L-16"><span class="linenos">16</span></a>
+</span><span id="L-17"><a href="#L-17"><span class="linenos">17</span></a>
+</span><span id="L-18"><a href="#L-18"><span class="linenos">18</span></a><span class="k">def</span> <span class="nf">group_batch_size</span><span class="p">(</span><span class="n">x</span><span class="p">:</span> <span class="n">LatentsDomainGroupT</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">int</span><span class="p">:</span>
+</span><span id="L-19"><a href="#L-19"><span class="linenos">19</span></a>    <span class="k">for</span> <span class="n">val</span> <span class="ow">in</span> <span class="n">x</span><span class="o">.</span><span class="n">values</span><span class="p">():</span>
+</span><span id="L-20"><a href="#L-20"><span class="linenos">20</span></a>        <span class="k">return</span> <span class="n">val</span><span class="o">.</span><span class="n">size</span><span class="p">(</span><span class="mi">0</span><span class="p">)</span>
+</span><span id="L-21"><a href="#L-21"><span class="linenos">21</span></a>    <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s2">&quot;Got empty group.&quot;</span><span class="p">)</span>
+</span><span id="L-22"><a href="#L-22"><span class="linenos">22</span></a>
+</span><span id="L-23"><a href="#L-23"><span class="linenos">23</span></a>
+</span><span id="L-24"><a href="#L-24"><span class="linenos">24</span></a><span class="k">def</span> <span class="nf">groups_batch_size</span><span class="p">(</span><span class="n">domain_latents</span><span class="p">:</span> <span class="n">LatentsDomainGroupsT</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">int</span><span class="p">:</span>
+</span><span id="L-25"><a href="#L-25"><span class="linenos">25</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="L-26"><a href="#L-26"><span class="linenos">26</span></a><span class="sd">    Get the batch size of the batch.</span>
+</span><span id="L-27"><a href="#L-27"><span class="linenos">27</span></a>
+</span><span id="L-28"><a href="#L-28"><span class="linenos">28</span></a><span class="sd">    Args:</span>
+</span><span id="L-29"><a href="#L-29"><span class="linenos">29</span></a><span class="sd">        domain_latents (`LatentsDomainGroupsT`): the batch of groups.</span>
+</span><span id="L-30"><a href="#L-30"><span class="linenos">30</span></a>
+</span><span id="L-31"><a href="#L-31"><span class="linenos">31</span></a><span class="sd">    Returns:</span>
+</span><span id="L-32"><a href="#L-32"><span class="linenos">32</span></a><span class="sd">        int: the batch size.</span>
+</span><span id="L-33"><a href="#L-33"><span class="linenos">33</span></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="L-34"><a href="#L-34"><span class="linenos">34</span></a>    <span class="k">for</span> <span class="n">data</span> <span class="ow">in</span> <span class="n">domain_latents</span><span class="o">.</span><span class="n">values</span><span class="p">():</span>
+</span><span id="L-35"><a href="#L-35"><span class="linenos">35</span></a>        <span class="k">for</span> <span class="n">tensor</span> <span class="ow">in</span> <span class="n">data</span><span class="o">.</span><span class="n">values</span><span class="p">():</span>
+</span><span id="L-36"><a href="#L-36"><span class="linenos">36</span></a>            <span class="k">return</span> <span class="n">tensor</span><span class="o">.</span><span class="n">size</span><span class="p">(</span><span class="mi">0</span><span class="p">)</span>
+</span><span id="L-37"><a href="#L-37"><span class="linenos">37</span></a>    <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s2">&quot;Empty batch.&quot;</span><span class="p">)</span>
+</span><span id="L-38"><a href="#L-38"><span class="linenos">38</span></a>
+</span><span id="L-39"><a href="#L-39"><span class="linenos">39</span></a>
+</span><span id="L-40"><a href="#L-40"><span class="linenos">40</span></a><span class="k">def</span> <span class="nf">groups_device</span><span class="p">(</span><span class="n">domain_latents</span><span class="p">:</span> <span class="n">LatentsDomainGroupsT</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">int</span><span class="p">:</span>
+</span><span id="L-41"><a href="#L-41"><span class="linenos">41</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="L-42"><a href="#L-42"><span class="linenos">42</span></a><span class="sd">    Get the batch size of the batch.</span>
+</span><span id="L-43"><a href="#L-43"><span class="linenos">43</span></a>
+</span><span id="L-44"><a href="#L-44"><span class="linenos">44</span></a><span class="sd">    Args:</span>
+</span><span id="L-45"><a href="#L-45"><span class="linenos">45</span></a><span class="sd">        domain_latents (`LatentsDomainGroupsT`): the batch of groups.</span>
+</span><span id="L-46"><a href="#L-46"><span class="linenos">46</span></a>
+</span><span id="L-47"><a href="#L-47"><span class="linenos">47</span></a><span class="sd">    Returns:</span>
+</span><span id="L-48"><a href="#L-48"><span class="linenos">48</span></a><span class="sd">        int: the batch size.</span>
+</span><span id="L-49"><a href="#L-49"><span class="linenos">49</span></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="L-50"><a href="#L-50"><span class="linenos">50</span></a>    <span class="k">for</span> <span class="n">data</span> <span class="ow">in</span> <span class="n">domain_latents</span><span class="o">.</span><span class="n">values</span><span class="p">():</span>
+</span><span id="L-51"><a href="#L-51"><span class="linenos">51</span></a>        <span class="k">for</span> <span class="n">tensor</span> <span class="ow">in</span> <span class="n">data</span><span class="o">.</span><span class="n">values</span><span class="p">():</span>
+</span><span id="L-52"><a href="#L-52"><span class="linenos">52</span></a>            <span class="k">return</span> <span class="n">tensor</span><span class="o">.</span><span class="n">size</span><span class="p">(</span><span class="mi">0</span><span class="p">)</span>
+</span><span id="L-53"><a href="#L-53"><span class="linenos">53</span></a>    <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s2">&quot;Empty batch.&quot;</span><span class="p">)</span>
+</span><span id="L-54"><a href="#L-54"><span class="linenos">54</span></a>
+</span><span id="L-55"><a href="#L-55"><span class="linenos">55</span></a>
+</span><span id="L-56"><a href="#L-56"><span class="linenos">56</span></a><span class="k">def</span> <span class="nf">group_device</span><span class="p">(</span><span class="n">x</span><span class="p">:</span> <span class="n">LatentsDomainGroupT</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">torch</span><span class="o">.</span><span class="n">device</span><span class="p">:</span>
+</span><span id="L-57"><a href="#L-57"><span class="linenos">57</span></a>    <span class="k">for</span> <span class="n">val</span> <span class="ow">in</span> <span class="n">x</span><span class="o">.</span><span class="n">values</span><span class="p">():</span>
+</span><span id="L-58"><a href="#L-58"><span class="linenos">58</span></a>        <span class="k">return</span> <span class="n">val</span><span class="o">.</span><span class="n">device</span>
+</span><span id="L-59"><a href="#L-59"><span class="linenos">59</span></a>    <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s2">&quot;Got empty group.&quot;</span><span class="p">)</span>
+</span><span id="L-60"><a href="#L-60"><span class="linenos">60</span></a>
+</span><span id="L-61"><a href="#L-61"><span class="linenos">61</span></a>
+</span><span id="L-62"><a href="#L-62"><span class="linenos">62</span></a><span class="k">def</span> <span class="nf">migrate_model</span><span class="p">(</span><span class="n">ckpt_path</span><span class="p">:</span> <span class="nb">str</span> <span class="o">|</span> <span class="n">PathLike</span><span class="p">,</span> <span class="o">**</span><span class="n">torch_load_kwargs</span><span class="p">):</span>
+</span><span id="L-63"><a href="#L-63"><span class="linenos">63</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="L-64"><a href="#L-64"><span class="linenos">64</span></a><span class="sd">    Migrates a model checkpoint</span>
+</span><span id="L-65"><a href="#L-65"><span class="linenos">65</span></a>
+</span><span id="L-66"><a href="#L-66"><span class="linenos">66</span></a><span class="sd">    After the migration, the given checkpoint will be migrated.</span>
+</span><span id="L-67"><a href="#L-67"><span class="linenos">67</span></a><span class="sd">    Other versions of the checkpoint will be saved under the stem-version.suffix.</span>
+</span><span id="L-68"><a href="#L-68"><span class="linenos">68</span></a>
+</span><span id="L-69"><a href="#L-69"><span class="linenos">69</span></a><span class="sd">    Args:</span>
+</span><span id="L-70"><a href="#L-70"><span class="linenos">70</span></a><span class="sd">        ckpt_path (`str | PathLike`):  path to checkpoint</span>
+</span><span id="L-71"><a href="#L-71"><span class="linenos">71</span></a><span class="sd">        torch_load_kwargs: additional args given to torch.load.</span>
+</span><span id="L-72"><a href="#L-72"><span class="linenos">72</span></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="L-73"><a href="#L-73"><span class="linenos">73</span></a>    <span class="n">ckpt_path</span> <span class="o">=</span> <span class="n">Path</span><span class="p">(</span><span class="n">ckpt_path</span><span class="p">)</span>
+</span><span id="L-74"><a href="#L-74"><span class="linenos">74</span></a>    <span class="n">ckpt</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">load</span><span class="p">(</span><span class="n">ckpt_path</span><span class="p">,</span> <span class="o">**</span><span class="n">torch_load_kwargs</span><span class="p">)</span>
+</span><span id="L-75"><a href="#L-75"><span class="linenos">75</span></a>    <span class="n">new_ckpt</span><span class="p">,</span> <span class="n">done_migrations</span> <span class="o">=</span> <span class="n">migrate_from_folder</span><span class="p">(</span><span class="n">ckpt</span><span class="p">,</span> <span class="n">MIGRATION_DIR</span><span class="p">)</span>
+</span><span id="L-76"><a href="#L-76"><span class="linenos">76</span></a>    <span class="n">done_migration_log</span> <span class="o">=</span> <span class="s2">&quot;, &quot;</span><span class="o">.</span><span class="n">join</span><span class="p">(</span><span class="nb">map</span><span class="p">(</span><span class="k">lambda</span> <span class="n">x</span><span class="p">:</span> <span class="n">x</span><span class="o">.</span><span class="n">name</span><span class="p">,</span> <span class="n">done_migrations</span><span class="p">))</span>
+</span><span id="L-77"><a href="#L-77"><span class="linenos">77</span></a>    <span class="nb">print</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Migrating: </span><span class="si">{</span><span class="n">done_migration_log</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">)</span>
+</span><span id="L-78"><a href="#L-78"><span class="linenos">78</span></a>    <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">done_migrations</span><span class="p">)</span> <span class="ow">or</span> <span class="n">ckpt_migration_key</span> <span class="ow">not</span> <span class="ow">in</span> <span class="n">ckpt</span><span class="p">:</span>
+</span><span id="L-79"><a href="#L-79"><span class="linenos">79</span></a>        <span class="n">version</span> <span class="o">=</span> <span class="mi">0</span>
+</span><span id="L-80"><a href="#L-80"><span class="linenos">80</span></a>        <span class="k">if</span> <span class="n">ckpt_migration_key</span> <span class="ow">in</span> <span class="n">ckpt</span><span class="p">:</span>
+</span><span id="L-81"><a href="#L-81"><span class="linenos">81</span></a>            <span class="n">version</span> <span class="o">=</span> <span class="nb">len</span><span class="p">(</span><span class="n">ckpt</span><span class="p">[</span><span class="n">ckpt_migration_key</span><span class="p">])</span>
+</span><span id="L-82"><a href="#L-82"><span class="linenos">82</span></a>        <span class="n">torch</span><span class="o">.</span><span class="n">save</span><span class="p">(</span><span class="n">ckpt</span><span class="p">,</span> <span class="n">ckpt_path</span><span class="o">.</span><span class="n">with_stem</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;</span><span class="si">{</span><span class="n">ckpt_path</span><span class="o">.</span><span class="n">stem</span><span class="si">}</span><span class="s2">-</span><span class="si">{</span><span class="n">version</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">))</span>
+</span><span id="L-83"><a href="#L-83"><span class="linenos">83</span></a>        <span class="n">torch</span><span class="o">.</span><span class="n">save</span><span class="p">(</span><span class="n">new_ckpt</span><span class="p">,</span> <span class="n">ckpt_path</span><span class="p">)</span>
+</span><span id="L-84"><a href="#L-84"><span class="linenos">84</span></a>
+</span><span id="L-85"><a href="#L-85"><span class="linenos">85</span></a>
+</span><span id="L-86"><a href="#L-86"><span class="linenos">86</span></a><span class="k">class</span> <span class="nc">SaveMigrations</span><span class="p">(</span><span class="n">Callback</span><span class="p">):</span>
+</span><span id="L-87"><a href="#L-87"><span class="linenos">87</span></a>    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
+</span><span id="L-88"><a href="#L-88"><span class="linenos">88</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">migrations</span> <span class="o">=</span> <span class="n">get_folder_migrations</span><span class="p">(</span><span class="n">MIGRATION_DIR</span><span class="p">)</span>
+</span><span id="L-89"><a href="#L-89"><span class="linenos">89</span></a>
+</span><span id="L-90"><a href="#L-90"><span class="linenos">90</span></a>    <span class="k">def</span> <span class="nf">on_save_checkpoint</span><span class="p">(</span>
+</span><span id="L-91"><a href="#L-91"><span class="linenos">91</span></a>        <span class="bp">self</span><span class="p">,</span> <span class="n">trainer</span><span class="p">:</span> <span class="n">Trainer</span><span class="p">,</span> <span class="n">pl_module</span><span class="p">:</span> <span class="n">LightningModule</span><span class="p">,</span> <span class="n">checkpoint</span><span class="p">:</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">Any</span><span class="p">]</span>
+</span><span id="L-92"><a href="#L-92"><span class="linenos">92</span></a>    <span class="p">):</span>
+</span><span id="L-93"><a href="#L-93"><span class="linenos">93</span></a>        <span class="n">checkpoint</span><span class="p">[</span><span class="n">ckpt_migration_key</span><span class="p">]</span> <span class="o">=</span> <span class="p">[</span><span class="n">mig</span><span class="o">.</span><span class="n">name</span> <span class="k">for</span> <span class="n">mig</span> <span class="ow">in</span> <span class="bp">self</span><span class="o">.</span><span class="n">migrations</span><span class="p">]</span>
+</span></pre></div>
+
+
+            </section>
+                <section id="MIGRATION_DIR">
+                    <div class="attr variable">
+            <span class="name">MIGRATION_DIR</span>        =
+<span class="default_value">PosixPath(&#39;/home/runner/work/shimmer/shimmer/shimmer/ckpt_migrations&#39;)</span>
+
+        
+    </div>
+    <a class="headerlink" href="#MIGRATION_DIR"></a>
+    
+    
+
+                </section>
+                <section id="group_batch_size">
+                            <input id="group_batch_size-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
+<div class="attr function">
+            
+        <span class="def">def</span>
+        <span class="name">group_batch_size</span><span class="signature pdoc-code condensed">(<span class="param"><span class="n">x</span><span class="p">:</span> <span class="n">collections</span><span class="o">.</span><span class="n">abc</span><span class="o">.</span><span class="n">Mapping</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]</span></span><span class="return-annotation">) -> <span class="nb">int</span>:</span></span>
+
+                <label class="view-source-button" for="group_batch_size-view-source"><span>View Source</span></label>
+
+    </div>
+    <a class="headerlink" href="#group_batch_size"></a>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="group_batch_size-19"><a href="#group_batch_size-19"><span class="linenos">19</span></a><span class="k">def</span> <span class="nf">group_batch_size</span><span class="p">(</span><span class="n">x</span><span class="p">:</span> <span class="n">LatentsDomainGroupT</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">int</span><span class="p">:</span>
+</span><span id="group_batch_size-20"><a href="#group_batch_size-20"><span class="linenos">20</span></a>    <span class="k">for</span> <span class="n">val</span> <span class="ow">in</span> <span class="n">x</span><span class="o">.</span><span class="n">values</span><span class="p">():</span>
+</span><span id="group_batch_size-21"><a href="#group_batch_size-21"><span class="linenos">21</span></a>        <span class="k">return</span> <span class="n">val</span><span class="o">.</span><span class="n">size</span><span class="p">(</span><span class="mi">0</span><span class="p">)</span>
+</span><span id="group_batch_size-22"><a href="#group_batch_size-22"><span class="linenos">22</span></a>    <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s2">&quot;Got empty group.&quot;</span><span class="p">)</span>
+</span></pre></div>
+
+
+    
+
+                </section>
+                <section id="groups_batch_size">
+                            <input id="groups_batch_size-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
+<div class="attr function">
+            
+        <span class="def">def</span>
+        <span class="name">groups_batch_size</span><span class="signature pdoc-code multiline">(<span class="param">	<span class="n">domain_latents</span><span class="p">:</span> <span class="n">collections</span><span class="o">.</span><span class="n">abc</span><span class="o">.</span><span class="n">Mapping</span><span class="p">[</span><span class="nb">frozenset</span><span class="p">[</span><span class="nb">str</span><span class="p">],</span> <span class="n">collections</span><span class="o">.</span><span class="n">abc</span><span class="o">.</span><span class="n">Mapping</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]]</span></span><span class="return-annotation">) -> <span class="nb">int</span>:</span></span>
+
+                <label class="view-source-button" for="groups_batch_size-view-source"><span>View Source</span></label>
+
+    </div>
+    <a class="headerlink" href="#groups_batch_size"></a>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="groups_batch_size-25"><a href="#groups_batch_size-25"><span class="linenos">25</span></a><span class="k">def</span> <span class="nf">groups_batch_size</span><span class="p">(</span><span class="n">domain_latents</span><span class="p">:</span> <span class="n">LatentsDomainGroupsT</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">int</span><span class="p">:</span>
+</span><span id="groups_batch_size-26"><a href="#groups_batch_size-26"><span class="linenos">26</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="groups_batch_size-27"><a href="#groups_batch_size-27"><span class="linenos">27</span></a><span class="sd">    Get the batch size of the batch.</span>
+</span><span id="groups_batch_size-28"><a href="#groups_batch_size-28"><span class="linenos">28</span></a>
+</span><span id="groups_batch_size-29"><a href="#groups_batch_size-29"><span class="linenos">29</span></a><span class="sd">    Args:</span>
+</span><span id="groups_batch_size-30"><a href="#groups_batch_size-30"><span class="linenos">30</span></a><span class="sd">        domain_latents (`LatentsDomainGroupsT`): the batch of groups.</span>
+</span><span id="groups_batch_size-31"><a href="#groups_batch_size-31"><span class="linenos">31</span></a>
+</span><span id="groups_batch_size-32"><a href="#groups_batch_size-32"><span class="linenos">32</span></a><span class="sd">    Returns:</span>
+</span><span id="groups_batch_size-33"><a href="#groups_batch_size-33"><span class="linenos">33</span></a><span class="sd">        int: the batch size.</span>
+</span><span id="groups_batch_size-34"><a href="#groups_batch_size-34"><span class="linenos">34</span></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="groups_batch_size-35"><a href="#groups_batch_size-35"><span class="linenos">35</span></a>    <span class="k">for</span> <span class="n">data</span> <span class="ow">in</span> <span class="n">domain_latents</span><span class="o">.</span><span class="n">values</span><span class="p">():</span>
+</span><span id="groups_batch_size-36"><a href="#groups_batch_size-36"><span class="linenos">36</span></a>        <span class="k">for</span> <span class="n">tensor</span> <span class="ow">in</span> <span class="n">data</span><span class="o">.</span><span class="n">values</span><span class="p">():</span>
+</span><span id="groups_batch_size-37"><a href="#groups_batch_size-37"><span class="linenos">37</span></a>            <span class="k">return</span> <span class="n">tensor</span><span class="o">.</span><span class="n">size</span><span class="p">(</span><span class="mi">0</span><span class="p">)</span>
+</span><span id="groups_batch_size-38"><a href="#groups_batch_size-38"><span class="linenos">38</span></a>    <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s2">&quot;Empty batch.&quot;</span><span class="p">)</span>
+</span></pre></div>
+
+
+            <div class="docstring"><p>Get the batch size of the batch.</p>
+
+<h6 id="arguments">Arguments:</h6>
+
+<ul>
+<li><strong>domain_latents (<code>LatentsDomainGroupsT</code>):</strong>  the batch of groups.</li>
+</ul>
+
+<h6 id="returns">Returns:</h6>
+
+<blockquote>
+  <p>int: the batch size.</p>
+</blockquote>
+</div>
+
+
+                </section>
+                <section id="groups_device">
+                            <input id="groups_device-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
+<div class="attr function">
+            
+        <span class="def">def</span>
+        <span class="name">groups_device</span><span class="signature pdoc-code multiline">(<span class="param">	<span class="n">domain_latents</span><span class="p">:</span> <span class="n">collections</span><span class="o">.</span><span class="n">abc</span><span class="o">.</span><span class="n">Mapping</span><span class="p">[</span><span class="nb">frozenset</span><span class="p">[</span><span class="nb">str</span><span class="p">],</span> <span class="n">collections</span><span class="o">.</span><span class="n">abc</span><span class="o">.</span><span class="n">Mapping</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]]</span></span><span class="return-annotation">) -> <span class="nb">int</span>:</span></span>
+
+                <label class="view-source-button" for="groups_device-view-source"><span>View Source</span></label>
+
+    </div>
+    <a class="headerlink" href="#groups_device"></a>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="groups_device-41"><a href="#groups_device-41"><span class="linenos">41</span></a><span class="k">def</span> <span class="nf">groups_device</span><span class="p">(</span><span class="n">domain_latents</span><span class="p">:</span> <span class="n">LatentsDomainGroupsT</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="nb">int</span><span class="p">:</span>
+</span><span id="groups_device-42"><a href="#groups_device-42"><span class="linenos">42</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="groups_device-43"><a href="#groups_device-43"><span class="linenos">43</span></a><span class="sd">    Get the batch size of the batch.</span>
+</span><span id="groups_device-44"><a href="#groups_device-44"><span class="linenos">44</span></a>
+</span><span id="groups_device-45"><a href="#groups_device-45"><span class="linenos">45</span></a><span class="sd">    Args:</span>
+</span><span id="groups_device-46"><a href="#groups_device-46"><span class="linenos">46</span></a><span class="sd">        domain_latents (`LatentsDomainGroupsT`): the batch of groups.</span>
+</span><span id="groups_device-47"><a href="#groups_device-47"><span class="linenos">47</span></a>
+</span><span id="groups_device-48"><a href="#groups_device-48"><span class="linenos">48</span></a><span class="sd">    Returns:</span>
+</span><span id="groups_device-49"><a href="#groups_device-49"><span class="linenos">49</span></a><span class="sd">        int: the batch size.</span>
+</span><span id="groups_device-50"><a href="#groups_device-50"><span class="linenos">50</span></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="groups_device-51"><a href="#groups_device-51"><span class="linenos">51</span></a>    <span class="k">for</span> <span class="n">data</span> <span class="ow">in</span> <span class="n">domain_latents</span><span class="o">.</span><span class="n">values</span><span class="p">():</span>
+</span><span id="groups_device-52"><a href="#groups_device-52"><span class="linenos">52</span></a>        <span class="k">for</span> <span class="n">tensor</span> <span class="ow">in</span> <span class="n">data</span><span class="o">.</span><span class="n">values</span><span class="p">():</span>
+</span><span id="groups_device-53"><a href="#groups_device-53"><span class="linenos">53</span></a>            <span class="k">return</span> <span class="n">tensor</span><span class="o">.</span><span class="n">size</span><span class="p">(</span><span class="mi">0</span><span class="p">)</span>
+</span><span id="groups_device-54"><a href="#groups_device-54"><span class="linenos">54</span></a>    <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s2">&quot;Empty batch.&quot;</span><span class="p">)</span>
+</span></pre></div>
+
+
+            <div class="docstring"><p>Get the batch size of the batch.</p>
+
+<h6 id="arguments">Arguments:</h6>
+
+<ul>
+<li><strong>domain_latents (<code>LatentsDomainGroupsT</code>):</strong>  the batch of groups.</li>
+</ul>
+
+<h6 id="returns">Returns:</h6>
+
+<blockquote>
+  <p>int: the batch size.</p>
+</blockquote>
+</div>
+
+
+                </section>
+                <section id="group_device">
+                            <input id="group_device-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
+<div class="attr function">
+            
+        <span class="def">def</span>
+        <span class="name">group_device</span><span class="signature pdoc-code condensed">(<span class="param"><span class="n">x</span><span class="p">:</span> <span class="n">collections</span><span class="o">.</span><span class="n">abc</span><span class="o">.</span><span class="n">Mapping</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">torch</span><span class="o">.</span><span class="n">Tensor</span><span class="p">]</span></span><span class="return-annotation">) -> <span class="n">torch</span><span class="o">.</span><span class="n">device</span>:</span></span>
+
+                <label class="view-source-button" for="group_device-view-source"><span>View Source</span></label>
+
+    </div>
+    <a class="headerlink" href="#group_device"></a>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="group_device-57"><a href="#group_device-57"><span class="linenos">57</span></a><span class="k">def</span> <span class="nf">group_device</span><span class="p">(</span><span class="n">x</span><span class="p">:</span> <span class="n">LatentsDomainGroupT</span><span class="p">)</span> <span class="o">-&gt;</span> <span class="n">torch</span><span class="o">.</span><span class="n">device</span><span class="p">:</span>
+</span><span id="group_device-58"><a href="#group_device-58"><span class="linenos">58</span></a>    <span class="k">for</span> <span class="n">val</span> <span class="ow">in</span> <span class="n">x</span><span class="o">.</span><span class="n">values</span><span class="p">():</span>
+</span><span id="group_device-59"><a href="#group_device-59"><span class="linenos">59</span></a>        <span class="k">return</span> <span class="n">val</span><span class="o">.</span><span class="n">device</span>
+</span><span id="group_device-60"><a href="#group_device-60"><span class="linenos">60</span></a>    <span class="k">raise</span> <span class="ne">ValueError</span><span class="p">(</span><span class="s2">&quot;Got empty group.&quot;</span><span class="p">)</span>
+</span></pre></div>
+
+
+    
+
+                </section>
+                <section id="migrate_model">
+                            <input id="migrate_model-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
+<div class="attr function">
+            
+        <span class="def">def</span>
+        <span class="name">migrate_model</span><span class="signature pdoc-code condensed">(<span class="param"><span class="n">ckpt_path</span><span class="p">:</span> <span class="nb">str</span> <span class="o">|</span> <span class="n">os</span><span class="o">.</span><span class="n">PathLike</span>, </span><span class="param"><span class="o">**</span><span class="n">torch_load_kwargs</span></span><span class="return-annotation">):</span></span>
+
+                <label class="view-source-button" for="migrate_model-view-source"><span>View Source</span></label>
+
+    </div>
+    <a class="headerlink" href="#migrate_model"></a>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="migrate_model-63"><a href="#migrate_model-63"><span class="linenos">63</span></a><span class="k">def</span> <span class="nf">migrate_model</span><span class="p">(</span><span class="n">ckpt_path</span><span class="p">:</span> <span class="nb">str</span> <span class="o">|</span> <span class="n">PathLike</span><span class="p">,</span> <span class="o">**</span><span class="n">torch_load_kwargs</span><span class="p">):</span>
+</span><span id="migrate_model-64"><a href="#migrate_model-64"><span class="linenos">64</span></a><span class="w">    </span><span class="sd">&quot;&quot;&quot;</span>
+</span><span id="migrate_model-65"><a href="#migrate_model-65"><span class="linenos">65</span></a><span class="sd">    Migrates a model checkpoint</span>
+</span><span id="migrate_model-66"><a href="#migrate_model-66"><span class="linenos">66</span></a>
+</span><span id="migrate_model-67"><a href="#migrate_model-67"><span class="linenos">67</span></a><span class="sd">    After the migration, the given checkpoint will be migrated.</span>
+</span><span id="migrate_model-68"><a href="#migrate_model-68"><span class="linenos">68</span></a><span class="sd">    Other versions of the checkpoint will be saved under the stem-version.suffix.</span>
+</span><span id="migrate_model-69"><a href="#migrate_model-69"><span class="linenos">69</span></a>
+</span><span id="migrate_model-70"><a href="#migrate_model-70"><span class="linenos">70</span></a><span class="sd">    Args:</span>
+</span><span id="migrate_model-71"><a href="#migrate_model-71"><span class="linenos">71</span></a><span class="sd">        ckpt_path (`str | PathLike`):  path to checkpoint</span>
+</span><span id="migrate_model-72"><a href="#migrate_model-72"><span class="linenos">72</span></a><span class="sd">        torch_load_kwargs: additional args given to torch.load.</span>
+</span><span id="migrate_model-73"><a href="#migrate_model-73"><span class="linenos">73</span></a><span class="sd">    &quot;&quot;&quot;</span>
+</span><span id="migrate_model-74"><a href="#migrate_model-74"><span class="linenos">74</span></a>    <span class="n">ckpt_path</span> <span class="o">=</span> <span class="n">Path</span><span class="p">(</span><span class="n">ckpt_path</span><span class="p">)</span>
+</span><span id="migrate_model-75"><a href="#migrate_model-75"><span class="linenos">75</span></a>    <span class="n">ckpt</span> <span class="o">=</span> <span class="n">torch</span><span class="o">.</span><span class="n">load</span><span class="p">(</span><span class="n">ckpt_path</span><span class="p">,</span> <span class="o">**</span><span class="n">torch_load_kwargs</span><span class="p">)</span>
+</span><span id="migrate_model-76"><a href="#migrate_model-76"><span class="linenos">76</span></a>    <span class="n">new_ckpt</span><span class="p">,</span> <span class="n">done_migrations</span> <span class="o">=</span> <span class="n">migrate_from_folder</span><span class="p">(</span><span class="n">ckpt</span><span class="p">,</span> <span class="n">MIGRATION_DIR</span><span class="p">)</span>
+</span><span id="migrate_model-77"><a href="#migrate_model-77"><span class="linenos">77</span></a>    <span class="n">done_migration_log</span> <span class="o">=</span> <span class="s2">&quot;, &quot;</span><span class="o">.</span><span class="n">join</span><span class="p">(</span><span class="nb">map</span><span class="p">(</span><span class="k">lambda</span> <span class="n">x</span><span class="p">:</span> <span class="n">x</span><span class="o">.</span><span class="n">name</span><span class="p">,</span> <span class="n">done_migrations</span><span class="p">))</span>
+</span><span id="migrate_model-78"><a href="#migrate_model-78"><span class="linenos">78</span></a>    <span class="nb">print</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;Migrating: </span><span class="si">{</span><span class="n">done_migration_log</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">)</span>
+</span><span id="migrate_model-79"><a href="#migrate_model-79"><span class="linenos">79</span></a>    <span class="k">if</span> <span class="nb">len</span><span class="p">(</span><span class="n">done_migrations</span><span class="p">)</span> <span class="ow">or</span> <span class="n">ckpt_migration_key</span> <span class="ow">not</span> <span class="ow">in</span> <span class="n">ckpt</span><span class="p">:</span>
+</span><span id="migrate_model-80"><a href="#migrate_model-80"><span class="linenos">80</span></a>        <span class="n">version</span> <span class="o">=</span> <span class="mi">0</span>
+</span><span id="migrate_model-81"><a href="#migrate_model-81"><span class="linenos">81</span></a>        <span class="k">if</span> <span class="n">ckpt_migration_key</span> <span class="ow">in</span> <span class="n">ckpt</span><span class="p">:</span>
+</span><span id="migrate_model-82"><a href="#migrate_model-82"><span class="linenos">82</span></a>            <span class="n">version</span> <span class="o">=</span> <span class="nb">len</span><span class="p">(</span><span class="n">ckpt</span><span class="p">[</span><span class="n">ckpt_migration_key</span><span class="p">])</span>
+</span><span id="migrate_model-83"><a href="#migrate_model-83"><span class="linenos">83</span></a>        <span class="n">torch</span><span class="o">.</span><span class="n">save</span><span class="p">(</span><span class="n">ckpt</span><span class="p">,</span> <span class="n">ckpt_path</span><span class="o">.</span><span class="n">with_stem</span><span class="p">(</span><span class="sa">f</span><span class="s2">&quot;</span><span class="si">{</span><span class="n">ckpt_path</span><span class="o">.</span><span class="n">stem</span><span class="si">}</span><span class="s2">-</span><span class="si">{</span><span class="n">version</span><span class="si">}</span><span class="s2">&quot;</span><span class="p">))</span>
+</span><span id="migrate_model-84"><a href="#migrate_model-84"><span class="linenos">84</span></a>        <span class="n">torch</span><span class="o">.</span><span class="n">save</span><span class="p">(</span><span class="n">new_ckpt</span><span class="p">,</span> <span class="n">ckpt_path</span><span class="p">)</span>
+</span></pre></div>
+
+
+            <div class="docstring"><p>Migrates a model checkpoint</p>
+
+<p>After the migration, the given checkpoint will be migrated.
+Other versions of the checkpoint will be saved under the stem-version.suffix.</p>
+
+<h6 id="arguments">Arguments:</h6>
+
+<ul>
+<li><strong>ckpt_path (<code>str | PathLike</code>):</strong>   path to checkpoint</li>
+<li><strong>torch_load_kwargs:</strong>  additional args given to torch.load.</li>
+</ul>
+</div>
+
+
+                </section>
+                <section id="SaveMigrations">
+                            <input id="SaveMigrations-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
+<div class="attr class">
+            
+    <span class="def">class</span>
+    <span class="name">SaveMigrations</span><wbr>(<span class="base">lightning.pytorch.callbacks.callback.Callback</span>):
+
+                <label class="view-source-button" for="SaveMigrations-view-source"><span>View Source</span></label>
+
+    </div>
+    <a class="headerlink" href="#SaveMigrations"></a>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="SaveMigrations-87"><a href="#SaveMigrations-87"><span class="linenos">87</span></a><span class="k">class</span> <span class="nc">SaveMigrations</span><span class="p">(</span><span class="n">Callback</span><span class="p">):</span>
+</span><span id="SaveMigrations-88"><a href="#SaveMigrations-88"><span class="linenos">88</span></a>    <span class="k">def</span> <span class="fm">__init__</span><span class="p">(</span><span class="bp">self</span><span class="p">):</span>
+</span><span id="SaveMigrations-89"><a href="#SaveMigrations-89"><span class="linenos">89</span></a>        <span class="bp">self</span><span class="o">.</span><span class="n">migrations</span> <span class="o">=</span> <span class="n">get_folder_migrations</span><span class="p">(</span><span class="n">MIGRATION_DIR</span><span class="p">)</span>
+</span><span id="SaveMigrations-90"><a href="#SaveMigrations-90"><span class="linenos">90</span></a>
+</span><span id="SaveMigrations-91"><a href="#SaveMigrations-91"><span class="linenos">91</span></a>    <span class="k">def</span> <span class="nf">on_save_checkpoint</span><span class="p">(</span>
+</span><span id="SaveMigrations-92"><a href="#SaveMigrations-92"><span class="linenos">92</span></a>        <span class="bp">self</span><span class="p">,</span> <span class="n">trainer</span><span class="p">:</span> <span class="n">Trainer</span><span class="p">,</span> <span class="n">pl_module</span><span class="p">:</span> <span class="n">LightningModule</span><span class="p">,</span> <span class="n">checkpoint</span><span class="p">:</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">Any</span><span class="p">]</span>
+</span><span id="SaveMigrations-93"><a href="#SaveMigrations-93"><span class="linenos">93</span></a>    <span class="p">):</span>
+</span><span id="SaveMigrations-94"><a href="#SaveMigrations-94"><span class="linenos">94</span></a>        <span class="n">checkpoint</span><span class="p">[</span><span class="n">ckpt_migration_key</span><span class="p">]</span> <span class="o">=</span> <span class="p">[</span><span class="n">mig</span><span class="o">.</span><span class="n">name</span> <span class="k">for</span> <span class="n">mig</span> <span class="ow">in</span> <span class="bp">self</span><span class="o">.</span><span class="n">migrations</span><span class="p">]</span>
+</span></pre></div>
+
+
+            <div class="docstring"><p>Abstract base class used to build new callbacks.</p>
+
+<p>Subclass this class and override any of the relevant hooks</p>
+</div>
+
+
+                            <div id="SaveMigrations.migrations" class="classattr">
+                                <div class="attr variable">
+            <span class="name">migrations</span>
+
+        
+    </div>
+    <a class="headerlink" href="#SaveMigrations.migrations"></a>
+    
+    
+
+                            </div>
+                            <div id="SaveMigrations.on_save_checkpoint" class="classattr">
+                                        <input id="SaveMigrations.on_save_checkpoint-view-source" class="view-source-toggle-state" type="checkbox" aria-hidden="true" tabindex="-1">
+<div class="attr function">
+            
+        <span class="def">def</span>
+        <span class="name">on_save_checkpoint</span><span class="signature pdoc-code multiline">(<span class="param">	<span class="bp">self</span>,</span><span class="param">	<span class="n">trainer</span><span class="p">:</span> <span class="n">lightning</span><span class="o">.</span><span class="n">pytorch</span><span class="o">.</span><span class="n">trainer</span><span class="o">.</span><span class="n">trainer</span><span class="o">.</span><span class="n">Trainer</span>,</span><span class="param">	<span class="n">pl_module</span><span class="p">:</span> <span class="n">lightning</span><span class="o">.</span><span class="n">pytorch</span><span class="o">.</span><span class="n">core</span><span class="o">.</span><span class="n">module</span><span class="o">.</span><span class="n">LightningModule</span>,</span><span class="param">	<span class="n">checkpoint</span><span class="p">:</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">typing</span><span class="o">.</span><span class="n">Any</span><span class="p">]</span></span><span class="return-annotation">):</span></span>
+
+                <label class="view-source-button" for="SaveMigrations.on_save_checkpoint-view-source"><span>View Source</span></label>
+
+    </div>
+    <a class="headerlink" href="#SaveMigrations.on_save_checkpoint"></a>
+            <div class="pdoc-code codehilite"><pre><span></span><span id="SaveMigrations.on_save_checkpoint-91"><a href="#SaveMigrations.on_save_checkpoint-91"><span class="linenos">91</span></a>    <span class="k">def</span> <span class="nf">on_save_checkpoint</span><span class="p">(</span>
+</span><span id="SaveMigrations.on_save_checkpoint-92"><a href="#SaveMigrations.on_save_checkpoint-92"><span class="linenos">92</span></a>        <span class="bp">self</span><span class="p">,</span> <span class="n">trainer</span><span class="p">:</span> <span class="n">Trainer</span><span class="p">,</span> <span class="n">pl_module</span><span class="p">:</span> <span class="n">LightningModule</span><span class="p">,</span> <span class="n">checkpoint</span><span class="p">:</span> <span class="nb">dict</span><span class="p">[</span><span class="nb">str</span><span class="p">,</span> <span class="n">Any</span><span class="p">]</span>
+</span><span id="SaveMigrations.on_save_checkpoint-93"><a href="#SaveMigrations.on_save_checkpoint-93"><span class="linenos">93</span></a>    <span class="p">):</span>
+</span><span id="SaveMigrations.on_save_checkpoint-94"><a href="#SaveMigrations.on_save_checkpoint-94"><span class="linenos">94</span></a>        <span class="n">checkpoint</span><span class="p">[</span><span class="n">ckpt_migration_key</span><span class="p">]</span> <span class="o">=</span> <span class="p">[</span><span class="n">mig</span><span class="o">.</span><span class="n">name</span> <span class="k">for</span> <span class="n">mig</span> <span class="ow">in</span> <span class="bp">self</span><span class="o">.</span><span class="n">migrations</span><span class="p">]</span>
+</span></pre></div>
+
+
+            <div class="docstring"><p>Called when saving a checkpoint to give you a chance to store anything else you might want to save.</p>
+
+<h6 id="arguments">Arguments:</h6>
+
+<ul>
+<li><strong>trainer:</strong>  the current <code>~lightning.pytorch.trainer.trainer.Trainer</code> instance.</li>
+<li><strong>pl_module:</strong>  the current <code>~lightning.pytorch.core.LightningModule</code> instance.</li>
+<li><strong>checkpoint:</strong>  the checkpoint dictionary that will be saved.</li>
+</ul>
+</div>
+
+
+                            </div>
+                            <div class="inherited">
+                                <h5>Inherited Members</h5>
+                                <dl>
+                                    <div><dt>lightning.pytorch.callbacks.callback.Callback</dt>
+                                <dd id="SaveMigrations.state_key" class="variable">state_key</dd>
+                <dd id="SaveMigrations.setup" class="function">setup</dd>
+                <dd id="SaveMigrations.teardown" class="function">teardown</dd>
+                <dd id="SaveMigrations.on_fit_start" class="function">on_fit_start</dd>
+                <dd id="SaveMigrations.on_fit_end" class="function">on_fit_end</dd>
+                <dd id="SaveMigrations.on_sanity_check_start" class="function">on_sanity_check_start</dd>
+                <dd id="SaveMigrations.on_sanity_check_end" class="function">on_sanity_check_end</dd>
+                <dd id="SaveMigrations.on_train_batch_start" class="function">on_train_batch_start</dd>
+                <dd id="SaveMigrations.on_train_batch_end" class="function">on_train_batch_end</dd>
+                <dd id="SaveMigrations.on_train_epoch_start" class="function">on_train_epoch_start</dd>
+                <dd id="SaveMigrations.on_train_epoch_end" class="function">on_train_epoch_end</dd>
+                <dd id="SaveMigrations.on_validation_epoch_start" class="function">on_validation_epoch_start</dd>
+                <dd id="SaveMigrations.on_validation_epoch_end" class="function">on_validation_epoch_end</dd>
+                <dd id="SaveMigrations.on_test_epoch_start" class="function">on_test_epoch_start</dd>
+                <dd id="SaveMigrations.on_test_epoch_end" class="function">on_test_epoch_end</dd>
+                <dd id="SaveMigrations.on_predict_epoch_start" class="function">on_predict_epoch_start</dd>
+                <dd id="SaveMigrations.on_predict_epoch_end" class="function">on_predict_epoch_end</dd>
+                <dd id="SaveMigrations.on_validation_batch_start" class="function">on_validation_batch_start</dd>
+                <dd id="SaveMigrations.on_validation_batch_end" class="function">on_validation_batch_end</dd>
+                <dd id="SaveMigrations.on_test_batch_start" class="function">on_test_batch_start</dd>
+                <dd id="SaveMigrations.on_test_batch_end" class="function">on_test_batch_end</dd>
+                <dd id="SaveMigrations.on_predict_batch_start" class="function">on_predict_batch_start</dd>
+                <dd id="SaveMigrations.on_predict_batch_end" class="function">on_predict_batch_end</dd>
+                <dd id="SaveMigrations.on_train_start" class="function">on_train_start</dd>
+                <dd id="SaveMigrations.on_train_end" class="function">on_train_end</dd>
+                <dd id="SaveMigrations.on_validation_start" class="function">on_validation_start</dd>
+                <dd id="SaveMigrations.on_validation_end" class="function">on_validation_end</dd>
+                <dd id="SaveMigrations.on_test_start" class="function">on_test_start</dd>
+                <dd id="SaveMigrations.on_test_end" class="function">on_test_end</dd>
+                <dd id="SaveMigrations.on_predict_start" class="function">on_predict_start</dd>
+                <dd id="SaveMigrations.on_predict_end" class="function">on_predict_end</dd>
+                <dd id="SaveMigrations.on_exception" class="function">on_exception</dd>
+                <dd id="SaveMigrations.state_dict" class="function">state_dict</dd>
+                <dd id="SaveMigrations.load_state_dict" class="function">load_state_dict</dd>
+                <dd id="SaveMigrations.on_load_checkpoint" class="function">on_load_checkpoint</dd>
+                <dd id="SaveMigrations.on_before_backward" class="function">on_before_backward</dd>
+                <dd id="SaveMigrations.on_after_backward" class="function">on_after_backward</dd>
+                <dd id="SaveMigrations.on_before_optimizer_step" class="function">on_before_optimizer_step</dd>
+                <dd id="SaveMigrations.on_before_zero_grad" class="function">on_before_zero_grad</dd>
+
+            </div>
+                                </dl>
+                            </div>
+                </section>
+    </main>
+<script>
+    function escapeHTML(html) {
+        return document.createElement('div').appendChild(document.createTextNode(html)).parentNode.innerHTML;
+    }
+
+    const originalContent = document.querySelector("main.pdoc");
+    let currentContent = originalContent;
+
+    function setContent(innerHTML) {
+        let elem;
+        if (innerHTML) {
+            elem = document.createElement("main");
+            elem.classList.add("pdoc");
+            elem.innerHTML = innerHTML;
+        } else {
+            elem = originalContent;
+        }
+        if (currentContent !== elem) {
+            currentContent.replaceWith(elem);
+            currentContent = elem;
+        }
+    }
+
+    function getSearchTerm() {
+        return (new URL(window.location)).searchParams.get("search");
+    }
+
+    const searchBox = document.querySelector(".pdoc input[type=search]");
+    searchBox.addEventListener("input", function () {
+        let url = new URL(window.location);
+        if (searchBox.value.trim()) {
+            url.hash = "";
+            url.searchParams.set("search", searchBox.value);
+        } else {
+            url.searchParams.delete("search");
+        }
+        history.replaceState("", "", url.toString());
+        onInput();
+    });
+    window.addEventListener("popstate", onInput);
+
+
+    let search, searchErr;
+
+    async function initialize() {
+        try {
+            search = await new Promise((resolve, reject) => {
+                const script = document.createElement("script");
+                script.type = "text/javascript";
+                script.async = true;
+                script.onload = () => resolve(window.pdocSearch);
+                script.onerror = (e) => reject(e);
+                script.src = "../search.js";
+                document.getElementsByTagName("head")[0].appendChild(script);
+            });
+        } catch (e) {
+            console.error("Cannot fetch pdoc search index");
+            searchErr = "Cannot fetch search index.";
+        }
+        onInput();
+
+        document.querySelector("nav.pdoc").addEventListener("click", e => {
+            if (e.target.hash) {
+                searchBox.value = "";
+                searchBox.dispatchEvent(new Event("input"));
+            }
+        });
+    }
+
+    function onInput() {
+        setContent((() => {
+            const term = getSearchTerm();
+            if (!term) {
+                return null
+            }
+            if (searchErr) {
+                return `<h3>Error: ${searchErr}</h3>`
+            }
+            if (!search) {
+                return "<h3>Searching...</h3>"
+            }
+
+            window.scrollTo({top: 0, left: 0, behavior: 'auto'});
+
+            const results = search(term);
+
+            let html;
+            if (results.length === 0) {
+                html = `No search results for '${escapeHTML(term)}'.`
+            } else {
+                html = `<h4>${results.length} search result${results.length > 1 ? "s" : ""} for '${escapeHTML(term)}'.</h4>`;
+            }
+            for (let result of results.slice(0, 10)) {
+                let doc = result.doc;
+                let url = `../${doc.modulename.replaceAll(".", "/")}.html`;
+                if (doc.qualname) {
+                    url += `#${doc.qualname}`;
+                }
+
+                let heading;
+                switch (result.doc.kind) {
+                    case "function":
+                        if (doc.fullname.endsWith(".__init__")) {
+                            heading = `<span class="name">${doc.fullname.replace(/\.__init__$/, "")}</span>${doc.signature}`;
+                        } else {
+                            heading = `<span class="def">${doc.funcdef}</span> <span class="name">${doc.fullname}</span>${doc.signature}`;
+                        }
+                        break;
+                    case "class":
+                        heading = `<span class="def">class</span> <span class="name">${doc.fullname}</span>`;
+                        if (doc.bases)
+                            heading += `<wbr>(<span class="base">${doc.bases}</span>)`;
+                        heading += `:`;
+                        break;
+                    case "variable":
+                        heading = `<span class="name">${doc.fullname}</span>`;
+                        if (doc.annotation)
+                            heading += `<span class="annotation">${doc.annotation}</span>`;
+                        if (doc.default_value)
+                            heading += `<span class="default_value"> = ${doc.default_value}</span>`;
+                        break;
+                    default:
+                        heading = `<span class="name">${doc.fullname}</span>`;
+                        break;
+                }
+                html += `
+                        <section class="search-result">
+                        <a href="${url}" class="attr ${doc.kind}">${heading}</a>
+                        <div class="docstring">${doc.doc}</div>
+                        </section>
+                    `;
+
+            }
+            return html;
+        })());
+    }
+
+    if (getSearchTerm()) {
+        initialize();
+        searchBox.value = getSearchTerm();
+        onInput();
+    } else {
+        searchBox.addEventListener("focus", initialize, {once: true});
+    }
+
+    searchBox.addEventListener("keydown", e => {
+        if (["ArrowDown", "ArrowUp", "Enter"].includes(e.key)) {
+            let focused = currentContent.querySelector(".search-result.focused");
+            if (!focused) {
+                currentContent.querySelector(".search-result").classList.add("focused");
+            } else if (
+                e.key === "ArrowDown"
+                && focused.nextElementSibling
+                && focused.nextElementSibling.classList.contains("search-result")
+            ) {
+                focused.classList.remove("focused");
+                focused.nextElementSibling.classList.add("focused");
+                focused.nextElementSibling.scrollIntoView({
+                    behavior: "smooth",
+                    block: "nearest",
+                    inline: "nearest"
+                });
+            } else if (
+                e.key === "ArrowUp"
+                && focused.previousElementSibling
+                && focused.previousElementSibling.classList.contains("search-result")
+            ) {
+                focused.classList.remove("focused");
+                focused.previousElementSibling.classList.add("focused");
+                focused.previousElementSibling.scrollIntoView({
+                    behavior: "smooth",
+                    block: "nearest",
+                    inline: "nearest"
+                });
+            } else if (
+                e.key === "Enter"
+            ) {
+                focused.querySelector("a").click();
+            }
+        }
+    });
+</script></body>
+</html>
\ No newline at end of file