PurdueDualityLab · InAIBot · Apr 6, 2023 · Apr 6, 2023 · Apr 7, 2023 · Apr 8, 2023
diff --git a/category_mask.npy b/category_mask.npy
diff --git a/img.npy b/img.npy
diff --git a/individual_masks.npy b/individual_masks.npy
diff --git a/instance_mask.npy b/instance_mask.npy
diff --git a/models/official/__pycache__/__init__.cpython-38.pyc b/models/official/__pycache__/__init__.cpython-38.pyc
diff --git a/models/official/__pycache__/__init__.cpython-39.pyc b/models/official/__pycache__/__init__.cpython-39.pyc
diff --git a/models/official/common/__pycache__/__init__.cpython-38.pyc b/models/official/common/__pycache__/__init__.cpython-38.pyc
diff --git a/models/official/common/__pycache__/__init__.cpython-39.pyc b/models/official/common/__pycache__/__init__.cpython-39.pyc
diff --git a/models/official/common/__pycache__/dataset_fn.cpython-39.pyc b/models/official/common/__pycache__/dataset_fn.cpython-39.pyc
diff --git a/models/official/common/__pycache__/distribute_utils.cpython-38.pyc b/models/official/common/__pycache__/distribute_utils.cpython-38.pyc
diff --git a/models/official/common/__pycache__/distribute_utils.cpython-39.pyc b/models/official/common/__pycache__/distribute_utils.cpython-39.pyc
diff --git a/models/official/common/distribute_utils.py b/models/official/common/distribute_utils.py
@@ -82,8 +82,9 @@ def tpu_initialize(tpu_address):
   Returns:
     A TPUClusterResolver.
   """
+
   cluster_resolver = tf.distribute.cluster_resolver.TPUClusterResolver(
-      tpu=tpu_address)
+      tpu=tpu_address, project=os.environ["TPU_PROJECT"], zone=os.environ["TPU_ZONE"])
   if tpu_address not in ("", "local"):
     tf.config.experimental_connect_to_cluster(cluster_resolver)
   tf.tpu.experimental.initialize_tpu_system(cluster_resolver)

diff --git a/models/official/core/__pycache__/__init__.cpython-38.pyc b/models/official/core/__pycache__/__init__.cpython-38.pyc
diff --git a/models/official/core/__pycache__/__init__.cpython-39.pyc b/models/official/core/__pycache__/__init__.cpython-39.pyc
diff --git a/models/official/core/__pycache__/actions.cpython-38.pyc b/models/official/core/__pycache__/actions.cpython-38.pyc
diff --git a/models/official/core/__pycache__/actions.cpython-39.pyc b/models/official/core/__pycache__/actions.cpython-39.pyc
diff --git a/models/official/core/__pycache__/base_task.cpython-38.pyc b/models/official/core/__pycache__/base_task.cpython-38.pyc
diff --git a/models/official/core/__pycache__/base_task.cpython-39.pyc b/models/official/core/__pycache__/base_task.cpython-39.pyc
diff --git a/models/official/core/__pycache__/base_trainer.cpython-38.pyc b/models/official/core/__pycache__/base_trainer.cpython-38.pyc
diff --git a/models/official/core/__pycache__/base_trainer.cpython-39.pyc b/models/official/core/__pycache__/base_trainer.cpython-39.pyc
diff --git a/models/official/core/__pycache__/config_definitions.cpython-38.pyc b/models/official/core/__pycache__/config_definitions.cpython-38.pyc
diff --git a/models/official/core/__pycache__/config_definitions.cpython-39.pyc b/models/official/core/__pycache__/config_definitions.cpython-39.pyc
diff --git a/models/official/core/__pycache__/exp_factory.cpython-39.pyc b/models/official/core/__pycache__/exp_factory.cpython-39.pyc
diff --git a/models/official/core/__pycache__/export_base.cpython-39.pyc b/models/official/core/__pycache__/export_base.cpython-39.pyc
diff --git a/models/official/core/__pycache__/file_writers.cpython-39.pyc b/models/official/core/__pycache__/file_writers.cpython-39.pyc
diff --git a/models/official/core/__pycache__/input_reader.cpython-39.pyc b/models/official/core/__pycache__/input_reader.cpython-39.pyc
diff --git a/models/official/core/__pycache__/registry.cpython-39.pyc b/models/official/core/__pycache__/registry.cpython-39.pyc
diff --git a/models/official/core/__pycache__/savedmodel_checkpoint_manager.cpython-39.pyc b/models/official/core/__pycache__/savedmodel_checkpoint_manager.cpython-39.pyc
diff --git a/models/official/core/__pycache__/task_factory.cpython-39.pyc b/models/official/core/__pycache__/task_factory.cpython-39.pyc
diff --git a/models/official/core/__pycache__/tf_example_builder.cpython-39.pyc b/models/official/core/__pycache__/tf_example_builder.cpython-39.pyc
diff --git a/models/official/core/__pycache__/tf_example_feature_key.cpython-39.pyc b/models/official/core/__pycache__/tf_example_feature_key.cpython-39.pyc
diff --git a/models/official/core/__pycache__/train_lib.cpython-39.pyc b/models/official/core/__pycache__/train_lib.cpython-39.pyc
diff --git a/models/official/core/__pycache__/train_utils.cpython-39.pyc b/models/official/core/__pycache__/train_utils.cpython-39.pyc
diff --git a/models/official/core/actions.py b/models/official/core/actions.py
@@ -222,15 +222,15 @@ def get_train_actions(
     )
     train_actions.append(recover_action)
 
-  if (
-      params.trainer.preemption_on_demand_checkpoint
-      and trainer.strategy.cluster_resolver
-  ):
-    on_demand_checkpoint_action = orbit.actions.SaveCheckpointIfPreempted(
-        trainer.strategy.cluster_resolver,
-        checkpoint_manager,
-        trainer.global_step,
-        keep_running_after_save=True,
-    )
-    train_actions.append(on_demand_checkpoint_action)
+  # if (
+  #     params.trainer.preemption_on_demand_checkpoint
+  #     and trainer.strategy.cluster_resolver
+  # ):
+    # on_demand_checkpoint_action = orbit.actions.SaveCheckpointIfPreempted(
+    #     trainer.strategy.cluster_resolver,
+    #     checkpoint_manager,
+    #     trainer.global_step,
+    #     keep_running_after_save=True,
+    # )
+    # train_actions.append(on_demand_checkpoint_action)
   return train_actions
diff --git a/models/official/core/base_trainer.py b/models/official/core/base_trainer.py
@@ -335,6 +335,7 @@ def train_loop_end(self):
       # Maybe a self-implemented optimizer does not have `optimizer.iterations`.
       # So just to be safe here.
       if hasattr(self.optimizer, "iterations"):
+
         logs["learning_rate"] = self.optimizer.learning_rate(
             self.optimizer.iterations)
       else:

diff --git a/models/official/modeling/__pycache__/__init__.cpython-38.pyc b/models/official/modeling/__pycache__/__init__.cpython-38.pyc
diff --git a/models/official/modeling/__pycache__/__init__.cpython-39.pyc b/models/official/modeling/__pycache__/__init__.cpython-39.pyc
diff --git a/models/official/modeling/__pycache__/performance.cpython-39.pyc b/models/official/modeling/__pycache__/performance.cpython-39.pyc
diff --git a/models/official/modeling/__pycache__/tf_utils.cpython-39.pyc b/models/official/modeling/__pycache__/tf_utils.cpython-39.pyc
diff --git a/models/official/modeling/activations/__pycache__/__init__.cpython-39.pyc b/models/official/modeling/activations/__pycache__/__init__.cpython-39.pyc
diff --git a/models/official/modeling/activations/__pycache__/gelu.cpython-39.pyc b/models/official/modeling/activations/__pycache__/gelu.cpython-39.pyc
diff --git a/models/official/modeling/activations/__pycache__/mish.cpython-39.pyc b/models/official/modeling/activations/__pycache__/mish.cpython-39.pyc
diff --git a/models/official/modeling/activations/__pycache__/relu.cpython-39.pyc b/models/official/modeling/activations/__pycache__/relu.cpython-39.pyc
diff --git a/models/official/modeling/activations/__pycache__/sigmoid.cpython-39.pyc b/models/official/modeling/activations/__pycache__/sigmoid.cpython-39.pyc
diff --git a/models/official/modeling/activations/__pycache__/swish.cpython-39.pyc b/models/official/modeling/activations/__pycache__/swish.cpython-39.pyc
diff --git a/models/official/modeling/hyperparams/__pycache__/__init__.cpython-38.pyc b/models/official/modeling/hyperparams/__pycache__/__init__.cpython-38.pyc
diff --git a/models/official/modeling/hyperparams/__pycache__/__init__.cpython-39.pyc b/models/official/modeling/hyperparams/__pycache__/__init__.cpython-39.pyc
diff --git a/models/official/modeling/hyperparams/__pycache__/base_config.cpython-38.pyc b/models/official/modeling/hyperparams/__pycache__/base_config.cpython-38.pyc
diff --git a/models/official/modeling/hyperparams/__pycache__/base_config.cpython-39.pyc b/models/official/modeling/hyperparams/__pycache__/base_config.cpython-39.pyc
diff --git a/models/official/modeling/hyperparams/__pycache__/oneof.cpython-38.pyc b/models/official/modeling/hyperparams/__pycache__/oneof.cpython-38.pyc
diff --git a/models/official/modeling/hyperparams/__pycache__/oneof.cpython-39.pyc b/models/official/modeling/hyperparams/__pycache__/oneof.cpython-39.pyc
diff --git a/models/official/modeling/hyperparams/__pycache__/params_dict.cpython-38.pyc b/models/official/modeling/hyperparams/__pycache__/params_dict.cpython-38.pyc
diff --git a/models/official/modeling/hyperparams/__pycache__/params_dict.cpython-39.pyc b/models/official/modeling/hyperparams/__pycache__/params_dict.cpython-39.pyc
diff --git a/models/official/modeling/optimization/__pycache__/__init__.cpython-38.pyc b/models/official/modeling/optimization/__pycache__/__init__.cpython-38.pyc
diff --git a/models/official/modeling/optimization/__pycache__/__init__.cpython-39.pyc b/models/official/modeling/optimization/__pycache__/__init__.cpython-39.pyc
diff --git a/models/official/modeling/optimization/__pycache__/adafactor_optimizer.cpython-39.pyc b/models/official/modeling/optimization/__pycache__/adafactor_optimizer.cpython-39.pyc
diff --git a/models/official/modeling/optimization/__pycache__/ema_optimizer.cpython-38.pyc b/models/official/modeling/optimization/__pycache__/ema_optimizer.cpython-38.pyc
diff --git a/models/official/modeling/optimization/__pycache__/ema_optimizer.cpython-39.pyc b/models/official/modeling/optimization/__pycache__/ema_optimizer.cpython-39.pyc
diff --git a/models/official/modeling/optimization/__pycache__/lars_optimizer.cpython-39.pyc b/models/official/modeling/optimization/__pycache__/lars_optimizer.cpython-39.pyc
diff --git a/models/official/modeling/optimization/__pycache__/legacy_adamw.cpython-39.pyc b/models/official/modeling/optimization/__pycache__/legacy_adamw.cpython-39.pyc
diff --git a/models/official/modeling/optimization/__pycache__/lr_schedule.cpython-39.pyc b/models/official/modeling/optimization/__pycache__/lr_schedule.cpython-39.pyc
diff --git a/models/official/modeling/optimization/__pycache__/optimizer_factory.cpython-39.pyc b/models/official/modeling/optimization/__pycache__/optimizer_factory.cpython-39.pyc
diff --git a/models/official/modeling/optimization/__pycache__/slide_optimizer.cpython-39.pyc b/models/official/modeling/optimization/__pycache__/slide_optimizer.cpython-39.pyc
diff --git a/models/official/modeling/optimization/configs/__pycache__/__init__.cpython-38.pyc b/models/official/modeling/optimization/configs/__pycache__/__init__.cpython-38.pyc
diff --git a/models/official/modeling/optimization/configs/__pycache__/__init__.cpython-39.pyc b/models/official/modeling/optimization/configs/__pycache__/__init__.cpython-39.pyc
diff --git a/...ls/official/modeling/optimization/configs/__pycache__/learning_rate_config.cpython-38.pyc b/...ls/official/modeling/optimization/configs/__pycache__/learning_rate_config.cpython-38.pyc
diff --git a/...ls/official/modeling/optimization/configs/__pycache__/learning_rate_config.cpython-39.pyc b/...ls/official/modeling/optimization/configs/__pycache__/learning_rate_config.cpython-39.pyc
diff --git a/models/official/modeling/optimization/configs/__pycache__/optimization_config.cpython-38.pyc b/models/official/modeling/optimization/configs/__pycache__/optimization_config.cpython-38.pyc
diff --git a/models/official/modeling/optimization/configs/__pycache__/optimization_config.cpython-39.pyc b/models/official/modeling/optimization/configs/__pycache__/optimization_config.cpython-39.pyc
diff --git a/models/official/modeling/optimization/configs/__pycache__/optimizer_config.cpython-38.pyc b/models/official/modeling/optimization/configs/__pycache__/optimizer_config.cpython-38.pyc
diff --git a/models/official/modeling/optimization/configs/__pycache__/optimizer_config.cpython-39.pyc b/models/official/modeling/optimization/configs/__pycache__/optimizer_config.cpython-39.pyc
diff --git a/models/official/modeling/privacy/__pycache__/__init__.cpython-39.pyc b/models/official/modeling/privacy/__pycache__/__init__.cpython-39.pyc
diff --git a/models/official/modeling/privacy/__pycache__/configs.cpython-39.pyc b/models/official/modeling/privacy/__pycache__/configs.cpython-39.pyc
diff --git a/models/official/modeling/privacy/__pycache__/ops.cpython-39.pyc b/models/official/modeling/privacy/__pycache__/ops.cpython-39.pyc
diff --git a/models/official/nlp/__pycache__/__init__.cpython-39.pyc b/models/official/nlp/__pycache__/__init__.cpython-39.pyc
diff --git a/models/official/nlp/modeling/__pycache__/__init__.cpython-39.pyc b/models/official/nlp/modeling/__pycache__/__init__.cpython-39.pyc
diff --git a/models/official/nlp/modeling/layers/__pycache__/__init__.cpython-39.pyc b/models/official/nlp/modeling/layers/__pycache__/__init__.cpython-39.pyc
diff --git a/models/official/nlp/modeling/layers/__pycache__/attention.cpython-39.pyc b/models/official/nlp/modeling/layers/__pycache__/attention.cpython-39.pyc
diff --git a/models/official/nlp/modeling/layers/__pycache__/bigbird_attention.cpython-39.pyc b/models/official/nlp/modeling/layers/__pycache__/bigbird_attention.cpython-39.pyc
diff --git a/models/official/nlp/modeling/layers/__pycache__/block_diag_feedforward.cpython-39.pyc b/models/official/nlp/modeling/layers/__pycache__/block_diag_feedforward.cpython-39.pyc
diff --git a/models/official/nlp/modeling/layers/__pycache__/cls_head.cpython-39.pyc b/models/official/nlp/modeling/layers/__pycache__/cls_head.cpython-39.pyc
diff --git a/models/official/nlp/modeling/layers/__pycache__/factorized_embedding.cpython-39.pyc b/models/official/nlp/modeling/layers/__pycache__/factorized_embedding.cpython-39.pyc
diff --git a/models/official/nlp/modeling/layers/__pycache__/gated_feedforward.cpython-39.pyc b/models/official/nlp/modeling/layers/__pycache__/gated_feedforward.cpython-39.pyc
diff --git a/models/official/nlp/modeling/layers/__pycache__/gaussian_process.cpython-39.pyc b/models/official/nlp/modeling/layers/__pycache__/gaussian_process.cpython-39.pyc
diff --git a/models/official/nlp/modeling/layers/__pycache__/kernel_attention.cpython-39.pyc b/models/official/nlp/modeling/layers/__pycache__/kernel_attention.cpython-39.pyc
diff --git a/models/official/nlp/modeling/layers/__pycache__/masked_lm.cpython-39.pyc b/models/official/nlp/modeling/layers/__pycache__/masked_lm.cpython-39.pyc
diff --git a/models/official/nlp/modeling/layers/__pycache__/masked_softmax.cpython-39.pyc b/models/official/nlp/modeling/layers/__pycache__/masked_softmax.cpython-39.pyc
diff --git a/models/official/nlp/modeling/layers/__pycache__/mat_mul_with_margin.cpython-39.pyc b/models/official/nlp/modeling/layers/__pycache__/mat_mul_with_margin.cpython-39.pyc
diff --git a/models/official/nlp/modeling/layers/__pycache__/mixing.cpython-39.pyc b/models/official/nlp/modeling/layers/__pycache__/mixing.cpython-39.pyc
diff --git a/models/official/nlp/modeling/layers/__pycache__/mobile_bert_layers.cpython-39.pyc b/models/official/nlp/modeling/layers/__pycache__/mobile_bert_layers.cpython-39.pyc
diff --git a/models/official/nlp/modeling/layers/__pycache__/moe.cpython-39.pyc b/models/official/nlp/modeling/layers/__pycache__/moe.cpython-39.pyc
diff --git a/models/official/nlp/modeling/layers/__pycache__/multi_channel_attention.cpython-39.pyc b/models/official/nlp/modeling/layers/__pycache__/multi_channel_attention.cpython-39.pyc
diff --git a/models/official/nlp/modeling/layers/__pycache__/on_device_embedding.cpython-39.pyc b/models/official/nlp/modeling/layers/__pycache__/on_device_embedding.cpython-39.pyc
diff --git a/models/official/nlp/modeling/layers/__pycache__/pack_optimization.cpython-39.pyc b/models/official/nlp/modeling/layers/__pycache__/pack_optimization.cpython-39.pyc
diff --git a/models/official/nlp/modeling/layers/__pycache__/per_dim_scale_attention.cpython-39.pyc b/models/official/nlp/modeling/layers/__pycache__/per_dim_scale_attention.cpython-39.pyc
diff --git a/models/official/nlp/modeling/layers/__pycache__/position_embedding.cpython-39.pyc b/models/official/nlp/modeling/layers/__pycache__/position_embedding.cpython-39.pyc
diff --git a/models/official/nlp/modeling/layers/__pycache__/relative_attention.cpython-39.pyc b/models/official/nlp/modeling/layers/__pycache__/relative_attention.cpython-39.pyc
diff --git a/models/official/nlp/modeling/layers/__pycache__/reuse_attention.cpython-39.pyc b/models/official/nlp/modeling/layers/__pycache__/reuse_attention.cpython-39.pyc
diff --git a/models/official/nlp/modeling/layers/__pycache__/reuse_transformer.cpython-39.pyc b/models/official/nlp/modeling/layers/__pycache__/reuse_transformer.cpython-39.pyc
diff --git a/models/official/nlp/modeling/layers/__pycache__/rezero_transformer.cpython-39.pyc b/models/official/nlp/modeling/layers/__pycache__/rezero_transformer.cpython-39.pyc
diff --git a/models/official/nlp/modeling/layers/__pycache__/routing.cpython-39.pyc b/models/official/nlp/modeling/layers/__pycache__/routing.cpython-39.pyc
diff --git a/models/official/nlp/modeling/layers/__pycache__/self_attention_mask.cpython-39.pyc b/models/official/nlp/modeling/layers/__pycache__/self_attention_mask.cpython-39.pyc
diff --git a/models/official/nlp/modeling/layers/__pycache__/spectral_normalization.cpython-39.pyc b/models/official/nlp/modeling/layers/__pycache__/spectral_normalization.cpython-39.pyc
diff --git a/models/official/nlp/modeling/layers/__pycache__/talking_heads_attention.cpython-39.pyc b/models/official/nlp/modeling/layers/__pycache__/talking_heads_attention.cpython-39.pyc
diff --git a/models/official/nlp/modeling/layers/__pycache__/text_layers.cpython-39.pyc b/models/official/nlp/modeling/layers/__pycache__/text_layers.cpython-39.pyc
diff --git a/models/official/nlp/modeling/layers/__pycache__/tn_expand_condense.cpython-39.pyc b/models/official/nlp/modeling/layers/__pycache__/tn_expand_condense.cpython-39.pyc
diff --git a/...ls/official/nlp/modeling/layers/__pycache__/tn_transformer_expand_condense.cpython-39.pyc b/...ls/official/nlp/modeling/layers/__pycache__/tn_transformer_expand_condense.cpython-39.pyc
diff --git a/models/official/nlp/modeling/layers/__pycache__/transformer.cpython-39.pyc b/models/official/nlp/modeling/layers/__pycache__/transformer.cpython-39.pyc
diff --git a/models/official/nlp/modeling/layers/__pycache__/transformer_encoder_block.cpython-39.pyc b/models/official/nlp/modeling/layers/__pycache__/transformer_encoder_block.cpython-39.pyc
diff --git a/models/official/nlp/modeling/layers/__pycache__/transformer_scaffold.cpython-39.pyc b/models/official/nlp/modeling/layers/__pycache__/transformer_scaffold.cpython-39.pyc
diff --git a/models/official/nlp/modeling/layers/__pycache__/transformer_xl.cpython-39.pyc b/models/official/nlp/modeling/layers/__pycache__/transformer_xl.cpython-39.pyc
diff --git a/models/official/nlp/modeling/layers/__pycache__/util.cpython-39.pyc b/models/official/nlp/modeling/layers/__pycache__/util.cpython-39.pyc
diff --git a/models/official/nlp/modeling/losses/__pycache__/__init__.cpython-39.pyc b/models/official/nlp/modeling/losses/__pycache__/__init__.cpython-39.pyc
diff --git a/...l/nlp/modeling/losses/__pycache__/weighted_sparse_categorical_crossentropy.cpython-39.pyc b/...l/nlp/modeling/losses/__pycache__/weighted_sparse_categorical_crossentropy.cpython-39.pyc
diff --git a/models/official/nlp/modeling/models/__pycache__/__init__.cpython-39.pyc b/models/official/nlp/modeling/models/__pycache__/__init__.cpython-39.pyc
diff --git a/models/official/nlp/modeling/models/__pycache__/bert_classifier.cpython-39.pyc b/models/official/nlp/modeling/models/__pycache__/bert_classifier.cpython-39.pyc
diff --git a/models/official/nlp/modeling/models/__pycache__/bert_pretrainer.cpython-39.pyc b/models/official/nlp/modeling/models/__pycache__/bert_pretrainer.cpython-39.pyc
diff --git a/models/official/nlp/modeling/models/__pycache__/bert_span_labeler.cpython-39.pyc b/models/official/nlp/modeling/models/__pycache__/bert_span_labeler.cpython-39.pyc
diff --git a/models/official/nlp/modeling/models/__pycache__/bert_token_classifier.cpython-39.pyc b/models/official/nlp/modeling/models/__pycache__/bert_token_classifier.cpython-39.pyc
diff --git a/models/official/nlp/modeling/models/__pycache__/dual_encoder.cpython-39.pyc b/models/official/nlp/modeling/models/__pycache__/dual_encoder.cpython-39.pyc
diff --git a/models/official/nlp/modeling/models/__pycache__/electra_pretrainer.cpython-39.pyc b/models/official/nlp/modeling/models/__pycache__/electra_pretrainer.cpython-39.pyc
diff --git a/models/official/nlp/modeling/models/__pycache__/seq2seq_transformer.cpython-39.pyc b/models/official/nlp/modeling/models/__pycache__/seq2seq_transformer.cpython-39.pyc
diff --git a/models/official/nlp/modeling/models/__pycache__/t5.cpython-39.pyc b/models/official/nlp/modeling/models/__pycache__/t5.cpython-39.pyc
diff --git a/models/official/nlp/modeling/models/__pycache__/xlnet.cpython-39.pyc b/models/official/nlp/modeling/models/__pycache__/xlnet.cpython-39.pyc
diff --git a/models/official/nlp/modeling/networks/__pycache__/__init__.cpython-39.pyc b/models/official/nlp/modeling/networks/__pycache__/__init__.cpython-39.pyc
diff --git a/models/official/nlp/modeling/networks/__pycache__/albert_encoder.cpython-39.pyc b/models/official/nlp/modeling/networks/__pycache__/albert_encoder.cpython-39.pyc
diff --git a/models/official/nlp/modeling/networks/__pycache__/bert_encoder.cpython-39.pyc b/models/official/nlp/modeling/networks/__pycache__/bert_encoder.cpython-39.pyc
diff --git a/models/official/nlp/modeling/networks/__pycache__/classification.cpython-39.pyc b/models/official/nlp/modeling/networks/__pycache__/classification.cpython-39.pyc
diff --git a/models/official/nlp/modeling/networks/__pycache__/encoder_scaffold.cpython-39.pyc b/models/official/nlp/modeling/networks/__pycache__/encoder_scaffold.cpython-39.pyc
diff --git a/models/official/nlp/modeling/networks/__pycache__/fnet.cpython-39.pyc b/models/official/nlp/modeling/networks/__pycache__/fnet.cpython-39.pyc
diff --git a/models/official/nlp/modeling/networks/__pycache__/funnel_transformer.cpython-39.pyc b/models/official/nlp/modeling/networks/__pycache__/funnel_transformer.cpython-39.pyc
diff --git a/models/official/nlp/modeling/networks/__pycache__/mobile_bert_encoder.cpython-39.pyc b/models/official/nlp/modeling/networks/__pycache__/mobile_bert_encoder.cpython-39.pyc
diff --git a/models/official/nlp/modeling/networks/__pycache__/packed_sequence_embedding.cpython-39.pyc b/models/official/nlp/modeling/networks/__pycache__/packed_sequence_embedding.cpython-39.pyc
diff --git a/models/official/nlp/modeling/networks/__pycache__/span_labeling.cpython-39.pyc b/models/official/nlp/modeling/networks/__pycache__/span_labeling.cpython-39.pyc
diff --git a/models/official/nlp/modeling/networks/__pycache__/sparse_mixer.cpython-39.pyc b/models/official/nlp/modeling/networks/__pycache__/sparse_mixer.cpython-39.pyc
diff --git a/models/official/nlp/modeling/networks/__pycache__/xlnet_base.cpython-39.pyc b/models/official/nlp/modeling/networks/__pycache__/xlnet_base.cpython-39.pyc
diff --git a/models/official/nlp/modeling/ops/__pycache__/__init__.cpython-39.pyc b/models/official/nlp/modeling/ops/__pycache__/__init__.cpython-39.pyc
diff --git a/models/official/nlp/modeling/ops/__pycache__/beam_search.cpython-39.pyc b/models/official/nlp/modeling/ops/__pycache__/beam_search.cpython-39.pyc
diff --git a/models/official/nlp/modeling/ops/__pycache__/decoding_module.cpython-39.pyc b/models/official/nlp/modeling/ops/__pycache__/decoding_module.cpython-39.pyc
diff --git a/models/official/nlp/modeling/ops/__pycache__/sampling_module.cpython-39.pyc b/models/official/nlp/modeling/ops/__pycache__/sampling_module.cpython-39.pyc
diff --git a/models/official/nlp/modeling/ops/__pycache__/segment_extractor.cpython-39.pyc b/models/official/nlp/modeling/ops/__pycache__/segment_extractor.cpython-39.pyc
diff --git a/models/official/projects/__pycache__/__init__.cpython-38.pyc b/models/official/projects/__pycache__/__init__.cpython-38.pyc
diff --git a/models/official/projects/__pycache__/__init__.cpython-39.pyc b/models/official/projects/__pycache__/__init__.cpython-39.pyc
diff --git a/models/official/projects/detr/configs/__pycache__/detr.cpython-39.pyc b/models/official/projects/detr/configs/__pycache__/detr.cpython-39.pyc
diff --git a/models/official/projects/detr/dataloaders/__pycache__/detr_input.cpython-39.pyc b/models/official/projects/detr/dataloaders/__pycache__/detr_input.cpython-39.pyc
diff --git a/models/official/projects/detr/dataloaders/coco.py b/models/official/projects/detr/dataloaders/coco.py
@@ -116,7 +116,7 @@ def preprocess(self, inputs):
                 classes, self._params.max_num_boxes),
         'boxes':
             preprocess_ops.clip_or_pad_to_fixed_size(
-                boxes, self._params.max_num_boxes)
+                boxes, self._params.max_num_boxes) # [4, 100]
     }
     if not self._params.is_training:
       labels.update({

diff --git a/models/official/projects/detr/experiments/detr_r50_300epochs.sh b/models/official/projects/detr/experiments/detr_r50_300epochs.sh
@@ -2,5 +2,6 @@
 python3 official/projects/detr/train.py \
   --experiment=detr_coco \
   --mode=train_and_eval \
-  --model_dir=/tmp/logging_dir/ \
+  --model_dir="./" \
   --params_override=task.init_checkpoint='gs://tf_model_garden/vision/resnet50_imagenet/ckpt-62400',trainer.train_steps=554400,trainer.optimizer_config.learning_rate.stepwise.boundaries="[369600]"
+
diff --git a/models/official/projects/detr/modeling/__pycache__/detr.cpython-39.pyc b/models/official/projects/detr/modeling/__pycache__/detr.cpython-39.pyc
diff --git a/models/official/projects/detr/modeling/__pycache__/transformer.cpython-39.pyc b/models/official/projects/detr/modeling/__pycache__/transformer.cpython-39.pyc
diff --git a/models/official/projects/detr/ops/__pycache__/matchers.cpython-39.pyc b/models/official/projects/detr/ops/__pycache__/matchers.cpython-39.pyc
diff --git a/models/official/projects/detr/ops/matchers.py b/models/official/projects/detr/ops/matchers.py
@@ -27,9 +27,9 @@
 Based on the original implementation by Jiquan Ngiam <[email protected]>.
 """
 import tensorflow as tf
+# from official.modeling import tf_utils
 from official.modeling import tf_utils
 
-
 def _prepare(weights):
   """Prepare the cost matrix.
 
@@ -73,6 +73,7 @@ def _greedy_assignment(adj_matrix):
     Each row and column can have at most one true element. Some of the rows
     and columns may not be matched.
   """
+
   _, num_elems, _ = tf_utils.get_shape_list(adj_matrix, expected_rank=3)
   adj_matrix = tf.transpose(adj_matrix, [1, 0, 2])
 

diff --git a/models/official/projects/detr/ops/matchers_test.py b/models/official/projects/detr/ops/matchers_test.py
@@ -18,9 +18,8 @@
 from scipy import optimize
 import tensorflow as tf
 
-from official.projects.detr.ops import matchers
-
-
+# from official.projects.detr.ops import matchers
+import matchers
 class MatchersOpsTest(tf.test.TestCase):
 
   def testLinearSumAssignment(self):

diff --git a/models/official/projects/detr/tasks/__pycache__/detection.cpython-39.pyc b/models/official/projects/detr/tasks/__pycache__/detection.cpython-39.pyc
diff --git a/models/official/projects/detr/tasks/detection.py b/models/official/projects/detr/tasks/detection.py
@@ -152,7 +152,7 @@ def _compute_cost(self, cls_outputs, box_outputs, cls_targets, box_targets):
         tf.cast(tf.not_equal(cls_targets, 0), dtype=total_cost.dtype), axis=1)
     total_cost = (1 - valid) * max_cost + valid * total_cost
 
-    # Set inf of nan to large constant
+    # Set inf or nan to large constant
     total_cost = tf.where(
         tf.logical_or(tf.math.is_nan(total_cost), tf.math.is_inf(total_cost)),
         max_cost * tf.ones_like(total_cost, dtype=total_cost.dtype),
@@ -176,7 +176,7 @@ def build_losses(self, outputs, labels, aux_losses=None):
     target_index = tf.math.argmax(indices, axis=1)
     cls_assigned = tf.gather(cls_outputs, target_index, batch_dims=1, axis=1)
     box_assigned = tf.gather(box_outputs, target_index, batch_dims=1, axis=1)
-
+    
     background = tf.equal(cls_targets, 0)
     num_boxes = tf.reduce_sum(
         tf.cast(tf.logical_not(background), tf.float32), axis=-1)

diff --git a/models/official/projects/maskformer/.gitignore b/models/official/projects/maskformer/.gitignore
@@ -0,0 +1,4 @@
+.gitignore
+myreadme.md
+ckpts/
+.npy
diff --git a/models/official/projects/maskformer/.ipynb_checkpoints/testing-checkpoint.ipynb b/models/official/projects/maskformer/.ipynb_checkpoints/testing-checkpoint.ipynb
@@ -0,0 +1,6 @@
+{
+ "cells": [],
+ "metadata": {},
+ "nbformat": 4,
+ "nbformat_minor": 4
+}
diff --git a/models/official/projects/maskformer/__pycache__/__init__.cpython-38.pyc b/models/official/projects/maskformer/__pycache__/__init__.cpython-38.pyc
diff --git a/models/official/projects/maskformer/__pycache__/__init__.cpython-39.pyc b/models/official/projects/maskformer/__pycache__/__init__.cpython-39.pyc
diff --git a/models/official/projects/maskformer/__pycache__/optimization.cpython-39.pyc b/models/official/projects/maskformer/__pycache__/optimization.cpython-39.pyc
diff --git a/models/official/projects/maskformer/configs/.ipynb_checkpoints/maskformer-checkpoint.py b/models/official/projects/maskformer/configs/.ipynb_checkpoints/maskformer-checkpoint.py
@@ -0,0 +1,212 @@
+# Copyright 2022 The TensorFlow Authors. All Rights Reserved.
+#
+# Licensed under the Apache License, Version 2.0 (the "License");
+# you may not use this file except in compliance with the License.
+# You may obtain a copy of the License at
+#
+#     http://www.apache.org/licenses/LICENSE-2.0
+#
+# Unless required by applicable law or agreed to in writing, software
+# distributed under the License is distributed on an "AS IS" BASIS,
+# WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
+# See the License for the specific language governing permissions and
+# limitations under the License.
+
+"""MaskFormer configurations."""
+
+import dataclasses
+import os
+from typing import List, Optional, Union
+
+from official.core import config_definitions as cfg
+from official.core import exp_factory
+from official.modeling import hyperparams
+from official.vision.configs import backbones
+from official.vision.configs import common
+from official.projects.maskformer import optimization
+
+
+@dataclasses.dataclass
+class Parser(hyperparams.Config):
+    """Config definitions for parser"""
+    output_size: List[int] = None
+    min_scale: float = 0.3
+    aspect_ratio_range: List[float] = (0.5, 2.0)
+    min_overlap_params: List[float] = (0.0, 1.4, 0.2, 0.1)
+    max_retry: int = 50
+    pad_output: bool = False
+    resize_eval_groundtruth: bool = True
+    groundtruth_padded_size: Optional[List[int]] = None
+    ignore_label: int = 0
+    aug_rand_hflip: bool = True
+    aug_scale_min: float = 1.0
+    aug_scale_max: float = 1.0
+    color_aug_ssd: bool = False
+    brightness: float = 0.2
+    saturation: float = 0.3
+    contrast: float = 0.5
+    aug_type: Optional[common.Augmentation] = None
+    sigma: float = 8.0
+    small_instance_area_threshold: int = 4096
+    small_instance_weight: float = 3.0
+    dtype: str = 'float32'
+    seed: int = None
+
+@dataclasses.dataclass
+class DataConfig(cfg.DataConfig):
+  """Input config for training."""
+  input_path: str = ''
+  tfds_name: str = ''
+  tfds_split: str = 'train'
+  global_batch_size: int = 0
+  is_training: bool = False
+  regenerate_source_id: bool = False
+  # TODO : Change the dtype to bloat16 for TPU training
+  dtype: str = 'bfloat16'
+  decoder: common.DataDecoder = common.DataDecoder()
+  shuffle_buffer_size: int = 10000
+  file_type: str = 'tfrecord'
+  drop_remainder: bool = True
+  parser: Parser = Parser()
+
+
+@dataclasses.dataclass
+class Losses(hyperparams.Config):
+  # TODO update these for maskformer
+  class_offset: int = 0
+  lambda_cls: float = 1.0
+  lambda_box: float = 5.0
+  lambda_giou: float = 2.0
+  background_cls_weight: float = 0.1
+  l2_weight_decay: float = 1e-4
+
+
+@dataclasses.dataclass
+class MaskFormer(hyperparams.Config):
+  # TODO update these for maskformer
+  """MaskFormer model definations."""
+  num_queries: int = 100
+  hidden_size: int = 256
+  # TODO: Actually there are 133 classes for panoptic segmentation
+  num_classes: int = 133  # 0: background
+  num_encoder_layers: int = 6
+  num_decoder_layers: int = 6
+  input_size: List[int] = dataclasses.field(default_factory=list)
+  backbone: backbones.Backbone = backbones.Backbone(
+      type='resnet', resnet=backbones.ResNet(model_id=50, bn_trainable=False))
+  norm_activation: common.NormActivation = common.NormActivation()
+  backbone_endpoint_name: str = '5'
+
+
+@dataclasses.dataclass
+class MaskFormerTask(cfg.TaskConfig):
+  model: MaskFormer = MaskFormer()
+  train_data: cfg.DataConfig = cfg.DataConfig()
+  validation_data: cfg.DataConfig = cfg.DataConfig()
+  losses: Losses = Losses()
+  init_checkpoint: Optional[str] = None
+  init_checkpoint_modules: Union[str, List[str]] = 'all'  # all, backbone
+  annotation_file: Optional[str] = None
+  per_category_metrics: bool = False
+
+# TODO : we should pass this via cmd 
+# COCO_INPUT_PATH_BASE = '/depot/davisjam/data/vishal/datasets/coco/'
+COCO_INPUT_PATH_BASE = 'gs://cam2-datasets/coco_panoptic/'
+COCO_TRAIN_EXAMPLES = 118287
+COCO_VAL_EXAMPLES = 5000
+
+
+@exp_factory.register_config_factory('maskformer_coco_panoptic')
+def maskformer_coco_panoptic() -> cfg.ExperimentConfig:
+  """Config to get results that matches the paper."""
+  train_batch_size = 8
+  eval_batch_size = 8
+  steps_per_epoch = 100
+#   steps_per_epoch = COCO_TRAIN_EXAMPLES // train_batch_size
+  train_steps = 300 * steps_per_epoch  # 300 epochs
+  decay_at = train_steps - 100 * steps_per_epoch  # 200 epochs
+  config = cfg.ExperimentConfig(
+      task=MaskFormerTask(
+          init_checkpoint='',
+          init_checkpoint_modules='backbone',
+          annotation_file=os.path.join(COCO_INPUT_PATH_BASE,'annotations'
+                                       'instances_train2017.json'),
+          model=MaskFormer(
+              input_size=[640, 640, 3],
+              norm_activation=common.NormActivation()),
+          losses=Losses(),
+          train_data=DataConfig(
+              input_path=os.path.join(COCO_INPUT_PATH_BASE, 'tfrecords/train*'),
+              is_training=True,
+              global_batch_size=train_batch_size,
+              shuffle_buffer_size=1000,
+              parser = Parser(
+                    output_size = [640,640],
+                    min_scale = 0.3,
+                    aspect_ratio_range = (0.5, 2.0),
+                    min_overlap_params = (0.0, 1.4, 0.2, 0.1),
+                    max_retry = 50,
+                    pad_output = False,
+                    resize_eval_groundtruth = True,
+                    groundtruth_padded_size = None,
+                    ignore_label = 0,
+                    aug_rand_hflip = True,
+                    aug_scale_min = 1.0,
+                    aug_scale_max = 1.0,
+                    color_aug_ssd = False,
+                    brightness = 0.2,
+                    saturation = 0.3,
+                    contrast = 0.5,
+                    # TODO choose appropriate augmentation
+                    aug_type = None,
+                    sigma = 8.0,
+                    small_instance_area_threshold = 4096,
+                    small_instance_weight = 3.0,
+                    dtype = 'bfloat16',
+                    seed = 2045,
+                )
+          ),
+          validation_data=DataConfig(
+              input_path=os.path.join(COCO_INPUT_PATH_BASE, 'tfrecords/val*'),
+              is_training=False,
+              global_batch_size=eval_batch_size,
+              drop_remainder=False,
+              parser = Parser(
+                    output_size = [640,640],
+                    pad_output = True,
+                    seed = 4096,
+                )
+
+          )),
+      trainer=cfg.TrainerConfig(
+          train_steps=train_steps,
+          validation_steps=COCO_VAL_EXAMPLES // eval_batch_size,
+          steps_per_loop=steps_per_epoch,
+          summary_interval=steps_per_epoch,
+          checkpoint_interval=steps_per_epoch,
+          validation_interval= 5 * steps_per_epoch,
+          max_to_keep=1,
+          best_checkpoint_export_subdir='best_ckpt',
+          # TODO: Not defined the metric
+          optimizer_config=optimization.OptimizationConfig({
+              'optimizer': {
+                  'type': 'detr_adamw',
+                  'detr_adamw': {
+                      'weight_decay_rate': 1e-4,
+                      'global_clipnorm': 0.1,
+                      # Avoid AdamW legacy behavior.
+                      'gradient_clip_norm': 0.0
+                  }
+              },
+              'learning_rate': {
+                  'type': 'stepwise',
+                  'stepwise': {
+                      'boundaries': [decay_at],
+                      'values': [0.0001, 1.0e-05]
+                  }
+              },
+          })),
+      restrictions=[
+          'task.train_data.is_training != None',
+      ])
+  return config
diff --git a/models/official/projects/maskformer/configs/__pycache__/maskformer.cpython-39.pyc b/models/official/projects/maskformer/configs/__pycache__/maskformer.cpython-39.pyc