From 1dcec1d81ac2268302421c82a120b8fffe330b3e Mon Sep 17 00:00:00 2001
From: nikosbosse <nikosbosse@gmail.com>
Date: Mon, 16 Sep 2024 18:04:52 +0200
Subject: [PATCH 1/4] Fix code after changes in scoringutils

---
 R/score_model_out.R                           | 46 ++++++++++++-------
 tests/testthat/test-score_model_out.R         |  3 +-
 .../testthat/test-transform_point_model_out.R |  9 +++-
 .../test-transform_quantile_model_out.R       |  7 ++-
 4 files changed, 43 insertions(+), 22 deletions(-)

diff --git a/R/score_model_out.R b/R/score_model_out.R
index a2c8525..1b35f16 100644
--- a/R/score_model_out.R
+++ b/R/score_model_out.R
@@ -15,16 +15,16 @@
 #'
 #' @details If `metrics` is `NULL` (the default), this function chooses
 #' appropriate metrics based on the `output_type` contained in the `model_out_tbl`:
-#' \itemize{
-#'   \item For `output_type == "quantile"`, we use the default metrics provided by
-#' `scoringutils::metrics_quantile()`: `r names(scoringutils::metrics_quantile())`
-#'   \item For `output_type == "pmf"` and `output_type_id_order` is `NULL` (indicating
+#'
+#' - For `output_type == "quantile"`, we use the default metrics provided by
+#' `scoringutils`:
+#' `r names(scoringutils::get_metrics(scoringutils::example_quantile))`
+#' - For `output_type == "pmf"` and `output_type_id_order` is `NULL` (indicating
 #' that the predicted variable is a nominal variable), we use the default metric
-#' provided by `scoringutils::metrics_nominal()`,
-#' `r names(scoringutils::metrics_nominal())`
-#'   \item For `output_type == "median"`, we use "ae_point"
-#'   \item For `output_type == "mean"`, we use "se_point"
-#' }
+#' provided by `scoringutils`:,
+#' `r names(scoringutils::get_metrics(scoringutils::example_nominal))`
+#'   - For `output_type == "median"`, we use "ae_point"
+#'   - For `output_type == "mean"`, we use "se_point"
 #'
 #' Alternatively, a character vector of scoring metrics can be provided. In this
 #' case, the following options are supported:
@@ -46,6 +46,9 @@
 #'   - `output_type == "pmf"`:
 #'     - "log_score": log score
 #'
+#' See [scoringutils::get_metrics()] for more details on the default meterics
+#' used by `scoringutils`.
+#'
 #' @examplesIf requireNamespace("hubExamples", quietly = TRUE)
 #' # compute WIS and interval coverage rates at 80% and 90% levels based on
 #' # quantile forecasts, summarized by the mean score for each model
@@ -143,10 +146,10 @@ get_metrics <- function(metrics, output_type, output_type_id_order) {
 #' @noRd
 get_metrics_default <- function(output_type, output_type_id_order) {
   metrics <- switch(output_type,
-    quantile = scoringutils::metrics_quantile(),
-    pmf = scoringutils::metrics_nominal(),
-    mean = scoringutils::metrics_point(select = "se_point"),
-    median = scoringutils::metrics_point(select = "ae_point"),
+    quantile = scoringutils::get_metrics(scoringutils::example_quantile),
+    pmf = scoringutils::get_metrics(scoringutils::example_nominal),
+    mean = scoringutils::get_metrics(scoringutils::example_point, select = "se_point"),
+    median = scoringutils::get_metrics(scoringutils::example_point, select = "ae_point"),
     NULL # default
   )
   if (is.null(metrics)) {
@@ -199,7 +202,10 @@ get_metrics_character <- function(metrics, output_type) {
     )
     names(interval_metric_fns) <- interval_metrics
 
-    other_metric_fns <- scoringutils::metrics_quantile(select = other_metrics)
+    other_metric_fns <- scoringutils::get_metrics(
+      scoringutils::example_quantile,
+      select = other_metrics
+    )
 
     metric_fns <- c(other_metric_fns, interval_metric_fns)[metrics]
     metrics <- metric_fns
@@ -208,13 +214,19 @@ get_metrics_character <- function(metrics, output_type) {
     invalid_metrics <- metrics[!metrics %in% valid_metrics]
     error_if_invalid_metrics(valid_metrics, invalid_metrics, output_type)
 
-    metrics <- scoringutils::metrics_nominal(select = metrics)
+    metrics <- scoringutils::get_metrics(
+      scoringutils::example_nominal,
+      select = metrics
+    )
   } else if (output_type %in% c("median", "mean")) {
     valid_metrics <- c("ae_point", "se_point")
     invalid_metrics <- metrics[!metrics %in% valid_metrics]
     error_if_invalid_metrics(valid_metrics, invalid_metrics, output_type)
 
-    metrics <- scoringutils::metrics_point(select = metrics)
+    metrics <- scoringutils::get_metrics(
+      scoringutils::example_point,
+      select = metrics
+    )
   } else {
     # we have already validated `output_type`, so this case should not be
     # triggered; this case is just double checking in case we add something new
@@ -231,7 +243,7 @@ error_if_invalid_metrics <- function(valid_metrics, invalid_metrics, output_type
   if (n > 0) {
     cli::cli_abort(
       c(
-        "`metrics` had {n} unsupported metric{?s} for 
+        "`metrics` had {n} unsupported metric{?s} for
         {.arg output_type} {.val {output_type}}: {.strong {.val {invalid_metrics}}};
         supported metrics include {.val {valid_metrics}}.",
         comment
diff --git a/tests/testthat/test-score_model_out.R b/tests/testthat/test-score_model_out.R
index 8987ee9..8dc8efe 100644
--- a/tests/testthat/test-score_model_out.R
+++ b/tests/testthat/test-score_model_out.R
@@ -441,7 +441,7 @@ test_that("score_model_out errors when invalid metrics are requested", {
     score_model_out(
       model_out_tbl = forecast_outputs |> dplyr::filter(.data[["output_type"]] == "mean"),
       target_observations = forecast_target_observations,
-      metrics = scoringutils::metrics_point(),
+      metrics = scoringutils::get_metrics(scoringutils::example_point),
       by = c("model_id", "location")
     ),
     regexp = "`metrics` must be either `NULL` or a character vector of supported metrics."
@@ -464,3 +464,4 @@ test_that("score_model_out errors when an unsupported output_type is provided",
     regexp = "only supports the following types"
   )
 })
+
diff --git a/tests/testthat/test-transform_point_model_out.R b/tests/testthat/test-transform_point_model_out.R
index 503c448..b55bc4e 100644
--- a/tests/testthat/test-transform_point_model_out.R
+++ b/tests/testthat/test-transform_point_model_out.R
@@ -140,6 +140,11 @@ test_that("hubExamples data set is transformed correctly", {
       reference_date = as.Date(reference_date, "%Y-%m-%d"),
       target_end_date = as.Date(target_end_date, "%Y-%m-%d")
     )
-  class(exp_forecast) <- c("forecast_point", "forecast", "data.table", "data.frame")
-  expect_equal(act_forecast, exp_forecast)
+  expect_s3_class(
+    act_forecast,
+    c("forecast_point", "forecast", "data.table", "data.frame")
+  )
+  expect_equal(as.data.frame(act_forecast), as.data.frame(exp_forecast))
 })
+
+
diff --git a/tests/testthat/test-transform_quantile_model_out.R b/tests/testthat/test-transform_quantile_model_out.R
index bdc01a0..0e9f14b 100644
--- a/tests/testthat/test-transform_quantile_model_out.R
+++ b/tests/testthat/test-transform_quantile_model_out.R
@@ -89,6 +89,9 @@ test_that("hubExamples data set is transformed correctly", {
       reference_date = as.Date(reference_date, "%Y-%m-%d"),
       target_end_date = as.Date(target_end_date, "%Y-%m-%d")
     )
-  class(exp_forecast) <- c("forecast", "forecast_quantile", "data.table", "data.frame")
-  expect_equal(act_forecast, exp_forecast, ignore_attr = "class")
+  expect_s3_class(
+    act_forecast,
+    c("forecast_quantile", "forecast", "data.table", "data.frame")
+  )
+  expect_equal(as.data.frame(act_forecast), as.data.frame(exp_forecast))
 })

From 937187aeb24bf00a1ec6791aab7daa0a4bc0106e Mon Sep 17 00:00:00 2001
From: nikosbosse <nikosbosse@gmail.com>
Date: Mon, 16 Sep 2024 18:09:36 +0200
Subject: [PATCH 2/4] Update docs

---
 man/score_model_out.Rd | 12 +++++++++---
 1 file changed, 9 insertions(+), 3 deletions(-)

diff --git a/man/score_model_out.Rd b/man/score_model_out.Rd
index 8c42a92..94fd2d0 100644
--- a/man/score_model_out.Rd
+++ b/man/score_model_out.Rd
@@ -43,14 +43,17 @@ If \code{metrics} is \code{NULL} (the default), this function chooses
 appropriate metrics based on the \code{output_type} contained in the \code{model_out_tbl}:
 \itemize{
 \item For \code{output_type == "quantile"}, we use the default metrics provided by
-\code{scoringutils::metrics_quantile()}: wis, overprediction, underprediction, dispersion, bias, interval_coverage_50, interval_coverage_90, interval_coverage_deviation, ae_median
+\code{scoringutils}:
+\verb{r names(scoringutils::get_metrics(scoringutils::example_quantile))}
 \item For \code{output_type == "pmf"} and \code{output_type_id_order} is \code{NULL} (indicating
 that the predicted variable is a nominal variable), we use the default metric
-provided by \code{scoringutils::metrics_nominal()},
-log_score
+provided by \code{scoringutils}:,
+\verb{r names(scoringutils::get_metrics(scoringutils::example_nominal))}
+\itemize{
 \item For \code{output_type == "median"}, we use "ae_point"
 \item For \code{output_type == "mean"}, we use "se_point"
 }
+}
 
 Alternatively, a character vector of scoring metrics can be provided. In this
 case, the following options are supported:
@@ -79,6 +82,9 @@ based on quantiles at the probability levels 0.025 and 0.975.
 \item "log_score": log score
 }
 }
+
+See \code{\link[scoringutils:get_metrics]{scoringutils::get_metrics()}} for more details on the default meterics
+used by \code{scoringutils}.
 }
 \examples{
 \dontshow{if (requireNamespace("hubExamples", quietly = TRUE)) (if (getRversion() >= "3.4") withAutoprint else force)(\{ # examplesIf}

From 31993ef756e42aa9fac2a45344736341f2df5079 Mon Sep 17 00:00:00 2001
From: nikosbosse <nikosbosse@gmail.com>
Date: Mon, 16 Sep 2024 18:12:43 +0200
Subject: [PATCH 3/4] fix linting issues

---
 tests/testthat/test-score_model_out.R           | 1 -
 tests/testthat/test-transform_point_model_out.R | 2 --
 2 files changed, 3 deletions(-)

diff --git a/tests/testthat/test-score_model_out.R b/tests/testthat/test-score_model_out.R
index 8dc8efe..6d02eeb 100644
--- a/tests/testthat/test-score_model_out.R
+++ b/tests/testthat/test-score_model_out.R
@@ -464,4 +464,3 @@ test_that("score_model_out errors when an unsupported output_type is provided",
     regexp = "only supports the following types"
   )
 })
-
diff --git a/tests/testthat/test-transform_point_model_out.R b/tests/testthat/test-transform_point_model_out.R
index b55bc4e..1bc6aa2 100644
--- a/tests/testthat/test-transform_point_model_out.R
+++ b/tests/testthat/test-transform_point_model_out.R
@@ -146,5 +146,3 @@ test_that("hubExamples data set is transformed correctly", {
   )
   expect_equal(as.data.frame(act_forecast), as.data.frame(exp_forecast))
 })
-
-

From 0d12262957b1c3d3657c1919a3addda42cb3dcf5 Mon Sep 17 00:00:00 2001
From: nikosbosse <nikosbosse@gmail.com>
Date: Mon, 16 Sep 2024 18:30:38 +0200
Subject: [PATCH 4/4] fix docs

---
 R/score_model_out.R    | 14 ++++++++------
 man/score_model_out.Rd | 11 +++++------
 2 files changed, 13 insertions(+), 12 deletions(-)

diff --git a/R/score_model_out.R b/R/score_model_out.R
index 1b35f16..0fd3a29 100644
--- a/R/score_model_out.R
+++ b/R/score_model_out.R
@@ -16,15 +16,17 @@
 #' @details If `metrics` is `NULL` (the default), this function chooses
 #' appropriate metrics based on the `output_type` contained in the `model_out_tbl`:
 #'
-#' - For `output_type == "quantile"`, we use the default metrics provided by
+#' \itemize{
+#' \item For `output_type == "quantile"`, we use the default metrics provided by
 #' `scoringutils`:
 #' `r names(scoringutils::get_metrics(scoringutils::example_quantile))`
-#' - For `output_type == "pmf"` and `output_type_id_order` is `NULL` (indicating
+#' \item For `output_type == "pmf"` and `output_type_id_order` is `NULL` (indicating
 #' that the predicted variable is a nominal variable), we use the default metric
-#' provided by `scoringutils`:,
+#' provided by `scoringutils`:
 #' `r names(scoringutils::get_metrics(scoringutils::example_nominal))`
-#'   - For `output_type == "median"`, we use "ae_point"
-#'   - For `output_type == "mean"`, we use "se_point"
+#'   \item For `output_type == "median"`, we use "ae_point"
+#'   \item For `output_type == "mean"`, we use "se_point"
+#' }
 #'
 #' Alternatively, a character vector of scoring metrics can be provided. In this
 #' case, the following options are supported:
@@ -46,7 +48,7 @@
 #'   - `output_type == "pmf"`:
 #'     - "log_score": log score
 #'
-#' See [scoringutils::get_metrics()] for more details on the default meterics
+#' See [scoringutils::get_metrics()] for more details on the default metrics
 #' used by `scoringutils`.
 #'
 #' @examplesIf requireNamespace("hubExamples", quietly = TRUE)
diff --git a/man/score_model_out.Rd b/man/score_model_out.Rd
index 94fd2d0..64b1209 100644
--- a/man/score_model_out.Rd
+++ b/man/score_model_out.Rd
@@ -41,19 +41,18 @@ Score model output predictions with a single \code{output_type} against observed
 \details{
 If \code{metrics} is \code{NULL} (the default), this function chooses
 appropriate metrics based on the \code{output_type} contained in the \code{model_out_tbl}:
+
 \itemize{
 \item For \code{output_type == "quantile"}, we use the default metrics provided by
 \code{scoringutils}:
-\verb{r names(scoringutils::get_metrics(scoringutils::example_quantile))}
+wis, overprediction, underprediction, dispersion, bias, interval_coverage_50, interval_coverage_90, interval_coverage_deviation, ae_median
 \item For \code{output_type == "pmf"} and \code{output_type_id_order} is \code{NULL} (indicating
 that the predicted variable is a nominal variable), we use the default metric
-provided by \code{scoringutils}:,
-\verb{r names(scoringutils::get_metrics(scoringutils::example_nominal))}
-\itemize{
+provided by \code{scoringutils}:
+log_score
 \item For \code{output_type == "median"}, we use "ae_point"
 \item For \code{output_type == "mean"}, we use "se_point"
 }
-}
 
 Alternatively, a character vector of scoring metrics can be provided. In this
 case, the following options are supported:
@@ -83,7 +82,7 @@ based on quantiles at the probability levels 0.025 and 0.975.
 }
 }
 
-See \code{\link[scoringutils:get_metrics]{scoringutils::get_metrics()}} for more details on the default meterics
+See \code{\link[scoringutils:get_metrics]{scoringutils::get_metrics()}} for more details on the default metrics
 used by \code{scoringutils}.
 }
 \examples{