Use k samples for training before evaluating the progressing validation score #756

SirPopiel · 2021-11-04T19:29:20Z

SirPopiel
Nov 4, 2021

Hello, I was wondering if it were easily possible to use k samples (say 100) of a data stream for training before evaluating the progressing validation score in an online fashion. It would be useful for me, as I'm using River's algorithms to benchmark the results of some models which assume to have (a few) training data before starting to work online.
Thank you in advance!

Answered by MaxHalford

Nov 4, 2021

Hello! What's preventing you from doing that right now? For example:

import itertools
from river import datasets
from river import evaluate
from river import linear_model
from river import metrics
from river import preprocessing

model = (
    preprocessing.StandardScaler() |
    linear_model.LogisticRegression()
)

dataset = iter(datasets.Phishing())

# Warm up
k = 200
for x, y in itertools.islice(dataset, k):
    model.predict_one(x)
    model.learn_one(x, y)

evaluate.progressive_val_score(
    model=model,
    dataset=dataset,
    metric=metrics.ROCAUC(),
    print_every=100
)

View full answer

MaxHalford · 2021-11-04T20:52:19Z

MaxHalford
Nov 4, 2021
Maintainer

Hello! What's preventing you from doing that right now? For example:

import itertools
from river import datasets
from river import evaluate
from river import linear_model
from river import metrics
from river import preprocessing

model = (
    preprocessing.StandardScaler() |
    linear_model.LogisticRegression()
)

dataset = iter(datasets.Phishing())

# Warm up
k = 200
for x, y in itertools.islice(dataset, k):
    model.predict_one(x)
    model.learn_one(x, y)

evaluate.progressive_val_score(
    model=model,
    dataset=dataset,
    metric=metrics.ROCAUC(),
    print_every=100
)

2 replies

SirPopiel Nov 4, 2021
Author

Yup, you are right, my bad. Thank you!

MaxHalford Nov 4, 2021
Maintainer

No worries! Never hesitate to ask.

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Use k samples for training before evaluating the progressing validation score #756

{{title}}

Replies: 1 comment 2 replies

{{title}}

{{title}}

{{title}}

Select a reply

Use k samples for training before evaluating the progressing validation score #756

SirPopiel Nov 4, 2021

Replies: 1 comment · 2 replies

MaxHalford Nov 4, 2021 Maintainer

SirPopiel Nov 4, 2021 Author

MaxHalford Nov 4, 2021 Maintainer

SirPopiel
Nov 4, 2021

Replies: 1 comment 2 replies

MaxHalford
Nov 4, 2021
Maintainer

SirPopiel Nov 4, 2021
Author

MaxHalford Nov 4, 2021
Maintainer