Copied!







# Tratamiento y modelado de Series Temporales
from darts import TimeSeries
from darts.dataprocessing.transformers import Scaler
import pandas as pd
import numpy as np

# Visualizacion
import matplotlib.pyplot as plt
from darts.utils.statistics import plot_residuals_analysis

# Modelos
from darts.models import BlockRNNModel, NBEATSModel, RandomForest

# Metrica
from darts.metrics.metrics import rmse

# Parametros necesarios
RANDOM_SEED = 2024

TARGET = "OT"
DATE = "date"

PAST_COVARIATES = ["HUFL", "HULL", "MUFL", "MULL", "LUFL", "LULL"]

# Tratamiento y modelado de Series Temporales
from darts import TimeSeries
from darts.dataprocessing.transformers import Scaler
import pandas as pd
import numpy as np

# Visualizacion
import matplotlib.pyplot as plt
from darts.utils.statistics import plot_residuals_analysis

# Modelos
from darts.models import BlockRNNModel, NBEATSModel, RandomForest

# Metrica
from darts.metrics.metrics import rmse

# Parametros necesarios
RANDOM_SEED = 2024

TARGET = "OT"
DATE = "date"

PAST_COVARIATES = ["HUFL", "HULL", "MUFL", "MULL", "LUFL", "LULL"]





Copied!







# Tratamiento y modelado de Series Temporales
from darts import TimeSeries
from darts.dataprocessing.transformers import Scaler
import pandas as pd
import numpy as np

# Visualizacion
import matplotlib.pyplot as plt
from darts.utils.statistics import plot_residuals_analysis

# Modelos
from darts.models import BlockRNNModel, NBEATSModel, RandomForest

# Metrica
from darts.metrics.metrics import rmse

# Parametros necesarios
RANDOM_SEED = 2024

TARGET = "OT"
DATE = "date"

PAST_COVARIATES = ["HUFL", "HULL", "MUFL", "MULL", "LUFL", "LULL"]

# Tratamiento y modelado de Series Temporales
from darts import TimeSeries
from darts.dataprocessing.transformers import Scaler
import pandas as pd
import numpy as np

# Visualizacion
import matplotlib.pyplot as plt
from darts.utils.statistics import plot_residuals_analysis

# Modelos
from darts.models import BlockRNNModel, NBEATSModel, RandomForest

# Metrica
from darts.metrics.metrics import rmse

# Parametros necesarios
RANDOM_SEED = 2024

TARGET = "OT"
DATE = "date"

PAST_COVARIATES = ["HUFL", "HULL", "MUFL", "MULL", "LUFL", "LULL"]





Copied!







# Lectura de los datos
# df = pd.read_csv('/home/javier/capgemini-prueba-tecnica/jcg-testdatascience-2/data/electricity_transformer.csv')
series = TimeSeries.from_csv(
    "/home/javier/capgemini-prueba-tecnica/jcg-testdatascience-2/data/electricity_transformer.csv",
    DATE,
    [TARGET] + PAST_COVARIATES,
)

# Lectura de los datos
# df = pd.read_csv('/home/javier/capgemini-prueba-tecnica/jcg-testdatascience-2/data/electricity_transformer.csv')
series = TimeSeries.from_csv(
    "/home/javier/capgemini-prueba-tecnica/jcg-testdatascience-2/data/electricity_transformer.csv",
    DATE,
    [TARGET] + PAST_COVARIATES,
)





Copied!







# Lectura de los datos
# df = pd.read_csv('/home/javier/capgemini-prueba-tecnica/jcg-testdatascience-2/data/electricity_transformer.csv')
series = TimeSeries.from_csv(
    "/home/javier/capgemini-prueba-tecnica/jcg-testdatascience-2/data/electricity_transformer.csv",
    DATE,
    [TARGET] + PAST_COVARIATES,
)

# Lectura de los datos
# df = pd.read_csv('/home/javier/capgemini-prueba-tecnica/jcg-testdatascience-2/data/electricity_transformer.csv')
series = TimeSeries.from_csv(
    "/home/javier/capgemini-prueba-tecnica/jcg-testdatascience-2/data/electricity_transformer.csv",
    DATE,
    [TARGET] + PAST_COVARIATES,
)





Copied!







series.columns, len(series)

series.columns, len(series)

(Index(['OT', 'HUFL', 'HULL', 'MUFL', 'MULL', 'LUFL', 'LULL'], dtype='object', name='component'),
 2083)





Copied!







series.columns, len(series)

series.columns, len(series)

(Index(['OT', 'HUFL', 'HULL', 'MUFL', 'MULL', 'LUFL', 'LULL'], dtype='object', name='component'),
 2083)





Copied!







# Division en train y test
train, test = series[:-100], series[-100:]
print(len(train))
print(len(test))

plt.figure(figsize=(20, 6))
train[TARGET].plot(label="Train")
test[TARGET].plot(label="Test")

# Division en train y test
train, test = series[:-100], series[-100:]
print(len(train))
print(len(test))

plt.figure(figsize=(20, 6))
train[TARGET].plot(label="Train")
test[TARGET].plot(label="Test")

1983
100

<Axes: xlabel='date'>





Copied!







# Division en train y test
train, test = series[:-100], series[-100:]
print(len(train))
print(len(test))

plt.figure(figsize=(20, 6))
train[TARGET].plot(label="Train")
test[TARGET].plot(label="Test")

# Division en train y test
train, test = series[:-100], series[-100:]
print(len(train))
print(len(test))

plt.figure(figsize=(20, 6))
train[TARGET].plot(label="Train")
test[TARGET].plot(label="Test")

1983
100

<Axes: xlabel='date'>





Copied!







plt.figure(figsize=(20, 6))
train[TARGET].plot(label="Train")
test[TARGET].plot(label="Test")
for k in range(5):
    split = train[(-100 * (5 - k)) : ((-100 * (4 - k)) if k != 4 else None)]
    split[TARGET].plot(label=f"Validation Split {k+1}")

plt.figure(figsize=(20, 6))
train[TARGET].plot(label="Train")
test[TARGET].plot(label="Test")
for k in range(5):
    split = train[(-100 * (5 - k)) : ((-100 * (4 - k)) if k != 4 else None)]
    split[TARGET].plot(label=f"Validation Split {k+1}")





Copied!







plt.figure(figsize=(20, 6))
train[TARGET].plot(label="Train")
test[TARGET].plot(label="Test")
for k in range(5):
    split = train[(-100 * (5 - k)) : ((-100 * (4 - k)) if k != 4 else None)]
    split[TARGET].plot(label=f"Validation Split {k+1}")

plt.figure(figsize=(20, 6))
train[TARGET].plot(label="Train")
test[TARGET].plot(label="Test")
for k in range(5):
    split = train[(-100 * (5 - k)) : ((-100 * (4 - k)) if k != 4 else None)]
    split[TARGET].plot(label=f"Validation Split {k+1}")





Copied!







scaler = Scaler()  # Darts utiliza MinMaxScaler por defecto
train_wo_val, val = train[:-500], train[-500:]
scaler.fit(train_wo_val)
train = scaler.transform(train)
test = scaler.transform(test)

scaler = Scaler()  # Darts utiliza MinMaxScaler por defecto
train_wo_val, val = train[:-500], train[-500:]
scaler.fit(train_wo_val)
train = scaler.transform(train)
test = scaler.transform(test)





Copied!







scaler = Scaler()  # Darts utiliza MinMaxScaler por defecto
train_wo_val, val = train[:-500], train[-500:]
scaler.fit(train_wo_val)
train = scaler.transform(train)
test = scaler.transform(test)

scaler = Scaler()  # Darts utiliza MinMaxScaler por defecto
train_wo_val, val = train[:-500], train[-500:]
scaler.fit(train_wo_val)
train = scaler.transform(train)
test = scaler.transform(test)





Copied!







considered_models = [
    (
        "Block-Recurrent Neural Network",
        BlockRNNModel(input_chunk_length=50, output_chunk_length=100),
        {
            # Version mas realista de los parámetros
            # 'input_chunk_length': [200],
            # 'output_chunk_length': [100],
            # 'model': ['RNN', 'LSTM', 'GRU'],
            # 'hidden_dim': [25, 32, 64, 128],
            # 'n_rnn_layers': [1, 2, 3],
            # 'dropout': [0.0, 0.2, 0.4, 0.5],
            # Version que utilizaremos por limitaciones de tiempo
            "input_chunk_length": [50],
            "output_chunk_length": [100],
            "model": ["RNN"],
            "hidden_dim": [32, 64],
            "n_rnn_layers": [1, 2],
            "dropout": [0.0, 0.2],
            "random_state": [RANDOM_SEED],
        },
    ),
    (
        "N-BEATS",
        NBEATSModel(input_chunk_length=50, output_chunk_length=100),
        {
            # Version mas realista de los parámetros
            # 'input_chunk_length': [5],
            # 'output_chunk_length': [5],
            # 'num_stacks': [10, 20, 30],
            # 'num_blocks': [1, 2, 3],
            # 'num_layers': [4, 8],
            # 'layer_widths': [64, 128, 256, 512],
            # 'expansion_coefficient_dim': [3, 5, 10],
            # 'dropout': [0.0, 0.1, 0.2, 0.5],
            # Version que utilizaremos por limitaciones de tiempo
            "input_chunk_length": [50],
            "output_chunk_length": [100],
            "num_layers": [4, 8],
            "dropout": [0.0, 0.2],
            "random_state": [RANDOM_SEED],
        },
    ),
    (
        "Random Forest",
        RandomForest(lags=100, lags_past_covariates=100, output_chunk_length=100),
        {
            # Version mas realista de los parámetros
            # 'n_estimators': [50, 100, 200],
            # 'max_depth': [None, 10, 20, 30],
            # 'multi_models': [True, False],
            # Version que utilizaremos por limitaciones de tiempo
            "lags": [100],
            "lags_past_covariates": [100],
            "output_chunk_length": [100],
            "max_depth": [None, 20],
            "multi_models": [True, False],
            "random_state": [RANDOM_SEED],
        },
    ),
]

considered_models = [
    (
        "Block-Recurrent Neural Network",
        BlockRNNModel(input_chunk_length=50, output_chunk_length=100),
        {
            # Version mas realista de los parámetros
            # 'input_chunk_length': [200],
            # 'output_chunk_length': [100],
            # 'model': ['RNN', 'LSTM', 'GRU'],
            # 'hidden_dim': [25, 32, 64, 128],
            # 'n_rnn_layers': [1, 2, 3],
            # 'dropout': [0.0, 0.2, 0.4, 0.5],
            # Version que utilizaremos por limitaciones de tiempo
            "input_chunk_length": [50],
            "output_chunk_length": [100],
            "model": ["RNN"],
            "hidden_dim": [32, 64],
            "n_rnn_layers": [1, 2],
            "dropout": [0.0, 0.2],
            "random_state": [RANDOM_SEED],
        },
    ),
    (
        "N-BEATS",
        NBEATSModel(input_chunk_length=50, output_chunk_length=100),
        {
            # Version mas realista de los parámetros
            # 'input_chunk_length': [5],
            # 'output_chunk_length': [5],
            # 'num_stacks': [10, 20, 30],
            # 'num_blocks': [1, 2, 3],
            # 'num_layers': [4, 8],
            # 'layer_widths': [64, 128, 256, 512],
            # 'expansion_coefficient_dim': [3, 5, 10],
            # 'dropout': [0.0, 0.1, 0.2, 0.5],
            # Version que utilizaremos por limitaciones de tiempo
            "input_chunk_length": [50],
            "output_chunk_length": [100],
            "num_layers": [4, 8],
            "dropout": [0.0, 0.2],
            "random_state": [RANDOM_SEED],
        },
    ),
    (
        "Random Forest",
        RandomForest(lags=100, lags_past_covariates=100, output_chunk_length=100),
        {
            # Version mas realista de los parámetros
            # 'n_estimators': [50, 100, 200],
            # 'max_depth': [None, 10, 20, 30],
            # 'multi_models': [True, False],
            # Version que utilizaremos por limitaciones de tiempo
            "lags": [100],
            "lags_past_covariates": [100],
            "output_chunk_length": [100],
            "max_depth": [None, 20],
            "multi_models": [True, False],
            "random_state": [RANDOM_SEED],
        },
    ),
]





Copied!







considered_models = [
    (
        "Block-Recurrent Neural Network",
        BlockRNNModel(input_chunk_length=50, output_chunk_length=100),
        {
            # Version mas realista de los parámetros
            # 'input_chunk_length': [200],
            # 'output_chunk_length': [100],
            # 'model': ['RNN', 'LSTM', 'GRU'],
            # 'hidden_dim': [25, 32, 64, 128],
            # 'n_rnn_layers': [1, 2, 3],
            # 'dropout': [0.0, 0.2, 0.4, 0.5],
            # Version que utilizaremos por limitaciones de tiempo
            "input_chunk_length": [50],
            "output_chunk_length": [100],
            "model": ["RNN"],
            "hidden_dim": [32, 64],
            "n_rnn_layers": [1, 2],
            "dropout": [0.0, 0.2],
            "random_state": [RANDOM_SEED],
        },
    ),
    (
        "N-BEATS",
        NBEATSModel(input_chunk_length=50, output_chunk_length=100),
        {
            # Version mas realista de los parámetros
            # 'input_chunk_length': [5],
            # 'output_chunk_length': [5],
            # 'num_stacks': [10, 20, 30],
            # 'num_blocks': [1, 2, 3],
            # 'num_layers': [4, 8],
            # 'layer_widths': [64, 128, 256, 512],
            # 'expansion_coefficient_dim': [3, 5, 10],
            # 'dropout': [0.0, 0.1, 0.2, 0.5],
            # Version que utilizaremos por limitaciones de tiempo
            "input_chunk_length": [50],
            "output_chunk_length": [100],
            "num_layers": [4, 8],
            "dropout": [0.0, 0.2],
            "random_state": [RANDOM_SEED],
        },
    ),
    (
        "Random Forest",
        RandomForest(lags=100, lags_past_covariates=100, output_chunk_length=100),
        {
            # Version mas realista de los parámetros
            # 'n_estimators': [50, 100, 200],
            # 'max_depth': [None, 10, 20, 30],
            # 'multi_models': [True, False],
            # Version que utilizaremos por limitaciones de tiempo
            "lags": [100],
            "lags_past_covariates": [100],
            "output_chunk_length": [100],
            "max_depth": [None, 20],
            "multi_models": [True, False],
            "random_state": [RANDOM_SEED],
        },
    ),
]

considered_models = [
    (
        "Block-Recurrent Neural Network",
        BlockRNNModel(input_chunk_length=50, output_chunk_length=100),
        {
            # Version mas realista de los parámetros
            # 'input_chunk_length': [200],
            # 'output_chunk_length': [100],
            # 'model': ['RNN', 'LSTM', 'GRU'],
            # 'hidden_dim': [25, 32, 64, 128],
            # 'n_rnn_layers': [1, 2, 3],
            # 'dropout': [0.0, 0.2, 0.4, 0.5],
            # Version que utilizaremos por limitaciones de tiempo
            "input_chunk_length": [50],
            "output_chunk_length": [100],
            "model": ["RNN"],
            "hidden_dim": [32, 64],
            "n_rnn_layers": [1, 2],
            "dropout": [0.0, 0.2],
            "random_state": [RANDOM_SEED],
        },
    ),
    (
        "N-BEATS",
        NBEATSModel(input_chunk_length=50, output_chunk_length=100),
        {
            # Version mas realista de los parámetros
            # 'input_chunk_length': [5],
            # 'output_chunk_length': [5],
            # 'num_stacks': [10, 20, 30],
            # 'num_blocks': [1, 2, 3],
            # 'num_layers': [4, 8],
            # 'layer_widths': [64, 128, 256, 512],
            # 'expansion_coefficient_dim': [3, 5, 10],
            # 'dropout': [0.0, 0.1, 0.2, 0.5],
            # Version que utilizaremos por limitaciones de tiempo
            "input_chunk_length": [50],
            "output_chunk_length": [100],
            "num_layers": [4, 8],
            "dropout": [0.0, 0.2],
            "random_state": [RANDOM_SEED],
        },
    ),
    (
        "Random Forest",
        RandomForest(lags=100, lags_past_covariates=100, output_chunk_length=100),
        {
            # Version mas realista de los parámetros
            # 'n_estimators': [50, 100, 200],
            # 'max_depth': [None, 10, 20, 30],
            # 'multi_models': [True, False],
            # Version que utilizaremos por limitaciones de tiempo
            "lags": [100],
            "lags_past_covariates": [100],
            "output_chunk_length": [100],
            "max_depth": [None, 20],
            "multi_models": [True, False],
            "random_state": [RANDOM_SEED],
        },
    ),
]





Copied!







tuning_results = []
for name, base_model, params in considered_models:
    # Realizamos el gridsearch
    best_model_, best_params_, score_ = base_model.gridsearch(
        parameters=params,
        series=train[TARGET],
        past_covariates=train[PAST_COVARIATES],
        start=1483,
        forecast_horizon=100,
        stride=100,
        verbose=True,
        metric=rmse,
        last_points_only=False,
        n_jobs=-1,
    )

    # Entrenamos el mejor modelo con el dataset completo
    best_model_.fit(series=train[TARGET], past_covariates=train[PAST_COVARIATES])
    predictions_ = best_model_.predict(100, past_covariates=train[PAST_COVARIATES])
    #
    final_score_ = rmse(test[TARGET], predictions_)

    # Predecimos el conjunto de test
    tuning_results += [[name, best_model_, best_params_, score_, final_score_]]

tuning_results = []
for name, base_model, params in considered_models:
    # Realizamos el gridsearch
    best_model_, best_params_, score_ = base_model.gridsearch(
        parameters=params,
        series=train[TARGET],
        past_covariates=train[PAST_COVARIATES],
        start=1483,
        forecast_horizon=100,
        stride=100,
        verbose=True,
        metric=rmse,
        last_points_only=False,
        n_jobs=-1,
    )

    # Entrenamos el mejor modelo con el dataset completo
    best_model_.fit(series=train[TARGET], past_covariates=train[PAST_COVARIATES])
    predictions_ = best_model_.predict(100, past_covariates=train[PAST_COVARIATES])
    #
    final_score_ = rmse(test[TARGET], predictions_)

    # Predecimos el conjunto de test
    tuning_results += [[name, best_model_, best_params_, score_, final_score_]]





Copied!







tuning_results = []
for name, base_model, params in considered_models:
    # Realizamos el gridsearch
    best_model_, best_params_, score_ = base_model.gridsearch(
        parameters=params,
        series=train[TARGET],
        past_covariates=train[PAST_COVARIATES],
        start=1483,
        forecast_horizon=100,
        stride=100,
        verbose=True,
        metric=rmse,
        last_points_only=False,
        n_jobs=-1,
    )

    # Entrenamos el mejor modelo con el dataset completo
    best_model_.fit(series=train[TARGET], past_covariates=train[PAST_COVARIATES])
    predictions_ = best_model_.predict(100, past_covariates=train[PAST_COVARIATES])
    #
    final_score_ = rmse(test[TARGET], predictions_)

    # Predecimos el conjunto de test
    tuning_results += [[name, best_model_, best_params_, score_, final_score_]]

tuning_results = []
for name, base_model, params in considered_models:
    # Realizamos el gridsearch
    best_model_, best_params_, score_ = base_model.gridsearch(
        parameters=params,
        series=train[TARGET],
        past_covariates=train[PAST_COVARIATES],
        start=1483,
        forecast_horizon=100,
        stride=100,
        verbose=True,
        metric=rmse,
        last_points_only=False,
        n_jobs=-1,
    )

    # Entrenamos el mejor modelo con el dataset completo
    best_model_.fit(series=train[TARGET], past_covariates=train[PAST_COVARIATES])
    predictions_ = best_model_.predict(100, past_covariates=train[PAST_COVARIATES])
    #
    final_score_ = rmse(test[TARGET], predictions_)

    # Predecimos el conjunto de test
    tuning_results += [[name, best_model_, best_params_, score_, final_score_]]





Copied!







tuning_results_df = pd.DataFrame(
    [
        [name, best_params_, score_, final_score_]
        for name, _, best_params_, score_, final_score_ in tuning_results
    ],
    columns=["Model", "Best Parameters", "Backtesting RMSE", "Test RMSE"],
)
tuning_results_df

tuning_results_df = pd.DataFrame(
    [
        [name, best_params_, score_, final_score_]
        for name, _, best_params_, score_, final_score_ in tuning_results
    ],
    columns=["Model", "Best Parameters", "Backtesting RMSE", "Test RMSE"],
)
tuning_results_df





Copied!







tuning_results_df = pd.DataFrame(
    [
        [name, best_params_, score_, final_score_]
        for name, _, best_params_, score_, final_score_ in tuning_results
    ],
    columns=["Model", "Best Parameters", "Backtesting RMSE", "Test RMSE"],
)
tuning_results_df

tuning_results_df = pd.DataFrame(
    [
        [name, best_params_, score_, final_score_]
        for name, _, best_params_, score_, final_score_ in tuning_results
    ],
    columns=["Model", "Best Parameters", "Backtesting RMSE", "Test RMSE"],
)
tuning_results_df





Copied!







test[TARGET].plot(label="Test")
for name_, model_, _, _, _ in tuning_results:
    model_.predict(100, past_covariates=series[PAST_COVARIATES]).plot(label=name_)

test[TARGET].plot(label="Test")
for name_, model_, _, _, _ in tuning_results:
    model_.predict(100, past_covariates=series[PAST_COVARIATES]).plot(label=name_)

GPU available: False, used: False
TPU available: False, using: 0 TPU cores
HPU available: False, using: 0 HPUs

Predicting: |          | 0/? [00:00<?, ?it/s]

GPU available: False, used: False
TPU available: False, using: 0 TPU cores
HPU available: False, using: 0 HPUs

Predicting: |          | 0/? [00:00<?, ?it/s]





Copied!







test[TARGET].plot(label="Test")
for name_, model_, _, _, _ in tuning_results:
    model_.predict(100, past_covariates=series[PAST_COVARIATES]).plot(label=name_)

test[TARGET].plot(label="Test")
for name_, model_, _, _, _ in tuning_results:
    model_.predict(100, past_covariates=series[PAST_COVARIATES]).plot(label=name_)

GPU available: False, used: False
TPU available: False, using: 0 TPU cores
HPU available: False, using: 0 HPUs

Predicting: |          | 0/? [00:00<?, ?it/s]

GPU available: False, used: False
TPU available: False, using: 0 TPU cores
HPU available: False, using: 0 HPUs

Predicting: |          | 0/? [00:00<?, ?it/s]





Copied!







rf_model = tuning_results[2][1]
rf_preds = rf_model.predict(100, past_covariates=series[PAST_COVARIATES])
rf_residuals = test[TARGET] - rf_preds
plot_residuals_analysis(rf_residuals, acf_max_lag=100)

rf_model = tuning_results[2][1]
rf_preds = rf_model.predict(100, past_covariates=series[PAST_COVARIATES])
rf_residuals = test[TARGET] - rf_preds
plot_residuals_analysis(rf_residuals, acf_max_lag=100)





Copied!







rf_model = tuning_results[2][1]
rf_preds = rf_model.predict(100, past_covariates=series[PAST_COVARIATES])
rf_residuals = test[TARGET] - rf_preds
plot_residuals_analysis(rf_residuals, acf_max_lag=100)

rf_model = tuning_results[2][1]
rf_preds = rf_model.predict(100, past_covariates=series[PAST_COVARIATES])
rf_residuals = test[TARGET] - rf_preds
plot_residuals_analysis(rf_residuals, acf_max_lag=100)





Copied!







final_model = RandomForest(
    **{
        "lags": 100,
        "lags_past_covariates": 100,
        "output_chunk_length": 100,
        "max_depth": None,
        "multi_models": True,
        "random_state": RANDOM_SEED,
    }
)

scaled_series = scaler.fit_transform(series)
final_model.fit(
    series=scaled_series[TARGET], past_covariates=scaled_series[PAST_COVARIATES]
)

final_model = RandomForest(
    **{
        "lags": 100,
        "lags_past_covariates": 100,
        "output_chunk_length": 100,
        "max_depth": None,
        "multi_models": True,
        "random_state": RANDOM_SEED,
    }
)

scaled_series = scaler.fit_transform(series)
final_model.fit(
    series=scaled_series[TARGET], past_covariates=scaled_series[PAST_COVARIATES]
)

RandomForest(lags=100, lags_past_covariates=100, lags_future_covariates=None, output_chunk_length=100, output_chunk_shift=0, add_encoders=None, n_estimators=100, max_depth=None, multi_models=True, use_static_covariates=True, random_state=2024)





Copied!







final_model = RandomForest(
    **{
        "lags": 100,
        "lags_past_covariates": 100,
        "output_chunk_length": 100,
        "max_depth": None,
        "multi_models": True,
        "random_state": RANDOM_SEED,
    }
)

scaled_series = scaler.fit_transform(series)
final_model.fit(
    series=scaled_series[TARGET], past_covariates=scaled_series[PAST_COVARIATES]
)

final_model = RandomForest(
    **{
        "lags": 100,
        "lags_past_covariates": 100,
        "output_chunk_length": 100,
        "max_depth": None,
        "multi_models": True,
        "random_state": RANDOM_SEED,
    }
)

scaled_series = scaler.fit_transform(series)
final_model.fit(
    series=scaled_series[TARGET], past_covariates=scaled_series[PAST_COVARIATES]
)

RandomForest(lags=100, lags_past_covariates=100, lags_future_covariates=None, output_chunk_length=100, output_chunk_shift=0, add_encoders=None, n_estimators=100, max_depth=None, multi_models=True, use_static_covariates=True, random_state=2024)





Copied!







final_predictions = final_model.predict(100)
# Tenemos que revertir el escalado para expresar las predicciones finales en las unidades correctas
# Añadimos series dummy para obtener 7 series con las que poder ejecutar la funcion inverse_transform
dates = pd.date_range(start="2018-06-26 20:00:00", periods=100, freq="h")
dummy_data = np.random.rand(100)
dummy_series = TimeSeries.from_times_and_values(
    dates, dummy_data, columns=["Initial Series"]
)

for i in range(6):
    final_predictions = final_predictions.stack(dummy_series)

final_predictions = scaler.inverse_transform(final_predictions)
series[TARGET][-300:].plot(label="Últimos datos")
final_predictions["OT"].plot(label="Predichos")

final_predictions = final_model.predict(100)
# Tenemos que revertir el escalado para expresar las predicciones finales en las unidades correctas
# Añadimos series dummy para obtener 7 series con las que poder ejecutar la funcion inverse_transform
dates = pd.date_range(start="2018-06-26 20:00:00", periods=100, freq="h")
dummy_data = np.random.rand(100)
dummy_series = TimeSeries.from_times_and_values(
    dates, dummy_data, columns=["Initial Series"]
)

for i in range(6):
    final_predictions = final_predictions.stack(dummy_series)

final_predictions = scaler.inverse_transform(final_predictions)
series[TARGET][-300:].plot(label="Últimos datos")
final_predictions["OT"].plot(label="Predichos")

<Axes: xlabel='date'>





Copied!







final_predictions = final_model.predict(100)
# Tenemos que revertir el escalado para expresar las predicciones finales en las unidades correctas
# Añadimos series dummy para obtener 7 series con las que poder ejecutar la funcion inverse_transform
dates = pd.date_range(start="2018-06-26 20:00:00", periods=100, freq="h")
dummy_data = np.random.rand(100)
dummy_series = TimeSeries.from_times_and_values(
    dates, dummy_data, columns=["Initial Series"]
)

for i in range(6):
    final_predictions = final_predictions.stack(dummy_series)

final_predictions = scaler.inverse_transform(final_predictions)
series[TARGET][-300:].plot(label="Últimos datos")
final_predictions["OT"].plot(label="Predichos")

final_predictions = final_model.predict(100)
# Tenemos que revertir el escalado para expresar las predicciones finales en las unidades correctas
# Añadimos series dummy para obtener 7 series con las que poder ejecutar la funcion inverse_transform
dates = pd.date_range(start="2018-06-26 20:00:00", periods=100, freq="h")
dummy_data = np.random.rand(100)
dummy_series = TimeSeries.from_times_and_values(
    dates, dummy_data, columns=["Initial Series"]
)

for i in range(6):
    final_predictions = final_predictions.stack(dummy_series)

final_predictions = scaler.inverse_transform(final_predictions)
series[TARGET][-300:].plot(label="Últimos datos")
final_predictions["OT"].plot(label="Predichos")

<Axes: xlabel='date'>

	Model	Best Parameters	Backtesting RMSE	Test RMSE
0	Block-Recurrent Neural Network	{'input_chunk_length': 50, 'output_chunk_lengt...	0.084051	0.037654
1	N-BEATS	{'input_chunk_length': 50, 'output_chunk_lengt...	0.103135	0.078973
2	Random Forest	{'lags': 100, 'lags_past_covariates': 100, 'ou...	0.077147	0.037400

Keys	Action
`?`	Open this help
`n`	Next page
`p`	Previous page
`s`	Search

Selección del modelo¶

Metodología de selección del modelo¶

Métricas de evaluación¶

Sobre los Modelos a considerar¶

Partición de los datos¶

Estandarizado¶

Backtesting para tuning de hiperparámetros¶

Los modelos considerados¶

Predicciones finales¶