Evalml: рд╕реНрдЯреИрдХреНрдб рдкрд╣рдирд╛рд╡рд╛ рдЦрд░рд╛рдм рдкреНрд░рджрд░реНрд╢рди рдХрд░ рд░рд╣рд╛ рд╣реИ

рдХреЛ рдирд┐рд░реНрдорд┐рдд 6 рдЕрдкреНрд░реИрд▓ 2021  ┬╖  11рдЯрд┐рдкреНрдкрдгрд┐рдпрд╛рдБ  ┬╖  рд╕реНрд░реЛрдд: alteryx/evalml

рдкреНрд░рдЬрдирди рдХреЗ рдЪрд░рдг:

  1. рд╣реИрдкреНрдкреАрдиреЗрд╕ рдбреЗрдЯрд╛рд╕реЗрдЯ рдХреЛ evalml рдореЗрдВ рд▓реЛрдб рдХрд░реЗрдВ
  2. рдХреЛрдбрд╛рдВрддрд░рдг рд╢рд╛рдорд┐рд▓ рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рдкрд░реНрдпрд╛рдкреНрдд рджреЗрд░ рддрдХ рджреМрдбрд╝реЗрдВ
  3. рдмреЗрд╕рд▓рд╛рдЗрди рд░реЗрдЬрд┐рд╕реНрдЯрд░, рд╕реНрдЯреИрдХреНрдб рд░реЗрдЬрд┐рд╕реНрдЯрд░ рдХреА рддреБрд▓рдирд╛ рдореЗрдВ рдЙрдЪреНрдЪ рд░реИрдВрдХ рдХреЗ рд░реВрдк рдореЗрдВ рджрд┐рдЦрд╛рддрд╛ рд╣реИред
    рдЦреБрд╢реА рдбреЗрдЯрд╛ рдкреВрд░реНрдг рд╕реЗрдЯ.csv.zip

рд╕рднреА 11 рдЯрд┐рдкреНрдкрдгрд┐рдпрд╛рдБ

@dancuarini рдореИрдВрдиреЗ рдЗрд╕реЗ рд╕реНрдерд╛рдиреАрдп рд░реВрдк рд╕реЗ рдкреБрди: рдкреЗрд╢ рдХрд░рдиреЗ рдХреА рдХреЛрд╢рд┐рд╢ рдХреА рд▓реЗрдХрд┐рди рд╕рдХреНрд╖рдо рдирд╣реАрдВ рдерд╛; AutoMLSearch рдЪрд▓рд╛рдиреЗ рд╕реЗ рдкрд╣рд▓реЗ рдЕрддрд┐рд░рд┐рдХреНрдд рдЪрд░рдгреЛрдВ рдХреЗ рдХрд╛рд░рдг рд╣реЛ рд╕рдХрддрд╛ рд╣реИ (рдЙрджрд╛: рдбреЗрдЯрд╛ рд╕реНрдкреНрд▓рд┐рдЯ рдЖрдХрд╛рд░, рдбреНрд░реЙрдкрд┐рдВрдЧ рдХреЙрд▓рдо)ред рдЪрд▓реЛ рд╕рдорд╕реНрдпрд╛ рд╡рд┐рдиреНрдпрд╛рд╕ рдХреЗ рдмрд╛рд░реЗ рдореЗрдВ рдмрд╛рдд рдХрд░рддреЗ рд╣реИрдВ!

рдпрд╣рд╛рдВ рдореИрдВрдиреЗ рд╕реНрдерд╛рдиреАрдп рд░реВрдк рд╕реЗ рдЪрд▓рд╛рдиреЗ рдХреА рдХреЛрд╢рд┐рд╢ рдХреА рд╣реИ:

from evalml.automl import AutoMLSearch
import pandas as pd
import woodwork as ww
from evalml.automl.callbacks import raise_error_callback

happiness_data_set = pd.read_csv("Happiness Data Full Set.csv")
y = happiness_data_set['Happiness']
X = happiness_data_set.drop(['Happiness'], axis=1)
# display(X.head())

X = ww.DataTable(X)
X_train, X_holdout, y_train, y_holdout = evalml.preprocessing.split_data(X, y, problem_type='regression', test_size=0.2, random_seed=0)
# print(X.types)

automl = AutoMLSearch(X, y, problem_type="regression", objective="MAE", error_callback=raise_error_callback, max_batches=20, ensembling=True)
automl.search()

рдЗрд╕рдХрд╛ рдкрд░рд┐рдгрд╛рдо рдирд┐рдореНрдирд▓рд┐рдЦрд┐рдд рд░реИрдВрдХрд┐рдВрдЧ рдореЗрдВ рд╣реЛрддрд╛ рд╣реИ:

image

рд╡рд░реНрддрдорд╛рди рдкреНрд░рдЧрддрд┐: рд╕реНрдерд╛рдиреАрдп рд╕реНрддрд░ рдкрд░ рд░рд┐рдкреНрд░реЛ рдореЗрдВ рд╕рдХреНрд╖рдо рдирд╣реАрдВ рд╣реЛрдиреЗ рдХреЗ рдмрд╛рд░реЗ рдореЗрдВ рд░реЗрдкреНрд░реЛ - рдЗрдВрдЧ рдФрд░ рдЕрдЧрд▓реЗ рдЪрд░рдгреЛрдВ рдХреЗ рдмрд╛рд░реЗ рдореЗрдВ рд░рд╣реЗрдЧрд╛ ред

@ рдПрдВрдЬреЗрд▓рд╛ 97lin рд░реБрдХреЛ, рдХреНрдпрд╛ рдЖрдк рд╡рд╛рдХрдИ

рдкреБрдирд░реБрддреНрдкрд╛рджрдХ рд╕рд╛рдЭрд╛ рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рдзрдиреНрдпрд╡рд╛рдж :)

@dsherry рд╣рд╛рд▓рд╛рдВрдХрд┐ рдпрд╣ рдереЛрдбрд╝рд╛ рд╕рдВрджреЗрд╣рд╛рд╕реНрдкрдж рд╣реИ рдХрд┐ рд╕реНрдЯреИрдХреНрдб

@ рдПрдВрдЬреЗрд▓рд╛ 97 рд▓рд┐рди рдЖрд╣ рд╣рд╛рдБ рд╕рдордЭ рдЧрдпрд╛! рдореИрдВрдиреЗ рдЖрдкрдХреЛ рдХреБрдЫ рдиреЛрдЯреНрд╕ рднреЗрдЬреЗ рд╣реИрдВред

рдореБрдЭреЗ рд▓рдЧрддрд╛ рд╣реИ рдХрд┐ рдХреЛрдИ рднреА рд╕рдмреВрдд рд╣реИ рдХрд┐ рд╣рдорд╛рд░реЗ рдкрд╣рдирд╛рд╡рд╛ рд╣рдореЗрд╢рд╛ рд╢реАрд░реНрд╖ рдХреЗ рдХрд░реАрдм рдирд╣реАрдВ рд╣реЛрддреЗ рд╣реИрдВ, рдПрдХ рд╕рдорд╕реНрдпрд╛ рд╣реИред

рдЗрд╕рдореЗрдВ рдереЛрдбрд╝рд╛ рдФрд░ рдЦреЛрджреЛред рдореБрдЭреЗ рд▓рдЧрддрд╛ рд╣реИ рдХрд┐ рдХреБрдЫ рд╕рдВрднрд╛рд╡рд┐рдд рдХрд╛рд░рдг рд╣реИрдВ рдХрд┐ рдПрдирд╕реЗрдВрдмрд▓рд░ рдЗрд╕ рдбреЗрдЯрд╛ рд╕реЗрдЯ рдХреЗ рд╕рд╛рде рдЦрд░рд╛рдм рдкреНрд░рджрд░реНрд╢рди рдХреНрдпреЛрдВ рдХрд░рддрд╛ рд╣реИ:

  1. рдбреЗрдЯрд╛рд╕реЗрдЯ рд╡рд╛рд╕реНрддрд╡ рдореЗрдВ рдЫреЛрдЯрд╛ рд╣реИ, рдФрд░ рд╣рдорд╛рд░реА рд╡рд░реНрддрдорд╛рди рдбреЗрдЯрд╛ рд╡рд┐рднрд╛рдЬрди рд░рдгрдиреАрддрд┐ рдХрд╛ рдЕрд░реНрде рд╣реИ рдХрд┐ рдПрдирд╕реЗрдореНрдмрд▓рд░ рдХреЛ рдбреЗрдЯрд╛ рдХреЗ рдПрдХ рдмрд╣реБрдд рдЫреЛрдЯреЗ рдЙрдкрд╕рдореБрдЪреНрдЪрдп рдХреЗ рд╕рд╛рде рдкреНрд░рджрд╛рди рдХрд┐рдпрд╛ рдЬрд╛рддрд╛ рд╣реИ рдФрд░ рдорд╛рдиреНрдп рдХрд┐рдпрд╛ рдЬрд╛рддрд╛ рд╣реИред рдЕрднреА, рдпрджрд┐ рд╣рдо рдПрдХ рд╕реНрдЯреИрдХреНрдб рдПрдирд╕реЗрдореНрдмрд▓рд░ рдХреЛ рдкреНрд░рд╢рд┐рдХреНрд╖рд┐рдд рдХрд░рдирд╛ рдЪрд╛рд╣рддреЗ рд╣реИрдВ, рддреЛ рд╣рдо рдПрдирд╕реЗрдореНрдмрд▓рд░ рдХреЛ рдкреНрд░рд╢рд┐рдХреНрд╖рд┐рдд рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рдХреБрдЫ рдбреЗрдЯрд╛ ( ensembling_indices рд╕рд╛рде рдкрд╣рдЪрд╛рдиреЗ рдЧрдП) рдХреЛ рд╡рд┐рднрд╛рдЬрд┐рдд рдХрд░рддреЗ рд╣реИрдВред рдпрд╣ рдзрд╛рддреБ рд╕реАрдЦрдиреЗ рд╡рд╛рд▓реЗ рдХреЛ рдЙрд╕реА рдбреЗрдЯрд╛ рдкрд░ рдкреНрд░рд╢рд┐рдХреНрд╖рдг рдХреЗ рдорд╛рдзреНрдпрдо рд╕реЗ рдПрдирд╕реЗрдВрдмрд▓рд░ рдХреЛ рдУрд╡рд░рдлрд┐рдЯ рдХрд░рдиреЗ рд╕реЗ рд░реЛрдХрдиреЗ рдХреЗ рд▓рд┐рдП рд╣реИ рдЬрд┐рд╕ рдкрд░ рдЗрдирдкреБрдЯ рдкрд╛рдЗрдкрд▓рд╛рдЗрди рдкрд╣рд▓реЗ рд╕реЗ рд╣реА рдкреНрд░рд╢рд┐рдХреНрд╖рд┐рдд рдереЗред рдлрд┐рд░ рд╣рдо рдПрдХ рд╕реАрд╡реА рд╕реНрдкреНрд▓рд┐рдЯ рдХрд░рддреЗ рд╣реИрдВ, рдФрд░ рдбреЗрдЯрд╛ рдХреЛ ensembling_indices рд╕реЗ рд╡рд┐рднрд╛рдЬрд┐рдд рдХрд░рддреЗ рд╣реИрдВред 128 рдкрдВрдХреНрддрд┐рдпреЛрдВ рдХреЗ рдЗрд╕ рдбреЗрдЯрд╛рд╕реЗрдЯ рдХреЗ рд▓рд┐рдП, рд╣рдо рдХреНрд░рдорд╢рдГ 17 рдФрд░ 8 рдкрдВрдХреНрддрд┐рдпреЛрдВ рдкрд░ рдкреНрд░рд╢рд┐рдХреНрд╖рдг рдФрд░ рд╕рддреНрдпрд╛рдкрди рдХрд░рддреЗ рд╣реИрдВред рдореИрдВрдиреЗ рдпрд╣ рдЪрд░реНрдЪрд╛ рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП #2144 рджрд╛рдпрд░ рдХрд┐рдпрд╛ рдХрд┐ рдХреНрдпрд╛ рд╣рдо рдпрд╣ рдЕрддрд┐рд░рд┐рдХреНрдд рд╕реАрд╡реА рд╡рд┐рднрд╛рдЬрди рдХрд░рдирд╛ рдЪрд╛рд╣рддреЗ рд╣реИрдВред

  2. рд╣рдорд╛рд░реЗ рдПрдирд╕реЗрдВрдмрд▓рд░ рдХрд╛ рдирд┐рд░реНрдорд╛рдг рд╡рд░реНрддрдорд╛рди рдореЗрдВ рдкрд╛рдП рдЧрдП рдкреНрд░рддреНрдпреЗрдХ рдореЙрдбрд▓ рдкрд░рд┐рд╡рд╛рд░ рдХреА рд╕рд░реНрд╡рд╢реНрд░реЗрд╖реНрда рдкрд╛рдЗрдкрд▓рд╛рдЗрди рдХреЛ рд▓реЗрдХрд░ рдФрд░ рд╕реНрдЯреИрдХреНрдб рдПрдирд╕реЗрдВрдмрд▓рд░ рдХреЗ рд▓рд┐рдП рдЗрдирдкреБрдЯ рдкрд╛рдЗрдкрд▓рд╛рдЗрди рдХреЗ рд░реВрдк рдореЗрдВ рдЙрдкрдпреЛрдЧ рдХрд░рдХреЗ рдХрд┐рдпрд╛ рдЬрд╛рддрд╛ рд╣реИред рд╣рд╛рд▓рд╛рдВрдХрд┐, рдЕрдЧрд░ рдХреБрдЫ рдЗрдирдкреБрдЯ рдкрд╛рдЗрдкрд▓рд╛рдЗрди рдХрд╛рдлреА рдЦрд░рд╛рдм рдкреНрд░рджрд░реНрд╢рди рдХрд░рддреЗ рд╣реИрдВ, рддреЛ рд╕реНрдЯреИрдХреНрдб рдПрдиреНрд╕реЗрдореНрдмрд▓рд░ рдПрдХ рдЙрдЪреНрдЪ-рдкреНрд░рджрд░реНрд╢рди рд╡рд╛рд▓реА рд╡реНрдпрдХреНрддрд┐рдЧрдд рдкрд╛рдЗрдкрд▓рд╛рдЗрди рдХреЗ рд╕рд╛рде-рд╕рд╛рде рдкреНрд░рджрд░реНрд╢рди рдирд╣реАрдВ рдХрд░ рд╕рдХрддрд╛ рд╣реИред

рдЙрджрд╛рд╣рд░рдг рдХреЗ рд▓рд┐рдП, рдпрд╣ рдЕрдВрддрд┐рдо рд░реИрдВрдХрд┐рдВрдЧ рддрд╛рд▓рд┐рдХрд╛ рд╣реИ:
image

рд╣рдо рджреЗрдЦрддреЗ рд╣реИрдВ рдХрд┐ рд╕реНрдЯреИрдХреНрдб рдкрд╣рдирд╛рд╡рд╛ рдмреАрдЪ рдореЗрдВ рд╕рд╣реА рд╕реНрдореИрдХ рдХрд╛ рдкреНрд░рджрд░реНрд╢рди рдХрд░рддрд╛ рд╣реИ - рдЕрдЧрд░ рд╣рдо рдЗрд╕реЗ рд╕рд░рд▓ рдмрдирд╛рддреЗ рд╣реИрдВ рдФрд░ рдХрд╣рддреЗ рд╣реИрдВ рдХрд┐ рд╕реНрдЯреИрдХреНрдб рдкрд╣рдирд╛рд╡рд╛ рдЗрд╕рдХреА рдЗрдирдкреБрдЯ рдкрд╛рдЗрдкрд▓рд╛рдЗрдиреЛрдВ рдХреА рднрд╡рд┐рд╖реНрдпрд╡рд╛рдгрд┐рдпреЛрдВ рдХрд╛ рдФрд╕рдд рд╣реИ, рддреЛ рдпрд╣ рд╕рдордЭ рдореЗрдВ рдЖрддрд╛ рд╣реИред рдЕрдкрдиреА рдкрд░рд┐рдХрд▓реНрдкрдирд╛ рдХрд╛ рдкрд░реАрдХреНрд╖рдг рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП, рдореИрдВрдиреЗ рдХреЗрд╡рд▓ рдЙрди рдореЙрдбрд▓ рдкрд░рд┐рд╡рд╛рд░реЛрдВ рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рдиреЗ рдХрд╛ рдирд┐рд░реНрдгрдп рд▓рд┐рдпрд╛, рдЬрд┐рдиреНрд╣реЛрдВрдиреЗ рд╕рднреА рдореЙрдбрд▓ рдкрд░рд┐рд╡рд╛рд░реЛрдВ рдХреЗ рдмрдЬрд╛рдп рд╕реНрдЯреИрдХреНрдб рдПрдирд╕реЗрдВрдмрд▓рд░ рд╕реЗ рдмреЗрд╣рддрд░ рдкреНрд░рджрд░реНрд╢рди рдХрд┐рдпрд╛, рдФрд░ рджреЗрдЦрд╛ рдХрд┐ рдкрд░рд┐рдгрд╛рдореА рд╕реНрдХреЛрд░ рдХрд┐рд╕реА рднреА рд╡реНрдпрдХреНрддрд┐рдЧрдд рдкрд╛рдЗрдкрд▓рд╛рдЗрди рдХреА рддреБрд▓рдирд╛ рдореЗрдВ рдмрд╣реБрдд рдмреЗрд╣рддрд░ рдкреНрд░рджрд░реНрд╢рди рдХрд░рддрд╛ рд╣реИред рдпрд╣ рдореБрдЭреЗ рд╡рд┐рд╢реНрд╡рд╛рд╕ рджрд┐рд▓рд╛рддрд╛ рд╣реИ рдХрд┐ рдЦрд░рд╛рдм рдкреНрд░рджрд░реНрд╢рди рдХрд░рдиреЗ рд╡рд╛рд▓реА рд╡реНрдпрдХреНрддрд┐рдЧрдд рдкрд╛рдЗрдкрд▓рд╛рдЗрдиреЛрдВ рдиреЗ рд╕реНрдЯреИрдХреНрдб рдПрдиреНрд╕реЗрдореНрдмрд▓рд░ рдХреЛ рдФрд░ рднреА рдЦрд░рд╛рдм рдкреНрд░рджрд░реНрд╢рди рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рдкреНрд░реЗрд░рд┐рдд рдХрд┐рдпрд╛ред

рдЗрд╕рдХреЗ рд▓рд┐рдП рд░реЗрдкреНрд░реЛ рдХреЛрдб рдпрд╣рд╛рдВ рджрд┐рдпрд╛ рдЧрдпрд╛ рд╣реИ:

рдЙрдкрд░ рд╕реЗ:

import pandas as pd
import woodwork as ww
happiness_data_set = pd.read_csv("Happiness Data Full Set.csv")
y = happiness_data_set['Happiness']
X = happiness_data_set.drop(['Happiness'], axis=1)

X = ww.DataTable(X)
X_train, X_holdout, y_train, y_holdout = evalml.preprocessing.split_data(X, y, problem_type='regression', test_size=0.25, random_seed=0)

automl = AutoMLSearch(X, y, problem_type="regression", objective="MAE", error_callback=raise_error_callback, max_batches=10, ensembling=True)
automl.search()

import woodwork as ww
from evalml.automl.engine import train_and_score_pipeline
from evalml.automl.engine.engine_base import JobLogger

# Get the pipelines fed into the ensemble but only use the ones better than the stacked ensemble
input_pipelines = []
input_info = automl._automl_algorithm._best_pipeline_info
from evalml.model_family import ModelFamily

trimmed = dict()
trimmed.update({ModelFamily.RANDOM_FOREST: input_info[ModelFamily.RANDOM_FOREST]})
trimmed.update({ModelFamily.XGBOOST: input_info[ModelFamily.XGBOOST]})
trimmed.update({ModelFamily.DECISION_TREE: input_info[ModelFamily.EXTRA_TREES]})

for pipeline_dict in trimmed.values():
    pipeline_class = pipeline_dict['pipeline_class']
    pipeline_params = pipeline_dict['parameters']
    input_pipelines.append(pipeline_class(parameters=automl._automl_algorithm._transform_parameters(pipeline_class, pipeline_params),
                                                      random_seed=automl._automl_algorithm.random_seed))
ensemble_pipeline = _make_stacked_ensemble_pipeline(input_pipelines, "regression")
X_train = X.iloc[automl.ensembling_indices]
y_train = ww.DataColumn(y.iloc[automl.ensembling_indices])
train_and_score_pipeline(ensemble_pipeline, automl.automl_config, X_train, y_train, JobLogger())

рдЗрди рддреАрди рдореЙрдбрд▓ рдкрд░рд┐рд╡рд╛рд░реЛрдВ рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рдХреЗ, рд╣рдореЗрдВ ~ 0.22 рдХрд╛ рдПрдордПрдИ рд╕реНрдХреЛрд░ рдорд┐рд▓рддрд╛ рд╣реИ, рдЬреЛ рдХрд┐ рдХрд┐рд╕реА рднреА рд╡реНрдпрдХреНрддрд┐рдЧрдд рдкрд╛рдЗрдкрд▓рд╛рдЗрди рд╕реЗ рдХрд╛рдлреА рдмреЗрд╣рддрд░ рд╣реИред

#output of train_and_score_pipeline(ensemble_pipeline, automl.automl_config, X_train, y_train, JobLogger())
{'scores': {'cv_data': [{'all_objective_scores': OrderedDict([('MAE',
                  0.22281276417465426),
                 ('ExpVariance', 0.9578811127332543),
                 ('MaxError', 0.3858477236606914),
                 ('MedianAE', 0.2790362808260225),
                 ('MSE', 0.0642654425375983),
                 ('R2', 0.9152119239698017),
                 ('Root Mean Squared Error', 0.2535062968401343),
                 ('# Training', 17),
                 ('# Validation', 9)]),
    'mean_cv_score': 0.22281276417465426,
    'binary_classification_threshold': None}],
  'training_time': 9.944366216659546,
  'cv_scores': 0    0.222813
  dtype: float64,
  'cv_score_mean': 0.22281276417465426},
 'pipeline': TemplatedPipeline(parameters={'Stacked Ensemble Regressor':{'input_pipelines': [GeneratedPipeline(parameters={'Imputer':{'categorical_impute_strategy': 'most_frequent', 'numeric_impute_strategy': 'most_frequent', 'categorical_fill_value': None, 'numeric_fill_value': None}, 'One Hot Encoder':{'top_n': 10, 'features_to_encode': None, 'categories': None, 'drop': 'if_binary', 'handle_unknown': 'ignore', 'handle_missing': 'error'}, 'Random Forest Regressor':{'n_estimators': 184, 'max_depth': 25, 'n_jobs': -1},}), GeneratedPipeline(parameters={'Imputer':{'categorical_impute_strategy': 'most_frequent', 'numeric_impute_strategy': 'mean', 'categorical_fill_value': None, 'numeric_fill_value': None}, 'One Hot Encoder':{'top_n': 10, 'features_to_encode': None, 'categories': None, 'drop': 'if_binary', 'handle_unknown': 'ignore', 'handle_missing': 'error'}, 'XGBoost Regressor':{'eta': 0.1, 'max_depth': 6, 'min_child_weight': 1, 'n_estimators': 100},}), GeneratedPipeline(parameters={'Imputer':{'categorical_impute_strategy': 'most_frequent', 'numeric_impute_strategy': 'mean', 'categorical_fill_value': None, 'numeric_fill_value': None}, 'One Hot Encoder':{'top_n': 10, 'features_to_encode': None, 'categories': None, 'drop': 'if_binary', 'handle_unknown': 'ignore', 'handle_missing': 'error'}, 'Extra Trees Regressor':{'n_estimators': 100, 'max_features': 'auto', 'max_depth': 6, 'min_samples_split': 2, 'min_weight_fraction_leaf': 0.0, 'n_jobs': -1},})], 'final_estimator': None, 'cv': None, 'n_jobs': -1},}),

рдЗрд╕рд╕реЗ рдореБрдЭреЗ рдЖрд╢реНрдЪрд░реНрдп рд╣реЛрддрд╛ рд╣реИ рдХрд┐ рдХреНрдпрд╛ рд╣рдореЗрдВ рдЗрд╕ рдмрд╛рд░реЗ рдореЗрдВ рдкреБрдирд░реНрд╡рд┐рдЪрд╛рд░ рдХрд░рдиреЗ рдХреА рдЖрд╡рд╢реНрдпрдХрддрд╛ рд╣реИ рдХрд┐ рд╣рдореЗрдВ рдЕрдкрдиреЗ рд╕реНрдЯреИрдХреНрдб рдПрдирд╕реЗрдВрдмрд▓рд░ рдХреЛ рдХреМрди рд╕реА рдЗрдирдкреБрдЯ рдкрд╛рдЗрдкрд▓рд╛рдЗрди рдЦрд┐рд▓рд╛рдиреА рдЪрд╛рд╣рд┐рдПред

  1. рд╣рдо рдЬрд┐рд╕ рдзрд╛рддреБрдХрд░реНрдореА рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░ рд░рд╣реЗ рд╣реИрдВ (LinearRegressor) рд╡рд╣ рд╕рдмрд╕реЗ рдЕрдЪреНрдЫрд╛ рдирд╣реАрдВ рд╣реИред рдореИрдВрдиреЗ рдЗрд╕реЗ stacking_test рд╢рд╛рдЦрд╛ рдХреЗ рдорд╛рдзреНрдпрдо рд╕реЗ рдкрд░реАрдХреНрд╖рдг рдХрд┐рдпрд╛, рдЬрд╣рд╛рдВ рдореИрдВрдиреЗ рд░рд┐рдЬрд╕реАрд╡реА (рд╕реНрдХрд┐рдХрд┐рдЯ-рд▓рд░реНрди рдбрд┐рдлреЙрд▓реНрдЯ, рд▓реЗрдХрд┐рди рд╣рдорд╛рд░реЗ рдкрд╛рд╕ рдЗрд╡рд▓рдПрдордПрд▓ рдореЗрдВ рдирд╣реАрдВ рд╣реИ) рдХреЗ рд▓рд┐рдП рдбрд┐рдлрд╝реЙрд▓реНрдЯ рдореЗрдЯрд▓рд░реНрдирд░ рдХреЛ рдЕрдкрдбреЗрдЯ рдХрд┐рдпрд╛ рд╣реИ, рдФрд░ рдПрдирд╕реЗрдВрдмрд▓рд░ рдмрд╣реБрдд рдмреЗрд╣рддрд░ рдкреНрд░рджрд░реНрд╢рди рдХрд░рддрд╛ рд╣реИ:
    image

@dshery рдХреЗ рд╕рд╛рде рдЪрд░реНрдЪрд╛ рдХреЗ рдмрд╛рдж рдЕрдЧрд▓реЗ рдЪрд░рдг:

рдЕрдиреНрдп рдбреЗрдЯрд╛рд╕реЗрдЯ рдкрд░ # 1 рдФрд░ # 3 (рдЗрд▓рд╛рд╕реНрдЯрд┐рдХ рдиреЗрдЯ рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рдХреЗ) рдЖрдЬрд╝рдорд╛рдПрдВ, рдкреВрд░реНрдг рдкрд░реАрдХреНрд╖рдг рдЪрд▓рд╛рдПрдВ, рджреЗрдЦреЗрдВ рдХрд┐ рдХреНрдпрд╛ рд╣рдо рд╕рдордЧреНрд░ рд░реВрдк рд╕реЗ рдмреЗрд╣рддрд░ рдкреНрд░рджрд░реНрд╢рди рдкреНрд░рд╛рдкреНрдд рдХрд░ рд╕рдХрддреЗ рд╣реИрдВред

@ Angela97lin рдЫреЛрдЯреЗ рдбреЗрдЯрд╛рд╕реЗрдЯ рдХреЗ рд▓рд┐рдП рдмрдВрдЯрд╡рд╛рд░реЗ рдХреЗ рдмрд╛рд░реЗ рдореЗрдВ рдЖрдкрдХреА рдмрд╛рддреЗрдВ рд╕рд╣реА рд╣реИрдВред рдЖрдЦрд┐рд░рдХрд╛рд░, рд╣рдореЗрдВ рдЫреЛрдЯреЗ рдбреЗрдЯрд╛рд╕реЗрдЯ рдХреЛ рд╡рд╛рд╕реНрддрд╡ рдореЗрдВ рдмрдбрд╝реЗ рд╕реЗ рдЕрд▓рдЧ рддрд░реАрдХреЗ рд╕реЗ рд╕рдВрднрд╛рд▓рдиреЗ рдХреА рдЖрд╡рд╢реНрдпрдХрддрд╛ рд╣реЛрддреА рд╣реИ, рдЙрджрд╛рд╣рд░рдг рдХреЗ рд▓рд┐рдП рдкреВрд░реЗ рдбреЗрдЯрд╛рд╕реЗрдЯ рдкрд░ рдХреЗрд╡рд▓ рдЙрдЪреНрдЪ-рдЧреБрдирд╛-рдЧрд┐рдирддреА xval рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рдХреЗ, рдпрд╣рд╛рдВ рддрдХ тАЛтАЛтАЛтАЛрдХрд┐ LOOCV, рдФрд░ рдпрд╣ рд╕реБрдирд┐рд╢реНрдЪрд┐рдд рдХрд░рдирд╛ рдХрд┐ рд╣рдо рдХрд▓рд╛рдХрд╛рд░реЛрдВ рдХреА рдЯреБрдХрдбрд╝реА рдХреЗ рдкреНрд░рд╢рд┐рдХреНрд╖рдг рдХреЗ рд▓рд┐рдП рдЕрд▓рдЧ-рдЕрд▓рдЧ рд╕рд┐рд▓рд╡рдЯреЛрдВ рдХрд╛ рдирд┐рд░реНрдорд╛рдг рдХрд░рддреЗ рд╣реИрдВред

рдореИрдВ рдпрд╣ рднреА рдорд╛рдирддрд╛ рд╣реВрдВ рдХрд┐ рдзрд╛рддреБ рдЕрд░реНрдЬрд┐рдд рдХрд░рдиреЗ рд╡рд╛рд▓реЗ рдХреЛ рдордЬрдмреВрдд рдирд┐рдпрдорд┐рддреАрдХрд░рдг рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рдиреЗ рдХреА рдЖрд╡рд╢реНрдпрдХрддрд╛ рд╣реИред рдореИрдВрдиреЗ H2O-3 StackedEnsemble рдореЗрдВ Elastic Net рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд┐рдпрд╛, рдФрд░ рдХреЗрд╡рд▓ рдПрдХ рдмрд╛рд░ рдпрд╛рдж рдХрд┐рдпрд╛ рдХрд┐ рд▓реАрдбрд░рдмреЛрд░реНрдб рдореЗрдВ рдкрд╣рдирд╛рд╡рд╛ рджреВрд╕рд░реЗ рд╕реНрдерд╛рди рдкрд░ рдЖрдпрд╛ рдерд╛ред рд╣рд░ рдмрд╛рд░ рдЬрдм рдореИрдВрдиреЗ рдкрд░реАрдХреНрд╖рдг рдХрд┐рдпрд╛, рддреЛ рдпрд╣ рдкрд╣рд▓рд╛ рдерд╛ред рдирд┐рдпрдорд┐рддреАрдХрд░рдг рдХреЛ рдХрднреА рднреА рдЦрд░рд╛рдм рдореЙрдбрд▓реЛрдВ рдХреЛ рдкрд╣рдирд╛рд╡реЗ рдХреЗ рдкреНрд░рджрд░реНрд╢рди рдХреЛ рдХрдо рдХрд░рдиреЗ рдХреА рдЕрдиреБрдорддрд┐ рдирд╣реАрдВ рджреЗрдиреА рдЪрд╛рд╣рд┐рдПред

рдФрд░ рдпрд╣ 50 рдореЙрдбрд▓реНрд╕ рдХреЗ рдкреВрд░реЗ рд▓реАрдбрд░рдмреЛрд░реНрдб рдХреЛ рдореЗрдЯрд▓ рдЕрд░реНрдирд░ рдореЗрдВ рдлреАрдб рдХрд░ рд░рд╣рд╛ рдерд╛ред :-)

рдмрд╕ рдЗрд╕ рдкрд░ рдХреБрдЫ рдЕрддрд┐рд░рд┐рдХреНрдд рдЕрдкрдбреЗрдЯ рдкреЛрд╕реНрдЯ рдХрд░ рд░рд╣реЗ рд╣реИрдВ:

рд╕рднреА рд░рд┐рдЧреНрд░реЗрд╢рди рдбреЗрдЯрд╛рд╕реЗрдЯ рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рдХреЗ рд╕реНрдерд╛рдиреАрдп рд░реВрдк рд╕реЗ рдкрд░реАрдХреНрд╖рдг рдХрд┐рдпрд╛ рдЧрдпрд╛ред рдкрд░рд┐рдгрд╛рдо рдпрд╣рд╛рдВ рдпрд╛ рд╕рд┐рд░реНрдл рдЪрд╛рд░реНрдЯ рдпрд╣рд╛рдВ рджреЗрдЦреЗ рдЬрд╛ рд╕рдХрддреЗ

рдЗрд╕ рд╕реЗ:

  • рд╕рд╣рдордд @ рд░рдкреЗрдХ! рд╣рдореЗрдВ рдирд┐рд╢реНрдЪрд┐рдд рд░реВрдк рд╕реЗ рдордЬрдмреВрдд рдирд┐рдпрдорд┐рддреАрдХрд░рдг рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рдзрд╛рддреБрдХрд░реНрдореА рдХреЛ рдЕрдкрдбреЗрдЯ рдХрд░рдирд╛ рдЪрд╛рд╣рд┐рдПред ElasticNetCV рдХрдИ рдбреЗрдЯрд╛рд╕реЗрдЯ рдкрд░ рд╣рдорд╛рд░реЗ LinearRegressor рд╕реЗ рдмреЗрд╣рддрд░ рдкреНрд░рджрд░реНрд╢рди рдХрд░рддрд╛ рдкреНрд░рддреАрдд рд╣реЛрддрд╛ рд╣реИред рдпрд╣ рд╕рдорд╕реНрдпрд╛ рдЗрд╕реЗ рдЯреНрд░реИрдХ рдХрд░рддреА рд╣реИ: https://github.com/alteryx/evalml/issues/1739
  • @dsherry рдФрд░ рдореИрдВрдиреЗ рдЕрдкрдиреА рдбреЗрдЯрд╛ рд╡рд┐рднрд╛рдЬрди рд░рдгрдиреАрддрд┐ рдкрд░ рдлрд┐рд░ рд╕реЗ рдЪрд░реНрдЪрд╛ рдХреА: рдЕрднреА, рд╣рдо рдкрд╣рдирд╛рд╡рд╛ рдХреЗ рд▓рд┐рдП рдбреЗрдЯрд╛ рдХреЛ рд╡рд┐рднрд╛рдЬрд┐рдд рдХрд░рддреЗ рд╣реИрдВред рд╣рд╛рд▓рд╛рдБрдХрд┐, рдпрд╣ рдЗрд╕ рдзрд╛рд░рдгрд╛ рдХреЗ рддрд╣рдд рд╣реИ рдХрд┐ рд╣рдо рдЪрд╛рд╣рддреЗ рд╣реИрдВ рдХрд┐ рдзрд╛рддреБрдХрд░реНрдореА рдХреЛ рдЗрд╕ рдкрд╣рдирд╛рд╡рд╛ рд╕реВрдЪрдХрд╛рдВрдХ рдкрд░ рдкреНрд░рд╢рд┐рдХреНрд╖рд┐рдд рдХрд┐рдпрд╛ рдЬрд╛рдПред рд╕реНрдХрд┐рдХрд┐рдЯ-рд▓рд░реНрди рдХрд╛рд░реНрдпрд╛рдиреНрд╡рдпрди рдХреЗ рд╕рд╛рде, рдЬрдм рд╣рдо рдЕрдкрдиреЗ StackedEnsembler рдХреЛ рдЗрд╕ рдПрд╕реЗрдореНрдмрд▓ рдЗрдВрдбреЗрдХреНрд╕ рд╕реНрдкреНрд▓рд┐рдЯ рдкрд░ рдкреНрд░рд╢рд┐рдХреНрд╖рд┐рдд рдХрд░рддреЗ рд╣реИрдВ, рддреЛ рд╣рдо рдбреЗрдЯрд╛ рдХреЗ рдЗрд╕ рдЫреЛрдЯреЗ рд╕реЗ рд╕реЗрдЯ рдкрд░ рдЗрдирдкреБрдЯ рдкрд╛рдЗрдкрд▓рд╛рдЗрди рдФрд░ рдореЗрдЯрд▓рд░реНрдирд░ рджреЛрдиреЛрдВ рдХреЛ рдкреНрд░рд╢рд┐рдХреНрд╖рдг рджреЗрддреЗ рд╣реИрдВред рд╢рд╛рдпрдж рдпрд╣реА рд╡рдЬрд╣ рд╣реИ рдХрд┐ рд╣рдо рдЕрдЪреНрдЫрд╛ рдкреНрд░рджрд░реНрд╢рди рдирд╣реАрдВ рдХрд░ рд░рд╣реЗ рд╣реИрдВред рдЬрдмрдХрд┐ рд╣рдорд╛рд░реЗ рдЗрдирдкреБрдЯ рдкрд╛рдЗрдкрд▓рд╛рдЗрдиреЛрдВ рдХреЗ рд▓рд┐рдП рдкреИрд░рд╛рдореАрдЯрд░ рдЕрдиреНрдп рдбреЗрдЯрд╛ рджреНрд╡рд╛рд░рд╛ рдЯреНрдпреВрдирд┐рдВрдЧ рд╕реЗ рд╣реИрдВ, рдпреЗ рдкрд╛рдЗрдкрд▓рд╛рдЗрди рдлрд┐рдЯ рдирд╣реАрдВ рд╣реИрдВред рд▓рдВрдмреЗ рд╕рдордп рдореЗрдВ, рдЕрдкрдиреЗ рд╕реНрд╡рдпрдВ рдХреЗ рдХрд╛рд░реНрдпрд╛рдиреНрд╡рдпрди рдХреЛ рд░реЛрд▓ рдХрд░рдиреЗ рд╕реЗ рд╣рдо рдкреНрд░рд╢рд┐рдХреНрд╖рд┐рдд рдкрд╛рдЗрдкрд▓рд╛рдЗрдиреЛрдВ рдореЗрдВ рдПрдирд╕реЗрдВрдмрд▓рд░ рдХреЛ рдкрд╛рд╕ рдХрд░ рд╕рдХрддреЗ рд╣реИрдВ, рдЗрд╕ рд╕реНрдерд┐рддрд┐ рдореЗрдВ рд╣рдорд╛рд░реЗ рдкрд╛рд╕ рд╡рд╣ рд╡реНрдпрд╡рд╣рд╛рд░ рд╣реЛрдЧрд╛ рдЬреЛ рд╣рдо рдЪрд╛рд╣рддреЗ рд╣реИрдВред рдлрд┐рд▓рд╣рд╛рд▓ рддреЛ рдРрд╕рд╛ рдирд╣реАрдВ рд╣реИред

рдЕрдЧрд▓рд╛ рдЪрд░рдг: рдЗрд╕ рдкрд░рд┐рдХрд▓реНрдкрдирд╛ рдХрд╛ рдкрд░реАрдХреНрд╖рдг рдореИрдиреНрдпреБрдЕрд▓ рд░реВрдк рд╕реЗ рдПрдиреНрд╕реЗрдореНрдмрд▓рд░ рдХреЗ рд╕рд╛рде рдХрд░реЗрдВред 80% рдбреЗрдЯрд╛ рдкрд░ рдЗрдирдкреБрдЯ рдкрд╛рдЗрдкрд▓рд╛рдЗрдиреЛрдВ рдХреЛ рдореИрдиреНрдпреБрдЕрд▓ рд░реВрдк рд╕реЗ рдкреНрд░рд╢рд┐рдХреНрд╖рд┐рдд рдХрд░рдиреЗ рдХрд╛ рдкреНрд░рдпрд╛рд╕ рдХрд░реЗрдВ, рдбреЗрдЯрд╛ рдХреЛ рдЬреЛрдбрд╝рдиреЗ рдХреЗ рд▓рд┐рдП рдЕрд▓рдЧ-рдЕрд▓рдЧ рд╕реЗрдЯ рдкрд░ рдХреНрд░реЙрд╕-рд╕рддреНрдпрд╛рдкрд┐рдд рднрд╡рд┐рд╖реНрдпрд╡рд╛рдгрд┐рдпрд╛рдВ рдмрдирд╛рдПрдВ рдФрд░ рдмрд╛рд╣рд░реА рднрд╡рд┐рд╖реНрдпрд╡рд╛рдгрд┐рдпреЛрдВ рдХреЗ рд╕рд╛рде рдзрд╛рддреБ рд╕реАрдЦрдиреЗ рд╡рд╛рд▓реЗ рдХреЛ рдкреНрд░рд╢рд┐рдХреНрд╖рд┐рдд рдХрд░реЗрдВред

рдкреНрд░рдпреЛрдЧ рдХреЗ рдкрд░рд┐рдгрд╛рдо рдЕрдЪреНрдЫреЗ рджрд┐рдЦрддреЗ рд╣реИрдВ: https://alteryx.quip.com/4hEyAaTBZDap/Ensembling-Performance-Using-More-Data

рдЕрдЧрд▓рд╛ рдХрджрдо:

  • рд╣реЛрд▓реНрдбрдЖрдЙрдЯ рд╕реЗрдЯ рдФрд░ рд╕рддреНрдпрд╛рдкрди рд╕реНрдХреЛрд░ рдХреЗ рд╕рд╛рде рджреЛрдмрд╛рд░рд╛ рдЬрд╛рдВрдЪ рдХрд░реЗрдВ
  • https://github.com/alteryx/evalml/issues/1930 . рдХреЗ рд▓рд┐рдП рдбрд┐рдЬрд╝рд╛рдЗрди рджрд╕реНрддрд╛рд╡реЗрдЬрд╝

рдХреБрдЫ рдЦреЛрдЬ рдХрд░рдиреЗ рдХреЗ рдмрд╛рдж, рд╣рдо рдорд╛рдирддреЗ рд╣реИрдВ рдХрд┐ рдореБрджреНрджрд╛ рдпрд╣ рдирд╣реАрдВ рд╣реИ рдХрд┐ рдкрд╣рдирд╛рд╡рд╛ рдХреИрд╕рд╛ рдкреНрд░рджрд░реНрд╢рди рдХрд░рддрд╛ рд╣реИ, рдмрд▓реНрдХрд┐ рдпрд╣ рд╣реИ рдХрд┐ рд╣рдо рдкрд╣рдирд╛рд╡рд╛ рдХреЗ рдкреНрд░рджрд░реНрд╢рди рдХреА рд░рд┐рдкреЛрд░реНрдЯ рдХреИрд╕реЗ рдХрд░рддреЗ рд╣реИрдВред рд╡рд░реНрддрдорд╛рди рдореЗрдВ, рд╣рдо рдПрдХ рдЕрд▓рдЧ рдкрд╣рдирд╛рд╡рд╛ рд╡рд┐рднрд╛рдЬрди рдХрд░рддреЗ рд╣реИрдВ рдЬреЛ рдбреЗрдЯрд╛ рдХрд╛ 20% рд╣реИ, рдФрд░ рдлрд┐рд░ рдПрдХ рдФрд░ рдЯреНрд░реЗрди-рд╕рддреНрдпрд╛рдкрди рд╡рд┐рднрд╛рдЬрди рдХрд░рддреЗ рд╣реИрдВ, рдФрд░ рд╕рддреНрдпрд╛рдкрди рдбреЗрдЯрд╛ рдХреЗ рд░реВрдк рдореЗрдВ рдкрд╣рдирд╛рд╡рд╛ рдХреЗ рд╕реНрдХреЛрд░ рдХреА рд░рд┐рдкреЛрд░реНрдЯ рдХрд░рддреЗ рд╣реИрдВред рдЗрд╕рдХрд╛ рдорддрд▓рдм рдпрд╣ рд╣реИ рдХрд┐ рдХреБрдЫ рдорд╛рдорд▓реЛрдВ рдореЗрдВ, рдкрд╣рдирд╛рд╡рд╛ рд╕реНрдХреЛрд░ рдХреА рдЧрдгрдирд╛ рдмрд╣реБрдд рдХрдо рд╕рдВрдЦреНрдпрд╛ рдореЗрдВ рдкрдВрдХреНрддрд┐рдпреЛрдВ рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рдХреЗ рдХреА рдЬрд╛рддреА рд╣реИ (рдЬреИрд╕рд╛ рдХрд┐ рдКрдкрд░ рдЦреБрд╢реА рдХреЗ рдбреЗрдЯрд╛рд╕реЗрдЯ рдХреЗ рд░реВрдк рдореЗрдВ)ред

рдкрд╣рдирд╛рд╡рд╛ рд╕реВрдЪрдХрд╛рдВрдХреЛрдВ рдХреЗ рд╡рд┐рднрд╛рдЬрди рдХреЛ рд╣рдЯрд╛рдХрд░ рдФрд░ рдкрд╣рдирд╛рд╡рд╛ рдХреЗ рд▓рд┐рдП cv рдкреНрд░рд╢рд┐рдХреНрд╖рдг рд╕реНрдХреЛрд░ рдХреА рдЧрдгрдирд╛ рдХрд░рдиреЗ рдХреА рд╣рдорд╛рд░реА рдкреБрд░рд╛рдиреА рдкрджреНрдзрддрд┐ рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рдХреЗ (рдЗрд╕реЗ рд╕рднреА рдбреЗрдЯрд╛ рджреЗрдВ, рдЯреНрд░реЗрди рдХрд░реЗрдВ рдФрд░ рдПрдХ рдЧреБрдирд╛ рдкрд░ рдорд╛рдиреНрдп рдХрд░реЗрдВ), рд╣рдо рджреЗрдЦрддреЗ рд╣реИрдВ рдХрд┐ рдкрд╣рдирд╛рд╡рд╛ рд▓рдЧрднрдЧ рд╕рднреА рдорд╛рдорд▓реЛрдВ рдореЗрдВ рдЙрдЪреНрдЪ рд╕реНрдерд╛рди рдкрд░ рд╣реИ, рдФрд░ рдКрдкрд░ рдЖрддрд╛ рд╣реИ рдХрдИ рдФрд░ рдорд╛рдорд▓реЛрдВ рдореЗрдВ # 1 рдХреЗ рд░реВрдк рдореЗрдВред рдЗрд╕ рдмреАрдЪ, рд╕рддреНрдпрд╛рдкрди рд╕реНрдХреЛрд░ рд╕рдорд╛рди рдпрд╛ рдереЛрдбрд╝рд╛ рдмреЗрд╣рддрд░ рд╣реИред

рдзреНрдпрд╛рди рджреЗрдВ рдХрд┐ рдЪреВрдВрдХрд┐ рд╣рдо рдХреЛрдИ рд╣рд╛рдЗрдкрд░рдкреИрд░рд╛рдореАрдЯрд░ рдЯреНрдпреВрдирд┐рдВрдЧ рдирд╣реАрдВ рдХрд░рддреЗ рд╣реИрдВ, рдЗрдирдкреБрдЯ рдкрд╛рдЗрдкрд▓рд╛рдЗрдиреЛрдВ рдХреЛ рдкреНрд░рд╢рд┐рдХреНрд╖рд┐рдд рдирд╣реАрдВ рдХрд┐рдпрд╛ рдЬрд╛рддрд╛ рд╣реИ, рдФрд░ рдкрд╣рдирд╛рд╡рд╛ рдХреЗрд╡рд▓ рдЗрдирдкреБрдЯ рдкрд╛рдЗрдкрд▓рд╛рдЗрдиреЛрдВ рдХреЗ рдЗрдирдкреБрдЯ рдХреЗ рд░реВрдк рдореЗрдВ рдЖрдЙрдЯрдкреНрд░реЗрдбрд┐рдХреНрд╢рди рдкреНрд░рд╛рдкреНрдд рдХрд░рддрд╛ рд╣реИ, рдУрд╡рд░рдлрд┐рдЯрд┐рдВрдЧ рдХреЛрдИ рд╕рдорд╕реНрдпрд╛ рдирд╣реАрдВ рд╣реИред рд╣рдо рдЕрдкрдиреЗ рд╕реНрд╡рдпрдВ рдХреЗ рдкрд╣рдирд╛рд╡реЗ рдХреЛ рд▓рд╛рдЧреВ рдХрд░рдиреЗ рдкрд░ рдлрд┐рд░ рд╕реЗ рд╡рд┐рдЪрд╛рд░ рдХрд░ рд╕рдХрддреЗ рд╣реИрдВ рдФрд░ рд╡рд┐рднрд╛рдЬрди рдХреА рд░рдгрдиреАрддрд┐ рдХреЛ рдЕрдкрдбреЗрдЯ рдХрд░ рд╕рдХрддреЗ рд╣реИрдВ, рд▓реЗрдХрд┐рди рдЕрднреА рдХреЗ рд▓рд┐рдП, рд╣рдо рдХреЗрд╡рд▓ рдбреЗрдЯрд╛ рд╕реНрдкреНрд▓рд┐рдЯ рд░рдгрдиреАрддрд┐ рдФрд░ рд╕реНрдХрд┐рдХрд┐рдЯ-рд▓рд░реНрди рдХреЗ рдХрд╛рд░реНрдпрд╛рдиреНрд╡рдпрди рдХреЛ рдмрджрд▓рдХрд░ рд╕реБрдзрд╛рд░ рджреЗрдЦ рд╕рдХрддреЗ рд╣реИрдВред

рдзреНрдпрд╛рди рджреЗрдВ рдХрд┐ рдпрд╣ рд╕рдВрдпреЛрдЬрди рд╕рдХреНрд╖рдо рд╣реЛрдиреЗ рдкрд░ рдлрд┐рдЯ рд╕рдордп рдореЗрдВ рд╡реГрджреНрдзрд┐ рдХрд╛ рдХрд╛рд░рдг рд╣реЛрдЧрд╛: рд╕рднреА рдкрд╛рдЗрдкрд▓рд╛рдЗрдиреЛрдВ рдХреЛ рдЕрдзрд┐рдХ рдбреЗрдЯрд╛ (рдХреЛрдИ рдЖрд░рдХреНрд╖рд┐рдд рдкрд╣рдирд╛рд╡рд╛ рд╕реВрдЪрдХрд╛рдВрдХ рдирд╣реАрдВ) рджрд┐рдЦрд╛рдИ рджреЗрддрд╛ рд╣реИ, рдФрд░ рдкрд╣рдирд╛рд╡рд╛ рдЕрдзрд┐рдХ рдбреЗрдЯрд╛ рдкрд░ рдкреНрд░рд╢рд┐рдХреНрд╖рд┐рдд рд╣реЛрддрд╛ рд╣реИред рдореБрдЭреЗ рд▓рдЧрддрд╛ рд╣реИ рдХрд┐ рдпрд╣ рдареАрдХ рд╣реИред

рдкрд░рд┐рдгрд╛рдо рдпрд╣рд╛рдВ рд╕рд╛рд░рдгреАрдмрджреНрдз рд╣реИрдВ: https://alteryx.quip.com/jI2mArnWZfTU/Ensembling-vs-Best-Pipeline-Validation-Scores#MKWACADlCDt

рдХреНрдпрд╛ рдпрд╣ рдкреГрд╖реНрда рдЙрдкрдпреЛрдЧреА рдерд╛?
0 / 5 - 0 рд░реЗрдЯрд┐рдВрдЧреНрд╕

рд╕рдВрдмрдВрдзрд┐рдд рдореБрджреНрджреЛрдВ

chukarsten picture chukarsten  ┬╖  4рдЯрд┐рдкреНрдкрдгрд┐рдпрд╛рдБ

dsherry picture dsherry  ┬╖  3рдЯрд┐рдкреНрдкрдгрд┐рдпрд╛рдБ

dsherry picture dsherry  ┬╖  4рдЯрд┐рдкреНрдкрдгрд┐рдпрд╛рдБ

angela97lin picture angela97lin  ┬╖  4рдЯрд┐рдкреНрдкрдгрд┐рдпрд╛рдБ

freddyaboulton picture freddyaboulton  ┬╖  3рдЯрд┐рдкреНрдкрдгрд┐рдпрд╛рдБ