Evalml: рдбрд╛рдпрдордВрдб рдбреЗрдЯрд╛рд╕реЗрдЯ рдкрд░ рдЦрд░рд╛рдм рдкреНрд░рджрд░реНрд╢рди

рдХреЛ рдирд┐рд░реНрдорд┐рдд 5 рдЕрдХреНрддреВре░ 2020  ┬╖  3рдЯрд┐рдкреНрдкрдгрд┐рдпрд╛рдБ  ┬╖  рд╕реНрд░реЛрдд: alteryx/evalml

рд╕рдВрдХрдЯ
Automl рдирдХрд╛рд░рд╛рддреНрдордХ R2 рдХреЗ рд╕рд╛рде рдореЙрдбрд▓ рдЙрддреНрдкрдиреНрди рдХрд░рддрд╛ рд╣реИред

рд░реЗрдкреНрд░реЛ
рдпрд╣рд╛рдБ рдбреЗрдЯрд╛рд╕реЗрдЯред

import evalml
import pandas as pd
import numpy as np
df = pd.read_csv('stones_encoded_small.csv')
y = df.pop('total_sales_price')
automl = evalml.automl.AutoMLSearch(problem_type='regression')
automl.search(df, y)

рдЕрддреНрдпрдзрд┐рдХ рд╢реВрдиреНрдп/рдПрдХрд▓-рдорд╛рди рдХреЙрд▓рдо рдХреЗ рдХрд╛рд░рдг рдбреЗрдЯрд╛ рдЬрд╛рдВрдЪ рд╡рд┐рдлрд▓ рд╣реЛ рдЬрд╛рдПрдЧреАред рдЖрдк рдЙрдиреНрд╣реЗрдВ data_checks='disabled' рдЕрдХреНрд╖рдо рдХрд░ рд╕рдХрддреЗ рд╣реИрдВред рдпрд╛, рдЙрдиреНрд╣реЗрдВ рд╕рдВрдмреЛрдзрд┐рдд рдХрд░рдиреЗ рдФрд░ рдЬрд╛рд░реА рд░рдЦрдиреЗ рдХреЗ рд▓рд┐рдП:

cols_to_drop = ['culet_condition', 'fancy_color_dominant_color', 'fancy_color_intensity', 'fancy_color_overtone', 'fancy_color_secondary_color', 'fluor_color', 'image_file_url', 'diamond_id', 'currency_code', 'currency_symbol', 'fancy_color_dominant_color', 'fancy_color_intensity', 'fancy_color_overtone', 'fancy_color_secondary_color', 'has_sarineloupe']
df.drop(columns=cols_to_drop, inplace=True)
automl = evalml.automl.AutoMLSearch(problem_type='regression')
automl.search(df, y)

рдкрд░рд┐рдгрд╛рдо рдХрд┐рд╕реА рднреА рддрд░рд╣ рд╕реЗ рдмрд╣реБрдд рд╕рдорд╛рди рд╣реИрдВ: рд╕рднреА рдореЙрдбрд▓реЛрдВ рдХреЗ рд▓рд┐рдП рдирдХрд╛рд░рд╛рддреНрдордХ R2 рдорд╛рди, рдЕрд░реНрдерд╛рдд рдореЙрдбрд▓ рд╕рд╛рд░реНрдердХ рдкрд░рд┐рдгрд╛рдо рдирд╣реАрдВ рджреЗ рд╕рдХрддреЗ рд╣реИрдВред

рдореАрдЯреНрд░рд┐рдХ рдХреЛ MSE рдФрд░ MAE рдореЗрдВ рдмрджрд▓рдиреЗ рд╕реЗ рд╕рдорд╛рди рд░реВрдк рд╕реЗ рдЦрд░рд╛рдм рдореЙрдбрд▓ рдкреНрд░рд╛рдкреНрдд рд╣реЛрддреЗ рд╣реИрдВред

рд╡рд┐рдЪрд╛рд░-рд╡рд┐рдорд░реНрд╢
рдореЗрд░рд╛ рдкрд╣рд▓рд╛ рд╕рдВрджреЗрд╣ рдпрд╣ рд╣реИ рдХрд┐ рд╕реБрд╡рд┐рдзрд╛рдУрдВ рдХреЛ рд╕рд╣реА рдкреНрд░рдХрд╛рд░ рдирд╣реАрдВ рдорд┐рд▓ рд░рд╣рд╛ рд╣реИред рдЬрдм рдореИрдВ рдкрд╛рдВрдбрд╛ рджреНрд╡рд╛рд░рд╛ рдЕрдиреБрдорд╛рдирд┐рдд dtypes рдХреЛ рджреЗрдЦрддрд╛ рд╣реВрдВ, рддреЛ рдореБрдЭреЗ рд▓рдЧрддрд╛ рд╣реИ рдХрд┐ рдХрдИ float64 рд░реВрдк рдореЗрдВ рд╕реЗрдЯ рд╣реИрдВ, рд▓реЗрдХрд┐рди рдХреЗрд╡рд▓ рдХреБрдЫ рдЕрджреНрд╡рд┐рддреАрдп рдорд╛рди рд╣реИрдВ, рдпрд╛рдиреА рдЙрдиреНрд╣реЗрдВ рд╢реНрд░реЗрдгреАрдмрджреНрдз рдХреЗ рд░реВрдк рдореЗрдВ рд╕реЗрдЯ рдХрд┐рдпрд╛ рдЬрд╛рдирд╛ рдЪрд╛рд╣рд┐рдПред рдореИрдВрдиреЗ рдЗрд╕реЗ рдПрдХ рд╢реЙрдЯ рджрд┐рдпрд╛ рд▓реЗрдХрд┐рди рдРрд╕рд╛ рд▓рдЧрддрд╛ рд╣реИ рдХрд┐ рдореЙрдбрд▓ рдХреЗ рдкрд░рд┐рдгрд╛рдо рдирд╣реАрдВ рдмрджрд▓рддреЗ рд╣реИрдВ, рдЗрд╕рд▓рд┐рдП рдХрд╣рд╛рдиреА рдХреЗ рд▓рд┐рдП рдФрд░ рднреА рдХреБрдЫ рд╣реИред

рд╕рднреА 3 рдЯрд┐рдкреНрдкрдгрд┐рдпрд╛рдБ

рд╣рд╛рдп рдЯреАрдо,

рдореЗрд░рд╛ рдорд╛рдирдирд╛ тАЛтАЛтАЛтАЛрд╣реИ рдХрд┐ рдпрд╣ рд▓рдХреНрд╖реНрдп рдЪрд░ рджреНрд╡рд╛рд░рд╛ рдХреНрд░рдордмрджреНрдз рдЗрдирдкреБрдЯ рдбреЗрдЯрд╛ рд╕реЗрдЯ рдФрд░ 3-рдЧреБрдирд╛ рдХреНрд░реЙрд╕ рд╕рддреНрдпрд╛рдкрди рдХреЗ рд▓рд┐рдП рдЙрдкрдпреЛрдЧ рдХреА рдЬрд╛рдиреЗ рд╡рд╛рд▓реА рдирдореВрдирд╛ рд╡рд┐рдзрд┐ рд╕реЗ рд╕рдВрдмрдВрдзрд┐рдд рд╣реИред рдЗрд╕ рдбреЗрдЯрд╛ рд╕реЗрдЯ рдХреЛ рдиреНрдпреВрдирддрдо рд╕реЗ рдЙрдЪреНрдЪрддрдо рддрдХ рдореВрд▓реНрдп рдХреЗ рдЖрдзрд╛рд░ рдкрд░ рдХреНрд░рдордмрджреНрдз рдХрд┐рдпрд╛ рдЬрд╛рддрд╛ рд╣реИред рдореБрдЭреЗ рд╕рдВрджреЗрд╣ рд╣реИ рдХрд┐ рдХреНрд░реЙрд╕ рд╕рддреНрдпрд╛рдкрди рдХреНрд░рдо рдореЗрдВ рд░рд┐рдХреЙрд░реНрдб рдХреЛ рд╡рд┐рднрд╛рдЬрд┐рдд рдХрд░ рд░рд╣рд╛ рд╣реИ, рдЗрд╕рд▓рд┐рдП рд╡рд┐рднрд╛рдЬрди рд▓рдХреНрд╖реНрдп рдЪрд░ рд╕реЗ рдмрдВрдзреЗ рд╣реИрдВ - рдЬрд┐рд╕рдХрд╛ рдЕрд░реНрде рд╣реИ рдХрд┐ R2 рдорд╛рди рд╡рд╛рд╕реНрддрд╡ рдореЗрдВ рдХрдо рд╣реИрдВ рдХреНрдпреЛрдВрдХрд┐ рдЙрдиреНрд╣реЗрдВ рд▓рдХреНрд╖реНрдп рдЪрд░ рдорд╛рдиреЛрдВ рдХреЗ рд╡рд┐рд░реБрджреНрдз рдкрд░реАрдХреНрд╖рдг рдХрд┐рдпрд╛ рдЬрд╛ рд░рд╣рд╛ рд╣реИ рдЬреЛ рдкреНрд░рд╢рд┐рдХреНрд╖рдг рдбреЗрдЯрд╛ рдореЗрдВ рд╢рд╛рдорд┐рд▓ рдирд╣реАрдВ рдереЗред рдЗрд╕ рд╡реНрдпрд╡рд╣рд╛рд░ рдХреЛ рдЦреЛрдЬ рдореЗрдВ рдлреАрдб рдХрд░рдиреЗ рд╕реЗ рдкрд╣рд▓реЗ рдкреВрд░реЗ рдбреЗрдЯрд╛ рд╕реЗрдЯ рдкрд░ рдлреЗрд░рдмрджрд▓ рдХрд░рдХреЗ рд╣рд▓ рдХрд┐рдпрд╛ рдЬрд╛рддрд╛ рд╣реИред

  • рдЬреИрд╕рд╛ рдХрд┐ @SydneyAyx рдиреЗ рдЙрд▓реНрд▓реЗрдЦ рдХрд┐рдпрд╛ рд╣реИ, рдбреЗрдЯрд╛рд╕реЗрдЯ рдореЗрдВ рдлреЗрд░рдмрджрд▓ рдХрд░рдиреЗ рдХреЗ рдмрд╛рдж рдЖрдкрдХреЛ рдПрдХ рдмреЗрд╣рддрд░ R2 рд╕реНрдХреЛрд░ рдорд┐рд▓рддрд╛ рд╣реИред
import evalml
import pandas as pd
import numpy as np
from evalml.data_checks import EmptyDataChecks

df = pd.read_csv('stones_encoded_small.csv')

# shuffles data
df = df.sample(frac=1)

y = df.pop('total_sales_price')
automl = evalml.automl.AutoMLSearch(problem_type='regression')
automl.search(df, y, data_checks=EmptyDataChecks()))

рдзрдиреНрдпрд╡рд╛рдж @SydneyAyx @gsheni ! рд╡рд╣рд╛рдБ рдорд╣рд╛рди рдЬрд╛рд╕реВрд╕реА рдХрд╛ рдХрд╛рдо, рдкреНрд░рддрд┐рднрд╛рд╢рд╛рд▓реА :)

рд╣рд╛рдВ, рдирд┐рд╢реНрдЪрд┐рддред рдРрд╕рд╛ рдкреНрд░рддреАрдд рд╣реЛрддрд╛ рд╣реИ рдХрд┐ рдСрдЯреЛрдПрдордПрд▓ рдореЗрдВ рд╣рдорд╛рд░реЗ рдбрд┐рдлрд╝реЙрд▓реНрдЯ рдбреЗрдЯрд╛ рд╕реНрдкреНрд▓рд┐рдЯрд░ рд╡рд░реНрддрдорд╛рди рдореЗрдВ shuffle=True рд╕реЗрдЯ рдирд╣реАрдВ рдХрд░рддреЗ рд╣реИрдВред

@SydneyAyx @gsheni рдПрдХ рд╡рд░реНрдХрдЕрд░рд╛рдЙрдВрдб automl рдЪрд▓рд╛рдиреЗ рд╕реЗ рдкрд╣рд▓реЗ рдлреЗрд░рдмрджрд▓ рдХрд░рдирд╛ рд╣реИ рдЬреИрд╕рд╛ рдХрд┐ @gsheni рдиреЗ рдКрдкрд░ рджрд┐рдЦрд╛рдпрд╛ рд╣реИред рдЕрдкрдирд╛ рдЦреБрдж рдХрд╛ рдбреЗрдЯрд╛ рд╕реНрдкреНрд▓рд┐рдЯрд░ рд╕реЗрдЯ рдХрд░рдирд╛ рдПрдХ рдФрд░ рдХрд╛рдордХрд╛рдЬ рд╣реИ, рдЬреИрд╕реЗ:

import evalml
import pandas as pd
import numpy as np
import sklearn.model_selection
df = pd.read_csv('stones_encoded_small.csv')
y = df.pop('total_sales_price')

data_splitter = sklearn.model_selection.KFold(n_splits=3, random_state=0, shuffle=True)
automl = evalml.automl.AutoMLSearch(problem_type='regression', data_split=data_splitter)
automl.search(df, y, data_checks='disabled')

рдореИрдВ evalml рдлрд┐рдХреНрд╕ рдХреЗ рд╕рд╛рде рдПрдХ рдкреАрдЖрд░ рдкреНрд░рд╛рдкреНрдд рдХрд░реВрдВрдЧрд╛ред

рдХреНрдпрд╛ рдпрд╣ рдкреГрд╖реНрда рдЙрдкрдпреЛрдЧреА рдерд╛?
0 / 5 - 0 рд░реЗрдЯрд┐рдВрдЧреНрд╕

рд╕рдВрдмрдВрдзрд┐рдд рдореБрджреНрджреЛрдВ

dsherry picture dsherry  ┬╖  3рдЯрд┐рдкреНрдкрдгрд┐рдпрд╛рдБ

dsherry picture dsherry  ┬╖  4рдЯрд┐рдкреНрдкрдгрд┐рдпрд╛рдБ

dsherry picture dsherry  ┬╖  4рдЯрд┐рдкреНрдкрдгрд┐рдпрд╛рдБ

freddyaboulton picture freddyaboulton  ┬╖  3рдЯрд┐рдкреНрдкрдгрд┐рдпрд╛рдБ

dsherry picture dsherry  ┬╖  4рдЯрд┐рдкреНрдкрдгрд┐рдпрд╛рдБ