Evalml: BalancedClassificationDataCVSplit рд╣рд░ рдмрд╛рд░ рдЗрд╕реЗ рдХрд╣реЗ рдЬрд╛рдиреЗ рдкрд░ рдЕрд▓рдЧ-рдЕрд▓рдЧ рд╡рд┐рднрд╛рдЬрди рдЙрддреНрдкрдиреНрди рдХрд░рддрд╛ рд╣реИ

рдХреЛ рдирд┐рд░реНрдорд┐рдд 16 рдорд╛рд░реНрдЪ 2021  ┬╖  3рдЯрд┐рдкреНрдкрдгрд┐рдпрд╛рдБ  ┬╖  рд╕реНрд░реЛрдд: alteryx/evalml

рд░реЗрдкреНрд░реЛ

import joblib
from evalml.demos import load_fraud
from evalml.preprocessing.data_splitters import BalancedClassificationDataCVSplit

splitter = BalancedClassificationDataCVSplit(n_splits=3, random_seed=0, shuffle=True)

X, y = load_fraud(5000)
X = X.to_dataframe()
y = y.to_series().astype("int")

for train, test in splitter.split(X, y):
    print((joblib.hash(train), joblib.hash(test)))

# Output
('75f1b95d7ce307ac6c793055330969aa', '8c89fe1a592c50a700b6d5cbb02dba8b')
('f8c849bbfbed37c13f66c5c742e237cb', '9c4879fb550fded8be9ac03e95a1bf95')
('cdc21f0d6bbf45459c9695258f7f04dc', '5b575765bbe176e732b8eb4dc1bf2822')

for train, test in splitter.split(X, y):
    print((joblib.hash(train), joblib.hash(test)))

# Output
('bf462b82af243c552ac48acad2dfd748', '8c89fe1a592c50a700b6d5cbb02dba8b')
('b8341b536c63c7957c099b05e315f49c', '9c4879fb550fded8be9ac03e95a1bf95')
('780e74673b601790037fc0b17dde56fe', '5b575765bbe176e732b8eb4dc1bf2822')

for train, test in splitter.split(X, y):
    print((joblib.hash(train), joblib.hash(test)

# Output
('385f6c538568ad3a33cf84f61d94144c', '8c89fe1a592c50a700b6d5cbb02dba8b')
('8db65d0a3bdf87ae0f135b9766a260dd', '9c4879fb550fded8be9ac03e95a1bf95')
('2a7293fc1308b8a572091d7c76d20205', '5b575765bbe176e732b8eb4dc1bf2822')

рдпрд╣ рд╕реНрдХреЗрд▓реЗрд░ рд╕реНрдкреНрд▓рд┐рдЯрд░ рдХреЗ рд╡реНрдпрд╡рд╣рд╛рд░ рд╕реЗ рдЕрд▓рдЧ рд╣реИ:

from sklearn.model_selection import StratifiedKFold

kfold = StratifiedKFold(n_splits=3, random_state=0, shuffle=True)

for train, test in kfold.split(X, y):
    print((joblib.hash(train), joblib.hash(test)))

#Output
('6c30ee6a11803927024354405389506a', '8c89fe1a592c50a700b6d5cbb02dba8b')
('df0a70e2e6ca783f12461e8c82a26ad4', '9c4879fb550fded8be9ac03e95a1bf95')
('2898e4b3d3621b436641016499f4aafb', '5b575765bbe176e732b8eb4dc1bf2822')

for train, test in kfold.split(X, y):
    print((joblib.hash(train), joblib.hash(test)))

# Output
('6c30ee6a11803927024354405389506a', '8c89fe1a592c50a700b6d5cbb02dba8b')
('df0a70e2e6ca783f12461e8c82a26ad4', '9c4879fb550fded8be9ac03e95a1bf95')
('2898e4b3d3621b436641016499f4aafb', '5b575765bbe176e732b8eb4dc1bf2822')

рдореБрдЭреЗ рд▓рдЧрддрд╛ рд╣реИ рдХрд┐ рдпрд╣ рджреЛ рдХрд╛рд░рдгреЛрдВ рд╕реЗ рд╕рдорд╕реНрдпрд╛рдЧреНрд░рд╕реНрдд рд╣реИ:

  1. рдЪреВрдБрдХрд┐ BalancedClassificationDataCVSplit рдСрдЯреЛрдПрдордПрд▓ рдореЗрдВ рдбрд┐рдлрд╝реЙрд▓реНрдЯ рд╕реНрдкреНрд▓рд┐рдЯрд░ рд╣реИ, рдЗрд╕рдХрд╛ рдорддрд▓рдм рд╣реИ рдХрд┐ рд╣рдорд╛рд░реА рдкрд╛рдЗрдкрд▓рд╛рдЗрдиреЛрдВ рдХрд╛ рдореВрд▓реНрдпрд╛рдВрдХрди рд╡рд┐рднрд┐рдиреНрди рд╡рд┐рднрд╛рдЬрдиреЛрдВ рдкрд░ рдХрд┐рдпрд╛ рдЬрд╛рддрд╛ рд╣реИ
  2. рдЪреВрдВрдХрд┐ split рдбреЗрдЯрд╛ рд╕реНрдкреНрд▓рд┐рдЯрд░ рдХреА рд╕реНрдерд┐рддрд┐ рдХреЛ рд╕рдВрд╢реЛрдзрд┐рдд рдХрд░рддрд╛ рд╣реИ, рдЗрд╕рдХрд╛ рдорддрд▓рдм рд╣реИ рдХрд┐ рд╣рдорд╛рд░реЗ рдкрд╛рд╕ рдЕрдиреБрдХреНрд░рдорд┐рдХ рдФрд░ рд╕рдорд╛рдирд╛рдВрддрд░ рдЗрдВрдЬрдиреЛрдВ рдХреЗ рдмреАрдЪ рдЕрд▓рдЧ-рдЕрд▓рдЧ рдкрд░рд┐рдгрд╛рдо рд╣реЛрдВрдЧреЗред

рд╕рднреА 3 рдЯрд┐рдкреНрдкрдгрд┐рдпрд╛рдБ

рдЗрд╕ рдкрд░ рдзреНрдпрд╛рди рджрд┐рд▓рд╛рдиреЗ рдХреЗ рд▓рд┐рдП рдзрдиреНрдпрд╡рд╛рджред

рд╡реНрдпрдХреНрддрд┐рдЧрдд рд░реВрдк рд╕реЗ, рдпрд╣ рд╡реНрдпрд╡рд╣рд╛рд░ рдореБрдЭреЗ рдкрд░реЗрд╢рд╛рди рдирд╣реАрдВ рдХрд░рддрд╛ рд╣реИред рдЬрдм рддрдХ рд╣рд░ рдмрд╛рд░ рд╣рдо рдПрдХ рдирд┐рд╢реНрдЪрд┐рдд рдмреАрдЬ рдХреЗ рд╕рд╛рде рдЖрд░рдВрдн рдХрд░рддреЗ рд╣реИрдВ, рд╣рдореЗрдВ рдЙрд╕ рдмрд┐рдВрджреБ рдХреЗ рдмрд╛рдж рдЖрдЙрдЯрдкреБрдЯ рдХрд╛ рд╕рдорд╛рди рдХреНрд░рдо рдорд┐рд▓рддрд╛ рд╣реИ, рд╣рдо рдЕрдЪреНрдЫреЗ рд╣реИрдВред рдореБрдЭреЗ рдЪрд┐рдВрддрд╛ рд╣реЛрдЧреА рдЕрдЧрд░ рд╣рдо рдпрд╛рджреГрдЪреНрдЫрд┐рдХ рдмреАрдЬ рдХрд╛ рд╕рдореНрдорд╛рди рдирд╣реАрдВ рдХрд░ рд░рд╣реЗ рдереЗ; рд▓реЗрдХрд┐рди рдпрд╣ рд╡рд╣ рдирд╣реАрдВ рд╣реИ рдЬреЛ рдпрд╣ рдореБрджреНрджрд╛ рдЯреНрд░реИрдХ рдХрд░рддрд╛ рд╣реИред

рдореЗрд░реА рд╕рд┐рдлрд╛рд░рд┐рд╢: рдХреБрдЫ рдордд рдХрд░реЛред рдРрд╕реЗ рдореЗрдВ рдмрдВрдж рдХрд░ рд░рд╣рд╛ рд╣реИред

@freddyaboulton рдпрджрд┐ рдЖрдк рдЗрд╕ рд╡реНрдпрд╡рд╣рд╛рд░ рд╕реЗ рдЕрд╕рд╣рдордд рд╣реИрдВ, рддреЛ рдЖрдЗрдП рдЗрд╕реЗ рдмрд╛рд╣рд░

@dsherry рдореБрдЭреЗ рд▓рдЧрддрд╛ рд╣реИ рдХрд┐ рдпрд╣ рджреЛ рдХрд╛рд░рдгреЛрдВ рд╕реЗ рдмрджрд▓рдиреЗ рд▓рд╛рдпрдХ рд╣реИ:

  1. рдпрд╣ рд╕реНрд╡рдЪрд╛рд▓рд┐рдд рдЦреЛрдЬ рдореЗрдВ рднрд┐рдиреНрдирддрд╛рдУрдВ рдХрд╛ рдкрд░рд┐рдЪрдп рджреЗрддрд╛ рд╣реИ рдХреНрдпреЛрдВрдХрд┐ рд╡рд┐рднрд┐рдиреНрди рдбреЗрдЯрд╛ рдкрд░ рд╡рд┐рднрд┐рдиреНрди рдкрд╛рдЗрдкрд▓рд╛рдЗрдиреЛрдВ рдХрд╛ рдореВрд▓реНрдпрд╛рдВрдХрди рдХрд┐рдпрд╛ рдЬрд╛рддрд╛ рд╣реИред рдпрд╣ рд░реИрдВрдХрд┐рдВрдЧ рддрд╛рд▓рд┐рдХрд╛ рдХреЛ рдереЛрдбрд╝рд╛ рднреНрд░рд╛рдордХ рдмрдирд╛рддрд╛ рд╣реИ рдХреНрдпреЛрдВрдХрд┐ рд╕реНрдХреЛрд░ рдХреА рдЧрдгрдирд╛ рдПрдХ рд╣реА рдбреЗрдЯрд╛ рдкрд░ рдирд╣реАрдВ рдХреА рдЬрд╛рддреА рд╣реИред
  2. рд╕рдорд╛рдирд╛рдВрддрд░ рдСрдЯреЛрдПрдордПрд▓ рдЦреЛрдЬ рдХреЗ рд▓рд┐рдП рдпрд╣ рдмреБрд░рд╛ рд╣реИ

    рдореБрдЭреЗ 2 рдХреЗ рдмрд╛рд░реЗ рдореЗрдВ рд╡рд┐рд╕реНрддрд╛рд░ рд╕реЗ рдмрддрд╛рдПрдВред рд╡рд░реНрддрдорд╛рди рд╡реНрдпрд╡рд╣рд╛рд░ рдХреЗ рд╕рд╛рде, рдЕрдиреБрдХреНрд░рдорд┐рдХ рдЗрдВрдЬрди рд╕реЗ рдкреВрд░реЗ рдЦреЛрдЬ рдореЗрдВ рдбреЗрдЯрд╛ рд╕реНрдкреНрд▓рд┐рдЯрд░ рдХреА рд╕реНрдерд┐рддрд┐ рдХреЛ рд╕рдВрд╢реЛрдзрд┐рдд рдХрд░рдиреЗ рдХреА рдЙрдореНрдореАрдж рд╣реИред рд╕рдорд╛рдирд╛рдВрддрд░ evalml рдореЗрдВ, рд╣рдо рдбреЗрдЯрд╛ рд╕реНрдкреНрд▓рд┐рдЯрд░ рдХреЛ рдЕрдЪрд╛рд░ рдХрд░рддреЗ рд╣реИрдВ рдФрд░ рд╡рд┐рднрд╛рдЬрди рдХреА рдЧрдгрдирд╛ рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рд╢реНрд░рдорд┐рдХреЛрдВ рдХреЛ рднреЗрдЬрддреЗ рд╣реИрдВред рдЪреВрдВрдХрд┐ рд╢реНрд░рдорд┐рдХреЛрдВ рдХреЛ рд╕реНрдкреНрд▓рд┐рдЯрд░ рдХреА рдПрдХ рдкреНрд░рддрд┐ рдорд┐рд▓рддреА рд╣реИ, рд╡реЗ рдореВрд▓ рдбреЗрдЯрд╛ рд╕реНрдкреНрд▓рд┐рдЯрд░ рдХреА рд╕реНрдерд┐рддрд┐ рдХреЛ рд╕рдВрд╢реЛрдзрд┐рдд рдирд╣реАрдВ рдХрд░рддреЗ рд╣реИрдВред

рдпрд╣ рдЕрдиреБрдХреНрд░рдорд┐рдХ рдФрд░ рд╕рдорд╛рдирд╛рдВрддрд░ рдЗрдВрдЬрдиреЛрдВ рдХреЗ рдмреАрдЪ рд╡реНрдпрд╡рд╣рд╛рд░ рдореЗрдВ рдЕрдВрддрд░ рдХрд╛ рдкрд░рд┐рдЪрдп рджреЗрддрд╛ рд╣реИ рдХреНрдпреЛрдВрдХрд┐ рдкрд╛рдЗрдкрд▓рд╛рдЗрди рдХреЗ рдореВрд▓реНрдпрд╛рдВрдХрди рдХреЗ рдХреНрд░рдо рдХреЗ рдЖрдзрд╛рд░ рдкрд░ рд╡рд┐рднрд╛рдЬрди рдореЗрд▓ рдирд╣реАрдВ рдЦрд╛рдПрдЧрд╛! рдЗрд╕рдХрд╛ рдорддрд▓рдм рд╣реИ рдХрд┐ рдПрдХ рд╣реА рдкрд╛рдЗрдкрд▓рд╛рдЗрди/рдкреИрд░рд╛рдореАрдЯрд░ рдХреЙрдореНрдмреЛ рдЕрдиреБрдХреНрд░рдорд┐рдХ рдЗрдВрдЬрди рдФрд░ рд╕рдорд╛рдВрддрд░ рдЗрдВрдЬрди рдореЗрдВ рдЕрд▓рдЧ-рдЕрд▓рдЧ рдкрд░рд┐рдгрд╛рдо рдкреНрд░рд╛рдкреНрдд рдХрд░реЗрдЧрд╛ рдФрд░ рдореБрдЭреЗ рд▓рдЧрддрд╛ рд╣реИ рдХрд┐ рдпрд╣ рдЕрд╡рд╛рдВрдЫрдиреАрдп рд╣реИред

рдореЗрд░реА рд░рд╛рдп рдореЗрдВ, рдмрд┐рдВрджреБ 1 рдЗрд╕реЗ рдареАрдХ рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рдкрд░реНрдпрд╛рдкреНрдд рдХрд╛рд░рдг рд╣реИ рдХреНрдпреЛрдВрдХрд┐ рд╣рдорд╛рд░реА рд╕рднреА рдкрд╛рдЗрдкрд▓рд╛рдЗрдиреЛрдВ рдХрд╛ рдореВрд▓реНрдпрд╛рдВрдХрди рдПрдХ рд╣реА рдбреЗрдЯрд╛ рдкрд░ рдХрд┐рдпрд╛ рдЬрд╛рдирд╛ рдЪрд╛рд╣рд┐рдП рдпрджрд┐ рд╣рдо рдЙрдирдХреА рд╕рд╛рд░реНрдердХ рд░реВрдк рд╕реЗ рддреБрд▓рдирд╛ рдХрд░рдиреЗ рдореЗрдВ рд╕рдХреНрд╖рдо рд╣реЛрдирд╛ рдЪрд╛рд╣рддреЗ рд╣реИрдВред рд▓реЗрдХрд┐рди рдЬреИрд╕рд╛ рдХрд┐ рд╣рдо рд╕рдорд╛рдирд╛рдВрддрд░ evalml рдХреА рдУрд░ рдмрдврд╝рддреЗ рд╣реИрдВ, рдореБрдЭреЗ рд▓рдЧрддрд╛ рд╣реИ рдХрд┐ рдпрд╣ рдорд╣рддреНрд╡рдкреВрд░реНрдг рд╣реИ рдХрд┐ рд╣рдо рд╕реБрдирд┐рд╢реНрдЪрд┐рдд рдХрд░реЗрдВ рдХрд┐ рд╡реИрд╢реНрд╡рд┐рдХ рд╕реНрдерд┐рддрд┐ рдХреЛ рд╕рдВрд╢реЛрдзрд┐рдд рдХрд░рдирд╛ рд╣рдорд╛рд░реЗ рдЕрдкреЗрдХреНрд╖рд┐рдд рд╡реНрдпрд╡рд╣рд╛рд░ рдХрд╛ рд╣рд┐рд╕реНрд╕рд╛ рдирд╣реАрдВ рд╣реИред

рдЖрдЧреЗ рдмрдврд╝ рд░рд╣реА рд╣реИ рдпреЛрдЬрдирд╛ :

  1. BalancedClassificationDataCVSplit рдХреЛ рд╕рдВрд╢реЛрдзрд┐рдд рдХрд░рдХреЗ рдЗрд╕ рд╕рдорд╕реНрдпрд╛ рдХреЛ рдареАрдХ рдХрд░реЗрдВ
  2. рд▓рдВрдмреЗ рд╕рдордп рддрдХ рд╣рдо рдРрд╕реЗ рдкрд░реАрдХреНрд╖рдг рд▓рд┐рдЦрдирд╛ рдЪрд╛рд╣рддреЗ рд╣реИрдВ рдЬреЛ рдпрд╣ рд╕рддреНрдпрд╛рдкрд┐рдд рдХрд░рддреЗ рд╣реИрдВ рдХрд┐ рд╣рдо рд╕реНрд╡рдЪрд╛рд▓рд┐рдд рдЦреЛрдЬ рдореЗрдВ рдЕрд▓рдЧ-рдЕрд▓рдЧ рдкрд╛рдЗрдкрд▓рд╛рдЗрдиреЛрдВ рдХреЛ рдЕрд▓рдЧ-рдЕрд▓рдЧ рд╡рд┐рднрд╛рдЬрди рдирд╣реАрдВ рдЦрд┐рд▓рд╛рддреЗ рд╣реИрдВред

рдЪрд░реНрдЪрд╛ рдХреЗ рд▓рд┐рдП рд╕рднреА рдХреЛ рдзрдиреНрдпрд╡рд╛рдж!

рдХреНрдпрд╛ рдпрд╣ рдкреГрд╖реНрда рдЙрдкрдпреЛрдЧреА рдерд╛?
0 / 5 - 0 рд░реЗрдЯрд┐рдВрдЧреНрд╕

рд╕рдВрдмрдВрдзрд┐рдд рдореБрджреНрджреЛрдВ

angela97lin picture angela97lin  ┬╖  4рдЯрд┐рдкреНрдкрдгрд┐рдпрд╛рдБ

bchen1116 picture bchen1116  ┬╖  4рдЯрд┐рдкреНрдкрдгрд┐рдпрд╛рдБ

angela97lin picture angela97lin  ┬╖  5рдЯрд┐рдкреНрдкрдгрд┐рдпрд╛рдБ

npapan69 picture npapan69  ┬╖  4рдЯрд┐рдкреНрдкрдгрд┐рдпрд╛рдБ

dsherry picture dsherry  ┬╖  3рдЯрд┐рдкреНрдкрдгрд┐рдпрд╛рдБ