рд░реЗрдкреНрд░реЛ
import joblib
from evalml.demos import load_fraud
from evalml.preprocessing.data_splitters import BalancedClassificationDataCVSplit
splitter = BalancedClassificationDataCVSplit(n_splits=3, random_seed=0, shuffle=True)
X, y = load_fraud(5000)
X = X.to_dataframe()
y = y.to_series().astype("int")
for train, test in splitter.split(X, y):
print((joblib.hash(train), joblib.hash(test)))
# Output
('75f1b95d7ce307ac6c793055330969aa', '8c89fe1a592c50a700b6d5cbb02dba8b')
('f8c849bbfbed37c13f66c5c742e237cb', '9c4879fb550fded8be9ac03e95a1bf95')
('cdc21f0d6bbf45459c9695258f7f04dc', '5b575765bbe176e732b8eb4dc1bf2822')
for train, test in splitter.split(X, y):
print((joblib.hash(train), joblib.hash(test)))
# Output
('bf462b82af243c552ac48acad2dfd748', '8c89fe1a592c50a700b6d5cbb02dba8b')
('b8341b536c63c7957c099b05e315f49c', '9c4879fb550fded8be9ac03e95a1bf95')
('780e74673b601790037fc0b17dde56fe', '5b575765bbe176e732b8eb4dc1bf2822')
for train, test in splitter.split(X, y):
print((joblib.hash(train), joblib.hash(test)
# Output
('385f6c538568ad3a33cf84f61d94144c', '8c89fe1a592c50a700b6d5cbb02dba8b')
('8db65d0a3bdf87ae0f135b9766a260dd', '9c4879fb550fded8be9ac03e95a1bf95')
('2a7293fc1308b8a572091d7c76d20205', '5b575765bbe176e732b8eb4dc1bf2822')
рдпрд╣ рд╕реНрдХреЗрд▓реЗрд░ рд╕реНрдкреНрд▓рд┐рдЯрд░ рдХреЗ рд╡реНрдпрд╡рд╣рд╛рд░ рд╕реЗ рдЕрд▓рдЧ рд╣реИ:
from sklearn.model_selection import StratifiedKFold
kfold = StratifiedKFold(n_splits=3, random_state=0, shuffle=True)
for train, test in kfold.split(X, y):
print((joblib.hash(train), joblib.hash(test)))
#Output
('6c30ee6a11803927024354405389506a', '8c89fe1a592c50a700b6d5cbb02dba8b')
('df0a70e2e6ca783f12461e8c82a26ad4', '9c4879fb550fded8be9ac03e95a1bf95')
('2898e4b3d3621b436641016499f4aafb', '5b575765bbe176e732b8eb4dc1bf2822')
for train, test in kfold.split(X, y):
print((joblib.hash(train), joblib.hash(test)))
# Output
('6c30ee6a11803927024354405389506a', '8c89fe1a592c50a700b6d5cbb02dba8b')
('df0a70e2e6ca783f12461e8c82a26ad4', '9c4879fb550fded8be9ac03e95a1bf95')
('2898e4b3d3621b436641016499f4aafb', '5b575765bbe176e732b8eb4dc1bf2822')
рдореБрдЭреЗ рд▓рдЧрддрд╛ рд╣реИ рдХрд┐ рдпрд╣ рджреЛ рдХрд╛рд░рдгреЛрдВ рд╕реЗ рд╕рдорд╕реНрдпрд╛рдЧреНрд░рд╕реНрдд рд╣реИ:
split
рдбреЗрдЯрд╛ рд╕реНрдкреНрд▓рд┐рдЯрд░ рдХреА рд╕реНрдерд┐рддрд┐ рдХреЛ рд╕рдВрд╢реЛрдзрд┐рдд рдХрд░рддрд╛ рд╣реИ, рдЗрд╕рдХрд╛ рдорддрд▓рдм рд╣реИ рдХрд┐ рд╣рдорд╛рд░реЗ рдкрд╛рд╕ рдЕрдиреБрдХреНрд░рдорд┐рдХ рдФрд░ рд╕рдорд╛рдирд╛рдВрддрд░ рдЗрдВрдЬрдиреЛрдВ рдХреЗ рдмреАрдЪ рдЕрд▓рдЧ-рдЕрд▓рдЧ рдкрд░рд┐рдгрд╛рдо рд╣реЛрдВрдЧреЗредрдЗрд╕ рдкрд░ рдзреНрдпрд╛рди рджрд┐рд▓рд╛рдиреЗ рдХреЗ рд▓рд┐рдП рдзрдиреНрдпрд╡рд╛рджред
рд╡реНрдпрдХреНрддрд┐рдЧрдд рд░реВрдк рд╕реЗ, рдпрд╣ рд╡реНрдпрд╡рд╣рд╛рд░ рдореБрдЭреЗ рдкрд░реЗрд╢рд╛рди рдирд╣реАрдВ рдХрд░рддрд╛ рд╣реИред рдЬрдм рддрдХ рд╣рд░ рдмрд╛рд░ рд╣рдо рдПрдХ рдирд┐рд╢реНрдЪрд┐рдд рдмреАрдЬ рдХреЗ рд╕рд╛рде рдЖрд░рдВрдн рдХрд░рддреЗ рд╣реИрдВ, рд╣рдореЗрдВ рдЙрд╕ рдмрд┐рдВрджреБ рдХреЗ рдмрд╛рдж рдЖрдЙрдЯрдкреБрдЯ рдХрд╛ рд╕рдорд╛рди рдХреНрд░рдо рдорд┐рд▓рддрд╛ рд╣реИ, рд╣рдо рдЕрдЪреНрдЫреЗ рд╣реИрдВред рдореБрдЭреЗ рдЪрд┐рдВрддрд╛ рд╣реЛрдЧреА рдЕрдЧрд░ рд╣рдо рдпрд╛рджреГрдЪреНрдЫрд┐рдХ рдмреАрдЬ рдХрд╛ рд╕рдореНрдорд╛рди рдирд╣реАрдВ рдХрд░ рд░рд╣реЗ рдереЗ; рд▓реЗрдХрд┐рди рдпрд╣ рд╡рд╣ рдирд╣реАрдВ рд╣реИ рдЬреЛ рдпрд╣ рдореБрджреНрджрд╛ рдЯреНрд░реИрдХ рдХрд░рддрд╛ рд╣реИред
рдореЗрд░реА рд╕рд┐рдлрд╛рд░рд┐рд╢: рдХреБрдЫ рдордд рдХрд░реЛред рдРрд╕реЗ рдореЗрдВ рдмрдВрдж рдХрд░ рд░рд╣рд╛ рд╣реИред
@freddyaboulton рдпрджрд┐ рдЖрдк рдЗрд╕ рд╡реНрдпрд╡рд╣рд╛рд░ рд╕реЗ рдЕрд╕рд╣рдордд рд╣реИрдВ, рддреЛ рдЖрдЗрдП рдЗрд╕реЗ рдмрд╛рд╣рд░
@dsherry рдореБрдЭреЗ рд▓рдЧрддрд╛ рд╣реИ рдХрд┐ рдпрд╣ рджреЛ рдХрд╛рд░рдгреЛрдВ рд╕реЗ рдмрджрд▓рдиреЗ рд▓рд╛рдпрдХ рд╣реИ:
рд╕рдорд╛рдирд╛рдВрддрд░ рдСрдЯреЛрдПрдордПрд▓ рдЦреЛрдЬ рдХреЗ рд▓рд┐рдП рдпрд╣ рдмреБрд░рд╛ рд╣реИ
рдореБрдЭреЗ 2 рдХреЗ рдмрд╛рд░реЗ рдореЗрдВ рд╡рд┐рд╕реНрддрд╛рд░ рд╕реЗ рдмрддрд╛рдПрдВред рд╡рд░реНрддрдорд╛рди рд╡реНрдпрд╡рд╣рд╛рд░ рдХреЗ рд╕рд╛рде, рдЕрдиреБрдХреНрд░рдорд┐рдХ рдЗрдВрдЬрди рд╕реЗ рдкреВрд░реЗ рдЦреЛрдЬ рдореЗрдВ рдбреЗрдЯрд╛ рд╕реНрдкреНрд▓рд┐рдЯрд░ рдХреА рд╕реНрдерд┐рддрд┐ рдХреЛ рд╕рдВрд╢реЛрдзрд┐рдд рдХрд░рдиреЗ рдХреА рдЙрдореНрдореАрдж рд╣реИред рд╕рдорд╛рдирд╛рдВрддрд░ evalml рдореЗрдВ, рд╣рдо рдбреЗрдЯрд╛ рд╕реНрдкреНрд▓рд┐рдЯрд░ рдХреЛ рдЕрдЪрд╛рд░ рдХрд░рддреЗ рд╣реИрдВ рдФрд░ рд╡рд┐рднрд╛рдЬрди рдХреА рдЧрдгрдирд╛ рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рд╢реНрд░рдорд┐рдХреЛрдВ рдХреЛ рднреЗрдЬрддреЗ рд╣реИрдВред рдЪреВрдВрдХрд┐ рд╢реНрд░рдорд┐рдХреЛрдВ рдХреЛ рд╕реНрдкреНрд▓рд┐рдЯрд░ рдХреА рдПрдХ рдкреНрд░рддрд┐ рдорд┐рд▓рддреА рд╣реИ, рд╡реЗ рдореВрд▓ рдбреЗрдЯрд╛ рд╕реНрдкреНрд▓рд┐рдЯрд░ рдХреА рд╕реНрдерд┐рддрд┐ рдХреЛ рд╕рдВрд╢реЛрдзрд┐рдд рдирд╣реАрдВ рдХрд░рддреЗ рд╣реИрдВред
рдпрд╣ рдЕрдиреБрдХреНрд░рдорд┐рдХ рдФрд░ рд╕рдорд╛рдирд╛рдВрддрд░ рдЗрдВрдЬрдиреЛрдВ рдХреЗ рдмреАрдЪ рд╡реНрдпрд╡рд╣рд╛рд░ рдореЗрдВ рдЕрдВрддрд░ рдХрд╛ рдкрд░рд┐рдЪрдп рджреЗрддрд╛ рд╣реИ рдХреНрдпреЛрдВрдХрд┐ рдкрд╛рдЗрдкрд▓рд╛рдЗрди рдХреЗ рдореВрд▓реНрдпрд╛рдВрдХрди рдХреЗ рдХреНрд░рдо рдХреЗ рдЖрдзрд╛рд░ рдкрд░ рд╡рд┐рднрд╛рдЬрди рдореЗрд▓ рдирд╣реАрдВ рдЦрд╛рдПрдЧрд╛! рдЗрд╕рдХрд╛ рдорддрд▓рдм рд╣реИ рдХрд┐ рдПрдХ рд╣реА рдкрд╛рдЗрдкрд▓рд╛рдЗрди/рдкреИрд░рд╛рдореАрдЯрд░ рдХреЙрдореНрдмреЛ рдЕрдиреБрдХреНрд░рдорд┐рдХ рдЗрдВрдЬрди рдФрд░ рд╕рдорд╛рдВрддрд░ рдЗрдВрдЬрди рдореЗрдВ рдЕрд▓рдЧ-рдЕрд▓рдЧ рдкрд░рд┐рдгрд╛рдо рдкреНрд░рд╛рдкреНрдд рдХрд░реЗрдЧрд╛ рдФрд░ рдореБрдЭреЗ рд▓рдЧрддрд╛ рд╣реИ рдХрд┐ рдпрд╣ рдЕрд╡рд╛рдВрдЫрдиреАрдп рд╣реИред
рдореЗрд░реА рд░рд╛рдп рдореЗрдВ, рдмрд┐рдВрджреБ 1 рдЗрд╕реЗ рдареАрдХ рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рдкрд░реНрдпрд╛рдкреНрдд рдХрд╛рд░рдг рд╣реИ рдХреНрдпреЛрдВрдХрд┐ рд╣рдорд╛рд░реА рд╕рднреА рдкрд╛рдЗрдкрд▓рд╛рдЗрдиреЛрдВ рдХрд╛ рдореВрд▓реНрдпрд╛рдВрдХрди рдПрдХ рд╣реА рдбреЗрдЯрд╛ рдкрд░ рдХрд┐рдпрд╛ рдЬрд╛рдирд╛ рдЪрд╛рд╣рд┐рдП рдпрджрд┐ рд╣рдо рдЙрдирдХреА рд╕рд╛рд░реНрдердХ рд░реВрдк рд╕реЗ рддреБрд▓рдирд╛ рдХрд░рдиреЗ рдореЗрдВ рд╕рдХреНрд╖рдо рд╣реЛрдирд╛ рдЪрд╛рд╣рддреЗ рд╣реИрдВред рд▓реЗрдХрд┐рди рдЬреИрд╕рд╛ рдХрд┐ рд╣рдо рд╕рдорд╛рдирд╛рдВрддрд░ evalml рдХреА рдУрд░ рдмрдврд╝рддреЗ рд╣реИрдВ, рдореБрдЭреЗ рд▓рдЧрддрд╛ рд╣реИ рдХрд┐ рдпрд╣ рдорд╣рддреНрд╡рдкреВрд░реНрдг рд╣реИ рдХрд┐ рд╣рдо рд╕реБрдирд┐рд╢реНрдЪрд┐рдд рдХрд░реЗрдВ рдХрд┐ рд╡реИрд╢реНрд╡рд┐рдХ рд╕реНрдерд┐рддрд┐ рдХреЛ рд╕рдВрд╢реЛрдзрд┐рдд рдХрд░рдирд╛ рд╣рдорд╛рд░реЗ рдЕрдкреЗрдХреНрд╖рд┐рдд рд╡реНрдпрд╡рд╣рд╛рд░ рдХрд╛ рд╣рд┐рд╕реНрд╕рд╛ рдирд╣реАрдВ рд╣реИред
рдЖрдЧреЗ рдмрдврд╝ рд░рд╣реА рд╣реИ рдпреЛрдЬрдирд╛ :
BalancedClassificationDataCVSplit
рдХреЛ рд╕рдВрд╢реЛрдзрд┐рдд рдХрд░рдХреЗ рдЗрд╕ рд╕рдорд╕реНрдпрд╛ рдХреЛ рдареАрдХ рдХрд░реЗрдВрдЪрд░реНрдЪрд╛ рдХреЗ рд▓рд┐рдП рд╕рднреА рдХреЛ рдзрдиреНрдпрд╡рд╛рдж!