Evalml: automl이 전체 β€‹β€‹ν›ˆλ ¨ λ°μ΄ν„°μ—μ„œ 졜고의 νŒŒμ΄ν”„λΌμΈμ„ μžλ™μœΌλ‘œ λ§žμΆ”λ„λ‘ ν•©λ‹ˆλ‹€.

에 λ§Œλ“  2020λ…„ 12μ›” 11일  Β·  3μ½”λ©˜νŠΈ  Β·  좜처: alteryx/evalml

λ°°κ²½
automlμ—μ„œ ν›ˆλ ¨λœ νŒŒμ΄ν”„λΌμΈμ„ κ°€μ Έμ˜€λ €λ©΄ νŒŒμ΄ν”„λΌμΈμ—μ„œ fit λ₯Ό ν˜ΈμΆœν•΄μ•Ό ν•©λ‹ˆλ‹€. automl은 항상 νŒŒμ΄ν”„λΌμΈμ˜ ν›ˆλ ¨λ˜μ§€ μ•Šμ€ 볡사본을 λ°˜ν™˜ν•˜κΈ° λ•Œλ¬Έμž…λ‹ˆλ‹€.

automl.search(X_train, y_train)
best_pipeline = automl.best_pipeline
best_pipeline.fit(X_train, y_train)
best_pipeline.score(X_test, y_test, objectives=['MSE'])
pipeline = automl.get_pipeline(42)
pipeline.fit(X_train, y_train)
pipeline.score(X_test, y_test, objectives=['MSE'])

도전
μš°λ¦¬λŠ” μ‚¬λžŒλ“€μ΄ automl을 μ‹€ν–‰ν•˜κ³  νŒŒμ΄ν”„λΌμΈμ„ μ„ νƒν•˜κ³  ν•΄λ‹Ή νŒŒμ΄ν”„λΌμΈμ„ μ‚¬μš©ν•˜μ—¬ 반볡 및 λ””λ²„κ·Έν•˜κ³  톡찰λ ₯을 μƒμ„±ν•˜κ³  ν”„λ‘œλ•μ…˜μ— 배포할 수 μžˆλ„λ‘ μ΅œλŒ€ν•œ μ‰½κ²Œ λ§Œλ“€κ³  μ‹ΆμŠ΅λ‹ˆλ‹€.

μ œμ•ˆ
λ‹¨κΈ°μ μœΌλ‘œ(즉, 이 문제): best_pipeline μ ‘κ·Όμžκ°€ ν›ˆλ ¨λœ νŒŒμ΄ν”„λΌμΈμ„ λ°˜ν™˜ν•˜λ„λ‘ ν•©λ‹ˆλ‹€.

automl.search(X_train, y_train)
best_pipeline = automl.best_pipeline
best_pipeline.score(X_test, y_test, objectives=['MSE'])

automl 검색이 아직 μ‹€ν–‰λ˜μ§€ μ•Šμ€ 경우 ν•΄λ‹Ή μ ‘κ·Όμžμ— 였λ₯˜κ°€ λ°œμƒν•΄μ•Ό ν•©λ‹ˆλ‹€.

이λ₯Ό κ΅¬ν˜„ν•˜λŠ” 방법에 λŒ€ν•œ λ‚˜μ˜ ꢌμž₯ 사항은 λ§ˆμ§€λ§‰μ— μ΅œμƒμ˜ νŒŒμ΄ν”„λΌμΈμ— 맞게 automl 검색을 μ—…λ°μ΄νŠΈν•˜κ³  ν›ˆλ ¨λœ νŒŒμ΄ν”„λΌμΈμ— λŒ€ν•œ μ°Έμ‘°λ₯Ό μ €μž₯ν•˜λŠ” κ²ƒμž…λ‹ˆλ‹€.

μ‚¬μš©μž κ°€μ΄λ“œλ₯Ό μ—…λ°μ΄νŠΈν•˜λŠ” 것을 μžŠμ§€ λ§ˆμ‹­μ‹œμ˜€!

μ„±λŠ₯ ν…ŒμŠ€νŠΈμ—λ„ 영ν–₯이 μžˆμŠ΅λ‹ˆλ‹€. μžλ™ 검색 μ‹œκ°„κ³Ό 졜적의 νŒŒμ΄ν”„λΌμΈμ— λ§žλŠ” μ‹œκ°„μ„ λ³„λ„λ‘œ κΈ°λ‘ν•˜λ„λ‘ κ±°μšΈμ„ μ—…λ°μ΄νŠΈν•΄μ•Ό ν•©λ‹ˆλ‹€. μ΄λŠ” 독립적인 μž‘μ—…μ΄κΈ° λ•Œλ¬Έμž…λ‹ˆλ‹€.

미래
μž₯기적으둜 search 호좜 μ™ΈλΆ€μ˜ 데이터에 λŒ€ν•œ μ°Έμ‘°λ₯Ό μœ μ§€ν•˜κΈ° μœ„ν•œ 좔상화λ₯Ό λ§Œλ“€κ³  μ‹ΆμŠ΅λ‹ˆλ‹€. μ΄λ ‡κ²Œ ν•˜λ©΄ automl search ν˜ΈμΆœν•˜λŠ” λ™μ•ˆ λͺ¨λ“  νŒŒμ΄ν”„λΌμΈμ„ ν›ˆλ ¨ν•  ν•„μš” 없이 get_pipeline ν›ˆλ ¨λœ νŒŒμ΄ν”„λΌμΈμ„ λ°˜ν™˜ν•˜λŠ” 것과 같은 μž‘μ—…μ„ μˆ˜ν–‰ν•  수 μžˆμŠ΅λ‹ˆλ‹€.

enhancement

κ°€μž₯ μœ μš©ν•œ λŒ“κΈ€

μ‚¬μš©μžκ°€ 이것을 끌 수 μžˆλ„λ‘ train_best_pipeline ν”Œλž˜κ·Έλ₯Ό search() λ˜λŠ” __init__ ν•΄μ•Ό ν•©λ‹ˆκΉŒ? μ‚¬μš©μžκ°€ μ›ν•˜μ§€ μ•Šμ„ 수 μžˆλŠ” μž‘μ—…μ— λŒ€ν•΄ μƒλ‹Ήν•œ μΆ”κ°€ μ‹œκ°„κ³Ό λ©”λͺ¨λ¦¬λ₯Ό μΆ”κ°€ν•  수 있기 λ•Œλ¬Έμ— 쒋을 것이라고 μƒκ°ν•©λ‹ˆλ‹€.

λͺ¨λ“  3 λŒ“κΈ€

λ”°λΌμ„œ κ³„νšμ€ X_test 및 y_test 에 λŒ€ν•œ 인수λ₯Ό AutoMLSearch.search api 에 μΆ”κ°€ν•˜λŠ” κ²ƒμž…λ‹ˆλ‹€. μ•„λ‹ˆλ©΄μ΄μ— λ§žλŠ” X 및 y 에 전달 search ?

μ‚¬μš©μžκ°€ 이것을 끌 수 μžˆλ„λ‘ train_best_pipeline ν”Œλž˜κ·Έλ₯Ό search() λ˜λŠ” __init__ ν•΄μ•Ό ν•©λ‹ˆκΉŒ? μ‚¬μš©μžκ°€ μ›ν•˜μ§€ μ•Šμ„ 수 μžˆλŠ” μž‘μ—…μ— λŒ€ν•΄ μƒλ‹Ήν•œ μΆ”κ°€ μ‹œκ°„κ³Ό λ©”λͺ¨λ¦¬λ₯Ό μΆ”κ°€ν•  수 있기 λ•Œλ¬Έμ— 쒋을 것이라고 μƒκ°ν•©λ‹ˆλ‹€.

@freddyaboulton search 에 제곡된 전체 ꡐ윑 데이터에 λ§žμ•„μ•Ό ν•œλ‹€κ³  μƒκ°ν•©λ‹ˆλ‹€.

@kmax12 쒋은 점, λ™μ˜ν•©λ‹ˆλ‹€. 기본적으둜 True인 train_best_pipeline ν”Œλž˜κ·Έλ₯Ό μΆ”κ°€ν•  수 μžˆμŠ΅λ‹ˆλ‹€. 이 경우 APIκ°€ False인 경우 μˆ˜ν–‰ν•΄μ•Ό ν•˜λŠ” μž‘μ—…μ€ TBDμž…λ‹ˆλ‹€. λ‚΄ λ³ΈλŠ₯은 λ‹¨μˆœνžˆ best_pipeline κ°€ ν›ˆλ ¨λ˜μ§€ μ•Šμ€ νŒŒμ΄ν”„λΌμΈμ„ λ°˜ν™˜ν•˜λ„λ‘ ν•˜λŠ” κ²ƒμž…λ‹ˆλ‹€. @bchen1116 참고둜

이 νŽ˜μ΄μ§€κ°€ 도움이 λ˜μ—ˆλ‚˜μš”?
0 / 5 - 0 λ“±κΈ‰