Evalml: νŒŒμ΄ν”„λΌμΈ: 적합 전에 λ³€ν™˜/μ˜ˆμΈ‘μ„ ν˜ΈμΆœν•  λ•Œ ν‘œμ€€ 였λ₯˜

에 λ§Œλ“  2020λ…„ 07μ›” 28일  Β·  6μ½”λ©˜νŠΈ  Β·  좜처: alteryx/evalml

#969(문제 #851)μ—μ„œ μš°λ¦¬λŠ” κ΅¬μ„±μš”μ†Œκ°€ μ ν•©λ˜μ—ˆλŠ”μ§€ ν™•μΈν•˜κΈ° μœ„ν•΄ 예츑/λ³€ν™˜μ„ λž˜ν•‘ν•˜λŠ” λ©”νƒ€ν΄λž˜μŠ€λ₯Ό μ‚¬μš©ν•˜μ—¬ κ΅¬μ„±μš”μ†Œμ— μ ν•©ν•˜κΈ° 전에 예츑/λ³€ν™˜μ— λŒ€ν•œ 보편적인 였λ₯˜λ₯Ό μΆ”κ°€ν–ˆμŠ΅λ‹ˆλ‹€. PipelineBase μ—μ„œ μƒμ†λ˜λŠ” λͺ¨λ“  것이 λ™μΌν•œ μœ νš¨μ„± 검사λ₯Ό 받도둝 νŒŒμ΄ν”„λΌμΈμ— λ™μΌν•œ 처리λ₯Ό μΆ”κ°€ν•΄μ•Ό ν•©λ‹ˆλ‹€.

enhancement

κ°€μž₯ μœ μš©ν•œ λŒ“κΈ€

@angela97lin tl;dr: μ’‹μ•„, 쒋은 것 κ°™μ•„!

ꡬ성 μš”μ†Œκ°€ μ‚¬μš©μž μ •μ˜ fit , transform 및 predict λ©”μ„œλ“œλ‘œ ν™•μž₯되고 μœ μΌν•œ ν™•μ‹€ν•œ 방법이기 λ•Œλ¬Έμ— ꡬ성 μš”μ†Œμ—μ„œ 이 ν•­λͺ©μ„ ν™•μΈν•˜κΈ° μœ„ν•΄ 메타 클래슀 μ „λž΅μ„ μ‚¬μš©ν–ˆμŠ΅λ‹ˆλ‹€. μ΄λŸ¬ν•œ μ •μ˜μ— μœ νš¨μ„± 검사 μ½”λ“œλ₯Ό κ°€μ Έμ˜€λŠ” 것은 λ©”νƒ€ν΄λž˜μŠ€λ₯Ό 톡해 클래슀 μ •μ˜ μ‹œκ°„μ— 이λ₯Ό μ‚½μž…ν•˜λŠ” κ²ƒμ΄μ—ˆμŠ΅λ‹ˆλ‹€.

이제 νŒŒμ΄ν”„λΌμΈ ν΄λž˜μŠ€κ°€ fit / predict μ‚¬μš©μž μ •μ˜ κ΅¬ν˜„μ„ 직접 μœ μ§€ν•˜λŠ” λŒ€μ‹  ꡬ성 μš”μ†Œ κ·Έλž˜ν”„λ₯Ό λž˜ν•‘ν•˜λŠ” ν…œν”Œλ¦ΏμœΌλ‘œ μ‚¬μš©λ˜λŠ” μœ„μΉ˜μ— μžˆμŠ΅λ‹ˆλ‹€. λ‹ΉλΆ„κ°„ 지원을 μœ μ§€ν•΄μ•Ό ν•©λ‹ˆλ‹€. ν›Œλ₯­ν•˜λ‹€κ³  μƒκ°ν•©λ‹ˆλ‹€. 이것은 이 문제의 λͺ©ν‘œλ₯Ό μΆ©μ‘±ν•˜κΈ° μœ„ν•΄ λ©”νƒ€ν΄λž˜μŠ€ μ „λž΅μ΄ ν•„μš”ν•˜μ§€ μ•Šλ‹€λŠ” 의미이며 fit νŒŒμ΄ν”„λΌμΈ predict κ°€ fit 전에 호좜될 λ•Œ λͺ…ν™•ν•œ 였λ₯˜ λ©”μ‹œμ§€λ₯Ό ν‘œμ‹œν•©λ‹ˆλ‹€.

κ·ΈλŸ¬λ‚˜ μ§€κΈˆ νŒŒμ΄ν”„λΌμΈ λ©”νƒ€ν΄λž˜μŠ€λ₯Ό κ΅¬ν˜„ν•˜λŠ” 것은 쒋은 νˆ¬μžμž…λ‹ˆλ‹€. νŒŒμ΄ν”„λΌμΈκ³Ό ꡬ성 μš”μ†Œ λͺ¨λ‘μ—μ„œ λ‹€μ–‘ν•œ ν•„λ“œμ— λŒ€ν•œ 좔적 클래슀 μ •μ˜ μ‹œκ°„ μœ νš¨μ„± 검사에 λŒ€ν•΄ μ΅œμ†Œν•œ λͺ‡ 가지 λ¬Έμ œκ°€ μžˆμŠ΅λ‹ˆλ‹€. 그리고 λ©”νƒ€ν΄λž˜μŠ€λŠ” 이λ₯Ό μˆ˜ν–‰ν•˜κΈ° μœ„ν•œ μ˜¬λ°”λ₯Έ μ„ νƒμž„μ΄ 거의 ν™•μ‹€ν•©λ‹ˆλ‹€. κ·Έλž˜μ„œ, 전속λ ₯으둜 μ „μ§„ν•˜μ‹­μ‹œμ˜€! 🏎️😁

λͺ¨λ“  6 λŒ“κΈ€

λ„€. λ‚΄ 생각은 ꡬ성 μš”μ†Œμ— λŒ€ν•΄ μΆ”κ°€ν•œ 메타 클래슀 νŒ¨ν„΄ @jeremyliweishihλ₯Ό μΌλ°˜ν™”ν•œ λ‹€μŒ ꡬ성 μš”μ†Œμ™€ νŒŒμ΄ν”„λΌμΈ λͺ¨λ‘μ—μ„œ μ‚¬μš©ν•΄μ•Ό ν•œλ‹€λŠ” κ²ƒμž…λ‹ˆλ‹€.

JW: νŒŒμ΄ν”„λΌμΈμ΄ ꡬ성 μš”μ†Œλ‘œ λ§Œλ“€μ–΄μ§€κΈ° λ•Œλ¬Έμ— 이것을 "무료"둜 얻지 μ•ŠμŠ΅λ‹ˆκΉŒ? pipeline.predictλ₯Ό ν˜ΈμΆœν•˜λ©΄ ꡬ성 μš”μ†Œμ˜ 보편적인 였λ₯˜λ‘œ μš”μ•½λ˜μ§€ μ•ŠμŠ΅λ‹ˆκΉŒ?

@angela97lin λ„€ 말이 λ§žμ•„! μ•„λž˜ μŠ€ν¬λ¦°μƒ·μ„ μ°Έμ‘°ν•˜μ„Έμš”.

λ¬Έμ œλŠ” μ•„λž˜μ˜ λ™μž‘μ— λ¬Έμ œκ°€ μ—†λŠ”μ§€, μ•„λ‹ˆλ©΄ μŠ€νƒ 좔적을 보닀 μ§μ ‘μ μœΌλ‘œ μ›ν•˜λŠ”μ§€μž…λ‹ˆλ‹€. ν˜„μž¬ μŠ€νƒ 좔적은 첫 번째 ꡬ성 μš”μ†Œμ—μ„œ κ°€μ Έμ˜΅λ‹ˆλ‹€. μ΄μƒμ μœΌλ‘œλŠ” νŒŒμ΄ν”„λΌμΈ μžμ²΄μ—μ„œ λ‚˜μ˜΅λ‹ˆλ‹€.

μŠ€νƒ 좔적을 더 λͺ…ν™•ν•˜κ²Œν•˜λŠ” κ°€μž₯ λΉ λ₯Έ 방법 μ œμ™Έν•˜λŠ” κ²ƒμž…λ‹ˆλ‹€ ComponentNotYetFittedError νŒŒμ΄ν”„ 라인 방식에 λ‹€μŒ 던져 PipelineNotYetFittedError . 또 λ‹€λ₯Έ 방법은 ꡬ성 μš”μ†Œμ— λŒ€ν•΄ μ·¨ν•œ 메타 클래슀/λ°μ½”λ ˆμ΄ν„° μ „λž΅μ„ μž¬ν™œμš©ν•˜κ³  νŒŒμ΄ν”„λΌμΈμ— μ μš©ν•˜λŠ” κ²ƒμž…λ‹ˆλ‹€.

Screen Shot 2020-08-12 at 10 43 24 AM

@dsherry νŒ”λ‘œμš° ν•΄μ£Όμ…”μ„œ κ°μ‚¬ν•©λ‹ˆλ‹€! 이 문제λ₯Ό ν•΄κ²°ν•˜κ³  PipelineNotYetFittedError 였λ₯˜λ₯Ό μž‘μ•„μ„œ λ¨Όμ € μ²˜λ¦¬ν•˜μ—¬ ν•΄κ²°ν•˜λ €κ³  ν•©λ‹ˆλ‹€. μΆ©λΆ„ν•˜λ‹€λ©΄ μ§€λ‚˜μΉ˜κ²Œ λ³΅μž‘ν•  ν•„μš”κ°€ μ—†λ‹€κ³  μƒκ°ν•˜κΈ° λ•Œλ¬Έμž…λ‹ˆλ‹€. 그렇지 μ•Šμ€ 경우 메타 클래슀 μ ‘κ·Ό 방식을 μ‹œλ„ν•©λ‹ˆλ‹€. :)

흠, μ‹€μ œλ‘œ κ΅¬ν˜„ν–ˆμ„ λ•Œ λ©”νƒ€ν΄λž˜μŠ€ μ ‘κ·Ό 방식이 μš°λ¦¬κ°€ 관심 μžˆλŠ” 각 λ©”μ†Œλ“œμ— μœ μ‚¬ν•œ 였λ₯˜λ₯Ό 뢙일 ν•„μš”κ°€ μ—†μœΌλ―€λ‘œ λŒ€μ‹  ν•΄λ‹Ή 경둜λ₯Ό 택할 것이기 λ•Œλ¬Έμ— λ©”νƒ€ν΄λž˜μŠ€ μ ‘κ·Ό 방식이 더 λ‚˜μ„ 수 μžˆλ‹€λŠ” 것이 더 λΆ„λͺ…ν–ˆμŠ΅λ‹ˆλ‹€.

@angela97lin tl;dr: μ’‹μ•„, 쒋은 것 κ°™μ•„!

ꡬ성 μš”μ†Œκ°€ μ‚¬μš©μž μ •μ˜ fit , transform 및 predict λ©”μ„œλ“œλ‘œ ν™•μž₯되고 μœ μΌν•œ ν™•μ‹€ν•œ 방법이기 λ•Œλ¬Έμ— ꡬ성 μš”μ†Œμ—μ„œ 이 ν•­λͺ©μ„ ν™•μΈν•˜κΈ° μœ„ν•΄ 메타 클래슀 μ „λž΅μ„ μ‚¬μš©ν–ˆμŠ΅λ‹ˆλ‹€. μ΄λŸ¬ν•œ μ •μ˜μ— μœ νš¨μ„± 검사 μ½”λ“œλ₯Ό κ°€μ Έμ˜€λŠ” 것은 λ©”νƒ€ν΄λž˜μŠ€λ₯Ό 톡해 클래슀 μ •μ˜ μ‹œκ°„μ— 이λ₯Ό μ‚½μž…ν•˜λŠ” κ²ƒμ΄μ—ˆμŠ΅λ‹ˆλ‹€.

이제 νŒŒμ΄ν”„λΌμΈ ν΄λž˜μŠ€κ°€ fit / predict μ‚¬μš©μž μ •μ˜ κ΅¬ν˜„μ„ 직접 μœ μ§€ν•˜λŠ” λŒ€μ‹  ꡬ성 μš”μ†Œ κ·Έλž˜ν”„λ₯Ό λž˜ν•‘ν•˜λŠ” ν…œν”Œλ¦ΏμœΌλ‘œ μ‚¬μš©λ˜λŠ” μœ„μΉ˜μ— μžˆμŠ΅λ‹ˆλ‹€. λ‹ΉλΆ„κ°„ 지원을 μœ μ§€ν•΄μ•Ό ν•©λ‹ˆλ‹€. ν›Œλ₯­ν•˜λ‹€κ³  μƒκ°ν•©λ‹ˆλ‹€. 이것은 이 문제의 λͺ©ν‘œλ₯Ό μΆ©μ‘±ν•˜κΈ° μœ„ν•΄ λ©”νƒ€ν΄λž˜μŠ€ μ „λž΅μ΄ ν•„μš”ν•˜μ§€ μ•Šλ‹€λŠ” 의미이며 fit νŒŒμ΄ν”„λΌμΈ predict κ°€ fit 전에 호좜될 λ•Œ λͺ…ν™•ν•œ 였λ₯˜ λ©”μ‹œμ§€λ₯Ό ν‘œμ‹œν•©λ‹ˆλ‹€.

κ·ΈλŸ¬λ‚˜ μ§€κΈˆ νŒŒμ΄ν”„λΌμΈ λ©”νƒ€ν΄λž˜μŠ€λ₯Ό κ΅¬ν˜„ν•˜λŠ” 것은 쒋은 νˆ¬μžμž…λ‹ˆλ‹€. νŒŒμ΄ν”„λΌμΈκ³Ό ꡬ성 μš”μ†Œ λͺ¨λ‘μ—μ„œ λ‹€μ–‘ν•œ ν•„λ“œμ— λŒ€ν•œ 좔적 클래슀 μ •μ˜ μ‹œκ°„ μœ νš¨μ„± 검사에 λŒ€ν•΄ μ΅œμ†Œν•œ λͺ‡ 가지 λ¬Έμ œκ°€ μžˆμŠ΅λ‹ˆλ‹€. 그리고 λ©”νƒ€ν΄λž˜μŠ€λŠ” 이λ₯Ό μˆ˜ν–‰ν•˜κΈ° μœ„ν•œ μ˜¬λ°”λ₯Έ μ„ νƒμž„μ΄ 거의 ν™•μ‹€ν•©λ‹ˆλ‹€. κ·Έλž˜μ„œ, 전속λ ₯으둜 μ „μ§„ν•˜μ‹­μ‹œμ˜€! 🏎️😁

이 νŽ˜μ΄μ§€κ°€ 도움이 λ˜μ—ˆλ‚˜μš”?
0 / 5 - 0 λ“±κΈ‰