์ด Epic์ Woodwork DataTables ๋ฅผ EvalML์ ํตํฉํ๋ ๊ฒ๊ณผ ๊ด๋ จ๋ ๋ชจ๋ ๋ฌธ์ ๋ฅผ ์ถ์ ํฉ๋๋ค.
์ฌ๊ธฐ ์ฐธ๊ณ : https://alteryx.quip.com/XedaAs9HXc9f/EvalML-Woodwork-Table-Integration
๋์์ธ ๋ฌธ์: https://alteryx.quip.com/Oa4aA6h0Rf2k/Woodwork-DataTable-Integration-Design-Document
์คํ ๊ณํ:
automl์ด ๊ธฐ๋ฅ์ ์ฌ๋ฐ๋ฅด๊ฒ ์ฒ๋ฆฌํ๊ณ ์ฌ์ฉ์๊ฐ pandas DataFrames / numpy ๋ฐฐ์ด์ ์ ๋ฌํ ๊ฒฝ์ฐ ๋ฐ์ํ ์ ์๋ ์ผ์ ๊ฒฝ๊ณ ํ๊ธฐ ์ํด ๋ฒ์ฃผํ, ์ซ์ ๋ฐ ํ ์คํธ๊ฐ ์ค์ ๋ ๊ฒ์ผ๋ก ์์๋๋ ์ ํ์ ๋ํ ๋ฌธ์๋ฅผ ์ถ๊ฐํฉ๋๋ค. 2์ผ
WW DataTables๋ฅผ ํ์ฉํ๋๋ก ํ์ดํ๋ผ์ธ ๋ฐ ๋ชจ๋ ๊ตฌ์ฑ ์์ ์ ๋ฐ์ดํธ: 1์ฃผ
์ด๊ณ: 3์ฃผ 3์ผ, ๊ทธ๋ํ ์์ฑ/ํ์ฉ์ 1์ฃผ ๋ ์์๋ฉ๋๋ค.
์ฃผ์ ๋ ์ง
10์ ๋ฐ๋งค๋ 10์ 27์ผ ํ์์ผ์
๋๋ค.
๋ชฉํ
11์ 6์ผ(๊ธ)(4์ฃผ)๊น์ง ๋ชจ๋ ์๋ฃํ์ญ์์ค. 11์ ์ถ์ ์์ .
์คํธ๋ ์น ๋ชฉํ
10์ ๋ฆด๋ฆฌ์ค(10์ 27์ผ)๊น์ง ์ํ๋ ๊ทธ๋ํ/์ ํธ๋ฆฌํฐ๋ฅผ ์ ์ธํ ๋ชจ๋ ๊ฒ.
@angela97lin : ์ฒ์์๋ ์ง์ํ์ง ์์ ์๋ก์ด ๋ฐ์ดํฐ ํ ์ด๋ธ ์ ํ์ ์ญ์ ํด์ผ ํ๋ค๊ณ ์๊ฐํฉ๋๋ค. ๊ทธ๋ฐ ๋ค์ ์ฌ๋ก๋ณ๋ก ์ง์์ ์ถ๊ฐํ ์ ์์ต๋๋ค. ๊ทธ๋์:
dt = ... # woodwork datatable as input to automl search, for example
numeric_features = dt.select('numeric')
categorical_features = dt.select('categorical')
natural_language_features = dt.select('natural_language')
# then, in order to drop unsupported types, from here on out, don't use
# the other features which may still be held in the original datatable
์ฃผ๋ชฉํ ๋งํ ์: ์ฌ๊ธฐ ๋ฐ์ดํฐ ์ธํธ๋ ์๋/๊ฒฝ๋ ๋ฅผ ์ฌ์ฉํฉ๋๋ค. ํ์ฌ, ๊ทธ๊ฒ์ ๋ ๊ฐ์ ๋ ๋ฆฝ์ ์ธ float๋ก ๊ทธ๊ฒ์ ์ ๋ฌํฉ๋๋ค. ๋จ๊ธฐ์ ์ผ๋ก๋ ๊ทธ๋ฅ ๋ด๋ ค์ผ ํฉ๋๋ค. ๋๋ ์ฐ๋ฆฌ๊ฐ ๋ ๊ฐ์ ๋ ๋ฆฝ์ ์ธ float๋ก ์ธ์ฝ๋ฉํ ์ ์๋ค๊ณ ์๊ฐํ์ง๋ง, ๊ทธ๊ฒ์ด ์ ์ํ๋ ์ง๋ ์์ฌ์ค๋ฝ์ต๋๋ค. ์ฅ๊ธฐ์ ์ผ๋ก ์ฐ๋ฆฌ๋ featuretools์ latlong ํธํ ํ๋ฆฌ๋ฏธํฐ๋ธ๋ฅผ ์ฌ์ฉํ์ฌ ํด๋น ์ ํ์ ๋ํ ๊ธฐ๋ฅ์ ๊ตฌ์ถํ๊ณ ์ ํ ๊ฒ์ ๋๋ค.
๋ง ๋๋ค?
@freddyaboulton ์ ์ค๋ ์ข์ ์ ์ ์ง์ ํ์ต๋๋ค. ์ฐ๋ฆฌ๋ conda๋ก evalml์ ์ ๊ณตํ๊ธฐ ๋๋ฌธ์ ์ฌ์ฉ์๊ฐ ์ค์นํ๊ธฐ๋ฅผ ๊ธฐ๋ํ๊ธฐ ์ ์ conda์ ๋ชฉ๊ณต์ด ํ์ํฉ๋๋ค. ๊ทธ๋ฌ๋ฉด ์งํ ๋ฐฉ๋ฒ์ ๋ํด ๋ค์๊ณผ ๊ฐ์ ์ต์ ์ด ๋จ๊ฒ ๋ฉ๋๋ค.
fit
/ predict
๋ฉ์๋์ ๋ํด ์ด ์์
์ ์ํํ๋ ๊ฒ์ด ์ด์ํ๊ฒ ๋๊ปด์ง๋๋ค. ํนํ ์ด์จ๋ conda์ ๋ชฉ๊ณต์ ์ถ๊ฐํ๋ ค๋ ๊ฒฝ์ฐ์๋ ์ด ์์
์ ํผํด์ผ ํฉ๋๋ค.๋๋ ์ต์ 1์ ํฌ์ ๋๋ค. ์ฆ, ๋ชฉ๊ณต์ conda์ ์ ์ฉํ๋ ๊ฒ์ ๋๋ค. ์๋ํ๋ฉด ๊ทธ๊ฒ์ด ์ฐ๋ฆฌ๊ฐ ์ฅ๊ธฐ์ ์ผ๋ก ํ๊ณ ์ถ์ดํ ๊ฒ์ด๋ผ๊ณ ๋ฏฟ๊ธฐ ๋๋ฌธ์ ๋๋ค.
conda์ ๋ชฉ๊ณต์ ์ถ๊ฐ ํ๋ ๊ฒ์ ๋ํ ๋ฌธ์ ๊ฐ ์ด๋ฏธ ์ ๊ธฐ๋ ๊ฒ์ ๋ด ๋๋ค. ํ์ ์กฐ์น๋ฅผ ์ทจํ๊ฒ ์ต๋๋ค.
@dsherry ๊ฐ์ฌํฉ๋๋ค! @gsheni ๋ ์ฌ๊ธฐ ์์ ์ด๋ฒ์ฃผ๋ง์ ์ ๋ฐ์ดํธ๊ฐ ์์ ๊ฒ์ด๋ผ๊ณ ์ธ๊ธํ์ต๋๋ค. ๊ทธ๋ ๋ค๋ฉด 10์ ๋ฆด๋ฆฌ์ค๋ฅผ ์ํด ๋ณํฉ์ ๋ณด๋ฅํด์ผ ํฉ๋๊น?
@angela97lin ๋ค, ๋ฆด๋ฆฌ์ค๊ฐ ๋ฉฐ์น ์์ ์๊ณ ์ฌ๋ฌ๋ถ๋ ์ ์ ๋ฐ์ ์์ ์ ์๋ค๋ ์ ์ ๊ฐ์ํ ๋ ๋์ค์ ๋ณํฉ๋ ๋๊น์ง ๊ธฐ๋ค๋ฆฌ๋ ๊ฒ์ ๊ทธ๋ฆฌ ํฐ ๋ฌธ์ ๊ฐ ๋์ง ์์ต๋๋ค.
๋ชฉ๊ณต ์ ๊ทธ๋ ์ด๋์ ๋ํด @angela97lin ๋ฐ @freddyaboulton ๊ณผ ๋ฐฉ๊ธ ์ฑํ ํ์ต๋๋ค. ๋ค์์ ํ์ฌ ๋ฏธ๊ฒฐ์ /์งํ ์ค์ธ ๊ฒ์ผ๋ก ๋์ดํ ๊ฒ์ ๋๋ค.
transform
/ predict
์์ ํ๋ค ๋์ ๋ชฉ๊ณต์ ๋ฐํํ๊ณ ์ฌ์ฉ์ ์
๋ ฅ ๋ฐ์ดํฐ์ ์ฌ๋ณธ์ด๋ ํ์ฅ์ ๋ฐํํ๋ ๊ณณ์ด๋ฉด ์ด๋๋ ์ง ๋ฐํํฉ๋๋ค.@angela97lin ์ ๊ฐ ๋์น๊ฒ ์๋์?
@dsherry ๊ฑฐ์ ๋ง๋ ๊ฒ ๊ฐ์ต๋๋ค!
transform
/ predict
์์ ํ๋ค ๋์ ๋ชฉ๊ณต์ ๋ฐํํ๊ณ ์ฌ์ฉ์๊ฐ ์
๋ ฅํ ๋ฐ์ดํฐ์ ๋ณต์ฌ๋ณธ ๋๋ ํ์ฅ์ ๋ฐํํ๋ ๊ณณ(#1406)@angela97lin ๊ต์ฅํฉ๋๋ค, ๊ฐ์ฌํฉ๋๋ค!
@chukarsten @dsherry ์ด ์ํฝ๊ณผ ๊ด๋ จ๋ ๋ชจ๋ ๋ฌธ์ ๊ฐ ์ข ๋ฃ๋์์ต๋๋ค! ์ด ์ํฝ์ ๋ซ๊ณ ๊ฐ๋ณ์ ์ผ๋ก ๋ฐ์ํ๋ WW ๋ฌธ์ ๋ฅผ ์ถ์ ํ๋ ๊ฒ์ด ์์ ํฉ๋๊น? :)