evalml 0.11.2๋ฅผ ์คํํฉ๋๋ค. ์ด์ ์ ์ด ๋ฌธ์ ์ ๋ํ ํด๊ฒฐ ๋ฐฉ๋ฒ์ด์๋ AutoMLSearch์์ ๋ฐ์ดํฐ ๊ฒ์ฌ๋ฅผ False๋ก ์ค์ ํ๋ ์ต์ ์ด ์ ๊ฑฐ๋ ๊ฒ ๊ฐ์ต๋๋ค.
TypeError Traceback(๊ฐ์ฅ ์ต๊ทผ ํธ์ถ ๋ง์ง๋ง)
1 automl = AutoMLSearch(objective="log_loss_multi", max_pipelines=5, problem_type="multiclass")
2
----> 3 automl.search(X, y)
~.conda\envs\evalml_test_1.0\lib\site-packages\evalml\automl\automl_search.py โโ๊ฒ์(self, X, y, data_checks, feature_types, raise_errors, show_iteration_plot)
316
317 = ๅฏถๅบฆ
--> 318 data_check_results = data_checks.validate(X, y)
319
320 if len(data_check_results) > 0:
~.conda\envs\evalml_test_1.0\lib\site-packages\evalml\data_checks\data_checks.py in validate(self, X, y)
33๊ฐ์ ๋ฉ์์ง = []
self.data_checks์ data_check์ฉ 34๊ฐ:
---> 35๊ฐ์ ๋ฉ์์ง_์ ๊ท = data_check.validate(X, y)
36 ๋ฉ์์ง.ํ์ฅ(messages_new)
37 ๋ฐํ ๋ฉ์์ง
~.conda\envs\evalml_test_1.0\lib\site-packages\evalml\data_checks\label_leakage_data_check.py in validate(self, X, y)
53 if len(X.columns) == 0:
54 ๋ฐํ []
---> 55 corrs = {label: abs(y.corr(col)) for label, col in X.iteritems() if abs(y.corr(col)) >= self.pct_corr_threshold}
56
57 high_corr_cols = {ํค: ํค์ ๋ํ ๊ฐ, ๊ฐ >= self.pct_corr_threshold์ธ ๊ฒฝ์ฐ corrs.items()์ ๊ฐ}
~.conda\envs\evalml_test_1.0\lib\site-packages\evalml\data_checks\label_leakage_data_check.py
53 if len(X.columns) == 0:
54 ๋ฐํ []
---> 55 corrs = {label: abs(y.corr(col)) for label, col in X.iteritems() if abs(y.corr(col)) >= self.pct_corr_threshold}
56
57 high_corr_cols = {ํค: ํค์ ๋ํ ๊ฐ, ๊ฐ >= self.pct_corr_threshold์ธ ๊ฒฝ์ฐ corrs.items()์ ๊ฐ}
~.conda\envs\evalml_test_1.0\lib\site-packages\pandas\core\series.py in corr(self, other, method, min_periods)
2252 if method in ["pearson", "spearman", "kendall"] ๋๋ callable(method):
2253
-> 2254 this.values, other.values, method=method, min_periods=min_periods
2255)
2256
~.conda\envs\evalml_test_1.0\lib\site-packages\pandas\core\nanops.py in _f( args, * kwargs)
67 ์๋:
68 np.errstate(invalid="ignore"):
---> 69 ๋ฐํ f( ์ธ์, * kwargs)
70 e๋ก ValueError ์ ์ธ:
71 # ๊ฐ์ฒด ๋ฐฐ์ด์ ๋ณํํ๊ณ ์ถ์ต๋๋ค
~.conda\envs\evalml_test_1.0\lib\site-packages\pandas\core\nanops.py in nancorr(a, b, method, min_periods)
1238
1239 ์ํ = get_corr_func(๋ฉ์๋)
-> 1240 ๋ฐํ f(a, b)
1241
1242
~.conda\envs\evalml_test_1.0\lib\site-packages\pandas\core\nanops.py in _pearson(a, b)
1254
1255 def _pearson(a, b):
-> 1256 ๋ฐํ np.corrcoef(a, b)[0, 1]
1257
1258 def _kendall(a, b):
corrcoef( args, * kwargs)์ <__array_function__ ๋ด๋ถ>
~.conda\envs\evalml_test_1.0\lib\site-packages\numpy\lib\function_base.py in corrcoef(x, y, rowvar, bias, ddof)
2524 warnings.warn('bias ๋ฐ ddof๋ ํจ๊ณผ๊ฐ ์์ผ๋ฉฐ ๋ ์ด์ ์ฌ์ฉ๋์ง ์์ต๋๋ค',
2525 ์ฌ์ฉ ์ค๋จ ๊ฒฝ๊ณ , ์คํ ์์ค=3)
-> 2526 c = cov(x, y, rowvar)
2527 ์๋:
2528 d = diag(c)
cov( args, * kwargs)์ <__array_function__ ๋ด๋ถ>
~.conda\envs\evalml_test_1.0\lib\site-packages\numpy\lib\function_base.py in cov(m, y, rowvar, bias, ddof, fweights, aweights)
2429 w *= ๋ฌด๊ฒ
2430
-> 2431 ํ๊ท , w_sum = ํ๊ท (X, ์ถ=1, ๊ฐ์ค์น=w, ๋ฐํ๋จ=์ฐธ)
2432 (์ฃผ)์์ด์น
2433
<__array_function__ ๋ด๋ถ> ํ๊ท ( args, * kwargs)
~.conda\envs\evalml_test_1.0\lib\site-packages\numpy\lib\function_base.py in average(a, axis, weights, ๋ฐํ๋จ)
391
๊ฐ์ค์น๊ฐ ์์์ธ ๊ฒฝ์ฐ 392:
--> 393 ํ๊ท = ํ๊ท (์ถ)
394 scl = avg.dtype.type
395 ๊ธฐํ:
~.conda\envs\evalml_test_1.0\lib\site-packages\numpy\core_methods.py in _mean(a, axis, dtype, out, keepdims)
152 if isinstance(ret, mu.ndarray):
153ํ
--> 154 ret, rcount, out=ret, ์บ์คํ
='์์ ํ์ง ์์', subok=False)
155 is_float16_result์ด๊ณ out์ด None์ด๋ฉด:
156ํ
TypeError: ์ง์๋์ง ์๋ ํผ์ฐ์ฐ์ ์ ํ/: 'str' ๋ฐ 'int'
์คํํ ๋ ์ฝ๊ฐ ๋ค๋ฅธ ์์ ์ ์ํํฉ๋๋ค. ์คํ ์ถ์ ์ผ๋ก ์คํจํ๋ ๋์ ๊ฒ์์ด ์คํ๋์ง๋ง ๋ชจ๋ ํ์ดํ๋ผ์ธ์ ๋ํ ๋ชจ๋ ์ ์๋ nan์ ๋๋ค.
๋ก๊ทธ ์์ค ๋ค์ค ํด๋์ค์ ๋ํ ์ต์ ํ.
์ ์๊ฐ ๋ฎ์์๋ก ์ข์ต๋๋ค.
์ต๋ 4๊ฐ์ ํ์ดํ๋ผ์ธ์ ๊ฒ์ํฉ๋๋ค.
ํ์ฉ๋๋ ๋ชจ๋ธ ํจ๋ฐ๋ฆฌ: random_forest, xgboost, linear_model, catboost
(1/4) ๋ชจ๋ ๊ธฐ์ค์ ๋ค์ค ํด๋์ค ๋ถ๋ฅ... ๊ฒฝ๊ณผ:00 :00
๊ต์ฐจ ๊ฒ์ฆ ์์
๋ชฉํ Log Loss Multiclass๋ฅผ ์ฑ์ ํ๋ ๋์ PipelineBase.score์ ์ค๋ฅ: ufunc 'isnan'์ ์
๋ ฅ ์ ํ์ ๋ํด ์ง์๋์ง ์์ผ๋ฉฐ ์
๋ ฅ์ ์บ์คํ
๊ท์น ''safe''์ ๋ฐ๋ผ ์ง์๋๋ ์ ํ์ผ๋ก ์์ ํ๊ฒ ๊ฐ์ ๋ณํ๋ ์ ์์ต๋๋ค.
๋ชฉํ Log Loss Multiclass๋ฅผ ์ฑ์ ํ๋ ๋์ PipelineBase.score์ ์ค๋ฅ: ufunc 'isnan'์ ์
๋ ฅ ์ ํ์ ๋ํด ์ง์๋์ง ์์ผ๋ฉฐ ์
๋ ฅ์ ์บ์คํ
๊ท์น ''safe''์ ๋ฐ๋ผ ์ง์๋๋ ์ ํ์ผ๋ก ์์ ํ๊ฒ ๊ฐ์ ๋ณํ๋ ์ ์์ต๋๋ค.
๋ชฉํ Log Loss Multiclass๋ฅผ ์ฑ์ ํ๋ ๋์ PipelineBase.score์ ์ค๋ฅ: ufunc 'isnan'์ ์
๋ ฅ ์ ํ์ ๋ํด ์ง์๋์ง ์์ผ๋ฉฐ ์
๋ ฅ์ ์บ์คํ
๊ท์น ''safe''์ ๋ฐ๋ผ ์ง์๋๋ ์ ํ์ผ๋ก ์์ ํ๊ฒ ๊ฐ์ ๋ณํ๋ ์ ์์ต๋๋ค.
๊ต์ฐจ ๊ฒ์ฆ ์๋ฃ - ํ๊ท ๋ก๊ทธ ์์ค ๋ฉํฐํด๋์ค: nan
(2/4) CatBoost ๋ถ๋ฅ๊ธฐ w/ Simple Imputer Elapsed:00 :00
๊ต์ฐจ ๊ฒ์ฆ ์์
๋ชฉํ Log Loss Multiclass๋ฅผ ์ฑ์ ํ๋ ๋์ PipelineBase.score์ ์ค๋ฅ: ufunc 'isnan'์ ์
๋ ฅ ์ ํ์ ๋ํด ์ง์๋์ง ์์ผ๋ฉฐ ์
๋ ฅ์ ์บ์คํ
๊ท์น ''safe''์ ๋ฐ๋ผ ์ง์๋๋ ์ ํ์ผ๋ก ์์ ํ๊ฒ ๊ฐ์ ๋ณํ๋ ์ ์์ต๋๋ค.
๋ชฉํ Log Loss Multiclass๋ฅผ ์ฑ์ ํ๋ ๋์ PipelineBase.score์ ์ค๋ฅ: ufunc 'isnan'์ ์
๋ ฅ ์ ํ์ ๋ํด ์ง์๋์ง ์์ผ๋ฉฐ ์
๋ ฅ์ ์บ์คํ
๊ท์น ''safe''์ ๋ฐ๋ผ ์ง์๋๋ ์ ํ์ผ๋ก ์์ ํ๊ฒ ๊ฐ์ ๋ณํ๋ ์ ์์ต๋๋ค.
๋ชฉํ Log Loss Multiclass๋ฅผ ์ฑ์ ํ๋ ๋์ PipelineBase.score์ ์ค๋ฅ: ufunc 'isnan'์ ์
๋ ฅ ์ ํ์ ๋ํด ์ง์๋์ง ์์ผ๋ฉฐ ์
๋ ฅ์ ์บ์คํ
๊ท์น ''safe''์ ๋ฐ๋ผ ์ง์๋๋ ์ ํ์ผ๋ก ์์ ํ๊ฒ ๊ฐ์ ๋ณํ๋ ์ ์์ต๋๋ค.
๊ต์ฐจ ๊ฒ์ฆ ์๋ฃ - ํ๊ท ๋ก๊ทธ ์์ค ๋ฉํฐํด๋์ค: nan
(3/4) XGBoost ๋ถ๋ฅ๊ธฐ w/ Simple Imputer Elapsed:00 :02
๊ต์ฐจ ๊ฒ์ฆ ์์
๋ชฉํ Log Loss Multiclass๋ฅผ ์ฑ์ ํ๋ ๋์ PipelineBase.score์ ์ค๋ฅ: ufunc 'isnan'์ ์
๋ ฅ ์ ํ์ ๋ํด ์ง์๋์ง ์์ผ๋ฉฐ ์
๋ ฅ์ ์บ์คํ
๊ท์น ''safe''์ ๋ฐ๋ผ ์ง์๋๋ ์ ํ์ผ๋ก ์์ ํ๊ฒ ๊ฐ์ ๋ณํ๋ ์ ์์ต๋๋ค.
๋ชฉํ Log Loss Multiclass๋ฅผ ์ฑ์ ํ๋ ๋์ PipelineBase.score์ ์ค๋ฅ: ufunc 'isnan'์ ์
๋ ฅ ์ ํ์ ๋ํด ์ง์๋์ง ์์ผ๋ฉฐ ์
๋ ฅ์ ์บ์คํ
๊ท์น ''safe''์ ๋ฐ๋ผ ์ง์๋๋ ์ ํ์ผ๋ก ์์ ํ๊ฒ ๊ฐ์ ๋ณํ๋ ์ ์์ต๋๋ค.
๋ชฉํ Log Loss Multiclass๋ฅผ ์ฑ์ ํ๋ ๋์ PipelineBase.score์ ์ค๋ฅ: ufunc 'isnan'์ ์
๋ ฅ ์ ํ์ ๋ํด ์ง์๋์ง ์์ผ๋ฉฐ ์
๋ ฅ์ ์บ์คํ
๊ท์น ''safe''์ ๋ฐ๋ผ ์ง์๋๋ ์ ํ์ผ๋ก ์์ ํ๊ฒ ๊ฐ์ ๋ณํ๋ ์ ์์ต๋๋ค.
๊ต์ฐจ ๊ฒ์ฆ ์๋ฃ - ํ๊ท ๋ก๊ทธ ์์ค ๋ฉํฐํด๋์ค: nan
(4/4) Random Forest Classifier w/ Simple Im... Elapsed:00 :02
๊ต์ฐจ ๊ฒ์ฆ ์์
๋ชฉํ Log Loss Multiclass๋ฅผ ์ฑ์ ํ๋ ๋์ PipelineBase.score์ ์ค๋ฅ: ufunc 'isnan'์ ์
๋ ฅ ์ ํ์ ๋ํด ์ง์๋์ง ์์ผ๋ฉฐ ์
๋ ฅ์ ์บ์คํ
๊ท์น ''safe''์ ๋ฐ๋ผ ์ง์๋๋ ์ ํ์ผ๋ก ์์ ํ๊ฒ ๊ฐ์ ๋ณํ๋ ์ ์์ต๋๋ค.
๋ชฉํ Log Loss Multiclass๋ฅผ ์ฑ์ ํ๋ ๋์ PipelineBase.score์ ์ค๋ฅ: ufunc 'isnan'์ ์
๋ ฅ ์ ํ์ ๋ํด ์ง์๋์ง ์์ผ๋ฉฐ ์
๋ ฅ์ ์บ์คํ
๊ท์น ''safe''์ ๋ฐ๋ผ ์ง์๋๋ ์ ํ์ผ๋ก ์์ ํ๊ฒ ๊ฐ์ ๋ณํ๋ ์ ์์ต๋๋ค.
๋ชฉํ Log Loss Multiclass๋ฅผ ์ฑ์ ํ๋ ๋์ PipelineBase.score์ ์ค๋ฅ: ufunc 'isnan'์ ์
๋ ฅ ์ ํ์ ๋ํด ์ง์๋์ง ์์ผ๋ฉฐ ์
๋ ฅ์ ์บ์คํ
๊ท์น ''safe''์ ๋ฐ๋ผ ์ง์๋๋ ์ ํ์ผ๋ก ์์ ํ๊ฒ ๊ฐ์ ๋ณํ๋ ์ ์์ต๋๋ค.
๊ต์ฐจ ๊ฒ์ฆ ์๋ฃ - ํ๊ท ๋ก๊ทธ ์์ค ๋ฉํฐํด๋์ค: nan
00:02 ์ดํ ๊ฒ์ ์๋ฃ
์ต๊ณ ์ ํ์ดํ๋ผ์ธ: ๋ชจ๋ ๊ธฐ์ค์ ๋ค์ค ํด๋์ค ๋ถ๋ฅ ํ์ดํ๋ผ์ธ
์ต๊ณ ์ ํ์ดํ๋ผ์ธ ๋ก๊ทธ ์์ค ๋ค์ค ํด๋์ค: nan
ToolId 3: AutoML ๋๊ตฌ ์๋ฃ
14.397์ด ๋ง์ ์๋ฃ
pandas ๋ฐ์ดํฐ ์ ํ์ ๋ ํ๊ฒฝ ๋ชจ๋์์ ๋์ผํฉ๋๋ค.
sepal.length float64
sepal.width float64
๊ฝ์.๊ธธ์ด float64
๊ฝ์ ํญ float64
ํด๋์ค ๊ฐ์ฒด
dtype: ๊ฐ์ฒด
Jupyter ๋ ธํธ๋ถ์ Python 3.7.3์ ์ฌ์ฉํ๊ณ ๋๊ตฌ๋ 3.6.8์ ๋๋ค.
@SydneyAyx : ์, 0.11.2์์ ๋ฐ์ดํฐ ๊ฒ์ฌ๋ฅผ ๋นํ์ฑํํ๋ ๋ฉ์ปค๋์ฆ์ ๋ณ๊ฒฝ
automl.search(..., data_checks=None, ...)
์ฌ์ฉ์ ๊ฐ์ด๋ ์น์ ์ ์ถ๊ฐํด์ผ ํฉ๋๋ค.
์๋ํด ๋ณด์๊ณ ๊ทธ๋๋ ๋ฌธ์ ๊ฐ ํด๊ฒฐ๋์ง ์์ผ๋ฉด ๋ค์ ์ด์ผ๊ธฐํด ๋ณด๊ฒ ์ต๋๋ค.
๋ฌธ์ ๊ฐ ํด๊ฒฐ๋๋ค๋ฉด #828์ด ์ด์ ์ ์ด๋ฅผ ์ถ์ ํ๊ธฐ ์ํด ์ ์ถ๋ ๊ฒ์ผ๋ก ๊ธฐ์ตํฉ๋๋ค. ๊ทธ๋ฆฌ๊ณ ์ฐ๋ฆฌ๋ ํ์ฌ ์งํ ์ค์ธ #645๋ฅผ ์ํด ๊ทธ๊ฒ์ ๋ซ์์ต๋๋ค. ๊ทธ๋ฌ๋ #645๊ฐ ์ค์ ๋ก ๊ทผ๋ณธ์ ์ธ ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ ์ ์์์ง ํ์ ํ ์ ์์ต๋๋ค. ๊ทธ๋ฌ๋ ์ด์ด๋์.
์, ํ์๋ผ์ธ์ ๋ํด ํผ๋์ค๋ฌ์ํ์ต๋๋ค. #932๊ฐ ์ง๋ ์ฃผ์ ๋ณํฉ๋์ด ์ด ๋ฌธ์ ๋ฅผ ์์ ํ์ต๋๋ค! ๋๋ ์ด๊ฒ์ ํ์ธํ๊ธฐ ์ํด #828์์ ์์ฑํ ์ฌ์๊ธฐ๋ฅผ ๋ฐฉ๊ธ ์คํํ์ต๋๋ค. ๋ค์ ๋ฆด๋ฆฌ์ค( 0.12.0
, ๋ค์ ํ์์ผ)์๋ ์์ ์ฌํญ์ด ํฌํจ๋ฉ๋๋ค.
๋๋ ์ด๊ฒ์ ์ด์ด๋๊ณ ์ฐ๋ฆฌ๊ฐ ๊ทธ ๋ฆด๋ฆฌ์ค๋ฅผ ๋ฐํํ ๋ ๊ทธ๊ฒ์ ๋ซ์ ๊ฒ์ ๋๋ค.
๋ฐฉ๊ธ ๋๊ฐ v0.12.0
์์ ์์ ๋์์ต๋๋ค!