DecisionTreeClassifier ๋ฐ RandomForestClassifier์ min_weight_fraction_leaf
๋งค๊ฐ ๋ณ์๋ฅผ ์๋ชป ์ฌ์ฉํ๊ณ ์์ผ๋ฉฐ ๋ค๋ฅธ ์ฌ๋๋ค์ด ์ ์ ๊ฐ์ ์ผ์ํ๊ณ ์์ ๊ฐ๋ฅ์ฑ์ด ๋์ต๋๋ค.
์๋ฅผ ๋ค์ด DecisionTreeClassifier์ min_weight_fraction_leaf
์ ๋ํ ๋ฌธ์๋ ๋ค์๊ณผ ๊ฐ์ต๋๋ค.
๋ฆฌํ ๋ ธ๋์ ์์ด์ผํ๋ ์ ๋ ฅ ์ํ์ ์ต์ ๊ฐ์ค์น ๋น์จ์ ๋๋ค.
๋ฌธ์๊ฐ "์
๋ ฅ ์ํ์ ๊ฐ์ค ๋ถ๋ถ"์ด ๋ฌด์์ ์๋ฏธํ๋์ง ์ ๋ง ๋ถ๋ถ๋ช
ํ์ต๋๋ค. ์ฒ์์๋ ํด๋์ค์ ํฌ๊ธฐ ๋๋ class_weight
์ํด ์ ๊ณต๋ ๊ฐ์ ๊ธฐ๋ฐ์ผ๋ก ํ ๊ฐ์ค์น๋ผ๊ณ ์๊ฐํ์ต๋๋ค. ๋งค๊ฐ ๋ณ์ ์ค๋ช
์ ์ฝ๊ฐ ๋ณ๊ฒฝํ๋ฉด์ด ํผ๋์ ํด๊ฒฐํ ์ ์๋ค๊ณ ์๊ฐํฉ๋๋ค. ์๋ง๋
fit () ๋ฉ์๋์์ sample_weight์ ์ํด ๊ฐ์ค์น๊ฐ ๊ฒฐ์ ๋๋ ๋ฆฌํ ๋ ธ๋์ ์์ด์ผํ๋ ์ ๋ ฅ ์ํ์ ์ต์ ๊ฐ์ค์น ๋น์จ์ ๋๋ค.
๋ํ min_weight_fraction_leaf
๋ sample_weight
๊ฐ fit()
ํธ์ถ์ ์ ๊ณต๋ ๊ฒฝ์ฐ์๋ง ์ ์ฉ๋ฉ๋๋ค. ๊ฒฝ์ฐ sample_weight
์ ๋ํ ํธ์ถ์ ์ ๊ณต๋์ง fit()
, min_weight_fraction_leaf
์๋์ผ๋ก ๋ฌด์๋ฉ๋๋ค. ์ฌ๊ธฐ์๋ min_weight_fraction_leaf
๊ฐ ๋ชจ๋ ์ํ์ ๋์ผํ ๊ฐ์ค์น๊ฐ ์ ์ฉ๋๋ค๋ ๊ฐ์ ํ์ ์ฌ์ ํ ์ ์ฉ๋์ด์ผํ๊ฑฐ๋ sample_weight
๊ฐ ์ ๊ณต๋์ง ์์๊ธฐ ๋๋ฌธ์ min_weight_fraction_leaf
๊ฐ ์ฌ์ฉ๋์ง ์๋๋ค๋ ๊ฒฝ๊ณ ๊ฐ ์ฃผ์ด์ ธ์ผํ๋ค๊ณ ์๊ฐํฉ๋๋ค.
Darwin-15.5.0-x86_64-i386-64 ๋นํธ
Python 3.5.1 | Continuum Analytics, Inc. | (๊ธฐ๋ณธ๊ฐ, 2015 ๋
12 ์ 7 ์ผ, 11:24:55)
[GCC 4.2.1 (Apple Inc. ๋น๋ 5577)]
NumPy 1.11.0
SciPy 0.17.1
Scikit-Learn 0.17.1
๋ํ ๋ด๊ฐ ์ ์ํ ๋ณ๊ฒฝ ์ฌํญ์ ์์ฑํ๊ณ ์ถ์ง๋ง (ํด๋น ์ฌํญ์ด ์๋ค๊ณ ํ๋จ๋๋ฉด) ์คํ ์์ค ๋ผ์ด๋ธ๋ฌ๋ฆฌ์ ๊ธฐ์ฌํ ๊ฒฝํ์ด ๊ฑฐ์ ์์ต๋๋ค. ๋๊ตฐ๊ฐ ๋๋ฅผ ๋์ ์ค ์ ์๋ค๋ฉด ์ฝ๊ฐ์ ์ ์ก๊ธฐ๊ฐ ํ์ํ ์ ์์ต๋๋ค.
PR์ ์ ์ถํ์ญ์์ค
2016 ๋ 6 ์ 29 ์ผ 06:09์ Ben [email protected] ์ ๋ค์๊ณผ ๊ฐ์ด ์ผ์ต๋๋ค.
๊ธฐ์
๋๋ min_weight_fraction_leaf ๋งค๊ฐ ๋ณ์๋ฅผ ์ฌ์ฉํ๊ณ ์์ต๋๋ค.
DecisionTreeClassifier ๋ฐ RandomForestClassifier๊ฐ ์๋ชป๋์๋ค๊ณ ์๊ฐํฉ๋๋ค.
๋ค๋ฅธ ์ฌ๋๋ค๋ ๋์ ๊ฐ์ ์ผ์ํ๊ณ ์์ ๊ฐ๋ฅ์ฑ์ด ๋์ต๋๋ค.์๋ฅผ ๋ค์ด, min_weight_fraction_leaf์ ๋ํ ๋ฌธ์๋
DecisionTreeClassifier
http://scikit-learn.org/stable/modules/generated/sklearn.tree.DecisionTreeClassifier.html
๋งํ๋ค์ ๋ ฅ ์ํ์ ์ต์ ๊ฐ์ค ๋น์จ์
๋ฆฌํ ๋ ธ๋.๋ฌธ์๊ฐ "๊ฐ์ค์น ๋น์จ"์ด ์๋ฏธํ๋ ๋ฐ๊ฐ
์ ๋ ฅ ์ํ "์ ๋๋ค. ์ฒ์์๋ ์ด๊ฒ์ด
ํด๋์ค์ ํฌ๊ธฐ ๋๋ class_weight์ ์ํด ์ ๊ณต๋ ๊ฐ. ๋๋ ์ฝ๊ฐ์ ์๊ฐ
๋งค๊ฐ ๋ณ์ ์ค๋ช ์ ๋ณ๊ฒฝํ๋ฉด ์ด๋ฌํ ํผ๋์ ํด๊ฒฐํ ์ ์์ต๋๋ค. ํน์
๋ญ๊ฐ์ ๋ ฅ ์ํ์ ์ต์ ๊ฐ์ค ๋น์จ์
fit () ๋ฉ์๋์์ sample_weight์ ์ํด ๊ฐ์ค์น๊ฐ ๊ฒฐ์ ๋๋ ๋ฆฌํ ๋ ธ๋์ ๋๋ค.๋ํ min_weight_fraction_leaf๋ ๋ค์ ๊ฒฝ์ฐ์๋ง ์ ์ฉ๋ฉ๋๋ค.
sample_weight๋ fit () ํธ์ถ์์ ์ ๊ณต๋ฉ๋๋ค. sample_weight๊ฐ ์๋ ๊ฒฝ์ฐ
fit () ํธ์ถ์์ ์ ๊ณต๋๋ min_weight_fraction_leaf๋ ์กฐ์ฉํ
๋ฌด์๋ฉ๋๋ค. ์ฌ๊ธฐ์์๋ min_weight_fraction_leaf๊ฐ ์ฌ์ ํ ์๋์ ์ ์ฉ๋์ด์ผํ๋ค๊ณ ์๊ฐํฉ๋๋ค.
๋ชจ๋ ์ํ์ ๊ฐ์ค์น๊ฐ ๋์ผํ๊ฑฐ๋ ๊ฒฝ๊ณ ๊ฐ ์์ด์ผํ๋ค๋ ๊ฐ์
min_weight_fraction_leaf๋ sample_weight ์ดํ๋ก ์ฌ์ฉ๋์ง ์์ต๋๋ค.
์ ๊ณต๋์ง ์์์ต๋๋ค.
๋ฒ์ Darwin-15.5.0-x86_64-i386-64 ๋นํธ
Python 3.5.1 | Continuum Analytics, Inc. | (๊ธฐ๋ณธ๊ฐ, 2015 ๋ 12 ์ 7 ์ผ, 11:24:55)
[GCC 4.2.1 (Apple Inc. ๋น๋ 5577)]
NumPy 1.11.0
SciPy 0.17.1
Scikit-Learn 0.17.1โ
์ด ์ค๋ ๋๋ฅผ ๊ตฌ๋ ํ๊ธฐ ๋๋ฌธ์์ด ๋ฉ์์ง๊ฐ ์ ์ก๋์์ต๋๋ค.
์ด ์ด๋ฉ์ผ์ ์ง์ ๋ต์ฅํ๊ณ GitHub์์ ํ์ธํ์ธ์.
https://github.com/scikit-learn/scikit-learn/issues/6945 , ๋๋ ์์๊ฑฐ
์ค
https://github.com/notifications/unsubscribe/AAEz6xE2BmEJHo6hGgTWoigsPutoD4_nks5qQX9zgaJpZM4JAe96
.
min_weight_fraction_leaf
๊ฐ ์ค์ ๋๊ณ sample_weights
์ ๊ณต๋์ง ์์ผ๋ฉด ์ค๋ฅ๊ฐ ๋ฐ์ํ๊ฑฐ๋ ๊ท ์ผ ํ ๊ฐ์ค์น๋ฅผ ๊ฐ์ ํด์ผํ๋ค๊ณ ์๊ฐํฉ๋๋ค. ์ด ๊ฒฝ์ฐ min_samples_leaf
์ ์ฝ๊ฐ ์ค๋ณต๋์ง๋ง ๊ท ์ผ ํ ๊ฐ์ค์น๊ฐ ์ฌ์ ํ ๋ ๋ซ๋ค๊ณ ๊ฐ์ ํฉ๋๋ค.
๋๋ ์ด๊ฒ์ด min_samples_leaf
์ ๋น์ทํ๋ค๊ณ ์๊ฐํฉ๋๋ค. ๊ฐ ๋ฆฌํ ๋
ธ๋์์ ์ ๋ ์ํ ์๋ฅผ ์๊ตฌํ๋ ๋์ min_weight_fraction_leaf
๋ ๊ฐ ๋ฆฌํ์์ ์ํ์ ์ผ๋ถ (๋๋ ๊ฐ์ค์น)๋ฅผ ์๊ตฌํ๋ ์ต์
์ ์ ๊ณตํฉ๋๋ค. ๋ชจ๋ธ์ด ์ํ์ ๊ฐ์ค์น๋ฅผ ์ฌ์ฉํ๋์ง ์ฌ๋ถ๋ class_weight
์ ๋ฐ๋ผ ๋ค๋ฆ
๋๋ค.
๊ฐ์ฅ ์ ์ฉํ ๋๊ธ
min_weight_fraction_leaf
๊ฐ ์ค์ ๋๊ณsample_weights
์ ๊ณต๋์ง ์์ผ๋ฉด ์ค๋ฅ๊ฐ ๋ฐ์ํ๊ฑฐ๋ ๊ท ์ผ ํ ๊ฐ์ค์น๋ฅผ ๊ฐ์ ํด์ผํ๋ค๊ณ ์๊ฐํฉ๋๋ค. ์ด ๊ฒฝ์ฐmin_samples_leaf
์ ์ฝ๊ฐ ์ค๋ณต๋์ง๋ง ๊ท ์ผ ํ ๊ฐ์ค์น๊ฐ ์ฌ์ ํ ๋ ๋ซ๋ค๊ณ ๊ฐ์ ํฉ๋๋ค.