Scikit-learn: ๊ณต์„  ๋ณ€์ˆ˜ ์‚ญ์ œ ์ง€์› ์ถ”๊ฐ€

์— ๋งŒ๋“  2020๋…„ 02์›” 03์ผ  ยท  3์ฝ”๋ฉ˜ํŠธ  ยท  ์ถœ์ฒ˜: scikit-learn/scikit-learn

ํ™œ์„ฑํ™”ํ•˜๋ ค๋Š” ์›Œํฌํ”Œ๋กœ ์„ค๋ช…

๋ฐ์ดํ„ฐ์˜ ๊ณต์„ ์„ฑ(์ •ํ™•ํ•œ ๊ณต์„ ์„ฑ)์„ ์ œ๊ฑฐํ•  ์ˆ˜ ์žˆ๋Š” ๊ธฐ๋Šฅ์„ LinearRegression์— ์ถ”๊ฐ€ํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๊นŒ?

์ œ์•ˆ๋œ ์†”๋ฃจ์…˜ ์„ค๋ช…

๋‚ด ์ œ์•ˆ์€ ์‚ฌ์šฉ์ž๊ฐ€ ์„ค์ •ํ•œ ๊ฒฝ์šฐ remove_collinearity์™€ ๊ฐ™์€ ์ถ”๊ฐ€ ์ธ์ˆ˜๋ฅผ ์ถ”๊ฐ€ํ•˜๋Š” ๊ฒƒ์ž…๋‹ˆ๋‹ค. ๊ทธ๋Ÿฌ๋ฉด ํ–‰๋ ฌ์˜ ์ˆœ์œ„๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ ์ •ํ™•ํ•œ ๊ณต์„  ๋ณ€์ˆ˜๋ฅผ ์ œ๊ฑฐํ•˜๊ฑฐ๋‚˜ VIF๋ฅผ ์‚ฌ์šฉํ•˜์—ฌ ๊ณต์„  ๋ณ€์ˆ˜๋ฅผ ์ œ๊ฑฐํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ์ด๋ ‡๊ฒŒ ํ•˜๋ฉด Ridge ํšŒ๊ท€๋ฅผ ์‚ฌ์šฉํ•˜๋Š” ๋Œ€์‹  ์‹œ๊ฐ„์„ ์ ˆ์•ฝํ•  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

New Feature

๊ฐ€์žฅ ์œ ์šฉํ•œ ๋Œ“๊ธ€

์ด๊ฒƒ์€ ์—ฌ๊ธฐ์—์„œ ๊ธฐ๋Šฅ ์„ ํƒ ๋ณ€ํ™˜๊ธฐ๋กœ ์ž‘์—… ์ค‘์ž…๋‹ˆ๋‹ค: https://github.com/scikit-learn/scikit-learn/pull/14698

๋ชจ๋“  3 ๋Œ“๊ธ€

์ด๊ฒƒ์„ sklearn.feature_selection ์˜ ์ „์ฒ˜๋ฆฌ๊ธฐ๋กœ ๋‘๋Š” ๊ฒƒ์ด ๋” ๋‚˜์„ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ๊ทธ๋ ‡๊ฒŒ ํ•˜๋ฉด ์—ฌ๋Ÿฌ ์ถ”์ •๊ธฐ์— ์ ์šฉ๋  ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค. ์ •ํ™•ํ•œ ๊ณต์„ ์„ฑ์ด ์ž์ฃผ ๋ฐœ์ƒํ•˜๋Š” ๋ฌธ์ œ์ธ์ง€๋Š” ์ž˜ ๋ชจ๋ฅด๊ฒ ์Šต๋‹ˆ๋‹ค. ์‚ฌ์šฉ์ž ์ •์˜ ๊ธฐ๋Šฅ ์ƒ๊ด€ ์ž„๊ณ„๊ฐ’์ด ์žˆ๋Š” ์ถ”์ •๊ธฐ์ผ๊นŒ์š”?

๊ธฐ๋Šฅ ํด๋Ÿฌ์Šคํ„ฐ๋ง๊ณผ ๋‹ฌ๋ฆฌ ์ž์ฃผ ์ˆ˜ํ–‰๋˜๋Š” ์ž‘์—…์ธ์ง€ ์ž˜ ๋ชจ๋ฅด๊ฒ ์Šต๋‹ˆ๋‹ค. ํ›„์ž๋Š” cluster.FeatureAgglomeration์„ ์‚ฌ์šฉํ•˜์—ฌ scikit-learn์—์„œ ์ˆ˜ํ–‰ํ•  ์ˆ˜ ์žˆ์ง€๋งŒ ํ•„์š”ํ•œ n_clusters๊ฐ€ ์žˆ๋Š” ์ธํ„ฐํŽ˜์ด์Šค๊ฐ€ ์ด์ƒ์ ์ด์ง€ ์•Š์„ ์ˆ˜ ์žˆ์Šต๋‹ˆ๋‹ค.

cc @glemaitre

์ด๊ฒƒ์€ ์—ฌ๊ธฐ์—์„œ ๊ธฐ๋Šฅ ์„ ํƒ ๋ณ€ํ™˜๊ธฐ๋กœ ์ž‘์—… ์ค‘์ž…๋‹ˆ๋‹ค: https://github.com/scikit-learn/scikit-learn/pull/14698

์ •๋ง ๊ฐ์‚ฌํ•ฉ๋‹ˆ๋‹ค. ์ด ๋ฌธ์ œ๋ฅผ https://github.com/scikit-learn/scikit-learn/issues/13405 ์˜ ๋ณต์ œ๋ณธ์œผ๋กœ ์‚ฌํ•ญ์ด ์žˆ์œผ๋ฉด ๋ณด๋‚ด ์ฃผ์‹ญ์‹œ์˜ค.

์ด ํŽ˜์ด์ง€๊ฐ€ ๋„์›€์ด ๋˜์—ˆ๋‚˜์š”?
0 / 5 - 0 ๋“ฑ๊ธ‰