์ด ์ค๋ ๋๋ 0.90 ๋ฆด๋ฆฌ์ค์ ํฌํจ๋ ๋ชจ๋ ์ข์ ๊ฒ๋ค์ ์ถ์ ํ๊ธฐ ์ํ ๊ฒ์ ๋๋ค. ์ถ์ ์์ ์ผ(~2019๋ 5์ 1์ผ~ Spark 2.4.3์ด ๋์ค๋ ๋๋ก)์ด ๊ฐ๊น์์ง๋ฉด ์ ๋ฐ์ดํธ๋ฉ๋๋ค.
gpu_hist
๋ํ ์ถ๊ฐ ์ต์ ํ(#4248, #4283)hist
์ ๋ํ ์ถ๊ฐ ์ต์ ํ(#4310)https://github.com/dmlc/xgboost/pull/4349 ๋ฐ https://github.com/dmlc/xgboost/pull/4377 ๊ณผ ๊ฐ์ ์ฃผ์ ๋ณ๊ฒฝ ์ฌํญ์ด ์์ ์์ ์ด๋ฏ๋ก
๋ฒ์ ์ 0.9๋ก ์ฌ๋ ค ๋ณผ๊น์?
@CodingCat ๋ฌผ๋ก , ๋ธ๋ ์ดํน ์ฒด์ธ์ง๊ฐ ์ค์ํ๋ค๋ฉด 0.90๊น์ง
ํ์คํ,
* Spark 2.3 is reaching its end-of-life in a few months
์ด์ ๋ํ ๊ณต์ ์ ์ฅ์ด ์์ต๋๊น? ๊ทธ๋ค์ 1์์ 2.2.3์, 2์์ 2.3.3์ ์ถ์ํ์ต๋๋ค. ๊ณต๊ธ์ ์ฒด(MapR)๋ ์ฌ์ ํ 2.3.1์ ์ ๊ณตํฉ๋๋ค.
@alexvorobiev https://github.com/dmlc/xgboost/issues/4350 , databricks ์์ @srowen์ผ๋ก ํ์ธํ ์ ์์ต๋๋ค.
์ด๊ฒ์ Databricks์ ๋ํ ์ง๋ฌธ์ด ์๋๋ผ Spark ํ๋ก์ ํธ์ ๋ํ ์ง๋ฌธ์ ๋๋ค. ๊ธฐ๋ณธ ์ ์ฑ ์ 18๊ฐ์ ๋์ ๋ถ๊ธฐ์ ๋ํ ์ ์ง ๊ด๋ฆฌ ๋ฆด๋ฆฌ์ค์ ๋๋ค. https://spark.apache.org/versioning-policy.html ๊ทธ๋ฌ๋ฉด 2.3.x๊ฐ ์ฝ 7์์ EOL์ ํฌํจ๋๋ฏ๋ก ์ดํ 2.3.x ๋ฆด๋ฆฌ์ค๊ฐ ๋ ๋์ฌ ๊ฒ์ผ๋ก ์์ํ์ง ์์ต๋๋ค. OSS ํ๋ก์ ํธ์์.
@srowen ๊ฐ์ฌํฉ๋๋ค!
@srowen @CodingCat @alexvorobiev Scala 2.12 / 2.13 ์ง์ ๊ฐ๋ฅ์ฑ๋ ๋
ผ์ํฉ์๋ค. ํ์ฌ XGBoost4J๋ Scala 2.11์ฉ์ผ๋ก ์ปดํ์ผ๋ฉ๋๋ค.
https://github.com/dmlc/xgboost/blob/2c61f02add72cce8f6dc1ba87e016e3c5f0b7ea6/jvm-packages/pom.xml#L38 -L39
์ฌ์ฉ์ ๋ Scala 2.11์ฉ์ผ๋ก ์ปดํ์ผ๋ XGBoost4J JAR์ด Scala 2.12์ ๋ฐ์ด๋๋ฆฌ ํธํ๋์ง ์๋๋ค๊ณ
์, 2.11 / 2.12๋ ์ฌ์ ํ ๋ฐ์ด๋๋ฆฌ ํธํ๋์ง ์์ผ๋ฉฐ Spark์๋ ๋ ๊ฐ์ง ๋ฐฐํฌํ์ด ์์ต๋๋ค. ๋ ๋ค 2.4.x์์ ์ง์๋์ง๋ง 2.4.x์์๋ 2.12๊ฐ ๊ธฐ๋ณธ๊ฐ์ ๋๋ค. 3.0์ Scala 2.11 ์ง์์ ์ค๋จํฉ๋๋ค.
์ฝ๋๋ฅผ ๋ง์ด ๋ณ๊ฒฝํ๊ฑฐ๋ ๋ณ๊ฒฝํ๋ ๊ฒ์ด ์๋๋ผ ๋ ๊ฐ์ง ๋ฒ์ ์ ์ปดํ์ผํ๋ ๋ฌธ์ ์ผ ์ ์์ต๋๋ค. 2.12์์ ์ฌ๋ฏธ์๋ ์ค๋ฅ๊ฐ ๋ฐ์ํ๋ฉด Spark๋ฅผ ์ ๋ฐ์ดํธํ ๋ ์ด๋ฌํ ๋ฌธ์ ๋ฅผ ๋ง์ด ๋ณด์๊ธฐ ๋๋ฌธ์ ์๋ ค์ฃผ์ญ์์ค.
2.13์ ์ฌ์ ํ โโGA๊ฐ ์๋๋ฉฐ 2.11->2.12๋ณด๋ค 2.12->2.13์์ ๋ ์์ ๋ณ๊ฒฝ์ด ๋ ๊ฒ์ด๋ผ๊ณ ์๊ฐํฉ๋๋ค(์ฌ๊ธฐ์ ํฐ ์ฐจ์ด์ ์ ๋๋ค์ ํํ์ด ์์ ํ ๋ค๋ฅด๋ค๋ ๊ฒ์ ๋๋ค).
@hcho3 @alexvorobiev ์ ํ๊ทธ๋ฅผ ์ง์ ํ๊ณ ์ถ์์ต๋๊น?
@alexeygrigorev ์ฃ์กํฉ๋๋ค.
์ ์ผํ ๋ฌธ์ ๋ maven์์ xgboost์ ์ํฐํฉํธ ์ด๋ฆ, xgboost4j-spark => xgboost4j-spark_2.11/xgboost4j-spark_2.12(์: spark https://mvnrepository.com/artifact/)์ ํ๊ธฐ์ ์ธ ๋ณ๊ฒฝ์ ๋์ ํด์ผ ํ๋ค๋ ๊ฒ์ ๋๋ค
์๋
ํ์ธ์, @srowen though 2.12 is the default from here on in 2.4.x
, ๋๋ branch-2.4 pom.xml์ ํ์ธํ์ต๋๋ค. ํ๋กํ scala-2.12๋ฅผ ์ง์ ํ์ง ์์ผ๋ฉด ์ฌ์ ํ 2.11 ๋น๋๋ฅผ ์ป์ต๋๋ค.
0.9x์์ 2.12๋ง ์ง์ํ๋๋ก ์ ํํ ์ ์์ผ๋ฉฐ, ๊ทธ๋ฌ๋ฉด ์ํฐํฉํธ ์ด๋ฆ์ ์ ๋ฏธ์ฌ๋ฅผ ๋ถ์ผ ํ์๊ฐ ์์ต๋๋ค. ๋ ๋ค ์ง์ํ๋ค๋ฉด ๋ถํํ๋ ์ํฐํฉํธ ์ด๋ฆ์ ๋ณ๊ฒฝํ๊ณ _2.11 ๋ฐ _2.12 ๋ฒ์ ์ ์ฌ์ฉํ๊ณ ์ถ์ ๊ฒ์ ๋๋ค.
์, ๊ธฐ๋ณธ Spark 2.4.x ๋น๋๋ 2.11์ฉ์
๋๋ค. -Pscala-2.12
๋ 2.12 ๋น๋๋ฅผ ๊ฐ์ ธ์ต๋๋ค.
๊ฐ์ฌํฉ๋๋ค. ์ต์ํ ๋ค์ ๋ฒ์ ์์๋ 2.12๋ฅผ ์ง์ํ๋ ๋ฐ ๋ณด์์ ์ผ ๊ฒ์ ๋๋ค.
๋ด๊ฐ ์๋ ํ ๋๋ถ๋ถ์ Spark ์ฌ์ฉ์๋ ์ด์ ๋ฒ์ ์ Spark๋ฅผ ๋ฐ๋ฅด๋ ๋ฐ ์ต์ํ๊ธฐ ๋๋ฌธ์ ์ฌ์ ํ 2.11์ ์ฌ์ฉํ๊ณ ์์ต๋๋ค.
2.12 ์ง์์ ๋์ ํ๊ธฐ ์ํ ๋ชจ๋ ํ ์คํธ๋ฅผ ํต๊ณผํ ๋์ญํญ์ด ์์ ์ ์์ต๋๋ค.
1.0 ๋ฆด๋ฆฌ์ค์์ 2.12 + 2.11 ๋๋ 2.12๋ฅผ ์ง์ํ๋๋ก ์ ํํ๊ฒ ์ต๋๋ค...
@hcho3 ์ฐธ๊ณ ๋ก ์ ํ๋ ๋์ญํญ์ ๊ฐ์ํ ๋ ๋ก๋๋งต์์ ๋ฐ์ง ๋งคํธ๋ฆญ์ค ์ง์์ ์ ๊ฑฐํ์ต๋๋ค.
@hcho3 ์๊ฐ์ด https://github.com/dmlc/dmlc-core/pull/514 ๋ฅผ ๋ด์ฃผ ์๊ฒ ์ต๋๊น? ๋ค์ ๋ฆด๋ฆฌ์ค๊ฐ ํํธํ๊ธฐ ์ ์ ๋ณํฉํ ๊ฐ์น๊ฐ ์์ต๋๋ค.
@trivialfis ๋ด์ค๊ฒ
@CodingCat Spark 2.4.1 ๋ฐ 2.4.2์ ๋ฌธ์ ๊ฐ ์์ผ๋ฏ๋ก ๋ฆด๋ฆฌ์ค ๋ ์ง๋ฅผ ๋ค๋ก
@srowen Spark 2.4.3์ด ์ธ์
์กฐ๊ธ ๋ฆ์ถฐ๋ ๊ด์ฐฎ์ ๊ฒ ๊ฐ์์
์ข์, Spark 2.4.3์ด ๋์ฌ ๋๊น์ง ๊ธฐ๋ค๋ฆฌ์
Spark 2.3.x์ ๋ง์ง๋ง 0.83 ๋ฆด๋ฆฌ์ค๊ฐ ์์ต๋๊น?
@CodingCat 0.83์๋ #4377 ์ง์ ์ ๋ชจ๋ ์ปค๋ฐ์ด ํฌํจ๋ ๋ ๊ฐ์ ๋ณ๋ ฌ ๋ฆด๋ฆฌ์ค 0.83๊ณผ 0.90์
ํ์ง๋ง ํ ๊ฐ์ง ๋ฌธ์ ๋ ๊ฒฐ์ธก๊ฐ ์ฒ๋ฆฌ์ ๋ํ ์ฌ์ฉ์ ๊ฒฝํ์ ๋๋ค. ๋ชจ๋ ์ฌ๋์ด Spark 2.4.x๋ฅผ ์ฌ์ฉํ๋๋ก ๊ฐ์ ํ๋ฉด ๋๋ฝ๋ ๊ฐ์ด ์๋ง์ด ๋๋ ๊ฒ์ ๋ฐฉ์งํ ์ ์์ต๋๋ค(#4349์ ๋๊ธฐ๊ฐ ๋ ๋ฌธ์ ).
@hcho3 ๋๋ pkgs์ ๊ฐ์ฉ์ฑ์์ ๋ค๋ฅธ ๋ฒ์ ์ ๋ถ์ผ์น์ ๋ํด ์ฝ๊ฐ ์ฐ๋ คํ๊ณ ์์ต๋๋ค.
hey, I find 0.83 in maven so I upgrade our Spark pkg, but I cannot use 0.83 in notebook when attempting to explore my new model setup with a small amount of data with python pkg?
์ ๊ฐ์ ์ง๋ฌธ์ ์์ํ ์ ์์ต๋๋ค.
0.8x ๋ธ๋์น์ ๋ํ ์ ์ฒด ์ ์ง ๊ด๋ฆฌ ๋ฆด๋ฆฌ์ค๊ฐ ์๊ฑฐ๋ ์๋ ๊ฒ์ด ์ข์ต๋๋ค.
@CodingCat ์์ ์ต๋๋ค. ๋ชจ๋ ํจํค์ง์ ๋ํด ์ผ๊ด๋ ๋ฆด๋ฆฌ์ค๋ฅผ ์ํํ ๊ฒ์ ๋๋ค. ๊ทธ๋ ๋ค๋ฉด 0.83 ๋ฆด๋ฆฌ์ค์ ๋ํด ์ด๋ป๊ฒ ์๊ฐํ์ญ๋๊น? ์ฐ๋ฆฌ๋ ๊ทธ๊ฒ์ํด์ผํฉ๋๊น?
@CodingCat ์ฌ์ค, ์ด๊ฒ์ ๋ค๋ฅธ ๋ฉ์ธํ ์ด๋๋ฅผ ์ํ ์์ ์ ์์ฑํ ๊ฒ์ ๋๋ค, ์ฐ๋ฆฌ๋ ๊ทธ๋ค์๊ฒ ๋จผ์ ๋ฌผ์ด์ผ ํ ๊ฒ์ ๋๋ค
๊ฐ์ธ์ ์ธ ๊ฒฌํด์ ์งง์ ๋๋ต์ ์ด๋ก ์ yes ์ด์ง๋ง ์ปค๋ฐ ์ง์ ์ ์๋ฅด๋ ๊ฒ ์ด์์ผ ์ ์์ต๋๋ค(๋น์ ์ด ๋งํ๋ฏ์ด ๋ค๋ฅธ ์ฌ๋๋ค์ ์ํ ์์ ๋ ์์ฑํ ๊ฒ์ ๋๋ค) (๊ทธ๋ฌ๋ ์ ํ๋ ์ง์ญ์ฌํ์ ์์...)
๋ค์์ 0.8x์ ๊ฐ์ ์ ์ง ๊ด๋ฆฌ ๋ฆด๋ฆฌ์ค์ ๋ํด ์ด๋ป๊ฒ ์๊ฐํด์ผ ํ๋์ง์ ๋ํ 2์ผํธ์ ๋๋ค.
์ ์ง ๊ด๋ฆฌ ๋ฆด๋ฆฌ์ค๊ฐ ์๋ ์ด์ ๋ https://github.com/dmlc/xgboost/commit/2d875ec0197d5a83e7d585daf472b8201aa97c5667 ๋ฐ https://github.com/dmlc/xgboost/9877f453bboost/99c05 ์ ๊ฐ์ ์ค์ํ ๋ฒ๊ทธ ์์ ์ ๊ฐ์ ธ์ค๊ธฐ ์ํจ์ ๋๋ค.
๋ค๋ฅธ ํํธ์ผ๋ก, ๋ชจ๋ ์ปค๋ฏธํฐ๋ฅผ ์์ง์ํค๋ ๊ฒ ์ธ์ ์ปค๋ฎค๋ํฐ๋ฅผ ์ง์ ๊ฐ๋ฅํ๊ฒ ๋ง๋ค๊ธฐ ์ํด ์ฃผ๊ธฐ์ ์ผ๋ก ์ด์ ๋ฒ์ ์ ์ง์์ ์ค๋จํด์ผ ํฉ๋๋ค.
๊ธฐ๋ฅ ๋ฆด๋ฆฌ์ค(0.8์์ 0.9๋ก ์ด๋)๋ฅผ ํตํด ํ์ ๊ณผ ๊ฐ์ ์ ์ฌ์ฉ์์๊ฒ ์ ๊ณตํด์ผ ํฉ๋๋ค.
0.83์ผ๋ก ๊ฐ๊ธฐ๋ก ๊ฒฐ์ ํ ๊ฒฝ์ฐ @RAMitchell @trivialfis์ ์๊ฒฌ๋ ์์งํ๊ณ ํ๋จ์ ํตํด ์ค์ํ(์ ํ์ฑ์ ๋ํ ์ถ๊ฐ) ๋ฒ๊ทธ ์์ ์ฌํญ์ด ์๋์ง ํ์ธํด์ผ ํฉ๋๋ค.
๊ทธ๋ฐ ๋ค์ 0.82๋ฅผ ๊ธฐ๋ฐ์ผ๋ก 0.83 ๋ถ๊ธฐ๋ฅผ ๋ง๋ค์ด ์ปค๋ฐ์ ์ ํํฉ๋๋ค. ์ค์ ๋ก ๋ง์ ์์ ์ด ํ์ํฉ๋๋ค.
๋ด๊ฐ ์ฌ๋ฐ๋ฅด๊ฒ ์ดํดํ๋ค๋ฉด 0.9๋ ์ด์ ๋ฒ์ ์ ์คํํฌ๋ฅผ ์ง์ํ์ง ์์ผ๋ฏ๋ก ๋ฒ๊ทธ ์์ ์ ํฌํจํ๋ฉด์ ์ด์ ์คํํฌ ๋ฒ์ ์ ๋ํ ์ง์์ ๊ณ์ํ๊ธฐ ์ํด 0.83 ๋ฒ์ ๊ณผ 0.9๋ฅผ ์ง์ํ๋ผ๋ ์ ์์ ๋ฌด์์ ๋๊น?
์ผ๋ฐ์ ์ผ๋ก ์ ๋ ๊ฐ๋ฐ์ ์๊ฐ์ ์ฌ์ฉํ๋ ๋ชจ๋ ๊ฒ์ ๋ฐ๋ํฉ๋๋ค. ์ฐ๋ฆฌ๋ ์ด๋ฏธ ์ถฉ๋ถํ ๋ฐ์์ง ์์ต๋๊น? ๊ทธ๋ฌ๋ ์์ ์ ์ธ ๋ฒ์ ์ ๊ฐ๋ ๋ฐ ์ฝ๊ฐ์ ๊ฐ์น๊ฐ ์์ต๋๋ค.
@CodingCat Spark 2.4.x๋ก ์ ๊ทธ๋ ์ด๋ํ์ง ์๊ณ ๋ฒ๊ทธ ์์ (2d875ec ๋ฐ 995698b)์ ํตํฉํ ์ ์๋ ๋ฐฉ๋ฒ์ด ์์ต๋๊น?
์ ์ง ๊ด๋ฆฌ ๋ฆด๋ฆฌ์ค๋ฅผ ๋ง๋๋ ๊ฒ์ด ๋จ์ํ ๊ฐ์ง๋ฅผ ์๋ฅด๋ ๊ฒ ์ด์์ด๋ฉด(์: ์ฒด๋ฆฌ๋ฅผ ๋ฐ์ผ ํจ), ์ ๋ ๊ทธ๋ฌํ ์ฝ์์ ํ์ง ์์ ๊ฒ์ ๋๋ค.
์ผ๋ฐ์ ์ผ๋ก ์ ๋ ๊ฐ๋ฐ์ ์๊ฐ์ ์ฌ์ฉํ๋ ๋ชจ๋ ๊ฒ์ ๋ฐ๋ํฉ๋๋ค. ์ฐ๋ฆฌ๋ ์ด๋ฏธ ์ถฉ๋ถํ ๋ฐ์์ง ์์ต๋๊น?
๋๋ ๋์ํ๋ค.
@CodingCat Spark 2.4.x๋ก ์ ๊ทธ๋ ์ด๋ํ์ง ์๊ณ ๋ฒ๊ทธ ์์ (2d875ec ๋ฐ 995698b)์ ํตํฉํ ์ ์๋ ๋ฐฉ๋ฒ์ด ์์ต๋๊น?
@hcho3 ๋ถํํ๋ ์๋์. Spark์ ์์กดํ๋ ๋ผ์ด๋ธ๋ฌ๋ฆฌ์ ์ฃผ์ ๋ณ๊ฒฝ ์ฌํญ์ผ๋ก ์ธํด ์ผ๊ด๋ ๋ฒ์ ์ spark๋ก๋ง xgboost๋ฅผ ์ปดํ์ผํ๊ณ ์คํํ ์ ์์ต๋๋ค.
ํฅํ ์ ์ง ๊ด๋ฆฌ ๋ฆด๋ฆฌ์ค, ์ํฌํ๋ก(0.9 ๋ฆด๋ฆฌ์ค ์ดํ)์ ๊ด์ฌ์ด ์๋ค๋ฉด
0.9 ๋ถ๊ธฐ์ ํ์ํ ๋ฐฑํฌํธ ์์
2๊ฐ์๋ง๋ค 0.9x ๋ฆด๋ฆฌ์ค ๋๋ ์ค์ํ ๋ฒ๊ทธ ์์ ์ผ๋ก ์ธํด ๋ฐ์
์ฃผ์ ๊ธฐ๋ฅ ๋ฐ 0.9x๋ก ๋ฐฑํฌํธ๋ ๋ชจ๋ ์์ ์ฌํญ์ ๋ง์คํฐ์์ ์ฌ์ฉํ ์ ์์ด์ผ ํฉ๋๋ค.
๋ฆด๋ฆฌ์ค 1.0 ๋ ๋ง์คํฐ์์ ๋ถ๊ธฐ๋ฅผ ์๋ผ ......
ํ์ง๋ง ๋ค์, ๋ง์คํฐ์ ํฐ ๋ฆฌํฉํฐ๊ฐ ์๊ณ ๊ทธ ํ์ ์์ ์ฌํญ์ 0.9๋ก ๋ฐฑํฌํธํ๋ ค๋ ๊ฒฝ์ฐ... ๋ง์ ์์ ์ด ํ์ํฉ๋๋ค.
@CodingCat ํ์ฌ ๊ฐ๋ฐ ์ปค๋ฎค๋ํฐ์ ๊ท๋ชจ๋ฅผ ๊ฐ์ํ ๋ ์ ์ง ๊ด๋ฆฌ ๋ฆด๋ฆฌ์ค์ ๋ํด ์์๋ณด๊ฒ ์ต๋๋ค.
@tovbinm ์ฃ์กํฉ๋๋ค. ๋์ญํญ ๋ถ์กฑ์ผ๋ก ์ธํด 0.83 ๋ฆด๋ฆฌ์ค๋ฅผ ํ ์ ์์ ๊ฒ ๊ฐ์ต๋๋ค. Spark 2.4.3์ผ๋ก ์ ๊ทธ๋ ์ด๋ํ ์ ์์ต๋๊น?
์ด์ด ์์์ด. ์๋์, ๋จ๊ธฐ์ ์ผ๋ก๋ ์๋๋๋ค. ์ฐ๋ฆฌ๋ ์ฌ์ ํ 2.3.x์ ์์ต๋๋ค.
Spark๋ฅผ 2.3์์ 2.4๋ก ์ ๊ทธ๋ ์ด๋ํ ์ปค๋ฐ์ ๋ฌด์์ ๋๊น? ์๋ง๋ ์ฐ๋ฆฌ๋ ๊ฑฐ๊ธฐ์์ ์๋ผ๋ผ ์ ์์ต๋๋ค(๋ฌผ๋ก 0.82 ์ด์์ด๋ฉด).
@tovbinm Spark 2.3.x๋ฅผ ์ฌ์ฉํ๋ ค๋ฉด ์ปค๋ฐ 711397d6452d596d7acbb68f1052ffebdee3e3af๋ก XGBoost๋ฅผ ๋น๋ํ ์ ์์ต๋๋ค.
์์ฒญ๋. ๊ทธ๋ ๋ค๋ฉด ๊ทธ ์ปค๋ฐ์์ ๊ณต๊ฐ ๋ฆด๋ฆฌ์ค๋ฅผ ํ์ง ์๋ ์ด์ ๋ ๋ฌด์์ ๋๊น?
@CodingCat์ด ๋งํ๋ฏ์ด ์ ์ง ๊ด๋ฆฌ ๋ฆด๋ฆฌ์ค๋ ๋จ์ํ ์ปค๋ฐ ์ ์ ์๋ผ๋ด๋ ๋ฌธ์ ๊ฐ ์๋๋๋ค. ๋ํ ๊ณต๊ฐ ๋ฐํ๋ ์ง์์ ๋ํ ์๋ฌต์ ์ธ ์ฝ์์ ๋๋ค. ํ์ฌ๋ก์๋ ์ ์ง ๊ด๋ฆฌ์๊ฐ ๋ ๊ฐ์ง ์๋ก์ด ๋ฆด๋ฆฌ์ค๋ฅผ ์ง์ํ ์ค๋น๊ฐ ๋์ด ์์ง ์๋ค๊ณ ์๊ฐํฉ๋๋ค.
711397d6452d596d7acbb68f1052ffebdee3e3af ์์ ์ถ์ํด์ผ ํ๋์ง ์ฌ๋ถ๋ @CodingCat์ ๋งก๊ธฐ๊ฒ ์ต๋๋ค.
GPU ์์ธก๊ธฐ๊ฐ ์๋ ์ธ๋ถ ๋ฉ๋ชจ๋ฆฌ - ์ด๋ ์ฝ๋๊ฐ ๋ ์ด์ what(): std::bad_alloc: ๋ฉ๋ชจ๋ฆฌ ๋ถ์กฑ์ผ๋ก ์ถฉ๋ํ์ง ์์์ ์๋ฏธํฉ๋๋ค. (์ฆ, ์ผ์์ ์ผ๋ก RAM์ผ๋ก ์ค์ํ์๊ฒ ์ต๋๊น?)
๊ด๋ จ ๋ฌธ์ https://github.com/dmlc/xgboost/issues/4184 - ์ด๊ฒ์ ์ฃผ๋ก ์ผ์์ ์ธ ๋ฉ๋ชจ๋ฆฌ ๋ฒ์คํธ์ ๊ดํ ๊ฒ์ด์๊ณ ์์ฒด ํผํ ํ๋ก์ธ์ค์๋ ๋ง์ ๋ฉ๋ชจ๋ฆฌ๊ฐ ํ์ํ์ง ์์ต๋๋ค.
@hlbkin https://xgboost.readthedocs.io/en/latest/tutorials/external_memory.html ์ ๋ฐ๋ผ ๋ช ์์ ์ผ๋ก ์ธ๋ถ ๋ฉ๋ชจ๋ฆฌ๋ฅผ ํ์ฑํํด์ผ ํฉ๋๋ค.
์ฃผ์ ๋ฒ์ ๋ฒํ(์ฆ, 1.0) ์์ด๋ ๋ค๋ฅธ ๋ฐฉ์์ผ๋ก ์ ํํ ์ ์๋ค๊ณ ๊ฐ์ ํ์ง๋ง ์ ํํ ๋ ์ค์ํ๋ PEP 440 ๋ฒ์ ๋ฒํธ(iexyz) ๋ฐ ๋ฐ๋์งํ๊ฒ๋ ์๋ฏธ๋ก ์ ๋ฒ์ ๊ด๋ฆฌ๋ฅผ ์ง์ํ๋ ๊ฒ์ ๊ณ ๋ คํ ์ ์์ต๋๊น? 0.90(0.9.0์ด ์๋)์ ๋ํ ํ์ค ํด์์ ์ด๊ฒ์ด ์ฃผ ๋ฒ์ 0.x(์ฆ, ์์ ํ ๋ฆด๋ฆฌ์ค ์ด์ ) ์๋ฆฌ์ฆ์ 90๋ฒ์งธ ๋ถ ๋ฆด๋ฆฌ์ค์ด๋ฉฐ 0.83๋ณด๋ค ๋ ์ค์ํ์ง ์๋ค๋ ๊ฒ์ ๋๋ค. ๋ํ, ์ด๋ ๋ถ ๋ฒ์ ๋น ์ต๋ 9ํฌ์ธํธ ๋ฆด๋ฆฌ์ค๋ก ์ ํํ๊ณ ์ผ๋ถ ๋๊ตฌ(๋ฐ ์ฌ๋)๊ฐ ํด์ํ๊ธฐ ์ด๋ ต๊ฒ ๋ง๋ญ๋๋ค. ๊ฐ์ฌ ํด์!
+1
@CAM-Gerlach 1.0์ ์ถ์ํ ๋ ๊ณ ๋ คํ ๊ฒ์ ๋๋ค. ๋ฐ๋ฉด์ ์ฐ๋ฆฌ๋ 1.0์ผ๋ก ์๋๋ฅด๊ณ ์ถ์ง ์์ต๋๋ค. ์ฐ๋ฆฌ๋ 1.0์ด ๊ธฐ๋ฅ, ์์ ์ฑ ๋ฐ ์ฑ๋ฅ ๋ฉด์์ ์ผ์ข ์ ์ด์ ํ๊ฐ ๋๊ธฐ๋ฅผ ๋ฐ๋๋๋ค.
@hcho3 ์ค๋ช ๊ฐ์ฌํฉ๋๋ค.
Python 2 ์ฌ์ฉ์๊ฐ ์ค์๋ก ํธํ๋์ง ์๋ ๋ฒ์ ์ผ๋ก ์
๊ทธ๋ ์ด๋๋์ง ์๋๋ก setup()
์์ python_requires
์ธ์๋ฅผ '>=3.5'
๋ก ์ค์ ํ๋์ง ํ์ธํ๊ณ ์ถ์ ๊ฒ์
๋๋ค.
@hcho3 ์ธ๋ถ ๋ฉ๋ชจ๋ฆฌ๋ GPU ์๊ณ ๋ฆฌ์ฆ๊ณผ ํจ๊ป ์ฌ์ฉํ ์ ์์ต๋๋ค.
@hlbkin ๋น์ ์ด ๋ง์ต๋๋ค. ์ธ๋ถ ๋ฉ๋ชจ๋ฆฌ๋ ํ๋ จ์ด ์๋ GPU ์์ธก์๋ง ์ฌ์ฉํ ์ ์์ต๋๋ค.
@rongou @sriramch ์ธ๋ถ ๋ฉ๋ชจ๋ฆฌ์์ GPU ๊ต์ก์ ์ฌ์ฉํ ์ ์๋ค๋ ๊ฒ์ด ๋ง์ต๋๊น?
@hcho3 ๋ค ๋ง์ต๋๋ค. ์ฐ๋ฆฌ๋ ๊ทธ๊ฒ์ ๋ ธ๋ ฅํ๊ณ ์์ต๋๋ค. ๊ด์ฌ์ด ์๋ ๊ฒฝ์ฐ ๋ณ๊ฒฝ ์ฌํญ์ด ์ฌ๊ธฐ์ ์์ต๋๋ค. ์ด ๋ณ๊ฒฝ ์ฌํญ์ ๋ง์คํฐ์ ๋๊ธฐํํ๊ณ ๋ช ๊ฐ์ง ํ ์คํธ๋ฅผ ์์ฑํด์ผ ํฉ๋๋ค.
@sriramch ๊ต์ฅํฉ๋๋ค! 0.90 ๋ฆด๋ฆฌ์ค์ ์ธ๋ถ ๋ฉ๋ชจ๋ฆฌ ๊ต์ก์ ํฌํจํ๋ ๊ฒ์ ๋ชฉํ๋ก ํด์ผ ํฉ๋๊น, ์๋๋ฉด 0.90 ์ดํ์ ๋ค์ ํด์ผ ํฉ๋๊น?
๋ด 2์ผํธ, 0.x์ ๋ง์ ์๋ก์ด ๊ธฐ๋ฅ์ ์์ถํ๋ ๋ฐ ์ฝ๊ฐ์ ์๊ฐ์ ๋ค์ด๊ณ (๊ธํ๊ฒ) 1.0์ ๋ฌด์์ ๋ง์ผ์คํค ๋ฒ์ ์ผ๋ก ๋ฃ์์ง ๊ณ ๋ คํฉ์๋ค.
@CodingCat ๋์ํฉ๋๋ค. ์ฐธ๊ณ ๋ก ์ ๋ #4280์์ ์๋นํ ์ด๊ฒฌ์ด ์์๊ธฐ ๋๋ฌธ์ 0.90 ๋ก๋๋งต์์ ๋ถ์ฐ ์ฌ์ฉ์ ์ ์ ๋ชฉํ๋ฅผ ์ญ์ ํ์ต๋๋ค. 0.90 ์ดํ์ ๋ค์ ๊ณ ๋ คํ๊ฒ ์ต๋๋ค.
@sriramch 0.90 ๋ฆด๋ฆฌ์ค ์ดํ์ ์ธ๋ถ ๋ฉ๋ชจ๋ฆฌ ํ๋ จ์ ์๊ฐํด๋ณด์. ๋ ธ๊ณ ์ ๊ฐ์ฌ๋๋ฆฝ๋๋ค.
์ด๊ฒ์ 8.0 ๋์ cuda 9.0 ๋ฐ์ด๋๋ฆฌ๋ฅผ ์ถ์ํ๊ธฐ์ ์ข์ ์๊ธฐ์ผ ์ ์์ต๋๋ค. 9.0์ ์ด์ ์ฌ์ฉ์ ๋๋ผ์ด๋ฒ ๋ฒ์ ์์ ์ถฉ๋ถํ ์ง์๋ ๊ฒ์ด๋ผ๊ณ ์๊ฐํฉ๋๋ค. ๋ํ 9.0 ๋ฐ์ด๋๋ฆฌ๋ ์ต์ Volta ์ํคํ ์ฒ์ฉ์ผ๋ก JIT ์ปดํ์ผํ ํ์๊ฐ ์์ต๋๋ค.
@hcho3 ๊ฐ ์ค๋น ๋์ จ๋์?
๊ฑฐ์. #4438์ ๋ณํฉํด์ผ ํ๋ค๊ณ ์๊ฐํฉ๋๋ค.
์ด์ ๋ชจ๋ ๊ฒ์ด ์ข์ต๋๋ค. ๋ค์ ๋ฆด๋ฆฌ์ค ์์ ์ ์์ํ๊ฒ ์ต๋๋ค. ์์ ๋์ฐฉ์ผ: 2019๋ 5์ 16์ผ
setup.py
Python 3 ํ์@RAMitchell ํ ๋ฆด๋ฆฌ์ค์ CUDA 9.0 ๋๋ 9.2๋ฅผ ์ฌ์ฉํด์ผ ํฉ๋๊น?
CI์ ์ด๋ฏธ ์ค์ ๋์ด ์๋ 9.2๋ฅผ ์ฌ์ฉํ๊ฒ ์ต๋๋ค. ์ํ์ ๋๋ฌด ์๋ก์ด Nvidia ๋๋ผ์ด๋ฒ๊ฐ ํ์ํ๋ค๋ ๊ฒ์ ๋๋ค. ์ฐธ๊ณ ๋ก ๋ค์์ cuda ๋ฒ์ ๊ณผ ๋๋ผ์ด๋ฒ ๊ฐ์ ๋์ ๊ด๊ณ๋ฅผ ๋ณด์ฌ์ฃผ๋ ํ์ ๋๋ค. https://docs.nvidia.com/deploy/cuda-compatibility/index.html#binary -compatibility__table-toolkit-driver
๋ด๊ฐ ์๋ ํ ์ด๊ฒ์ ์ด์จ๋ CPU ์๊ณ ๋ฆฌ์ฆ์ ์ํฅ์ ๋ฏธ์น์ง ์์์ผ ํฉ๋๋ค. ์ฌ์ฉ์๊ฐ ๋ฌธ์ ๋ฅผ ๋ณด๊ณ ํ๊ธฐ ์์ํ๋ฉด ํฅํ ๋๋ผ์ด๋ฒ ํธํ์ฑ์ ๋ํ ๋ ๋์ ์ค๋ฅ ๋ฉ์์ง๋ก ์ด ๋ฌธ์ ๋ฅผ ํด๊ฒฐํ ์ ์์ต๋๋ค.
ํ ๊ทธ๋ ๋ค๋ฉด CI ์์ ์ ์ค ํ๋๋ฅผ CUDA 9.0์ผ๋ก ๋ค์ด๊ทธ๋ ์ด๋ํ ์ ์์ต๋๋ค. ์ฐ๋ฆฌ๋ Docker ์ปจํ ์ด๋๋ฅผ ๊ด๋ฒ์ํ๊ฒ ์ฌ์ฉํ๊ณ ์๊ธฐ ๋๋ฌธ์ ๊ทธ๋ ๊ฒ ์ด๋ ต์ง ์์ ๊ฒ์ ๋๋ค.
์ด์ 0.90 ๋ฆด๋ฆฌ์ค๋ฅผ ์ค๋นํ๊ฒ ์ต๋๋ค. ๋ด ๋ชฉํ๋ ์ด๋ฒ ์ฃผ ๋ง์ ๋ฆด๋ฆฌ์ค ๋ ธํธ๋ฅผ ์์ฑํ๋ ๊ฒ์ ๋๋ค.
ํ์ #4475
๊ฐ์ฅ ์ ์ฉํ ๋๊ธ
์ด๊ฒ์ Databricks์ ๋ํ ์ง๋ฌธ์ด ์๋๋ผ Spark ํ๋ก์ ํธ์ ๋ํ ์ง๋ฌธ์ ๋๋ค. ๊ธฐ๋ณธ ์ ์ฑ ์ 18๊ฐ์ ๋์ ๋ถ๊ธฐ์ ๋ํ ์ ์ง ๊ด๋ฆฌ ๋ฆด๋ฆฌ์ค์ ๋๋ค. https://spark.apache.org/versioning-policy.html ๊ทธ๋ฌ๋ฉด 2.3.x๊ฐ ์ฝ 7์์ EOL์ ํฌํจ๋๋ฏ๋ก ์ดํ 2.3.x ๋ฆด๋ฆฌ์ค๊ฐ ๋ ๋์ฌ ๊ฒ์ผ๋ก ์์ํ์ง ์์ต๋๋ค. OSS ํ๋ก์ ํธ์์.