Xgboost: Дорожная карта XGBoost 0.90

Созданный на 21 апр. 2019 · 56Комментарии · Источник: dmlc/xgboost

Эта ветка предназначена для отслеживания всех хороших вещей, которые будут включены в выпуск 0.90. Он будет обновляться по мере приближения запланированной даты выпуска (~ 1 мая 2019 г. ~ как только выйдет Spark 2.4.3).

[x] XGBoost больше не будет поддерживать Python 2.7, так как его срок службы скоро истечет . Это решение было принято в № 4379.
[x] XGBoost4J-Spark теперь требует Spark 2.4+ , так как Spark 2.3 подходит к концу через несколько месяцев (# 4377) (https://github.com/dmlc/xgboost/issues/4409)
[x] XGBoost4J теперь поддерживает до JDK 12 (# 4351)
[x] Дополнительная оптимизация для gpu_hist (# 4248, # 4283)
[x] XGBoost как цель CMake; Пример C API (# 4323, # 4333)
[x] Мультиклассовые показатели графического процессора (# 4368)
[x] API случайного леса, похожий на Scikit-learn (# 4148)
[x] Исправление: исправлено распределение гистограммы графического процессора (# 4347).
[x] [БЛОКИРОВКА] [jvm-packages] исправляют недетерминированный порядок внутри раздела (в случае перетасовки восходящего потока) при прогнозировании https://github.com/dmlc/xgboost/pull/4388
[x] Дорожная карта: дополнительная оптимизация для hist на многоядерных процессорах Intel (# 4310)
[x] Дорожная карта: усиленный Rabit; см. RFC # 4250
[x] Надежная обработка отсутствующих значений в XGBoost4J-Spark https://github.com/dmlc/xgboost/pull/4349
[x] Внешняя память с предсказателем графического процессора (# 4284, # 4438)
[x] Используйте ограничения взаимодействия функций, чтобы сузить разделение пространства поиска (# 4341)
[x] Конвейер непрерывной интеграции Re-vamp; см. RFC # 4234
[x] Исправление: метрики AUC и AUCPR должны правильно обрабатывать веса для задачи обучения ранжированию (# 4216).
[x] Игнорировать комментарии в файлах LIBSVM (# 4430)
[x] Исправление: исправлена метрика AUCPR для ранжирования (# 4436).

roadmap

Источник

hcho3

Самый полезный комментарий

Это вопрос не к Databricks, а к проекту Spark. Политика по умолчанию - выпуски обслуживания для веток на 18 месяцев: https://spark.apache.org/versioning-policy.html. Это поставит 2.3.x в EOL примерно в июле, поэтому не стоит ожидать больше выпусков 2.3.x после что из проекта OSS.

srowen 22 апр. 2019

👍4

Все 56 Комментарий

поскольку у нас будут критические изменения, такие как https://github.com/dmlc/xgboost/pull/4349 и https://github.com/dmlc/xgboost/pull/4377

поднять версию до 0.9?

CodingCat 22 апр. 2019

@CodingCat Конечно, мы можем критическое изменение будет значительным. Не могли бы вы сделать мне одолжение и описать в одном абзаце, зачем нужен # 4349?

hcho3 22 апр. 2019

Конечно,

CodingCat 22 апр. 2019

* Spark 2.3 is reaching its end-of-life in a few months

Есть ли официальное заявление по этому поводу? Они выпустили 2.2.3 в январе и 2.3.3 в феврале. Наш поставщик (MapR) по-прежнему поставляет 2.3.1.

alexvorobiev 22 апр. 2019

@alexvorobiev https://github.com/dmlc/xgboost/issues/4350 , вы можете проверить с помощью @srowen из databricks

CodingCat 22 апр. 2019

srowen 22 апр. 2019

👍4

@srowen Спасибо!

alexvorobiev 22 апр. 2019

@srowen @CodingCat @alexvorobiev Давайте также обсудим возможность поддержки Scala 2.12 / 2.13. Прямо сейчас XGBoost4J скомпилирован для Scala 2.11:
https://github.com/dmlc/xgboost/blob/2c61f02add72cce8f6dc1ba87e016e3c5f0b7ea6/jvm-packages/pom.xml#L38 -L39

Пользователь сообщил, что файлы JAR XGBoost4J, скомпилированные для Scala 2.11, несовместимы с двоичным кодом Scala 2.12.

hcho3 24 апр. 2019

Да, 2.11 / 2.12 по-прежнему несовместимы с двоичным кодом, а у Spark есть два дистрибутива. Оба поддерживаются в 2.4.x, хотя с этого момента в 2.4.x по умолчанию используется 2.12. 3.0 откажется от поддержки Scala 2.11.

Это может быть просто вопрос компиляции двух версий, а не большого или какого-либо изменения кода. Если вы столкнетесь с какими-либо забавными ошибками в 2.12, дайте мне знать, потому что я столкнулся с множеством этих проблем при обновлении Spark.

2.13 по-прежнему не является GA, и думаю, что это будет меньшее изменение с 2.12-> 2.13, чем с 2.11-> 2.12 (большая разница здесь в совершенно другом представлении лямбда-выражений).

srowen 24 апр. 2019

@ hcho3 Полагаю, вы хотели отметить @alexvorobiev?

alexeygrigorev 24 апр. 2019

@alexeygrigorev Ой, извините за это.

hcho3 24 апр. 2019

единственная проблема заключается в том, что нам нужно внести критическое изменение в имя артефакта xgboost в maven, xgboost4j-spark => xgboost4j-spark_2.11 / xgboost4j-spark_2.12, например Spark https://mvnrepository.com/artifact/ org.apache.spark / spark-core, и нам нужно дважды проверить, есть ли у нас временная зависимость от 2.11 (я думаю, что нет)

Привет, @srowen though 2.12 is the default from here on in 2.4.x , я проверил branch-2.4 pom.xml, если вы не укажете профиль scala-2.12, вы все равно получите сборку 2.11, нет?

CodingCat 25 апр. 2019

Вы можете выбрать поддержку только 2.12 в 0.9x, и тогда вам не нужно добавлять суффикс к имени артефакта. Если вы поддерживаете оба варианта, то, к сожалению, вы действительно захотите изменить имя артефакта и иметь версии _2.11 и _2.12.

Да, сборка Spark 2.4.x по умолчанию будет для 2.11; -Pscala-2.12 получает сборку 2.12.

srowen 25 апр. 2019

спасибо, я буду консервативен в поддержке 2.12 по крайней мере для следующей версии

Насколько мне известно, большинство пользователей Spark все еще используют 2.11, поскольку они привыкли следовать предыдущим версиям Spark.

У меня может не хватить пропускной способности для прохождения всех тестов, которые у меня есть для внедрения поддержки 2.12.

Я бы выбрал поддержку 2.12 + 2.11 или 2.12 в версии 1.0 ...

CodingCat 25 апр. 2019

@ hcho3 FYI, я просто удалил поддержку плотной матрицы из дорожной карты, учитывая ограниченную пропускную способность

CodingCat 25 апр. 2019

@ hcho3 Не могли бы вы взглянуть на https://github.com/dmlc/dmlc-core/pull/514, когда позволит время? Возможно, стоит слить до следующего релиза.

trivialfis 26 апр. 2019

@trivialfis Посмотрим на это

hcho3 26 апр. 2019

@CodingCat Я думаю, нам следует отодвинуть дату выпуска, поскольку у Spark 2.4.1 и 2.4.2 есть проблемы. Что вы думаете?

@srowen Вы знаете, когда выйдет Spark 2.4.3?

hcho3 28 апр. 2019

Я думаю, что небольшая задержка - это нормально

CodingCat 28 апр. 2019

Ладно, подождем пока выйдет Spark 2.4.3

hcho3 28 апр. 2019

Будет ли последний выпуск 0.83 для Spark 2.3.x?

tovbinm 29 апр. 2019

@CodingCat Что, если мы сделаем два параллельных выпуска 0.83 и 0.90, где 0.83 включает все коммиты непосредственно перед # 4377? Версия 0.83 будет выпущена только как пакеты JVM, а пакеты Python и R получат 0.90. Для меня это больше не будет работать, так как мне все равно нужно написать примечание к выпуску 0.90.

Одна из проблем - это удобство работы пользователя с обработкой пропущенных значений. Возможно, принуждение всех к использованию Spark 2.4.x предотвратит их ошибку с пропущенными значениями (проблема, которая послужила причиной # 4349)

hcho3 29 апр. 2019

👍1

@ hcho3 Меня немного беспокоит несоответствие разных версий доступности пакетов pkgs.

Я могу представить себе такие вопросы, как hey, I find 0.83 in maven so I upgrade our Spark pkg, but I cannot use 0.83 in notebook when attempting to explore my new model setup with a small amount of data with python pkg?

Я бы посоветовал нам либо выпустить полный отладочный выпуск в ветке 0.8x, либо ничего

CodingCat 29 апр. 2019

@CodingCat Понял. Мы сделаем последовательные выпуски для всех пакетов. Что вы думаете о выпуске 0.83? Стоит ли нам это делать?

hcho3 29 апр. 2019

@CodingCat На самом деле, это создаст работу для других сопровождающих, нам нужно сначала спросить их

hcho3 29 апр. 2019

короткий ответ с личной точки зрения - да в теории , но это может быть больше, чем сокращение прямо перед фиксацией (как вы сказали, это создаст работу и для других) (но я не решаюсь сделать это из-за ограниченного ресурсы в сообществе ...)

вот мои 2 цента о том, как мы должны думать о выпуске обслуживания, таком как 0.8x

Причина, по которой выпуск обслуживания состоит в том, чтобы внести критические исправления ошибок, такие как https://github.com/dmlc/xgboost/commit/2d875ec0197d5a83e7d585daf472b8201aa97c51 и https://github.com/dmlc/xgboost/commit/99569a08b
с другой стороны, чтобы сообщество было устойчивым, кроме выгорания всех коммиттеров, мы должны периодически отказываться от поддержки предыдущей версии.
нововведения и улучшения должны быть доведены до пользователей через выпуск функции (переход с 0.8 на 0.9)

если мы решим перейти на 0.83, нам нужно будет собрать мнения @RAMitchell @trivialfis и использовать их судью, чтобы узнать, есть ли у нас важные (больше о правильности) исправления ошибок, которые они заметили

а затем создайте ветку 0.83 на основе 0.82, чтобы выбрать коммиты ... на самом деле много работы

CodingCat 29 апр. 2019

Если я правильно понимаю, 0.9 не будет поддерживать старые версии Spark, отсюда и предложение о поддержке версии 0.83, а также 0.9, чтобы продолжить поддержку более старых версий Spark, включая исправления ошибок?

Обычно я против всего, что требует времени разработчика. Разве мы уже не достаточно заняты? Однако я вижу некоторую ценность в стабильной версии.

RAMitchell 30 апр. 2019

👍3

@CodingCat Есть ли способ включить исправления ошибок (2d875ec и 995698b) без обновления до Spark 2.4.x?

Если создание обновленных версий - это больше, чем просто обрезка ветвей (например, нужно выбирать вишню), я бы предпочел не брать на себя такие обязательства.

Обычно я против всего, что требует времени разработчика. Разве мы уже не достаточно заняты?

Я согласен.

hcho3 30 апр. 2019

@CodingCat Есть ли способ включить исправления ошибок (2d875ec и 995698b) без обновления до Spark 2.4.x?

@ hcho3, к сожалению, нет, из-за

CodingCat 30 апр. 2019

если в будущем нас интересует отладочный выпуск, рабочий процесс (после выпуска 0.9)

бэкпорт необходимое исправление в 0.9-ветку
выпуск 0.9x каждые, скажем, 2 месяца, или запускается исправлением важной ошибки
основные функции и все исправления, перенесенные на версию 0.9x, должны быть доступны в мастере
в выпуске 1.0 вырезать ветку от мастера ......

но опять же, как только у нас будет большой рефакторинг в master и после этого мы хотим вернуться к исправлению 0.9 ... тонны работы

CodingCat 30 апр. 2019

@CodingCat Учитывая текущий размер сообщества разработчиков, давайте начнем с техобслуживания.

@tovbinm Извините, я не думаю, что мы сможем выпустить выпуск 0.83 из-за недостаточной пропускной способности. Возможно ли вам перейти на Spark 2.4.3?

hcho3 30 апр. 2019

Это прискорбно. Нет, не в краткосрочной перспективе. Мы все еще на 2.3.x.

Что за коммит обновил Spark с 2.3 до 2.4? Возможно, мы сможем сократить его (если, конечно, выше 0,82).

tovbinm 1 мая 2019

@tovbinm Вы можете собрать XGBoost с помощью commit 711397d6452d596d7acbb68f1052ffebdee3e3af, чтобы использовать Spark 2.3.x.

hcho3 1 мая 2019

Большой. Так почему бы не сделать публичный релиз этого коммита?

tovbinm 1 мая 2019

Как сказал @CodingCat ,

Я отвечу на @CodingCat, чтобы узнать, следует ли нам выпускать релиз от 711397d6452d596d7acbb68f1052ffebdee3e3af.

hcho3 1 мая 2019

Внешняя память с предсказателем графического процессора - это означало бы, что код больше не будет сбой с what (): std :: bad_alloc: out of memory? (то есть временно подкачать в RAM?)

связанная проблема, я думаю, https://github.com/dmlc/xgboost/issues/4184 - это было в основном из-за временных всплесков памяти, сам процесс настройки никогда не требовал столько памяти

hlbkin 1 мая 2019

@hlbkin Вам необходимо явно включить внешнюю память, согласно https://xgboost.readthedocs.io/en/latest/tutorials/external_memory.html.

hcho3 1 мая 2019

Я предполагаю, что невозможно переключиться иначе без увеличения основной версии (например, 1.0), но когда вы это сделаете, не могли бы вы рассмотреть возможность поддержки соответствующих номеров версий PEP 440 (iexyz) и, предпочтительно, семантического управления версиями? Стандартная интерпретация 0.90 (а не 0.9.0) будет заключаться в том, что это 90-й второстепенный выпуск из серии основной версии 0.x (т.е. предварительная стабильная версия), и он не более значим, чем 0.83. Более того, это ограничивает вас максимум 9-ю выпусками на вспомогательную версию и создает трудности для интерпретации некоторыми инструментами (и людьми). Спасибо!

CAM-Gerlach 3 мая 2019

CodingCat 3 мая 2019

@ CAM-Gerlach Мы учтем это при выпуске 1.0. С другой стороны, мы не хотим спешить с версией 1.0. Мы хотим, чтобы версия 1.0 стала своего рода вехой с точки зрения возможностей, стабильности и производительности.

hcho3 3 мая 2019

👍1

Спасибо за объяснение, @ hcho3 .

Вероятно, вы захотите убедиться, что вы установили аргумент python_requires равным '>=3.5' в setup() чтобы гарантировать, что пользователи с Python 2 не будут случайно обновлены до несовместимой версии.

CAM-Gerlach 3 мая 2019

@ hcho3 Внешняя память недоступна с алгоритмами графического процессора

hlbkin 4 мая 2019

@hlbkin Вы правы. Внешняя память будет доступна только для предсказателя графического процессора, но не для обучения.

@rongou @sriramch Я правильно понимаю, что обучение графическому процессору недоступно с внешней памятью?

hcho3 4 мая 2019

@ hcho3 да ты прав. мы работаем над этим. изменения здесь, если вам интересно. мне придется синхронизировать это изменение с мастером и написать несколько тестов.

sriramch 6 мая 2019

@sriramch Замечательно ! Стоит ли нам стремиться включить тренировку внешней памяти в версию 0.90 или мы должны вернуться к ней после 0.90?

hcho3 6 мая 2019

только мои два цента, давайте оставим немного на сжатие многих новых функций в 0.x (в спешке) и рассмотрим, что должно быть добавлено в 1.0 в качестве промежуточной версии

CodingCat 6 мая 2019

👍1

@CodingCat Я согласен. К вашему сведению, я удалил распределенную настраиваемую цель из дорожной карты 0.90, поскольку в # 4280 были существенные разногласия. Мы рассмотрим его снова после 0.90.

@sriramch Рассмотрим тренировку внешней памяти после релиза 0.90. Большое спасибо за вашу тяжелую работу.

hcho3 6 мая 2019

Возможно, сейчас самое время выпустить двоичные файлы cuda 9.0 вместо 8.0. Я думаю, что 9.0 теперь будет в достаточной мере поддерживаться версией драйверов пользователей. Кроме того, двоичные файлы 9.0 не нужно будет компилировать JIT для новых архитектур Volta.

RAMitchell 7 мая 2019

@ hcho3 мы готовы к работе?

CodingCat 10 мая 2019

Почти. Думаю # 4438 нужно объединить.

hcho3 10 мая 2019

Теперь все хорошо. Я продолжу и начну работу над следующим выпуском. Расчетное время прибытия: 16 мая 2019 г.

[x] Требовать Python 3 в setup.py
[x] Измените CI для сборки колес CUDA 9.0 (# 4459)
[x] Исправить компиляцию Windows (# 4463)
[x] Настройка минимально жизнеспособного CI для Windows с графическим процессором (# 4463)

hcho3 10 мая 2019

@RAMitchell Должны ли мы использовать CUDA 9.0 или 9.2 для релизов колес?

hcho3 11 мая 2019

Давайте использовать 9.2, поскольку он уже настроен на CI. Опасность в том, что нам требуются слишком новые драйверы Nvidia. Для справки, вот таблица, показывающая соответствие между версией cuda и драйверами: https://docs.nvidia.com/deploy/cuda-compatibility/index.html#binary -compatibility__table-toolkit-driver

Насколько я знаю, это никоим образом не должно влиять на алгоритмы процессора. Если пользователи начнут сообщать о проблемах, мы сможем решить эту проблему в будущем с помощью улучшенных сообщений об ошибках совместимости драйверов.

RAMitchell 12 мая 2019

Хм, в этом случае я могу попробовать понизить оценку одного из CI worker до CUDA 9.0. Поскольку мы широко используем контейнеры Docker, это не должно быть слишком сложно.

hcho3 12 мая 2019

Сейчас я собираюсь подготовить релиз 0.90. Моя цель - завершить работу над выпуском к концу этой недели.

hcho3 14 мая 2019

Закрыл # 4475

hcho3 20 мая 2019

Была ли эта страница полезной?

0 / 5 - 0 рейтинги