Evalml: Повторно включить настройку порога двоичной классификации по умолчанию

Созданный на 15 апр. 2020 · 17Комментарии · Источник: alteryx/evalml

Мы добавили эту функцию в ветку функций # 346, а затем отказались от нее в # 606, потому что она пересчитывала predict и замедляла работу automl.

Мы должны снова включить это по умолчанию. Для этого нам нужно кэшировать вывод прогноза, который в настоящее время вычисляется в баллах. Долгосрочное решение - запоминать прогнозы с помощью кеша (# 466), но в краткосрочной перспективе мы должны уметь что-то делать.

Это также относится к # 579, который отслеживает очистку повторяющегося кода между методами score классов конвейера.

enhancement

Источник

dsherry

Все 17 Комментарий

Я бы хотел попробовать на следующей неделе. Я исследовал несколько разных методов кэширования и протестировал некоторые вещи локально.

dsherry 17 апр. 2020

Мы не должны этого делать, пока у нас не будет MVP для тестирования производительности.

dsherry 26 мая 2020

Теперь, когда у нас есть MVP для тестов производительности, мы должны это сделать! Это появилось как часть # 1024.

angela97lin 5 авг. 2020

👍1

@ angela97lin спасибо! Да, безусловно.

Следующим шагом будет создание сравнения производительности до и после для некоторых из наших задач двоичной классификации.

dsherry 6 авг. 2020

Дополнительные соображения

Потеря журнала (цель по умолчанию для класса бункера) и AUC при этом не должны изменяться, потому что они не зависят от пороговых значений. Но другие показатели, такие как F1, определенно должны улучшиться. Было бы неплохо взглянуть на несколько.
Время подойдет. Вопрос в том, насколько плохой удар? Я бы ожидал увеличения не более чем на 10-20%.
Мы могли бы поэкспериментировать с изменением размера разбиения порогового выбора. Это может улучшить точность удержания, предотвращая переоснащение / недостаточную подгонку. Увеличение размера разделения настройки порога также уменьшит размер разделения обучения, что приведет к более быстрому подгонке.

Будущая работа

В настоящее время у нас нет никаких гарантий относительно размера данных. Однако это относится к обучающей выборке в целом, поэтому мы должны подать отдельную проблему.

dsherry 6 авг. 2020

В первоначальной записи в апреле я сказал

нам нужно будет кэшировать вывод прогноза, который в настоящее время вычисляется в счетах.

Я считаю, что это больше не применимо, могу проигнорировать. Этот комментарий был оставлен до того, как мы реорганизовали score . Плюс мы делаем оптимизацию порога на отдельном сплите, поэтому кешировать нечего. @freddyaboulton К вашему сведению

dsherry 19 авг. 2020

👍1

@dsherry @ angela97lin я собрал несколько первых разделов анализа документ здесь . Можете ли вы сообщить мне, что вы думаете (читайте только до раздела "Эксперименты" - все остальное остается заполнителем)?

freddyaboulton 19 авг. 2020

👍1

@freddyaboulton Я только что оставил несколько комментариев. Мы обязательно должны посмотреть на потерю журнала, которая должна показать, что нет изменений, по крайней мере, в первом пакете. Однако я думаю, что мы также должны попытаться оптимизировать для F1 или чего-то еще, что чувствительно к порогу, чтобы мы могли увидеть эффект включения настройки.

dsherry 19 авг. 2020

@freddyaboulton, извините, меня

dsherry 19 авг. 2020

@freddyaboulton К вашему сведению, так как вы разместили документ, я переместил эту проблему в In Progress

dsherry 19 авг. 2020

👍1

@dsherry @ angela97lin Я закончил анализ файла "datasets_small_0.yaml".

Короче говоря, производительность действительно снизилась после настройки порога - может ли это быть из-за того, что мы не используем стратифицированное разбиение для настройки порога?

freddyaboulton 22 авг. 2020

@freddyaboulton о, да, это могло быть.

Я просмотрел ваш документ и оставил комментарии. Мне нравятся новые графики и статистика. Мы должны найти способы добавить их обратно в looking_glass/analysis/ чтобы мы могли их повторно использовать. Но не настойчиво.

Некоторые варианты, которые приходят в голову совершенно неожиданно:

Использовать стратифицированное разбиение для оптимизационного разделения порога
Установите минимальное количество строк для оптимизационного разделения порога. Если это недостижимо, может быть предупреждено и не установлено пороговое значение, или может возникнуть ошибка
Для небольших наборов данных используйте все обучающие данные в качестве порогового оптимизационного разделения и рискуйте переобучением.

Я думаю, нам следует сначала попробовать переключиться на стратифицированную выборку и посмотреть, что это даст.

Еще одна вещь, которую можно попробовать, - это переключить размер разделения с 80% тренировки 20% оптимизации порога на 50% тренировки 50% оптимизации порога. Я немного сомневаюсь, что это сработает, но это легко попробовать, и было бы интересно посмотреть.

dsherry 22 авг. 2020

Поскольку @jeremyliweishih набирает номер 1049, @freddyaboulton , возможно, вы захотите передать это ему. Я дам вам двоим понять это :)

dsherry 27 авг. 2020

👍1

@freddyaboulton, ты же не работаешь над этим, верно? Может @jeremyliweishih это

dsherry 25 сент. 2020

@jeremyliweishih @dsherry Примите, пожалуйста! Первоначальный анализ показал, что простое включение настройки не улучшает результаты. Может помочь использование другой стратегии разделения данных!

freddyaboulton 25 сент. 2020

👍1

Вернемся к Dev Backlog и займемся этим после дополнительной работы по разделению данных.

jeremyliweishih 29 сент. 2020

@ bchen1116 и я обсудили, и мы считаем, что это необходимо для # 973

dsherry 8 мар. 2021

Была ли эта страница полезной?

0 / 5 - 0 рейтинги

Смежные вопросы

AutoML: используйте отдельное разделение резюме для ансамбля

angela97lin · 4Комментарии

Запретить отзыв в качестве цели automl

dsherry · 5Комментарии

Автоматически настраивайте лучший конвейер для всех данных обучения

dsherry · 3Комментарии

Не удается запустить AutoML на наборе данных Iris

SydneyAyx · 3Комментарии

Импьютер не может поместиться, если в категориальном или логическом столбце нет Нет

freddyaboulton · 3Комментарии