Scikit-learn: Добавить линейную квантильную регрессию

Созданный на 13 мая 2014 · 17Комментарии · Источник: scikit-learn/scikit-learn

Кажется, что в питоне не так много пакетов с квантильной регрессией...

Источник

yangky11

👍3

Самый полезный комментарий

Всем привет! Пожалуйста, просмотрите мой PR, когда у вас будет на это время.

avidale 19 апр. 2018

👍13

Все 17 Комментарий

Похоже, пакетов в питоне с квантилем не очень много
регресс...

Почему это должно идти в scikit-learn?

GaelVaroquaux 13 мая 2014

Если возможно, то почему бы и нет?

yangky11 13 мая 2014

Потому что у нас уже есть много кода, который нужно поддерживать, и мы включаем только популярные алгоритмы машинного обучения. Это популярно? Имеет ли он явные преимущества для задач машинного обучения по сравнению с другими подходами?

(Кстати , VW имеет квантильную регрессию с потерями ℓ(p,y) = τ(p - y)[[y ≤ p]] + (1 - τ)(y - p)[[y ≥ p]], где [ [⋅]] — скобки Айверсона.)

larsmans 17 мая 2014

GradientBoostingRegressor поддерживает квантильную регрессию (с использованием loss=quantile и параметра alpha ). Пример см. на странице http://scikit-learn.org/dev/auto_examples/ensemble/plot_gradient_boosting_quantile.html#example -ensemble-plot-gradient-boosting-quantile-py.

glouppe 17 мая 2014

Я должен был это проверить. Закрытие этого вопроса.

larsmans 18 мая 2014

Хотя я не согласен с тем, что это не так много пакетов для квантильной регрессии на Python, я считаю, что важно иметь чистую квантильную регрессию (не внутри метода ансамбля) в научном наборе.

Квантильная регрессия имеет то преимущество, что она ориентирована на конкретный квантиль y. При этом можно уменьшить разницу медианы y_pred и y. В этом случае это похоже на минимизацию абсолютной ошибки, но гораздо более общее и работает для других квантилей.

Банки часто используют это при работе с кредитным скорингом и другими моделями, так что это проверенная в реальных условиях модель. Эта модель реализована в R и SAS.

prcastro 27 авг. 2017

@prcastro вы имеете в виду линейную модель?

amueller 29 авг. 2017

Точно. Сегодня sklearn реализует квантильную регрессию для ансамблевых методов. Однако обычно он используется как обычная линейная модель.

prcastro 30 авг. 2017

Я был бы готов добавить его. @jnothman @GaelVaroquaux?

amueller 30 авг. 2017

Кажется, это действительно установлено

agramfort 30 авг. 2017

Я был бы готов добавить его. @jnothman @GaelVaroquaux?

Нет оппозиции. Нам просто нужен хороший PR, и время, чтобы рассмотреть его.

GaelVaroquaux 30 авг. 2017

Что касается конкретного случая квантильной регрессии для медианы (абсолютная потеря), в отличие от более общих квантилей, кажется, что http://scikit-learn.org/stable/modules/generated/sklearn.linear_model.HuberRegressor.html позволит это если бы мы только могли передать epsilon=0.0. Почему HuberRegressor требует epsilon : float, greater than 1.0 ? ( The Huber Regressor optimizes the squared loss for the samples where |(y - X'w) / sigma| < epsilon and the absolute loss for the samples where |(y - X'w) / sigma| > epsilon. )