Scikit-learn: 선형 분위수 회귀 추가

에 만든 2014년 05월 13일 · 17코멘트 · 출처: scikit-learn/scikit-learn

분위수 회귀가 있는 파이썬에는 패키지가 많지 않은 것 같습니다...

출처

yangky11

👍3

가장 유용한 댓글

여러분, 안녕하세요! 시간이 되시면 제 PR을 검토해 주십시오.

avidale 에 2018년 04월 19일

👍13

모든 17 댓글

quantile이있는 파이썬에는 패키지가별로없는 것 같습니다.
회귀...

왜 scikit-learn에 들어가야 하나요?

GaelVaroquaux 에 2014년 05월 13일

가능하다면 그 이유는 무엇입니까?

yangky11 에 2014년 05월 13일

이미 유지 관리해야 할 코드가 많고 인기 있는 ML 알고리즘만 포함하기 때문입니다. 이거 유명해? 다른 접근 방식에 비해 머신 러닝 작업에 대한 분명한 이점이 있습니까?

(Btw. VW는 손실 ℓ(p,y) = τ(p - y)[[y ≤ p]] + (1 - τ)(y - p)[[y ≥ p]]를 갖는 분위수 회귀 를 가지고 있습니다. 여기서 [ [⋅]]는 Iverson 대괄호입니다.)

larsmans 에 2014년 05월 17일

GradientBoostingRegressor 는 분위수 회귀를 지원합니다( loss=quantile 및 alpha 매개변수 사용). 예제는 http://scikit-learn.org/dev/auto_examples/ensemble/plot_gradient_boosting_quantile.html#example -ensemble-plot-gradient-boosting-quantile-py를 참조하십시오.

glouppe 에 2014년 05월 17일

나는 그것을 확인했어야 했다. 이 문제를 닫습니다.

larsmans 에 2014년 05월 18일

Python의 Quantile Regression용 패키지가 많지 않다는 데 동의하지는 않지만 sci-kit에서 순수한 Quantile Regression(Ensemble 메서드 내부가 아님)을 학습하는 데 이것이 중요하다고 생각합니다.

분위수 회귀는 y의 특정 분위수를 대상으로 하는 이점이 있습니다. 이를 통해 y_pred와 y의 중앙값의 차이를 줄일 수 있습니다. 이 경우 절대 오차를 최소화하는 것과 유사하지만 훨씬 더 일반적이고 다른 분위수에 적용됩니다.

은행은 신용 점수 및 기타 모델을 다룰 때 이것을 많이 사용하므로 실제 응용 프로그램과 전투 테스트를 거친 모델입니다. R과 SAS는 이 모델을 구현했습니다.

prcastro 에 2017년 08월 27일

@prcastro 선형 모델을 의미합니까?

amueller 에 2017년 08월 29일

정확히. 오늘날 sklearn은 앙상블 방법에서 분위수 회귀를 구현합니다. 그러나 일반적으로 일반 선형 모델로 사용됩니다.

prcastro 에 2017년 08월 30일

나는 그것을 추가하는 데 열려 있습니다. @jnothman @GaelVaroquaux?

amueller 에 2017년 08월 30일

참으로 공평한 것 같다.

agramfort 에 2017년 08월 30일

나는 그것을 추가하는 데 열려 있습니다. @jnothman @GaelVaroquaux?

반대가 없습니다. 우리는 단지 좋은 PR과 그것을 검토할 시간이 필요합니다.

GaelVaroquaux 에 2017년 08월 30일

보다 일반적인 분위수와 달리 중앙값(절대 손실)에 대한 분위수 회귀의 특정 경우와 관련하여 http://scikit-learn.org/stable/modules/generated/sklearn.linear_model.HuberRegressor.html 이 허용하는 것으로 보입니다. 우리가 엡실론=0.0을 전달할 수만 있다면 말이다. HuberRegressor에 epsilon : float, greater than 1.0 가 필요한 이유는 무엇입니까? ( The Huber Regressor optimizes the squared loss for the samples where |(y - X'w) / sigma| < epsilon and the absolute loss for the samples where |(y - X'w) / sigma| > epsilon. )

atorch 에 2017년 09월 26일

엡실론=0인 후버 손실은 매끄럽지 않은 최적화 문제입니다.
동일한 클래스의 솔버를 사용할 수 없습니다.

GaelVaroquaux 에 2017년 09월 26일

위의 pull 요청에 고전적인 분위수 선형 회귀를 추가했습니다. 검토해 주세요!

avidale 에 2017년 10월 22일

👍11

여러분, 안녕하세요! 시간이 되시면 제 PR을 검토해 주십시오.

avidale 에 2018년 04월 19일

👍13

핑

avidale 에 2018년 08월 28일

👍11

분위수 회귀가 있는 파이썬에는 패키지가 많지 않은 것 같습니다...

그들은 2020년을 듣지 않을 것이며 여전히 적절한 4분위 회귀 패키지가 없습니다.

mu745511 에 2020년 09월 11일

이 페이지가 도움이 되었나요?

0 / 5 - 0 등급

Scikit-learn: 선형 분위수 회귀 추가

가장 유용한 댓글

모든 17 댓글

관련 문제