Scikit-learn: Agregar ejemplos a los documentos de la clase

Creado en 12 nov. 2014  ·  165Comentarios  ·  Fuente: scikit-learn/scikit-learn

__UPDATE 23 de mayo de 202__

Aquí hay una lista de las clases restantes:

  • [] feature_selection.SelectorMixin
  • [x] calibración.CalibratedClassifierCV ( # 15134 )
  • [] descomposición.DiccionarioLearning ( # 16907 )
  • [] descomposición.MiniBatchDictionaryLearning ( # 16907 )
  • [] descomposición.SparseCoder ( # 15233 )
  • [] ensemble.GradientBoostingClassifier
  • [x] gaussian_process.kernels.CompoundKernel
  • [] gaussian_process.kernels.Hyperparameter
  • [] gaussian_process.kernels.Kernel
  • [] proceso_gaussiano.kernels.PairwiseKernel
  • [] inspección.PartialDependenceDisplay
  • [x] linear_model.PoissonRegressor
  • [x] linear_model.TweedieRegressor
  • [x] linear_model.GammaRegressor
  • [x] metrics.ConfusionMatrixDisplay
  • [x] métricas.PrecisionRecallDisplay
  • [] blend.BayesianGaussianMixture
  • [] blend.GaussianMixture
  • [] multioutput.ClassifierChain ( # 15211 )
  • [x] multioutput.RegressorChain ( # 15215 )
  • [] vecinos. Árbol de bolas
  • [] vecinos.DistanciaMetric
  • [] vecinos.KDTree

La mayoría de los documentos de las clases carecen de ejemplos. Sería genial agregar uno o dos ejemplos similares a este, http://scikit-learn.org/stable/modules/generated/sklearn.linear_model.Lasso.html
image

Documentation Easy good first issue

Comentario más útil

Cerrando esto ya que todos los RP se han fusionado y no hay más clases relevantes sin ejemplos.
¡Gracias @ j2heng por ayudar en la clasificación durante el sprint!

Todos 165 comentarios

Supongo que te refieres a un pequeño fragmento de código / prueba documental con cada estimador.

Esta es una de las razones por las que agregué enlaces automáticos a los
ejemplos de la galería al mostrar la referencia de API compilada, p. ej.
http://scikit-learn.org/dev/modules/generated/sklearn.manifold.Isomap.html#examples -using-sklearn-manifold-isomap.
Desafortunadamente, no había una forma sencilla de hacer que estos renderizados donde
los ejemplos de doctest sí (y por lo tanto fueron relegados al final de la
página que está fuera de la generación numpydoc).

El 12 de noviembre de 2014 a las 23:06, Manoj Kumar [email protected] escribió:

La mayoría de los documentos de las clases carecen de ejemplos. Sería genial agregar uno
o dos ejemplos similares a este,
http://scikit-learn.org/stable/modules/generated/sklearn.linear_model.Lasso.html

-
Responda a este correo electrónico directamente o véalo en GitHub
https://github.com/scikit-learn/scikit-learn/issues/3846.

Sí, quise decir probablemente uno o dos revestimientos (por ejemplo) https://github.com/scikit-learn/scikit-learn/pull/3802/files#diff -1741ad6b05f1eb0fd71af8bad0e001c7R321 solo para mostrar la API.

Esta es una de las razones por las que agregué enlaces automáticos a ejemplos pertinentes de la galería al mostrar la referencia de API compilada

Esto es asombroso. ¡No lo había notado antes!

Esto es asombroso. ¡No lo había notado antes!

Solo en dev. Y escondido en la parte inferior de la página :(

¿Dónde más crees que sería mejor?

¿Debajo de la descripción de la clase y arriba de los parámetros?

Cualquier lugar antes de la descripción del método estaría bien. Las descripciones de los métodos pueden ocupar mucho espacio vertical en la página de referencia de la API, por lo que es poco probable que alguien se desplace más allá de ellas en busca de ejemplos.

Lo siento por la respuesta tardía. ¿Asumo que no es demasiado fácil de hacer? De lo contrario, lo habrías hecho tú mismo?

No, ¡es incluso más complicado que el enfoque actual!

El 19 de noviembre de 2014 a las 21:59, Manoj Kumar [email protected] escribió:

Lo siento por la respuesta tardía. ¿Asumo que no es demasiado fácil de hacer? Demás
lo habrías hecho tú mismo?

-
Responda a este correo electrónico directamente o véalo en GitHub
https://github.com/scikit-learn/scikit-learn/issues/3846#issuecomment -63623385
.

¿Qué tal simplemente agregar ejemplos a la cadena de documentos de las clases que faltan?

Estos son los estimadores (98-10 / 148) que actualmente carecen de una sección Examples : -

Hecho / WIP

ExtraTreesRegressor
BaggingClassifier
BaggingRegressor

4498 -

AdaBoostRegressor
GradientBoostingRegressor

Innecesario

ExtraTreeClassifier  # Used only in ensembling
ExtraTreeRegressor # -do-

HACER

AffinityPropagation
AgglomerativeClustering
Binarizer
CheckingClassifier
CountVectorizer
DBSCAN
DPGMM
DictionaryLearning
ElasticNet
ElasticNetCV
EmpiricalCovariance
FactorAnalysis
FastICA
FeatureAgglomeration
GaussianRandomProjection
GenericUnivariateSelect
GraphLasso
GraphLassoCV
HashingVectorizer
Imputer
IncrementalPCA
Isomap
KMeans
KernelCenterer
KernelDensity
KernelPCA
LarsCV
LassoCV
LassoLarsCV
LedoitWolf
LinearRegression
LinearSVC
LinearSVR
LocallyLinearEmbedding
LogOddsEstimator
LogisticRegression
LogisticRegressionCV
MDS
MeanEstimator
MeanShift
MinCovDet
MinMaxScaler
MiniBatchDictionaryLearning
MiniBatchKMeans
MiniBatchSparsePCA
MultiTaskLassoCV
Normalizer
Nystroem
OAS
OneClassSVM
OrthogonalMatchingPursuit
OrthogonalMatchingPursuitCV
PLSSVD
PassiveAggressiveClassifier
PassiveAggressiveRegressor
PatchExtractor
Perceptron
PriorProbabilityEstimator
QuantileEstimator
RANSACRegressor
RBFSampler
RandomForestClassifier
RandomForestRegressor
RidgeCV
RidgeClassifier
RidgeClassifierCV
ScaledLogOddsEstimator
SelectFdr
SelectFpr
SelectFwe
SelectKBest
SelectPercentile
ShrunkCovariance
SkewedChi2Sampler
SparsePCA
SparseRandomProjection
SpectralBiclustering
SpectralClustering
SpectralCoclustering
SpectralEmbedding
StandardScaler
TfidfVectorizer
TheilSenRegressor
VBGMM
Ward
WardAgglomeration
ZeroEstimator

Por supuesto, pero ¿no crees que eso es un poco tedioso? A menos que tenga un guión.

Quería aprender un poco sobre todos estos estimadores ... Creo que esta sería una buena manera de hacerlo :) ¿Debo empezar a trabajar en ello?

¡Seguro!

Estoy trabajando en esto.

@ltcguthrie que parte? Hay muchos modelos en los que trabajar para ello.

Empezaré con TfidfVectorizer.

Trabajando en RandomForestClassifier y RandomForestRegressor

Trabajando en PassiveAggressiveClassifier, PassiveAggressiveRegressor

Trabajando en LinearSVC, LinearSVR

Trabajando en StandardScaler, MinMaxScaler

Trabajando en ElasticNet, ElasticNetCV

Además, creó el documento de Google para la lista de objetos hechos / deshechos

https://docs.google.com/spreadsheets/d/19D-RQocsLk4BM7-Xax8hVvIu3XDgwYSUnvja4cMrJww/edit#gid = 0

@lodurality también puede crear una lista aquí con casillas de verificación

  • [ ] me gusta
  • [ ] esta

Lo marcaré como 0.21 y es un buen primer número, ya que creo que será útil incluir un pequeño ejemplo para cada clase.

trabajando en sklearn/cluster

Hola, estoy trabajando para agregar un ejemplo para el Imputer como primera contribución.

Trabajando en TfidfVectorizer y CountVectorizer.

Parece que se trabajó en los números 7961 , 8519 y 8525, pero aún no se terminaron ni se fusionaron.

También trabajando en HashingVectorizer en sklearn/feature_extraction/text.py .

Tomando OPTICS . (depende de # 11677)

Tomando sklearn/feature_selection/univariate_selection.py

Creo que aún puede proporcionar un ejemplo de ÓPTICA incluso con el error :)

@ qinhanmin2014 ¿te refieres a un ejemplo sin un valor atípico para que no muestre el error? Supongo que sería bueno tener un ejemplo de cómo OPTICS detecta un valor atípico, y sospecho que nos olvidaríamos de cambiar el ejemplo una vez que se solucione el error. Puedo escribir una nota en el problema _bug_ para corregir el ejemplo una vez que se solucione el problema, pero luego el ejemplo inicial no tendrá el valor atípico. ¿Debería hacer eso?

¿Te refieres a un ejemplo sin un valor atípico para que no muestre el error?

No, me refiero a uno con valores atípicos, como DBSCAN

No he investigado el error, pero espero que OPTICS pueda detectar valores atípicos correctos la mayor parte del tiempo, por lo que aún puede construir un ejemplo. Si este no es el caso, creo que debemos etiquetar el error como bloqueador.

Muy bien, intentaré ver si puedo encontrar un ejemplo simple en el que funcione bien.

Asumiendo sklearn/linear_model/ridge.py

asumiendo sklearn/covariance/graph_lasso_.py

tomando sklearn/linear_model/logistic.py

tomando clases preprocessing .

tomando Perceptron

He agregado el ejemplo en la clase Perceptron pero por algunas razones desconocidas no funcionará.
¡Se necesita ayuda, soy un novato! (PD: ya he creado una solicitud de extracción).

https://github.com/scikit-learn/scikit-learn/pull/11798

tomando sklearn/random_projection

[[MRG] Ejemplos de Perceptron en Perceptron.py a scikit-learn / scikit-learn / linear_model / perceptron.py # 11798

Tomando 'sklearn / manifold'

Estoy trabajando en sklearn.feature_extraction.image.PatchExtractor

Andrea y yo trabajaremos en sklearn.cluster.Ward y el ejemplo de LedoitWolf. Estamos actualizando el rastreador de Excel para asegurarnos de que nadie esté realizando esfuerzos duplicados.

Estoy trabajando en sklearn.decomposition.DictionaryLearning

Acabamos de actualizar el documento de Google de @lodurality aquí:
https://docs.google.com/spreadsheets/d/19D-RQocsLk4BM7-Xax8hVvIu3XDgwYSUnvja4cMrJww/edit#gid = 0

Shimeng y yo trabajaremos en los que faltan.

@andreanr , ese doc es un poco viejo y falta un montón de clases nuevas. Una mejor idea sería tomar un módulo o una carpeta y cubrir todas las clases públicas que contiene.

@adrinjalali Sí definitivamente, terminaremos los sobresalientes en la lista actual y luego actualizaremos la lista en base a los módulos actualizados.

@andreanr, ¿también estás trabajando en las clases de ensemble.gradient_boosting ? De lo contrario, me gustaría trabajar en eso.

@ daten-kieker ¡adelante!

Hola,

¿Queda algo a lo que pueda contribuir?

Gracias.

@srividhyaprakash Solo agregué ejemplos para estimadores en ensemble.gradient_boosting . Podrías echar un vistazo a las otras clases.

@ daten-kieker, Gracias por tu respuesta. Esta es mi primera vez en un repositorio público bien mantenido. ¿Podrías guiarme sobre una posible guía de inicio para comprometer el estilo y el formato del ejemplo?
Gracias.

@srividhyaprakash , puede comenzar revisando lo que encuentre en la guía del desarrollador . También puede preguntar en gitter si tiene preguntas para comenzar. Les deseo un feliz viaje de contribución aquí.

Una vez que comience con este problema en particular, puede verificar algunas de las solicitudes de extracción que ve en este hilo para tener una idea de lo que implica.

Hola, ¿hay algo en lo que pueda ayudar?

Si todavía está disponible, ¿podría ocuparme de la cadena de documentación LinearRegression?

@adrinjalali disculpas, acabo de leer las diferentes confirmaciones y vi que ya terminaste la regresión lineal en # 11975. ¿Puedo ocuparme de la cadena de documentación LogisticRegression?

Hemos perdido un poco la pista de lo que queda aquí. Una contribución sería verificar todas las clases públicas y enumerar las que aún necesitan un ejemplo, y partir de ahí.

@adrinjalali , puedo compilar una lista de lo que queda

@adrinjalali , me emocioné tanto que olvidé preguntar, ¿hay alguna rama específica de este proyecto que tenga las últimas actualizaciones?

master tiene las últimas actualizaciones. Por otro lado, un enfoque podría ser
considere la documentación de la API generada (por ejemplo, en
https://github.com/scikit-learn/scikit-learn.github.io/tree/master/dev/modules/generated)
y grep para archivos que no contienen class="rubric">Examples

@jnothman , gracias, el consejo de grepping fue acertado. Empezaré a compilar la lista hoy.

¿Necesita más ayuda aquí para actualizar un documento existente o para crear uno nuevo ...?
También me ayudaría a comenzar con el código abierto ... por lo que cualquier dirección o trabajo sería apreciado.

Todavía necesitamos una lista actualizada de clases sin ejemplos. ¿Ping @ Khayyon1?

@ Khayyon1 ¿has completado la lista o necesitas ayuda ...?

@adrinjalali , voy a tener que dejarlo porque la escuela se reanudó poco después de que pedí ayuda y no he podido trabajar en esto, mis disculpas.

@adrinjalali, así que debería ver cuáles quedan de la lista mencionada por @raghavrv

@ coderop2 es una lista de 3-4 años, ¡probablemente sea mejor comenzar una nueva!

Sry por la respuesta tardía ... Tan pronto como mis exámenes universitarios terminen, comenzaré a compilar una nueva lista mientras tengo en mente la lista anterior ... espero que sea suficiente para servir como referencia para todos

$ # list those with examples
$ git grep -p '^    Examples$' sklearn | grep '=class ' | sed 's/[^ ]* //;s/(.*//;s/:.*//' | sort > /tmp/classes_with_examples.txt
$ # rough list of all public classes
$ grep '\.[A-Z][a-zA-Z]\+' doc/modules/classes.rst  > /tmp/classes.txt
$ # classes without examples
$ grep -v -wFf /tmp/classes_with_examples.txt /tmp/classes.txt

...
that was incorrect. See below.
...

No estoy seguro de que esto sea exacto

Este puede ser más preciso, pero aún tiene falsos positivos. Además, asumiendo que no necesitamos ejemplos para las clases Mixin y Warning.

BaggingRegressor
BallTree
BaseEstimator
BayesianGaussianMixture
CalibratedClassifierCV
ClassifierChain
ColumnTransformer
CompoundKernel
ConstantKernel
DictionaryLearning
DistanceMetric
DotProduct
DummyClassifier
DummyRegressor
Exponentiation
ExpSineSquared
ExtraTreeClassifier
ExtraTreeRegressor
ExtraTreesClassifier
ExtraTreesRegressor
FunctionTransformer
GaussianMixture
GradientBoostingClassifier
GradientBoostingRegressor
GraphLasso
GraphLassoCV
GroupShuffleSplit
Hyperparameter
Imputer
IsolationForest
IsotonicRegression
IterativeImputer
KDTree
Kernel
KernelDensity
LocalOutlierFactor
Matern
Memory
MiniBatchDictionaryLearning
MLPClassifier
MLPRegressor
MultiOutputClassifier
MultiOutputRegressor
OAS
OneClassSVM
OneVsOneClassifier
OneVsRestClassifier
OPTICS
OutputCodeClassifier
PairwiseKernel
Parallel
Product
RandomizedSearchCV
RandomTreesEmbedding
RationalQuadratic
RBF
RegressorChain
SelectFromModel
SparseCoder
Sum
TfidfTransformer
WhiteKernel

Sí, tuve la búsqueda incorrecta, dando muchos falsos positivos. Este es mejor:

$ grep -v -f <(cat /tmp/classes_with_examples.txt | sed 's/.*/\\.&$/')  /tmp/classes.txt
   base.BaseEstimator
   base.BiclusterMixin
   base.ClassifierMixin
   base.ClusterMixin
   base.DensityMixin
   base.RegressorMixin
   base.TransformerMixin
   calibration.CalibratedClassifierCV
   cluster.OPTICS
    compose.ColumnTransformer
   covariance.OAS
   decomposition.DictionaryLearning
   decomposition.MiniBatchDictionaryLearning
   decomposition.SparseCoder
   dummy.DummyClassifier
   dummy.DummyRegressor
   ensemble.BaggingClassifier
   ensemble.BaggingRegressor
   ensemble.ExtraTreesClassifier
   ensemble.ExtraTreesRegressor
   ensemble.GradientBoostingClassifier
   ensemble.GradientBoostingRegressor
   ensemble.IsolationForest
   ensemble.RandomTreesEmbedding
   exceptions.ChangedBehaviorWarning
   exceptions.ConvergenceWarning
   exceptions.DataConversionWarning
   exceptions.DataDimensionalityWarning
   exceptions.EfficiencyWarning
   exceptions.NonBLASDotWarning
   exceptions.UndefinedMetricWarning
   feature_extraction.text.TfidfTransformer
   feature_selection.SelectFromModel
  gaussian_process.kernels.CompoundKernel
  gaussian_process.kernels.ConstantKernel
  gaussian_process.kernels.DotProduct
  gaussian_process.kernels.ExpSineSquared
  gaussian_process.kernels.Exponentiation
  gaussian_process.kernels.Hyperparameter
  gaussian_process.kernels.Kernel
  gaussian_process.kernels.Matern
  gaussian_process.kernels.PairwiseKernel
  gaussian_process.kernels.Product
  gaussian_process.kernels.RBF
  gaussian_process.kernels.RationalQuadratic
  gaussian_process.kernels.Sum
  gaussian_process.kernels.WhiteKernel
   isotonic.IsotonicRegression
   impute.IterativeImputer
   mixture.BayesianGaussianMixture
   mixture.GaussianMixture
   model_selection.GroupShuffleSplit
   model_selection.RandomizedSearchCV
    multiclass.OneVsRestClassifier
    multiclass.OneVsOneClassifier
    multiclass.OutputCodeClassifier
    multioutput.ClassifierChain
    multioutput.MultiOutputRegressor
    multioutput.MultiOutputClassifier
    multioutput.RegressorChain
   neighbors.BallTree
   neighbors.DistanceMetric
   neighbors.KDTree
   neighbors.KernelDensity
   neighbors.LocalOutlierFactor
   neural_network.MLPClassifier
   neural_network.MLPRegressor
   preprocessing.FunctionTransformer
   svm.OneClassSVM
   tree.ExtraTreeClassifier
   tree.ExtraTreeRegressor
   utils.Memory
   utils.Parallel
   covariance.GraphLasso
   covariance.GraphLassoCV
   preprocessing.Imputer

Esto es 76 mientras que su lista es 62: excluye base.* y exceptions.* que es bastante justo, @adrinjalali , mientras que incluye cosas extrañas como Sum .

Lo sentimos, ambos incluimos Sum. Tonto.

Asumiendo GroupShuffleSplit

Trabajaría en dummy (DummyClassifier, DummyRegressor).

Esta es la lista actual de clases que pueden necesitar ejemplos:

base.BaseEstimator
base.BiclusterMixin
base.ClassifierMixin
base.ClusterMixin
base.DensityMixin
base.RegressorMixin
base.TransformerMixin
cluster.OPTICS
compose.ColumnTransformer
covariance.OAS
decomposition.DictionaryLearning
decomposition.MiniBatchDictionaryLearning
decomposition.SparseCoder
ensemble.BaggingClassifier
ensemble.BaggingRegressor
ensemble.ExtraTreesClassifier
ensemble.ExtraTreesRegressor
ensemble.GradientBoostingClassifier
ensemble.GradientBoostingRegressor
ensemble.IsolationForest
ensemble.RandomTreesEmbedding
exceptions.ChangedBehaviorWarning
exceptions.ConvergenceWarning
exceptions.DataConversionWarning
exceptions.DataDimensionalityWarning
exceptions.EfficiencyWarning
exceptions.NonBLASDotWarning
exceptions.UndefinedMetricWarning
feature_extraction.text.TfidfTransformer
feature_selection.SelectFromModel
gaussian_process.kernels.CompoundKernel
gaussian_process.kernels.ConstantKernel
gaussian_process.kernels.DotProduct
gaussian_process.kernels.ExpSineSquared
gaussian_process.kernels.Exponentiation
gaussian_process.kernels.Hyperparameter
gaussian_process.kernels.Kernel
gaussian_process.kernels.Matern
gaussian_process.kernels.PairwiseKernel
gaussian_process.kernels.Product
gaussian_process.kernels.RBF
gaussian_process.kernels.RationalQuadratic
gaussian_process.kernels.Sum
gaussian_process.kernels.WhiteKernel
impute.IterativeImputer
inspection.PartialDependenceDisplay
metrics.RocCurveDisplay
mixture.BayesianGaussianMixture
mixture.GaussianMixture
multiclass.OneVsRestClassifier
multiclass.OneVsOneClassifier
multiclass.OutputCodeClassifier
multioutput.ClassifierChain
multioutput.MultiOutputRegressor
multioutput.MultiOutputClassifier
multioutput.RegressorChain
neighbors.BallTree
neighbors.DistanceMetric
neighbors.KDTree
neighbors.KernelDensity
neighbors.LocalOutlierFactor
neural_network.MLPClassifier
neural_network.MLPRegressor
preprocessing.FunctionTransformer
svm.LinearSVC
tree.ExtraTreeClassifier
tree.ExtraTreeRegressor
utils.Memory
utils.Parallel

Hola @pspachtholz @MechCoder , me gustaría trabajar en esto. Me interesa contribuir a scikit-learn y creo que este puede ser un buen punto de partida.

Gracias

@PyExtreme Creo que puede seguir adelante, seleccionar una o más clases de la lista que le parezcan interesantes y agregar ejemplos. Luego publicaría aquí en qué estás trabajando para evitar el trabajo duplicado. Para obtener orientación, puede echar un vistazo a las solicitudes de extracción fusionadas anteriormente.

@pspachtholz , estoy recogiendo _ExtraTreesClassifier_ inicialmente y después de realizar el compromiso, me gustaría

Gracias

Trabajó en el aumento de gradiente.

Recogiendo neural_network.MLPClassifier & neural_network.MLPRegressor

Estoy en svm.LinearSVC

Estoy trabajando en sklearn.multioutput.MultiOutputClassifier

Hola, estaré trabajando en mixture.BayesianGaussianMixture y mixture.GaussianMixture

Estoy en feature_extraction.text.TfidfTransformer . ¡Deseame buena suerte!

Estoy en feature_extraction.text.TfidfTransformer. ¡Deseame buena suerte!

también trabajando en ello - ¿Quizás podamos compartir ejemplos?

recogiendo ensemble.ExtraTreesClassifier

Estoy eligiendo el ensemble.BaggingRegressor

Estoy trabajando en feature_selection.SelectFromModel

Estoy escogiendo vecinos.

Estoy en ensemble.IsolationForest

en multiclass.OneVsRestClassifier

Oye, trabajaré en los núcleos del proceso gaussiano, comenzando con gaussian_process.kernels.RBF y luego haré los otros núcleos con @thorbenjensen

Trabajando en ensemble.GradientBoostingClassifier

Trabajando en Perceptron

Trabajando en ensemble.GradientBoostingRegressor

Siguiente tree.ExtraTreeClassifier

trabajando en ensemble.GradientBoostingRegressor

echando un vistazo a multiclass.OutputCodeClassifier

Mirando neighbors.LocalOutlierFactor .

trabajando en ensemble.RandomTreesEmbedding

recogiendo ensemble.ExtraTreesClassifier

Hola @jorahn , ya
No dude en elegir otro módulo.

Sugiero revisar los comentarios antes para ver si alguien ya está trabajando en una clase para evitar el trabajo duplicado.
Para algunas clases ya existen algunas solicitudes mrg (posiblemente obsoletas), donde podríamos preguntar a los autores si todavía están trabajando activamente en ello.

@flaviomorelli @LBrummer @mschaffenroth Hice el gradiente de conjunto en este PR ya # 15151

Realmente genial por cierto ver que esto está ganando velocidad :-)

recogiendo ensemble.ExtraTreesClassifier

Hola @jorahn , ya
No dude en elegir otro módulo.

oh, no vi eso en este tema. por lo que ahora tenemos dos RP para eso

Perceptron ya está documentado.

trabajando en tree.ExtraTreeRegressor

trabajando en impute.IterativeImputer

@pspachtholz , estoy recogiendo _ExtraTreesClassifier_ inicialmente y después de realizar el compromiso, me gustaría

Gracias

@jorahn , lo había mencionado hace 1 semana solo aquí y ya había estado trabajando en ello desde 1 semana.

Trabajando en OneVsOneClassifier.

Voy por los metrics.RocCurveDisplay

trabajando en multioutput.ClassifierChain

Trabajando en PriorProbabilityEstimator .

Trabajando en multioutput.MultiOutputRegressor

tomando neighbors.BallTree

PriorProbabilityEstimator está obsoleto en la versión 0.21 y se eliminará en la versión 0.23. No estoy trabajando en esto.

Trabajando en covariance.OAS

SelectPercentile ya documentado.

trabajando en ensemble.ExtraTreesRegressor

tomando neighbors.BallTree

hay algunos ejemplos para BallTree y compose.ColumnTransformer ya

RANSACRegressor ya documentado.

tomando decomposition.SparseCoder

SelectKBest ya documentado.

SpectralClustering ya documentado

Trabajando en IsolationForest

Trabajando en IsolationForest

Hola @zioalex , ya tengo un PR para esto: # 15205. Feliz de recibir sugerencias y comentarios: smiley:

Trabajando en neighbors.DistanceMetric .

trabajando en multioutput.RegressorChain

trabajando en exceptions.ConvergenceWarning

trabajando en exceptions.ChangedBehaviorWarning

trabajando en exceptions.ChangedBehaviorWarning

Después de ir a

Para su tranquilidad sea como nosotros, no trabaje en exceptions.ChangedBehaviorWarning

Trabajando en exceptions.DataDimensionalityWarning

Me gustaría trabajar en algunos. Empezaré por la óptica.

¡Hola! Acabo de plantear un PR después de agregar un fragmento de código de ejemplo a la agrupación de K-means. Esta es mi primera contribución de código abierto, por lo que sería genial si alguien pudiera investigar esto y ver si necesita más trabajo.
Gracias y saludos,
Smriti Singh

Revisé la lista de octubre pasado y verifiqué qué clases ya han combinado PR / ejemplos. Supongo que las afirmaciones del año pasado o hace más tiempo, sobre las que no ha sucedido nada más, pueden ignorarse.
Así que aquí viene una lista actualizada de tareas pendientes:

no funciona en esto, depende de la versión: excepciones.ChangedBehaviorWarning

RP abiertos:

descomposición.SparseCoder # 15233

~ excepciones.DataDimensionalityWarning # 15246 ~
mezcla BayesianGaussianMixture # 15193
mezcla.GaussianMixture # 15193
multioutput.ClassifierChain # 15211
multioutput.RegressorChain # 15215

nuevas prs abiertas:
descomposición.Diccionario Aprendizaje # 16907
~ excepciones Advertencia de eficiencia # 16785 ~
~ excepciones.UndefinedMetricWarning # 16784 ~

Gratis para tomar:

(EDITAR: los de base son más adecuados para la guía del desarrollador, ignorémoslos por ahora)
~ base.BaseEstimator ~
~ base.BiclusterMixin ~
~ base.ClassifierMixin ~
~ base.ClusterMixin ~
~ base.DensityMixin ~
~ base.RegressorMixin ~
~ base.TransformerMixin ~

descomposición.MiniBatchDictionaryLearning

~ excepciones.NonBLASDotWarning ~

~ feature_selection.SelectFromModel ~

gaussian_process.kernels.CompoundKernel
gaussian_process.kernels.Hyperparameter
~ gaussian_process.kernels.Kernel ~

~ inspección.PartialDependenceDisplay ~

~ multiclase.OneVsOneClassifier ~

~ multioutput.MultiOutputClassifier ~

~ utils.Memory ~
~ utils.Parallel ~

Actualizar.
covarianza OAS # 16681
multioutput.MultiOutputRegressor # 16698
tree.ExtraTreeClassifier # 16671

vecinos Distancia Métrica
vecinos.KDTree
vecinos.LocalOutlierFactor

excepciones.DataConversionWarning # 16704

multiclass.OneVsOneClassifier # 16700

¿Queremos ejemplos para las clases base.* ? Supongo que tiene más sentido tenerlos mejor documentados en developer guide . WDYT @jnothman @NicolasHug ?

De acuerdo, es mejor para la guía del desarrollador. Estoy editando el comentario

Creo que se cerró por accidente.

multioutput.MultiOutputClassifier ya tiene ejemplos. ¿Debería actualizarse para incluir un ejemplo del atributo o debería eliminarse de la lista de tareas pendientes?

Creo que se puede eliminar de la lista. Gracias @marenwestermann

Creo que se puede eliminar de la lista. Gracias @marenwestermann

Ok, entonces feature_selection.SelectFromModel también se puede eliminar porque también tiene ejemplos. (Estos se agregaron en octubre del año pasado).

Con respecto a utils.Memory y utils.Parallel :
en el sitio web scikit-learn se dice que "se eliminarán en la versión 0.23". Revisé el archivo utils.__init__.py donde vivían estas clases y se han eliminado. Por lo tanto, estos también pueden eliminarse de la lista.

Intentaré abordar gaussian_process.kernels.Kernel :)

Aparte del DictionaryLearning / MiniBatchDictionaryLearning PR anterior, también eché un vistazo a las clases vecinas. *: Todas ya tienen al menos un ejemplo. Los de los vecinos.KDTree y los vecinos.BallTree se generan a partir de la cadena de formato CLASS_DOC que se puede encontrar en el archivo de inclusión _binary_tree.pxi.

Es la primera vez que contribuyo con este proyecto. Me gustaría buscar vecinos. * Clases que incluyen:
vecinos Distancia Métrica
vecinos.KDTree
vecinos.LocalOutlierFactor

Eché un vistazo a gaussian_process.kernels.Kernel . Según la documentación, es la "Clase base para todos los núcleos". Por lo tanto, todos sus atributos son atributos de propiedad de solo lectura (métodos con @property decoradores). Por lo tanto, según tengo entendido, no tiene sentido agregar ejemplos a esta clase porque solo se puede usar en combinación con otra clase.
Sin embargo, si se desplaza hasta la parte inferior de la página web de gaussian_process.kernels.Kernel hay un enlace a un ejemplo de cómo se puede utilizar esta clase. Esto se agregó en noviembre de 2019. En este ejemplo, se crea la clase SequenceKernel que hereda de la clase Kernel . La clase SequenceKernel no es una característica de scikit-learn, pero podría ser una característica interesante para agregar.

Corríjame si algo de lo que he escrito aquí es incorrecto.

Sí, sería demasiado complicado escribir un ejemplo para ello. Me alegra que lo eliminen de la lista.

@Malesche exceptions.DataDimensionalityWarning ahora está cerrado y, por lo tanto, se puede quitar de la lista TODO.

Respecto a inspection.PartialDependenceDisplay :
En la descripción de la clase se dice: "Se recomienda usar plot_partial_dependence para crear un PartialDependenceDisplay ". Eché un vistazo a esta función y dentro de ella se crea PartialDependenceDisplay objeto plot se llama su método plot_partial_dependence y, por lo tanto, creo que no es necesario agregar ejemplos a inspection.PartialDependenceDisplay . ¿Qué opinas, @adrinjalali ?

de acuerdo @marenwestermann

exceptions.NonBLASDotWarning también se puede quitar de la lista TODO porque se ha tomado la decisión de no tener ejemplos en exceptions.py (ver # 17040).

@NicolasHug , @amueller en caso de que quieras usar este problema como un problema de sprint, puedes encontrar aquí la lista de las clases que aún faltan ejemplos (gracias al script de Joel, modificado por él mismo ... :)). Ya eliminé las clases base y exceptions . ¿Puedo sugerir editar el problema con la lista que está al principio? Esto facilitará la identificación de las clases disponibles. Las relaciones públicas aún abiertas de sprints anteriores (no solo) están vinculadas a la lista: creo que será útil finalizarlas antes de un nuevo evento (gracias @thomasjpfan por haber comenzado algunas revisiones ya).

Gracias por la sugerencia @cmarmo , actualicé el problema.

Hola, intentaré asumir gaussian_process.kernels.Hyperparameter .

Hola, me encargaré de linear_model.* .

  • linear_model.PoissonRegressor
  • linear_model.TweedieRegressor
  • linear_model.GammaRegressor

Hola, tomaremos ensemble.GradientBoostingClassifier

Hola, tomaremos ensemble.GradientBoostingClassifier

Este ya tiene un ejemplo.

Oye, ahora estamos tomando:

  • metrics.ConfusionMatrixDisplay
  • metrics.PrecisionRecallDisplay

Hola @adrinjalali , ¿puedes consultar las relaciones públicas? ¡Gracias!

@emdupre y trabajaré a continuación como parte del sprint general de datos.

  • vecinos.
  • vecinos Distancia Métrica
  • vecinos.KDTree

Hola @adrinjalali , Parece que ya podemos ver algunos ejemplos a continuación. No está actualizado en la lista de tareas pendientes. Por favor recomiende.

  • vecinos.
  • vecinos Distancia Métrica
  • vecinos.KDTree

Hola, trabajaré en:

  • descomposición.DictionaryLearning (# 16907)
  • descomposición.MiniBatchDictionaryLearning (# 16907)
  • descomposición.SparseCoder (# 15233)

Hola, trabajaré en:

  • gaussian_process.kernels.CompoundKernel

Cerrando esto ya que todos los RP se han fusionado y no hay más clases relevantes sin ejemplos.
¡Gracias @ j2heng por ayudar en la clasificación durante el sprint!

Ah, de verdad. ¿La lista de arriba está desactualizada?

Oh, sí, fusioné el otro PR.

¿Fue útil esta página
0 / 5 - 0 calificaciones