Scikit-learn: Beispiele zu Kursdokumenten hinzufügen

Erstellt am 12. Nov. 2014  ·  165Kommentare  ·  Quelle: scikit-learn/scikit-learn

__UPDATE 23. Mai 202__

Hier ist eine Liste der verbleibenden Klassen:

  • [ ] feature_selection.SelectorMixin
  • [x] Calibration.CalibratedClassifierCV (
  • [ ] Dekomposition.WörterbuchLernen ( #16907 )
  • [ ] Dekomposition.MiniBatchDictionaryLearning ( #16907 )
  • [ ] Dekomposition.SparseCoder ( #15233 )
  • [ ] ensemble.GradientBoostingClassifier
  • [x] gaussian_process.kernels.CompoundKernel
  • [ ] gaussian_process.kernels.Hyperparameter
  • [ ] gaussian_process.kernels.Kernel
  • [ ] gaussian_process.kernels.PairwiseKernel
  • [ ] Inspektion.PartialDependenceDisplay
  • [x] linear_model.PoissonRegressor
  • [x] linear_model.TweedieRegressor
  • [x] linear_model.GammaRegressor
  • [x] metrics.ConfusionMatrixDisplay
  • [x] metrics.PrecisionRecallDisplay
  • [ ] Mischung.BayesianGaussianMixture
  • [ ] Mischung.GaussianMixture
  • [ ] Multioutput.ClassifierChain ( #15211 )
  • [x] Mehrfachausgabe.RegressorChain ( #15215 )
  • [ ] Nachbarn.BallTree
  • [ ] Nachbarn.DistanceMetric
  • [ ] Nachbarn.KDTree

Den meisten Dokumenten in den Klassen fehlen Beispiele. Es wäre großartig, ein oder zwei ähnliche Beispiele hinzuzufügen, http://scikit-learn.org/stable/modules/generated/sklearn.linear_model.Lasso.html
image

Documentation Easy good first issue

Hilfreichster Kommentar

Schließen, da alle PRs zusammengeführt wurden und es keine relevanten Klassen mehr ohne Beispiele gibt.
Danke @j2heng für die Hilfe bei der Triage während des Sprints!

Alle 165 Kommentare

Ich gehe davon aus, dass Sie ein kleines Code-Snippet / doctest mit jedem Schätzer meinen.

Dies ist einer der Gründe, warum ich automatische Links wieder zu relevanten hinzugefügt habe
Beispiele aus der Galerie beim Anzeigen der kompilierten API-Referenz, zB
http://scikit-learn.org/dev/modules/generated/sklearn.manifold.Isomap.html#examples -using-sklearn-manifold-isomap.
Leider gab es keine einfache Möglichkeit, diese zu rendern, wo
die doctest-Beispiele tun dies (und wurden daher an das Ende des
Seite, die aus der numpydoc-Generation stammt).

Am 12. November 2014 23:06 schrieb Manoj Kumar [email protected] :

Den meisten Dokumenten in den Klassen fehlen Beispiele. Es wäre toll, einen hinzuzufügen
oder zwei ähnliche Beispiele,
http://scikit-learn.org/stable/modules/generated/sklearn.linear_model.Lasso.html


Antworten Sie direkt auf diese E-Mail oder zeigen Sie sie auf GitHub an
https://github.com/scikit-learn/scikit-learn/issues/3846.

Ja, ich hatte wahrscheinlich ein oder zwei Liner gemeint (zum Beispiel) https://github.com/scikit-learn/scikit-learn/pull/3802/files#diff -1741ad6b05f1eb0fd71af8bad0e001c7R321 nur um die API anzuzeigen.

Dies ist einer der Gründe, warum ich beim Anzeigen der kompilierten API-Referenz automatische Links zu relevanten Beispielen aus der Galerie hinzugefügt habe

Das ist fantastisch. war mir vorher noch nicht aufgefallen!

Das ist fantastisch. war mir vorher noch nicht aufgefallen!

Nur in dev. Und ganz unten auf der Seite versteckt :(

Wo wäre es Ihrer Meinung nach besser?

Unterhalb der Klassenbeschreibung und über den Parametern?

Irgendwo vor der Methodenbeschreibung wäre in Ordnung. Methodenbeschreibungen können viel vertikalen Platz auf der API-Referenzseite einnehmen, daher ist es unwahrscheinlich, dass jemand auf der Suche nach Beispielen daran vorbeiscrollt.

Entschuldigung für die späte Antwort. Ich gehe davon aus, dass es nicht so einfach ist? Hättest du es sonst selbst gemacht?

Nein, es ist noch hacker als der aktuelle Ansatz!

Am 19. November 2014 um 21:59 Uhr schrieb Manoj Kumar [email protected] :

Entschuldigung für die späte Antwort. Ich gehe davon aus, dass es nicht so einfach ist? Anders
hättest du es selbst gemacht?


Antworten Sie direkt auf diese E-Mail oder zeigen Sie sie auf GitHub an
https://github.com/scikit-learn/scikit-learn/issues/3846#issuecomment -63623385
.

Wie wäre es, einfach Beispiele zum Docstring der fehlenden Klassen hinzuzufügen?

Dies sind die Schätzer (98 - 10 / 148), denen derzeit ein Abschnitt Examples fehlt:-

Fertig/WIP

ExtraTreesRegressor
BaggingClassifier
BaggingRegressor

4498 -

AdaBoostRegressor
GradientBoostingRegressor

Nicht benötigt

ExtraTreeClassifier  # Used only in ensembling
ExtraTreeRegressor # -do-

MACHEN

AffinityPropagation
AgglomerativeClustering
Binarizer
CheckingClassifier
CountVectorizer
DBSCAN
DPGMM
DictionaryLearning
ElasticNet
ElasticNetCV
EmpiricalCovariance
FactorAnalysis
FastICA
FeatureAgglomeration
GaussianRandomProjection
GenericUnivariateSelect
GraphLasso
GraphLassoCV
HashingVectorizer
Imputer
IncrementalPCA
Isomap
KMeans
KernelCenterer
KernelDensity
KernelPCA
LarsCV
LassoCV
LassoLarsCV
LedoitWolf
LinearRegression
LinearSVC
LinearSVR
LocallyLinearEmbedding
LogOddsEstimator
LogisticRegression
LogisticRegressionCV
MDS
MeanEstimator
MeanShift
MinCovDet
MinMaxScaler
MiniBatchDictionaryLearning
MiniBatchKMeans
MiniBatchSparsePCA
MultiTaskLassoCV
Normalizer
Nystroem
OAS
OneClassSVM
OrthogonalMatchingPursuit
OrthogonalMatchingPursuitCV
PLSSVD
PassiveAggressiveClassifier
PassiveAggressiveRegressor
PatchExtractor
Perceptron
PriorProbabilityEstimator
QuantileEstimator
RANSACRegressor
RBFSampler
RandomForestClassifier
RandomForestRegressor
RidgeCV
RidgeClassifier
RidgeClassifierCV
ScaledLogOddsEstimator
SelectFdr
SelectFpr
SelectFwe
SelectKBest
SelectPercentile
ShrunkCovariance
SkewedChi2Sampler
SparsePCA
SparseRandomProjection
SpectralBiclustering
SpectralClustering
SpectralCoclustering
SpectralEmbedding
StandardScaler
TfidfVectorizer
TheilSenRegressor
VBGMM
Ward
WardAgglomeration
ZeroEstimator

Natürlich, aber finden Sie das nicht etwas langweilig? Es sei denn, Sie haben ein Skript.

Ich wollte ein wenig über all diese Schätzer lernen... Ich denke, das wäre ein guter Weg, dies zu tun :) Soll ich anfangen, daran zu arbeiten?

Sicher!

Daran arbeite ich.

@ltcguthrie welcher Teil? Dafür gibt es viele Modelle, an denen gearbeitet werden kann.

Ich beginne mit TfidfVectorizer.

Arbeiten an RandomForestClassifier und RandomForestRegressor

Arbeiten an PassiveAggressiveClassifier, PassiveAggressiveRegressor

Arbeiten an LinearSVC, LinearSVR

Arbeiten an StandardScaler, MinMaxScaler

Arbeiten an ElasticNet, ElasticNetCV

Außerdem wurde ein Google-Dokument für eine Liste der erledigten / rückgängig gemachten Objekte erstellt

https://docs.google.com/spreadsheets/d/19D-RQocsLk4BM7-Xax8hVvIu3XDgwYSUnvja4cMrJww/edit#gid =0

@lodurity hier

  • [ ] mögen
  • [ ] Dies

Ich werde es als 0.21 und gute erste Ausgabe markieren, da ich glaube, dass es hilfreich sein wird, ein kleines Beispiel für jede Klasse hinzuzufügen.

arbeite an sklearn/cluster

Hallo, ich arbeite daran, als ersten Beitrag ein Beispiel für den Imputer hinzuzufügen.

Arbeiten an TfidfVectorizer und CountVectorizer.

Anscheinend wurden diese in #7961 , #8519 und #8525 bearbeitet , aber noch nicht abgeschlossen oder zusammengeführt.

Arbeitet auch an HashingVectorizer in sklearn/feature_extraction/text.py .

Nimm OPTICS . (abhängig von #11677)

Einnahme von sklearn/feature_selection/univariate_selection.py

Ich denke, man kann auch mit dem Fehler noch ein Beispiel für OPTIK liefern :)

@qinhanmin2014 meinst du ein Beispiel ohne Ausreißer, damit der Fehler nicht OPTICS einen Ausreißer erkennt, und ich vermute, dass wir das Ändern des Beispiels vergessen würden, sobald dieser Fehler behoben ist. Ich kann eine Notiz in das _bug_-Problem schreiben, um das Beispiel zu beheben, sobald das Problem behoben ist, aber dann hat das ursprüngliche Beispiel keinen Ausreißer. Soll ich das tun?

Meinst du ein Beispiel ohne Ausreißer, damit der Fehler nicht angezeigt wird?

Nein, ich meine einen mit Ausreißern, wie DBSCAN

Ich habe den Fehler nicht untersucht, aber ich würde erwarten, dass OPTICS die meiste Zeit korrekte Ausreißer erkennen kann, sodass Sie immer noch ein Beispiel erstellen können. Wenn dies nicht der Fall ist, müssen wir den Fehler meiner Meinung nach als Blocker markieren.

Fair genug, ich werde versuchen, ein einfaches Beispiel zu finden, bei dem es gut funktioniert.

Übernehmen sklearn/linear_model/ridge.py

sklearn/covariance/graph_lasso_.py

nehmen sklearn/linear_model/logistic.py

an preprocessing Kursen teilnehmen.

Einnahme von Perceptron

Ich habe das Beispiel in der Perceptron-Klasse hinzugefügt, aber aus unbekannten Gründen funktioniert es nicht.
Hilfe benötigt, ich bin ein Anfänger! (ps-ich habe bereits einen Pull-Request erstellt).

https://github.com/scikit-learn/scikit-learn/pull/11798

nehmen sklearn/random_projection

[[MRG] Perceptron-Beispiele in Perceptron.py to scikit-learn/scikit-learn/linear_model/perceptron.py #11798

Einnahme von 'sklearn/manifold'

Ich arbeite an sklearn.feature_extraction.image.PatchExtractor

Andrea und ich werden am Beispiel sklearn.cluster.Ward und LedoitWolf arbeiten. Wir aktualisieren den Excel-Tracker, um sicherzustellen, dass niemand doppelte Anstrengungen unternimmt.

Ich arbeite an sklearn.decomposition.DictionaryLearning

Wir haben gerade das Google-Dokument von @lodurality hier aktualisiert:
https://docs.google.com/spreadsheets/d/19D-RQocsLk4BM7-Xax8hVvIu3XDgwYSUnvja4cMrJww/edit#gid =0

Ich und Shimeng werden an den fehlenden arbeiten.

@andreanr , dieses Dokument ist irgendwie alt und es fehlen eine ganze Reihe neuer Klassen. Eine bessere Idee wäre es, ein Modul oder einen Ordner zu nehmen und alle darin enthaltenen öffentlichen Klassen abzudecken.

@adrinjalali Ja auf jeden Fall, wir werden die ausstehenden in der aktuellen Liste fertigstellen und dann die

@andreanr arbeitest du auch an den Klassen in ensemble.gradient_boosting ? Ansonsten würde ich gerne daran arbeiten.

@daten-kieker mach weiter!

Hallo,

Gibt es noch etwas, wozu ich beitragen könnte?

Danke.

@srividhyaprakash Ich habe nur Beispiele für Schätzer in ensemble.gradient_boosting hinzugefügt. Sie können sich die anderen Klassen ansehen.

@daten-kieker, danke für deine Antwort. Dies ist mein erstes Mal in einem öffentlichen, gut gepflegten Repo. Könnten Sie mir bitte einen möglichen Startleitfaden zum Commit-Stil und -Format für das Beispiel geben?
Danke.

@srividhyaprakash , Sie können zunächst die Entwicklerhandbuch durchgehen. Sie können auch auf gitter fragen, wenn Sie Fragen zum Einstieg haben. Ich wünsche Ihnen hier eine fröhliche Beitragsreise.

Sobald Sie mit diesem speziellen Thema beginnen, können Sie einige der Pull-Requests überprüfen, die Sie in diesem Thread sehen, um eine Vorstellung davon zu bekommen, worum es geht.

Hallo, gibt es noch etwas, bei dem ich helfen könnte?

Wenn es noch verfügbar ist, könnte ich mit dem LinearRegression-Docstring umgehen?

@adrinjalali Entschuldigung, ich habe gerade die verschiedenen Commits gelesen und gesehen, dass Sie die LinearRegression bereits in #11975 abgeschlossen haben. Darf ich mit dem LogisticRegression-Docstring umgehen?

Wir haben irgendwie den Überblick verloren, was hier noch übrig ist. Ein Beitrag wäre, tatsächlich alle öffentlichen Klassen zu überprüfen und diejenigen aufzulisten, die noch ein Beispiel benötigen, und von dort aus zu übernehmen.

@adrinjalali , ich kann eine Liste zusammenstellen, was noch übrig ist

@adrinjalali , ich war so aufgeregt, dass ich vergessen habe zu fragen, gibt es einen bestimmten Zweig dieses Projekts, der die neuesten Updates enthält?

master hat die neuesten Updates. Andererseits könnte ein Ansatz darin bestehen,
Beachten Sie die generierte API-Dokumentation (zB at
https://github.com/scikit-learn/scikit-learn.github.io/tree/master/dev/modules/generated)
und grep für Dateien, die nicht class="rubric">Examples

@jnothman , danke, der grappende Rat war genau richtig. Ich werde heute mit der Zusammenstellung der Liste beginnen

Benötigen Sie hier weitere Hilfe, um entweder ein vorhandenes Dokument zu aktualisieren oder ein neues zu erstellen?
Es würde mir auch helfen, mit Open Source zu beginnen....also jede Richtung oder Arbeit wäre dankbar.

Wir brauchen noch eine aktualisierte Liste von Klassen ohne Beispiele. Ping @Khayyon1?

@Khayyon1 hast du die Liste ausgefüllt oder brauchst du Hilfe?

@adrinjalali , ich muss es abbrechen, weil die Schule kurz nach meiner Bitte um Unterstützung wieder aufgenommen wurde und ich nicht in der Lage war, daran zu arbeiten, entschuldige mich

@adrinjalali, also sollte ich sehen, welche von der von @raghavrv erwähnten Liste noch übrig sind

@coderop2 das ist eine 3-4 Jahre alte Liste, wahrscheinlich ist es besser, eine neue anzufangen!

Sry für die späte Antwort...Sobald meine College-Prüfungen vorbei sind, werde ich anfangen, eine neue Liste zu erstellen und dabei die alte Liste im Hinterkopf zu behalten...

$ # list those with examples
$ git grep -p '^    Examples$' sklearn | grep '=class ' | sed 's/[^ ]* //;s/(.*//;s/:.*//' | sort > /tmp/classes_with_examples.txt
$ # rough list of all public classes
$ grep '\.[A-Z][a-zA-Z]\+' doc/modules/classes.rst  > /tmp/classes.txt
$ # classes without examples
$ grep -v -wFf /tmp/classes_with_examples.txt /tmp/classes.txt

...
that was incorrect. See below.
...

Ich bin mir nicht sicher, ob das richtig ist

Dies kann ein genauerer sein, hat immer noch falsch positive Ergebnisse. Angenommen, wir benötigen keine Beispiele für die Klassen Mixin und Warning.

BaggingRegressor
BallTree
BaseEstimator
BayesianGaussianMixture
CalibratedClassifierCV
ClassifierChain
ColumnTransformer
CompoundKernel
ConstantKernel
DictionaryLearning
DistanceMetric
DotProduct
DummyClassifier
DummyRegressor
Exponentiation
ExpSineSquared
ExtraTreeClassifier
ExtraTreeRegressor
ExtraTreesClassifier
ExtraTreesRegressor
FunctionTransformer
GaussianMixture
GradientBoostingClassifier
GradientBoostingRegressor
GraphLasso
GraphLassoCV
GroupShuffleSplit
Hyperparameter
Imputer
IsolationForest
IsotonicRegression
IterativeImputer
KDTree
Kernel
KernelDensity
LocalOutlierFactor
Matern
Memory
MiniBatchDictionaryLearning
MLPClassifier
MLPRegressor
MultiOutputClassifier
MultiOutputRegressor
OAS
OneClassSVM
OneVsOneClassifier
OneVsRestClassifier
OPTICS
OutputCodeClassifier
PairwiseKernel
Parallel
Product
RandomizedSearchCV
RandomTreesEmbedding
RationalQuadratic
RBF
RegressorChain
SelectFromModel
SparseCoder
Sum
TfidfTransformer
WhiteKernel

Ja, ich hatte die falsche Suche und gab viele falsch positive Ergebnisse. Das ist besser:

$ grep -v -f <(cat /tmp/classes_with_examples.txt | sed 's/.*/\\.&$/')  /tmp/classes.txt
   base.BaseEstimator
   base.BiclusterMixin
   base.ClassifierMixin
   base.ClusterMixin
   base.DensityMixin
   base.RegressorMixin
   base.TransformerMixin
   calibration.CalibratedClassifierCV
   cluster.OPTICS
    compose.ColumnTransformer
   covariance.OAS
   decomposition.DictionaryLearning
   decomposition.MiniBatchDictionaryLearning
   decomposition.SparseCoder
   dummy.DummyClassifier
   dummy.DummyRegressor
   ensemble.BaggingClassifier
   ensemble.BaggingRegressor
   ensemble.ExtraTreesClassifier
   ensemble.ExtraTreesRegressor
   ensemble.GradientBoostingClassifier
   ensemble.GradientBoostingRegressor
   ensemble.IsolationForest
   ensemble.RandomTreesEmbedding
   exceptions.ChangedBehaviorWarning
   exceptions.ConvergenceWarning
   exceptions.DataConversionWarning
   exceptions.DataDimensionalityWarning
   exceptions.EfficiencyWarning
   exceptions.NonBLASDotWarning
   exceptions.UndefinedMetricWarning
   feature_extraction.text.TfidfTransformer
   feature_selection.SelectFromModel
  gaussian_process.kernels.CompoundKernel
  gaussian_process.kernels.ConstantKernel
  gaussian_process.kernels.DotProduct
  gaussian_process.kernels.ExpSineSquared
  gaussian_process.kernels.Exponentiation
  gaussian_process.kernels.Hyperparameter
  gaussian_process.kernels.Kernel
  gaussian_process.kernels.Matern
  gaussian_process.kernels.PairwiseKernel
  gaussian_process.kernels.Product
  gaussian_process.kernels.RBF
  gaussian_process.kernels.RationalQuadratic
  gaussian_process.kernels.Sum
  gaussian_process.kernels.WhiteKernel
   isotonic.IsotonicRegression
   impute.IterativeImputer
   mixture.BayesianGaussianMixture
   mixture.GaussianMixture
   model_selection.GroupShuffleSplit
   model_selection.RandomizedSearchCV
    multiclass.OneVsRestClassifier
    multiclass.OneVsOneClassifier
    multiclass.OutputCodeClassifier
    multioutput.ClassifierChain
    multioutput.MultiOutputRegressor
    multioutput.MultiOutputClassifier
    multioutput.RegressorChain
   neighbors.BallTree
   neighbors.DistanceMetric
   neighbors.KDTree
   neighbors.KernelDensity
   neighbors.LocalOutlierFactor
   neural_network.MLPClassifier
   neural_network.MLPRegressor
   preprocessing.FunctionTransformer
   svm.OneClassSVM
   tree.ExtraTreeClassifier
   tree.ExtraTreeRegressor
   utils.Memory
   utils.Parallel
   covariance.GraphLasso
   covariance.GraphLassoCV
   preprocessing.Imputer

Dies ist 76, während Ihre Liste 62 ist: Sie schließt base.* und exceptions.* was fair genug ist, @adrinjalali , während seltsame Dinge wie Sum .

Entschuldigung, wir haben beide Sum hinzugefügt. Dumm.

Übernahme von GroupShuffleSplit

Ich würde an einem Dummy arbeiten (DummyClassifier, DummyRegressor).

Dies ist die aktuelle Liste der Klassen, für die möglicherweise Beispiele benötigt werden:

base.BaseEstimator
base.BiclusterMixin
base.ClassifierMixin
base.ClusterMixin
base.DensityMixin
base.RegressorMixin
base.TransformerMixin
cluster.OPTICS
compose.ColumnTransformer
covariance.OAS
decomposition.DictionaryLearning
decomposition.MiniBatchDictionaryLearning
decomposition.SparseCoder
ensemble.BaggingClassifier
ensemble.BaggingRegressor
ensemble.ExtraTreesClassifier
ensemble.ExtraTreesRegressor
ensemble.GradientBoostingClassifier
ensemble.GradientBoostingRegressor
ensemble.IsolationForest
ensemble.RandomTreesEmbedding
exceptions.ChangedBehaviorWarning
exceptions.ConvergenceWarning
exceptions.DataConversionWarning
exceptions.DataDimensionalityWarning
exceptions.EfficiencyWarning
exceptions.NonBLASDotWarning
exceptions.UndefinedMetricWarning
feature_extraction.text.TfidfTransformer
feature_selection.SelectFromModel
gaussian_process.kernels.CompoundKernel
gaussian_process.kernels.ConstantKernel
gaussian_process.kernels.DotProduct
gaussian_process.kernels.ExpSineSquared
gaussian_process.kernels.Exponentiation
gaussian_process.kernels.Hyperparameter
gaussian_process.kernels.Kernel
gaussian_process.kernels.Matern
gaussian_process.kernels.PairwiseKernel
gaussian_process.kernels.Product
gaussian_process.kernels.RBF
gaussian_process.kernels.RationalQuadratic
gaussian_process.kernels.Sum
gaussian_process.kernels.WhiteKernel
impute.IterativeImputer
inspection.PartialDependenceDisplay
metrics.RocCurveDisplay
mixture.BayesianGaussianMixture
mixture.GaussianMixture
multiclass.OneVsRestClassifier
multiclass.OneVsOneClassifier
multiclass.OutputCodeClassifier
multioutput.ClassifierChain
multioutput.MultiOutputRegressor
multioutput.MultiOutputClassifier
multioutput.RegressorChain
neighbors.BallTree
neighbors.DistanceMetric
neighbors.KDTree
neighbors.KernelDensity
neighbors.LocalOutlierFactor
neural_network.MLPClassifier
neural_network.MLPRegressor
preprocessing.FunctionTransformer
svm.LinearSVC
tree.ExtraTreeClassifier
tree.ExtraTreeRegressor
utils.Memory
utils.Parallel

Hallo @pspachtholz @MechCoder , daran würde ich gerne arbeiten. Ich bin daran interessiert, zu scikit-learn beizutragen und denke, dass dies ein guter Ausgangspunkt sein kann.

Danke

@PyExtreme Ich denke, Sie können einfach weitermachen, eine oder mehrere Klassen aus der Liste auswählen, die Sie interessant finden, und Beispiele hinzufügen. Ich würde dann hier posten, woran du gerade arbeitest, um Doppelarbeit zu vermeiden. Zur Orientierung können Sie sich zuvor zusammengeführte Pull-Requests ansehen.

@pspachtholz , ich nehme _ExtraTreesClassifier_ zunächst auf und nach dem Commit möchte ich es in

Danke

Arbeitet an Gradient Boosting.

Abholen neural_network.MLPClassifier & neural_network.MLPRegressor

Ich bin auf svm.LinearSVC

Ich arbeite an sklearn.multioutput.MultiOutputClassifier

Hallo, ich arbeite an mixture.BayesianGaussianMixture und mixture.GaussianMixture

Ich bin auf feature_extraction.text.TfidfTransformer . Wünsch mir viel Glück!

Ich bin auf feature_extraction.text.TfidfTransformer. Wünsch mir viel Glück!

auch daran arbeiten - Vielleicht können wir Beispiele teilen?

abholen ensemble.ExtraTreesClassifier

Ich wähle das ensemble.BaggingRegressor

Ich arbeite an feature_selection.SelectFromModel

Ich suche Nachbarn aus.KernelDensity

Ich bin auf ensemble.IsolationForest

auf multiclass.OneVsRestClassifier

Hey, ich werde an den Gaussian Process-Kernels arbeiten, beginnend mit gaussian_process.kernels.RBF und dann die anderen Kernel mit @thorbenjensen machen

Arbeiten an ensemble.GradientBoostingClassifier

Arbeiten an Perceptron

Arbeiten an ensemble.GradientBoostingRegressor

Als nächstes tree.ExtraTreeClassifier

Arbeiten an ensemble.GradientBoostingRegressor

wirf einen Blick auf multiclass.OutputCodeClassifier

Blick auf neighbors.LocalOutlierFactor .

arbeite an ensemble.RandomTreesEmbedding

abholen ensemble.ExtraTreesClassifier

Hallo @jorahn , dazu habe ich schon eine PR eingereicht.
Bitte wählen Sie ein anderes Modul aus.

Ich schlage vor, die Kommentare vorher durchzusehen, um zu sehen, ob jemand bereits an einer Klasse arbeitet, um doppelte Arbeit zu vermeiden.
Für einige Klassen gibt es bereits einige (evtl. altbackene) mrg-Anfragen, bei denen wir die Autoren fragen könnten, ob sie noch aktiv daran arbeiten.

@flaviomorelli @LBrummer @mschaffenroth Den Ensembleverlauf

Wirklich cool übrigens zu sehen, dass das an Fahrt aufnimmt :-)

abholen ensemble.ExtraTreesClassifier

Hallo @jorahn , dazu habe ich schon eine PR eingereicht.
Bitte wählen Sie ein anderes Modul aus.

oh, das habe ich bei diesem Thema nicht gesehen. also haben wir jetzt zwei PRs dafür

Perceptron ist bereits dokumentiert.

arbeite an tree.ExtraTreeRegressor

arbeite an impute.IterativeImputer

@pspachtholz , ich nehme _ExtraTreesClassifier_ zunächst auf und nach dem Commit möchte ich es in

Danke

@jorahn , ich hatte es erst vor 1 Woche hier erwähnt und arbeite schon seit 1 Woche daran.

Arbeiten an OneVsOneClassifier.

Ich gehe zum metrics.RocCurveDisplay

arbeite an multioutput.ClassifierChain

Arbeiten an PriorProbabilityEstimator .

Arbeiten an multioutput.MultiOutputRegressor

nehmen neighbors.BallTree

PriorProbabilityEstimator ist in Version 0.21 veraltet und wird in Version 0.23 entfernt. Daran nicht arbeiten.

Arbeiten an covariance.OAS

SelectPercentile bereits dokumentiert.

arbeite an ensemble.ExtraTreesRegressor

nehmen neighbors.BallTree

es gibt bereits einige Beispiele für BallTree und compose.ColumnTransformer

RANSACRegressor bereits dokumentiert.

nehmen decomposition.SparseCoder

SelectKBest bereits dokumentiert.

SpectralClustering bereits dokumentiert

Arbeiten an IsolationForest

Arbeiten an IsolationForest

Hallo @zioalex , dazu habe ich schon eine PR: #15205. Freue mich über Anregungen und Kommentare :smiley:

Arbeiten in neighbors.DistanceMetric .

arbeite an multioutput.RegressorChain

arbeite an exceptions.ConvergenceWarning

arbeite an exceptions.ChangedBehaviorWarning

arbeite an exceptions.ChangedBehaviorWarning

Nachdem wir @adrinjalali besucht hatten , kamen wir zu dem Schluss, dass es besser ist, nicht an diesem zu arbeiten, da es

Seien Sie zu Ihrem Seelenfrieden wie wir, arbeiten Sie nicht an exceptions.ChangedBehaviorWarning

Arbeiten an exceptions.DataDimensionalityWarning

Ich möchte an einigen arbeiten. Ich fange mit der Optik an.

Hallo! Ich habe gerade eine PR erstellt, nachdem ich ein Beispiel-Code-Snippet zum K-Means-Clustering hinzugefügt hatte. Dies ist mein erster Open-Source-Beitrag, daher wäre es großartig, wenn sich jemand damit auseinandersetzen und sehen könnte, ob es noch mehr Arbeit braucht!
Danke und Grüße,
Smriti Singh

Ich bin die Liste vom letzten Oktober durchgegangen und habe überprüft, in welchen Klassen bereits PRs/Beispiele zusammengeführt wurden. Ich nehme an, dass Ansprüche aus dem letzten Jahr oder länger, zu denen nichts weiter passiert ist, ignoriert werden können.
Hier kommt also eine aktualisierte Todo-Liste:

nicht daran arbeiten, es ist release-abhängig: Exceptions.ChangedBehaviorWarning

offene PRs:

Dekomposition.SparseCoder #15233

~Exceptions.DataDimensionalityWarning #15246~
Mischung.BayesianGaussianMixture #15193
Mischung.GaussianMixture #15193
Multioutput.ClassifierChain #15211
Multioutput.RegressorChain #15215

neue offene prs:
Dekomposition.WörterbuchLernen #16907
~Ausnahmen.EffizienzWarnung #16785~
~Exceptions.UndefinedMetricWarning #16784~

Kostenlos zum Mitnehmen:

(BEARBEITEN: Die in base eignen sich besser für das Entwicklerhandbuch, ignorieren wir sie vorerst)
~base.BaseEstimator~
~base.BiclusterMixin~
~base.ClassifierMixin~
~base.ClusterMixin~
~base.DensityMixin~
~base.RegressorMixin~
~base.TransformerMixin~

Dekomposition.MiniBatchDictionaryLearning

~Ausnahmen.NonBLASDotWarning~

~feature_selection.SelectFromModel~

gaussian_process.kernels.CompoundKernel
gaussian_process.kernels.Hyperparameter
~gaussian_process.kernels.Kernel~

~inspection.PartialDependenceDisplay~

~multiclass.OneVsOneClassifier~

~multioutput.MultiOutputClassifier~

~utils.Speicher~
~utils.Parallel~

Aktualisieren.
Kovarianz.OAS #16681
multioutput.MultiOutputRegressor #16698
tree.ExtraTreeClassifier #16671

Nachbarn.DistanceMetric
Nachbarn.KDTree
Nachbarn.LocalOutlierFactor

Ausnahmen.DataConversionWarning #16704

multiclass.OneVsOneClassifier #16700

Wollen wir Beispiele für die base.* Klassen? Ich denke, es ist sinnvoller, sie im developer guide besser dokumentiert zu haben. WDYT @jnothman @NicolasHug ?

Zugegeben, es ist besser für den Entwicklerleitfaden. Ich bearbeite den Kommentar

Ich glaube, es wurde aus Versehen geschlossen.

multioutput.MultiOutputClassifier hat bereits Beispiele. Soll es aktualisiert werden, um ein Beispiel für das Attribut aufzunehmen, oder sollte es von der TO DO-Liste gestrichen werden?

Ich denke, es kann aus der Liste entfernt werden. Danke @marenwestermann

Ich denke, es kann aus der Liste entfernt werden. Danke @marenwestermann

Ok, dann kann feature_selection.SelectFromModel auch entfernt werden, da es auch Beispiele enthält. (Diese wurden im Oktober letzten Jahres hinzugefügt.)

Bezüglich utils.Memory und utils.Parallel :
auf der scikit-learn-Website heißt es "in Version 0.23 entfernt werden". Ich habe die Datei utils.__init__.py überprüft, in der diese Klassen lebten, und sie wurden entfernt. Diese können also auch von der Liste gestrichen werden.

Ich werde versuchen, gaussian_process.kernels.Kernel anzugehen :)

Abgesehen von der obigen DictionaryLearning/MiniBatchDictionaryLearning PR habe ich mir auch die Nachbarn*-Klassen angeschaut: Die haben alle schon mindestens ein Beispiel. Die für Neighbors.KDTree und Neighbors.BallTree werden aus dem CLASS_DOC-Formatstring generiert, der in der Include-Datei _binary_tree.pxi zu finden ist.

Es ist mein erster Beitrag zu diesem Projekt. Ich würde gerne nach Nachbarn suchen.* Klassen einschließlich:
Nachbarn.DistanceMetric
Nachbarn.KDTree
Nachbarn.LocalOutlierFactor

Ich habe mir gaussian_process.kernels.Kernel . Laut Dokumentation ist es die "Basisklasse für alle Kernel". Daher sind alle seine Attribute schreibgeschützte Eigenschaftsattribute (Methoden mit @property Dekoratoren). Aus meiner Sicht ist es daher nicht sinnvoll, dieser Klasse Beispiele hinzuzufügen, da sie nur in Kombination mit einer anderen Klasse verwendet werden kann.
Wenn Sie jedoch zum Ende der Webseite von gaussian_process.kernels.Kernel scrollen, finden Sie einen Link zu einem Beispiel, wie diese Klasse verwendet werden kann. Dies wurde im November 2019 In diesem Beispiel wird die Klasse hinzugefügt SequenceKernel erstellt wird , die erbt von der Kernel Klasse. Die Klasse SequenceKernel ist keine Funktion von scikit-learn, könnte aber eine interessante Ergänzung sein.

Bitte korrigiert mich, wenn etwas, was ich hier geschrieben habe, falsch ist.

Ja, es wäre zu kompliziert, ein Beispiel dafür zu schreiben. Ich freue mich, dass es aus der Liste gestrichen wird.

@Malesche exceptions.DataDimensionalityWarning ist nun geschlossen und kann daher von der TODO-Liste gestrichen werden.

Bezüglich inspection.PartialDependenceDisplay :
In der Klassenbeschreibung heißt es: "Es wird empfohlen, plot_partial_dependence zu verwenden, um ein PartialDependenceDisplay zu erstellen". Ich habe mir diese Funktion angesehen und darin wird ein PartialDependenceDisplay Objekt erstellt und seine plot Methode aufgerufen. Es gibt Beispiele für die Verwendung von plot_partial_dependence , und ich denke daher, dass es nicht nötig ist, inspection.PartialDependenceDisplay Beispiele hinzuzufügen. Was denkst du, @adrinjalali ?

zugestimmt @marenwestermann

exceptions.NonBLASDotWarning kann auch von der TODO-Liste gestrichen werden, da eine Entscheidung gegen Beispiele in exceptions.py getroffen wurde (siehe #17040).

@NicolasHug , @amueller nur falls ihr diese Ausgabe als hier die Liste der noch fehlenden Klassenbeispiele (dank Joel script , von ihm selbst geändert... :) ). Ich habe die Klassen base und exceptions bereits entfernt. Darf ich vorschlagen, das Problem mit der Liste am Anfang zu bearbeiten? Dies erleichtert die Identifizierung verfügbarer Klassen. Noch geöffnete PR aus früheren Sprints (nicht nur) sind in der Liste verlinkt: Ich denke, es wird nützlich sein, sie vor einem neuen Event abzuschließen (danke du bereits einige Reviews gestartet

Danke für den Vorschlag @cmarmo , ich habe das Problem aktualisiert.

HI, ich werde versuchen, es mit gaussian_process.kernels.Hyperparameter .

Hallo, ich übernehme linear_model.* .

  • linear_model.PoissonRegressor
  • linear_model.TweedieRegressor
  • linear_model.GammaRegressor

Hallo, wir werden ensemble.GradientBoostingClassifier nehmen

Hallo, wir werden ensemble.GradientBoostingClassifier nehmen

Dieser hat bereits ein Beispiel.

Hey, wir nehmen jetzt:

  • metrics.ConfusionMatrixDisplay
  • metrics.PrecisionRecallDisplay

Hey @adrinjalali , kannst du bitte die PR überprüfen? Danke!

@emdupre und ich werden im Folgenden im Rahmen des Daten-

  • Nachbarn.BallTree
  • Nachbarn.DistanceMetric
  • Nachbarn.KDTree

Hallo @adrinjalali , es scheint, als könnten wir unten bereits einige Beispiele sehen. Es wird in der Todo-Liste nicht aktualisiert. Bitte vorschlagen.

  • Nachbarn.BallTree
  • Nachbarn.DistanceMetric
  • Nachbarn.KDTree

Hallo, ich werde arbeiten an:

  • Dekomposition.WörterbuchLernen (#16907)
  • Dekomposition.MiniBatchDictionaryLearning (#16907)
  • Dekomposition.SparseCoder (#15233)

Hallo, ich werde arbeiten an:

  • gaussian_process.kernels.CompoundKernel

Schließen, da alle PRs zusammengeführt wurden und es keine relevanten Klassen mehr ohne Beispiele gibt.
Danke @j2heng für die Hilfe bei der Triage während des Sprints!

Ach, tatsächlich. Die Liste oben ist veraltet?

Oh ja, ich habe die anderen PR zusammengeführt.

War diese Seite hilfreich?
0 / 5 - 0 Bewertungen