Scikit-learn: Perbaiki dokumentasi nilai default di semua kelas

Dibuat pada 2 Des 2019 · 118Komentar · Sumber: scikit-learn/scikit-learn

Keterangan

Dokumentasi nilai default di banyak kelas tidak disertakan, tidak konsisten dalam cara penulisannya, atau ketinggalan zaman. Saya ingin mengumpulkan beberapa orang untuk mengerjakan dokumentasi nilai default untuk setiap kelas karena ada banyak kelas di mana masalah ini ada. Saya telah diberitahu bahwa nilai default harus didokumentasikan sebagai "default=<'value'>" dan jadi saya membuat masalah ini dengan asumsi itu.

Larutan

Berikut adalah beberapa hal yang saya lihat untuk parameter yang harus diubah:

tidak disebutkan apakah ada default yang harus diperiksa terhadap kode karena beberapa parameter hilang sepenuhnya
"opsional" harus diubah menjadi "default=<'value'>"
pastikan bagaimana nilai default didokumentasikan konsisten di dalam kelas, yaitu ubah semuanya ke format "default=<'value'>"
Ubah satu file per PR

Jika beberapa orang mengerjakan beberapa kelas masing-masing, maka ini harus dilakukan dalam waktu singkat! Ini semua harus menjadi perbaikan yang cukup sederhana.

#### Contoh
https://scikit-learn.org/stable/modules/generated/sklearn.cluster.AgglomerativeClustering.html
Tautan di atas adalah contoh di mana nilai default tidak ditunjukkan tetapi parameternya mengatakan "opsional", dan di mana nilai default yang ditunjukkan semuanya didokumentasikan secara tidak konsisten.

Sprint good first issue

Sumber

cgsavard

👍5

Komentar yang paling membantu

Berbicara secara logis, jika param adalah opsional, bukankah seharusnya defaultnya selalu None ? Memiliki parameter dengan nilai default selain None menyarankan itu harus diperlukan.

Jika ada default, ini biasanya berarti bahwa literatur telah menemukan ini sebagai nilai default yang masuk akal yang juga menunjukkan bahwa parameter ini berdampak pada kinerja dan karenanya tidak boleh opsional, tetapi harus menyebutkan apa defaultnya. Itu tampaknya lebih dekat dengan parameter yang diperlukan menurut definisi, kami kebetulan membuat pilihan yang masuk akal bagi pengguna sehingga mereka dapat mengubahnya atau tidak.

Atau lebih praktisnya, apakah saat ini ada parameter opsional yang kami temukan yang memiliki nilai default numerik, tetapi menentukan None akan menimbulkan pengecualian? Itu juga menunjukkan bahwa parameter sebenarnya diperlukan, tetapi default yang masuk akal telah dipilih berdasarkan literatur/penelitian.

Atau mungkin saya selama ini membingungkan arti dari required dan optional ? Tertawa terbahak-bahak. Pasti akan senang membantu dalam hal ini!

jmwoloso pada 6 Des 2019

👍4

Semua 118 komentar

Halo @cgsavard , saya ingin mengerjakan ini. Bisakah saya mulai melihat kelas AgglomerativeClustering?

vachanda pada 3 Des 2019

@vachanda Ayo! Kita bisa terus posting disini yang mana yang kita garap agar orang lain tahu.

cgsavard pada 3 Des 2019

Terima kasih telah mengoordinasikan @cgsavard ini

Catatan untuk kontributor: ikuti panduan di bawah: https://scikit-learn.org/stable/developers/contributing.html#guidelines -for-writing-documentation

adrinjalali pada 3 Des 2019

@cgsavard , Apakah ada daftar kelas yang memiliki perbedaan atau apakah kita harus melalui masing-masing dan memperbaruinya?

vachanda pada 4 Des 2019

@vachanda saya tidak punya daftar, sayangnya. Saya baru saja memeriksa file dan melihat apa yang perlu diperbarui.

cgsavard pada 4 Des 2019

Saya sedang mengerjakan AffinityPropagation, SpectralCoclustering, SpectralBiclustering, dan Birch.

cgsavard pada 4 Des 2019

Saya sedang mengerjakan FeatureAgglomeration, KMeans, dan MiniBatchKMeans.

vachanda pada 6 Des 2019

Berbicara secara logis, jika param adalah opsional, bukankah seharusnya defaultnya selalu None ? Memiliki parameter dengan nilai default selain None menyarankan itu harus diperlukan.

Atau mungkin saya selama ini membingungkan arti dari required dan optional ? Tertawa terbahak-bahak. Pasti akan senang membantu dalam hal ini!

jmwoloso pada 6 Des 2019

👍4

@jmwoloso Kami benar-benar tidak konsisten mengenai penggunaan optional dan oleh karena itu kami baru-baru ini memutuskan untuk menghapusnya.

glemaitre pada 6 Des 2019

🚀1

saya ingin berkontribusi juga. bisakah saya melanjutkan ini?

cyrus303 pada 6 Des 2019

@glemaitre ok, itu masuk akal. jadi kita menghapus kata kerja optional bersama-sama, kan, sambil juga mencatat nilai default dalam string dokumen?

haruskah masing-masing yang kami temukan dibuka sebagai masalah secara terpisah atau bagaimana kami mementaskan semua pekerjaan yang kami lakukan karena banyak orang mengerjakan banyak hal yang berkaitan dengan satu masalah ini?

jmwoloso pada 6 Des 2019

@cyrus303 @jmwoloso Anda bisa mendapatkan kelas (maksimum modul) dan memperbaikinya. Idenya adalah untuk menghapus opsional dan menambahkan default ketika ada satu (biasanya ada satu). Karena kita menyentuh dokumentasi, kita harus memastikan bahwa gaya pada baris mengikuti panduan gaya baru kita: https://scikit-learn.org/dev/developers/contributing.html#guidelines -for-writing-documentation

Anda dapat menyebutkan kelas/modul mana yang Anda kerjakan, buka tautan PR untuk menghindari upaya duplikat :). Menantikan untuk meninjaunya.

glemaitre pada 6 Des 2019

👍1

Hai! Saya akan mengerjakan kelas tree ( tree.DecisionTreeClassifier , tree.DecisionTreeRegressor , tree.ExtraTreeClassifier dan tree.ExtraTreeRegressor ).

alfaro96 pada 11 Des 2019

Saya juga akan memperbaiki masalah ini untuk modul neighbors .

alfaro96 pada 17 Des 2019

Saya akan mengambil modul ensemble .

jmwoloso pada 21 Des 2019

@glemaitre ada preferensi pada bool vs. boolean ? melihat campuran keduanya di ensemble , bahkan di kelas yang sama. mungkin juga mendapatkan yang bugar saat saya melakukan default.

EDIT:

sama untuk int vs integer . Saya berasumsi int untuk yang itu, tetapi ingin mengonfirmasi.

EDIT (lagi):

juga melihat docstrings dengan nilai yang tidak konsisten relatif terhadap tanda tangan __init__ untuk kelas itu, misalnya:

min_impurity_split untuk RandomForestClassifier

tanda tangan __init__ memiliki min_impurity_split=None sedangkan dokumen untuknya mengatakan min_impurity_split : float, (default=0) . Saya akan menganggap memperbarui docstrings agar sesuai dengan tanda tangan karena kami ingin menjaga perilaku kelas tetap konsisten (yaitu kami ingin default yang sama diteruskan saat instantiasi)?

jmwoloso pada 21 Des 2019

@jmwoloso Bisakah Anda merujuk ke https://scikit-learn.org/stable/developers/contributing.html#guidelines -for-writing-documentation. Pada dasarnya Anda harus default ke nama jenis python (bool, str, int, float)

tanda tangan __init__ memiliki min_impurity_split=Tidak ada sedangkan dokumen untuknya mengatakan min_impurity_split : float, (default=0). Saya akan menganggap memperbarui docstrings agar sesuai dengan tanda tangan karena kami ingin menjaga perilaku kelas tetap konsisten (yaitu kami ingin default yang sama diteruskan saat instantiasi)?

Kita harus mencocokkan parameter dalam tanda tangan fungsi. Parameter default nilai ini telah berubah dan docstring tidak diperbarui.

glemaitre pada 21 Des 2019

👍2

Hai @cgsavard , saya ingin berkontribusi tetapi ini akan menjadi pertama kalinya saya jadi perlu berpegangan tangan. Saya cukup akrab dengan python, agak berguna dengan editor teks dan baru-baru ini melalui fork -> clone -> edit -> tutorial alur kerja PR di sini . Mohon saran langkah selanjutnya... Terima kasih!

mghah pada 22 Des 2019

Hai @cgsavard ,
Bisakah saya bekerja di Imputer?

pulkitmehtawork pada 22 Des 2019

Hai @cgsavard , saya ingin mengerjakan kelas linear_model .

ankishb pada 22 Des 2019

Saya juga sedang mengerjakan kelas Neural Network , Decomposition , Feature Extraction , Metrics dan Preprocess .

ankishb pada 22 Des 2019

dapatkah seseorang memeriksa pr #15964 saya dan melihat mengapa kode cov gagal. Ini adalah pertama kalinya saya berkontribusi. Mohon bimbingannya.

pulkitmehtawork pada 24 Des 2019

Abaikan codecov. Ini adalah positif palsu karena kami tidak menyentuh kode. Saya akan segera meninjau PR

Dikirim dari ponsel saya - maaf singkat dan berpotensi salah eja.

glemaitre pada 24 Des 2019

👍2

Saya baru saja membuat kontribusi pertama saya #15988

mghah pada 30 Des 2019

Saya akan mengambil modul naive_bayes .

tamirlan1 pada 3 Jan 2020

Saya baru saja membuat kontribusi pertama saya #16019

tamirlan1 pada 3 Jan 2020

Hai Semua, sedang mengerjakan sklearn/neighbors , terima kasih.

mghah pada 4 Jan 2020

Berkontribusi pada sklearn/semi_supervised.Terima kasih

shubchat pada 7 Jan 2020

Hai @cgsavard , saya ingin berkontribusi juga, saya akan mengambil modul sklearn/svm . Terima kasih

tituschristian pada 8 Jan 2020

Berkontribusi pada sklearn/semi_supervised.Terima kasih
Apakah ada beberapa pengeditan lebih lanjut yang diperlukan pada PR #16042

shubchat pada 9 Jan 2020

@glemaitre di #16105, saya harus menggali sedikit lebih dalam ke konstruksi untuk mengambil nilai default, docstrings tampak tidak akurat dan ketinggalan jaman.

Saya juga mencoba menggunakan cara yang tidak terlalu ambigu, ringkas, dan ketat secara matematis untuk mendefinisikan rentang parameter. misalnya, saya mengubah positive float menjadi float in (0, inf] atau 0<= shrinkage <=1 menjadi float in (0, 1) . Singkat cerita, saya melakukan yang terbaik yang saya bisa untuk menjadi ringkas dan akurat tapi tolong beri perhatian 5% lebih untuk meninjau PR ini. Terima kasih.

mghah pada 11 Jan 2020

@cgsavard , ini adalah masalah yang sangat bagus untuk sprint! Jika Anda setuju dengan itu, saya berencana untuk menambahkannya ke daftar Sprint kami. Saya telah merangkum kelas-kelas yang telah ditangani oleh seorang PR, dan PR koresponden mereka di sini .
Apakah Anda keberatan untuk menautkan intisari dalam deskripsi masalah? Ini akan membuat informasi tersedia sejak awal. Bolehkah saya juga meminta Anda untuk mengklarifikasi dalam uraian bahwa setiap PR harus menangani satu file (maksimal satu modul) pada satu waktu seperti yang dijelaskan di sini ? Ini akan sangat membantu kontributor dan pengulas! Terima kasih banyak!

cmarmo pada 16 Jan 2020

Bagi mereka yang tertarik dengan masalah ini, perintah

git grep "optional.*default"

akan menampilkan file yang masih terpengaruh oleh masalah ini (terima kasih @ogrisel! :)).

cmarmo pada 16 Jan 2020

🎉1

@cgsavard Halo, saya ingin mengerjakan model_selection @WiMLDS

marielledado pada 25 Jan 2020

@lopusz dan saya ingin bekerja di random_projection.py

Bersenang-senanglah untuk semua orang!

@adrinjalali @noatamir @WiMLDS

magda-zielinska pada 25 Jan 2020

@ETay203 dan saya ingin mengerjakan mean_shift @WiMLDS_Berlin sprint.

mjmolina pada 25 Jan 2020

@magda-zielinska dan saya ingin bekerja di pipeline.py

@adrinjalali @noatamir @WiMLDS

lopusz pada 25 Jan 2020

@lopusz dan @magda-zielinska dan saya ingin bekerja di kernel_approximation.py

fraboeni pada 25 Jan 2020

Saya akan menangani _optics.py sekarang

ETay203 pada 25 Jan 2020

Pembukaan kembali: ditutup dengan kata kunci "Perbaikan" di #16216.

cmarmo pada 26 Jan 2020

Pembukaan kembali: ditutup dengan kata kunci "Perbaikan" di #16207

cmarmo pada 27 Jan 2020

Saya akan menangani sklearn/linear_model/_coordinate_descent.py sekarang

hs-nazuna pada 29 Jan 2020

Saya membersihkan base.py dan mengirimkan PR

lopusz pada 29 Jan 2020

Saya membersihkan discriminant_analysis.py dan mengirimkan PR

lopusz pada 30 Jan 2020

Saya akan melihat sekarang di sklearn/gaussian_process/*.py

lopusz pada 2 Feb 2020

Sudah ada PR panjang untuk GPs

adrinjalali pada 2 Feb 2020

@lopusz saya minta maaf, bahwa PR menyentuh masalah lain dari modul GP, Anda dapat melanjutkan dan mengerjakannya jika Anda tidak keberatan :)

adrinjalali pada 3 Feb 2020

@adrinjalali Terima kasih telah mengawasinya!

Memang, saya belum memindai PR terbuka dengan cukup baik, jadi fakta bahwa dokter tidak diambil lebih merupakan kecelakaan;)

Saya akan memastikan untuk melacak apa yang PRed.

Dan ya PR untuk dokter akan datang ;)

lopusz pada 5 Feb 2020

Apakah ada hal lain yang harus dilakukan di sini?

andrewasche pada 19 Apr 2020

Saya sedang mengerjakan sklearn/decomposition/_dict_learning.py

reshamas pada 28 Mei 2020

apa yang tersisa untuk dilakukan? Saya terbuka untuk membantu. . .

andrewasche pada 31 Mei 2020

Mencari tahu apa yang tersisa mungkin merupakan tempat yang baik untuk mulai membantu :)

adrinjalali pada 5 Jun 2020

Hai, Saya telah melihat-lihat untuk melihat apa yang tersisa, saya pikir masih ada beberapa pembaruan yang harus dilakukan di beberapa modul yang dilihat sebelumnya.
Saya akan mengerjakan ini, dimulai dengan modul cluster dan dapat meningkatkan PR untuk setiap modul saat saya melanjutkan?
Ini adalah kontribusi pertama saya jadi tolong beri tahu saya jika saya tidak mengikuti proses dengan benar, dll.
Terima kasih!

pgithubs pada 5 Jun 2020

Ini adalah daftar fungsi, kelas, dan modul yang tersisa untuk diperbaiki:

[x] sklearn.feature_selection.SelectorMixin
[x] sklearn.config_context
[x] sklearn.set_config
[x] sklearn.calibration.CalibratedClassifierCV
[x] sklearn.cluster.OPTICS
[x] sklearn.cluster.SpectralClustering
[x] sklearn.cluster.affinity_propagation
[x] sklearn.cluster.cluster_optics_dbscan
[x] sklearn.cluster.cluster_optics_xi
[x] sklearn.cluster.compute_optics_graph
[x] sklearn.cluster.mean_shift
[x] sklearn.cluster.spectral_clustering
[x] sklearn.cluster.ward_tree
[x] sklearn.cross_decomposition.CCA
[x] sklearn.cross_decomposition.PLSCanonical
[x] sklearn.cross_decomposition.PLSRegression
[x] sklearn.cross_decomposition.PLSSVD
[x] sklearn.datasets
[x] sklearn.decomposition
[x] sklearn.dummy
[x] sklearn.ensemble.HistGradientBoostingRegressor (percobaan)
[x] sklearn.ensemble.HistGradientBoostingRegressor (percobaan)
[x] sklearn.feature_extraction.image.grid_to_graph
[x] sklearn.feature_extraction.image.img_to_graph
[x] sklearn.feature_extraction.text.CountVectorizer
[x] sklearn.feature_extraction.text.HashVectorizer
[x] sklearn.feature_selection
[x] sklearn.impute
[x] sklearn.inspection.partial_dependence
[x] sklearn.inspection.permutation_importance
[x] sklearn.inspection.permutation_importance
[x] sklearn.inspection.PartialDependenceDisplay
[x] sklearn.inspection.plot_partial_dependence
[x] sklearn.isotonic.IsotonicRegression
[x] sklearn.isotonic.check_increasing
[x] sklearn.isotonic.isotonic_regression
[x] sklearn.kernel_approximation
[x] sklearn.kernel_ridge
[x] sklearn.linear_model.PassiveAggressiveClassifier
[x] sklearn.linear_model.LassoLars
[x] sklearn.linear_model.OrthogonalMatchingPursuit
[x] sklearn.linear_model.HuberRegressor
[x] sklearn.linear_model.RANSACRegressor
[x] sklearn.linear_model.TheilSenRegressor
[x] sklearn.linear_model.PassiveAggressiveRegressor
[x] sklearn.linear_model.orthogonal_mp
[x] sklearn.linear_model.orthogonal_mp_gram
[x] sklearn.manifold
[x] sklearn.metrics (kecuali sklearn.metrics.confusion_matrix , sklearn.metrics.roc_auc_score , sklearn.metrics.max_error sklearn.metrics.mean_poisson_deviance , sklearn.metrics.mean_gamma_deviance , sklearn.metrics.mean_tweedie_deviance , sklearn.metrics.plot_confusion_matrix , sklearn.metrics.plot_precision_recall_curve )
[x] sklearn.mixture
[x] sklearn.model_selection.GridSearchCV
[x] sklearn.model_selection.ParameterGrid
[x] sklearn.model_selection.ParameterSampler
[x] sklearn.model_selection.RandomizedSearchCV
[x] sklearn.model_selection.fit_grid_point
[x] sklearn.multiclass
[x] sklearn.multioutput
[x] sklearn.neural_network
[x] sklearn.preprocessing
[x] sklearn.random_projection
[x] sklearn.tree.export_graphviz
[x] sklearn.tree.export_text
[x] sklearn.tree.plot_tree
[x] sklearn.utils

Semoga saya tidak melewatkan apa pun.

alfaro96 pada 5 Jun 2020

Hai. Saya akan mencoba membuat pass di dokumentasi feature_selection

kohakukun pada 6 Jun 2020

Kami mengambil bagian sklearn.mixture

violetr pada 6 Jun 2020

Mengambil bagian cross_decomposition

kohakukun pada 6 Jun 2020

Untuk Scikit-Learn Sprint 2020, @icoder18 dan saya mengambil bagian sklearn.random_projection

mobigelow pada 6 Jun 2020

@adrinjalali kami menyelesaikan sklearn/campuran

violetr pada 6 Jun 2020

Bekerja pada sklearn.linear_model untuk sprint dengan @genvalen

parthsuresh pada 6 Jun 2020

Ambil sklearn.calibration.CalibratedClassifierCV

asubramaniyan pada 6 Jun 2020

Bekerja pada ini untuk sklearn.utils.validation

neinkeinkaffee pada 6 Jun 2020

Selanjutnya kita akan menangani sklearn.utils.random

neinkeinkaffee pada 6 Jun 2020

bekerja di sklearn.impute

mobigelow pada 6 Jun 2020

Bekerja di sklearn.tree.plot_tree

madelgi pada 6 Jun 2020

Tabel 14 akan mengambil sklearn.neural_network

amy12xx pada 6 Jun 2020

Ambil sklearn.kernel_approximation

asubramaniyan pada 6 Jun 2020

Mengambil sklearn.inspection

icoder18 pada 6 Jun 2020

Tabel 14 akan mengambil sklearn.preprocessing

amy12xx pada 6 Jun 2020

Mengambil kumpulan data

mobigelow pada 6 Jun 2020

Mengambil sklearn.mixture #17509

amy12xx pada 6 Jun 2020

Daftar diperbarui.

Terima kasih semua!

alfaro96 pada 6 Jun 2020

Mengambil sklearn.metrics untuk sprint

genvalen pada 7 Jun 2020

Mengambil modul model_selection

kohakukun pada 7 Jun 2020

@glemaitre Bisakah kami memperbarui deskripsi ini untuk memasukkan yang terbaik adalah mengirimkan satu file pada satu waktu?

reshamas pada 9 Jun 2020

Halo saya ingin berkontribusi. Ini adalah pertama kalinya bagi saya ... Dan tidak jelas bagi saya bagaimana saya bisa tahu di modul mana masih ada pekerjaan yang harus dilakukan? Terima kasih !

clmbst pada 19 Jun 2020

https://github.com/scikit-learn/scikit-learn/issues/15761#issuecomment -639461778 berisi daftar modul yang harus diperbaiki.

alfaro96 pada 19 Jun 2020

Terima kasih. Ambil sklearn.decomposition kemudian.

clmbst pada 19 Jun 2020

Saya sedang mengerjakan 'sklearn.isotonic.isotonic_regression'

Cristinamulas pada 20 Jun 2020

Saya sedang mengerjakan 'sklearn.multiclass.py'

Cristinamulas pada 20 Jun 2020

Hai, bolehkah saya mencoba mengambil sisa sklearn.tree ? Ini akan menjadi pertama kalinya saya berkontribusi juga.

m-vd pada 4 Jul 2020

Terima kasih telah check-in, senang mendapat bantuan Anda! Silakan lanjutkan; Saya pikir semua pembaruan sprint kami telah ditutup.

Pada 4 Juli 2020, pukul 10:45, Ivan Wiryadi [email protected] menulis:

Hai, bolehkah saya mencoba mengambil sisanya di sklearn.tree? Ini akan menjadi pertama kalinya saya berkontribusi juga.
—
Anda menerima ini karena Anda berkomentar.
Balas email ini secara langsung, lihat di GitHub, atau berhenti berlangganan.

mobigelow pada 4 Jul 2020

Hai, saya ingin memberikan kontribusi pertama saya. Bisakah saya mengambil sklearn.multioutput?

franslarsson pada 5 Jul 2020

Saya akan melanjutkan dengan sklearn.utils, dimulai dengan _encode.py

franslarsson pada 8 Jul 2020

Saya sedang mengerjakan sklearn/decomposition/_dict_learning.py

TahiriNadia pada 11 Jul 2020

Saya sedang mengerjakan sklearn.kernel_ridge di sprint

mikeaalv pada 11 Jul 2020

Hai, saya akan mulai mengerjakan sklearn.feature_extraction.image.img_to_graph

tijanajovanovic pada 11 Jul 2020

Saya sedang mengerjakan sklearn.feature_extraction.text.CountVectorizer

Probinette4 pada 11 Jul 2020

Saya sedang mengerjakan sklearn.sklearn.kernel_ridge

TahiriNadia pada 11 Jul 2020

Saya sedang mengerjakan sklearn.ensemble.HistGradientBoostingRegressor

Hoda1394 pada 11 Jul 2020

"Aku sedang mengerjakan ini"

hal ini? @Hoda1394

TahiriNadia pada 11 Jul 2020

"Aku sedang mengerjakan ini"
hal ini? @Hoda1394

@TahiriNadia dikoreksi.

Hoda1394 pada 11 Jul 2020

👍1

@cgsavard Hei, Bisakah saya mengerjakan ini? Saya pemula

Praveenk8051 pada 24 Jul 2020

Saya akan mengerjakan file di sklearn.datasets .

JinLi711 pada 25 Jul 2020

Bisakah saya bekerja di sklearn.linear_model._least_angle.py

sadakmed pada 2 Agu 2020

@glemaitre Saya sedang mengerjakan sklearn.linear_model._least_angle.py dan saya menemukan ketidakkonsistenan penggunaan method ='lar' kadang-kadang menunjukkan lars kadang-kadang lar , ketidakkonsistenan ini juga dalam kode (tidak hanya dalam dokumentasi), saya dapat melihat bahwa lars adalah yang benar, dapatkah Anda mengkonfirmasinya, dan saya akan membuat PR.

sadakmed pada 2 Agu 2020

mengerjakan 'sklearn/ensemble/_hist_gradient_boosting/binning.py'

sadakmed pada 2 Agu 2020

file perlu diubah:

sklearn/_config.py
sklearn/dummy.py
sklearn/multioutput.py
sklearn/linear_model/_huber.py
sklearn/linear_model/_theil_sen.py
sklearn/linear_model/_ridge.py
sklearn/linear_model/_omp.py
sklearn/linear_model/_sag.py
sklearn/externals/_lobpcg.py
sklearn/externals/_lobpcg.py
sklearn/utils/extmath.py
sklearn/utils/__init__.py
sklearn/utils/graph.py
sklearn/utils/_mocking.py
sklearn/utils/sparsefuncs.py
sklearn/neighbors/_base.py
sklearn/gaussian_process/_gpc.py
sklearn/gaussian_process/kernels.py
sklearn/model_selection/_validation.py
~sklearn/decomposition/_fastica.py~
~sklearn/decomposition/_dict_learning.py~
~sklearn/decomposition/_factor_analysis.py~
~sklearn/decomposition/_incremental_pca.py~
~sklearn/decomposition/_lda.py~
~sklearn/decomposition/_pca.py~
~sklearn/decomposition/_truncated_svd.py~
~sklearn/decomposition/_sparse_pca.py~
~sklearn/decomposition/_nmf.py~
sklearn/manifold/_mds.py
sklearn/manifold/_spectral_embedding.py
sklearn/manifold/_t_sne.py
sklearn/ensemble/_hist_gradient_boosting/grower.py
sklearn/ensemble/_hist_gradient_boosting/binning.py
sklearn/metrics/_ranking.py
sklearn/tree/_classes.py
sklearn/preprocessing/_discretization.py
sklearn/preprocessing/_encoders.py baris 620
sklearn/neural_network/_multilayer_perceptron.py baris 1054
sklearn/covariance/_robust_covariance.py

Silakan periksa apakah seseorang sudah mengerjakan/mengerjakan file yang Anda pilih

sadakmed pada 2 Agu 2020

@sadakmed , untuk semua "file dekomposisi", ada permintaan tarik #17739.

clmbst pada 3 Agu 2020

👍1

mengerjakan "gaussian_process.GaussianProcessRegressor" dan "neighbors._base.py"

sadakmed pada 3 Agu 2020

Hai, saya baru, dan saya ingin mulai berkontribusi. Apakah Anda masih memerlukan bantuan untuk masalah ini? apakah ada file yang masih perlu bantuan?

boricles pada 31 Agu 2020

Hai @boricles!

Lihat https://github.com/scikit-learn/scikit-learn/issues/15761#issuecomment -639461778 untuk daftar modul yang masih harus diperbaiki.

alfaro96 pada 31 Agu 2020

@alfaro96 terima kasih. Aku baru saja melihat sekilas. Saya akan memilih modul malam ini, dan mengerjakannya.

boricles pada 31 Agu 2020

Saya sedang mengerjakan sklearn/config_context

boricles pada 1 Sep 2020

Hei, kupikir aku akan melihat apakah aku bisa membantu dengan dokumen.

@alfaro96 Saya ingin mengerjakan sklearn.feature_extraction.text.CountVectorizer , jika belum diambil, terutama karena saya pribadi pernah mengalami beberapa jebakan ketika bekerja dengan Vectorizers di masa lalu.

Juga, saya perhatikan bahwa meskipun sklearn.model_selection.learning_curve telah diperbarui, ada tutorial yang kedaluwarsa menggunakan dokumentasi lama , haruskah saya membiarkannya? Atau apakah itu layak diperbarui?

madprogramer pada 5 Sep 2020

Hai @alfaro96 ,

setelah diedit:
Saya melihat sklearn.config_context dan sklearn.set_config dari sklearn.config_config.py telah diperbaiki sehingga dapat diperiksa dari daftar tugas .

Saya ingin bekerja pada sklearn.utils . Saya hanya melihat sekali contoh dokumentasi parameter di mana 'opsional' digunakan. Itu berarti saya hanya perlu memperbaiki contoh itu, benar? Itu ada di sklearn.utils._mocking.py

haiatn pada 5 Sep 2020

Hei, kupikir aku akan melihat apakah aku bisa membantu dengan dokumen.

Hai @madprogramer ,

@alfaro96 Saya ingin mengerjakan sklearn.feature_extraction.text.CountVectorizer , jika belum diambil, terutama karena saya pribadi pernah mengalami beberapa jebakan ketika bekerja dengan Vectorizers di masa lalu.

~Saya telah melihat daftar periksa dan referensi sklearn.feature_extraction.text.CountVectorizer dan sepertinya tidak diperbaiki. PR akan diterima.~

Sunting: sklearn.feature_extraction.text.CountVectorizer sudah diperbaiki.

Juga, saya perhatikan bahwa meskipun sklearn.model_selection.learning_curve telah diperbarui, ada tutorial yang kedaluwarsa menggunakan dokumentasi lama , haruskah saya membiarkannya? Atau apakah itu layak diperbarui?

Perlu diperbarui, meskipun ini harus dilakukan dalam PR terpisah.

Terima kasih!

alfaro96 pada 6 Sep 2020

👍1

Hai @alfaro96 ,

Hai @haiatn ,

setelah diedit:
Saya melihat sklearn.config_context dan sklearn.set_config dari sklearn.config_config.py telah diperbaiki sehingga dapat diperiksa dari daftar tugas .

Saya telah memperbarui daftar periksa .

Saya ingin bekerja pada sklearn.utils . Saya hanya melihat sekali contoh dokumentasi parameter di mana 'opsional' digunakan. Itu berarti saya hanya perlu memperbaiki contoh itu, benar? Itu ada di sklearn.utils._mocking.py

Itulah idenya, meskipun kelas dalam file sklearn.utils._mocking.py bukan bagian dari API publik, jadi menurut saya tidak layak untuk memperbaruinya.

Namun demikian, alangkah baiknya jika Anda dapat bekerja di salah satu fungsi, kelas, dan modul lain yang menunggu untuk diperbaiki.

Terima kasih!

alfaro96 pada 6 Sep 2020

👍1

Saya melihat daftar periksa. Dari apa yang saya lihat berikut ini dapat diperiksa dari daftar periksa:

sklearn.feature_extraction.image.img_to_graph
sklearn.isotonic.IsotonicRegression
sklearn.isotonic.check_increasing
Saya tidak menemukan file sklearn.ensemble.HistGradientBoostingRegressor tapi semua sklearn.ensemble OK

Bisakah saya bekerja pada sklearn.manifold._spectral_embedding dan sklearn.feature_extraction.text.HashVectorizer ? Saya akan melakukannya di PR terpisah. Saya pikir mereka adalah satu-satunya file yang tersisa yang perlu diperbaiki (dengan asumsi sklearn.feature_extraction.text.CountVectorizer diambil).

haiatn pada 6 Sep 2020

Saya melihat daftar periksa. Dari apa yang saya lihat berikut ini dapat diperiksa dari daftar periksa:
sklearn.feature_extraction.image.img_to_graph
sklearn.isotonic.IsotonicRegression
sklearn.isotonic.check_increasing

Terima kasih @haiatn , saya telah memperbarui daftar periksa.

Saya tidak menemukan file sklearn.ensemble.HistGradientBoostingRegressor tapi semua sklearn.ensemble OK

sklearn.ensemble.HistGradientBoostingClassifier dan sklearn.ensemble.HistGradientBoostingRegressor ada di file ini: scikit-learn/sklearn/ensemble/_hist_gradient_boosting/gradient_boosting.py . Namun, mereka sudah diperbaiki.

Bisakah saya bekerja pada sklearn.manifold._spectral_embedding dan sklearn.feature_extraction.text.HashVectorizer ? Saya akan melakukannya di PR terpisah. Saya pikir mereka adalah satu-satunya file yang tersisa yang perlu diperbaiki (dengan asumsi sklearn.feature_extraction.text.CountVectorizer diambil).

Saya telah melihat modul sklearn.manifold dan sklearn.feature_extraction.text.HashingVectorizer dan mereka telah diperbaiki (saya telah memperbarui daftar periksa yang sesuai).

Namun demikian, ada beberapa fungsi dalam modul sklearn.utils yang harus tetap diperbaiki.

Terima kasih @haiatn , kami sangat menghargai bantuan Anda!

alfaro96 pada 7 Sep 2020

Sekarang saya akan mengerjakan sklearn.utils._estimator_html_repr , sklearn.utils.deprecation dan sklearn.utils._testing

haiatn pada 11 Sep 2020

Saya akan menyelesaikan sklearn.utils. Hanya ada 3 file yang saya temukan yang perlu diperbaiki.

haiatn pada 15 Sep 2020

hai @alfaro96 ,
bisakah Anda meninjau permintaan tarik terbuka saya? Saya pikir mereka adalah yang terakhir.

18360 #18385 #18386

haiatn pada 18 Sep 2020

Hai @haiatn!

Saya sudah melihat PR terbuka Anda.

Terima kasih!

alfaro96 pada 20 Sep 2020

👍1

Sekarang setelah kita menggabungkan apa yang tersisa dari sklearn.utils dan itu adalah yang terakhir di daftar periksa , apakah kita sudah selesai?

haiatn pada 24 Sep 2020

Ada satu permintaan tarik terbuka terakhir #18025, maka masalah ini akhirnya bisa ditutup.

cmarmo pada 24 Sep 2020

👍1

Halo,
Saya ingin mulai berkontribusi. Apakah ada kelas yang tertunda untuk memperbaiki dokumen nilai default? Jika ada maka saya bisa mengambilnya.

mynkdsi1011 pada 24 Sep 2020

Hai, baru di open source, saya menantikan untuk memperbaiki doc jika ada kemungkinan ada sesuatu yang tersisa yang perlu diperbaiki

k-yash pada 4 Nov 2020

Apakah halaman ini membantu?

0 / 5 - 0 peringkat

Masalah terkait

sklearn.metrics.classification_report salah?

AntiDoctor · 3Komentar

Kesalahan muncul selama pencarian grid pada pipa dengan Tidak ada untuk langkah transformator

jrbourbeau · 3Komentar

Tambahkan lencana saluran pipa biru ke readme?

amueller · 3Komentar

Kesalahan impor saat memuat model acar yang ditarik dari Pipeline

bmulas1535 · 3Komentar

AttributeError: objek 'GridSearchCV' tidak memiliki atribut 'best_params_'

vitorcoliveira · 3Komentar