Scikit-learn: Perbaiki dokumentasi nilai default di semua kelas

Dibuat pada 2 Des 2019  ·  118Komentar  ·  Sumber: scikit-learn/scikit-learn

Keterangan

Dokumentasi nilai default di banyak kelas tidak disertakan, tidak konsisten dalam cara penulisannya, atau ketinggalan zaman. Saya ingin mengumpulkan beberapa orang untuk mengerjakan dokumentasi nilai default untuk setiap kelas karena ada banyak kelas di mana masalah ini ada. Saya telah diberitahu bahwa nilai default harus didokumentasikan sebagai "default=<'value'>" dan jadi saya membuat masalah ini dengan asumsi itu.

Larutan

Berikut adalah beberapa hal yang saya lihat untuk parameter yang harus diubah:

  • tidak disebutkan apakah ada default yang harus diperiksa terhadap kode karena beberapa parameter hilang sepenuhnya
  • "opsional" harus diubah menjadi "default=<'value'>"
  • pastikan bagaimana nilai default didokumentasikan konsisten di dalam kelas, yaitu ubah semuanya ke format "default=<'value'>"
  • Ubah satu file per PR

Jika beberapa orang mengerjakan beberapa kelas masing-masing, maka ini harus dilakukan dalam waktu singkat! Ini semua harus menjadi perbaikan yang cukup sederhana.

#### Contoh
https://scikit-learn.org/stable/modules/generated/sklearn.cluster.AgglomerativeClustering.html
Tautan di atas adalah contoh di mana nilai default tidak ditunjukkan tetapi parameternya mengatakan "opsional", dan di mana nilai default yang ditunjukkan semuanya didokumentasikan secara tidak konsisten.

Sprint good first issue

Komentar yang paling membantu

Berbicara secara logis, jika param adalah opsional, bukankah seharusnya defaultnya selalu None ? Memiliki parameter dengan nilai default selain None menyarankan itu harus diperlukan.

Jika ada default, ini biasanya berarti bahwa literatur telah menemukan ini sebagai nilai default yang masuk akal yang juga menunjukkan bahwa parameter ini berdampak pada kinerja dan karenanya tidak boleh opsional, tetapi harus menyebutkan apa defaultnya. Itu tampaknya lebih dekat dengan parameter yang diperlukan menurut definisi, kami kebetulan membuat pilihan yang masuk akal bagi pengguna sehingga mereka dapat mengubahnya atau tidak.

Atau lebih praktisnya, apakah saat ini ada parameter opsional yang kami temukan yang memiliki nilai default numerik, tetapi menentukan None akan menimbulkan pengecualian? Itu juga menunjukkan bahwa parameter sebenarnya diperlukan, tetapi default yang masuk akal telah dipilih berdasarkan literatur/penelitian.

Atau mungkin saya selama ini membingungkan arti dari required dan optional ? Tertawa terbahak-bahak. Pasti akan senang membantu dalam hal ini!

Semua 118 komentar

Halo @cgsavard , saya ingin mengerjakan ini. Bisakah saya mulai melihat kelas AgglomerativeClustering?

@vachanda Ayo! Kita bisa terus posting disini yang mana yang kita garap agar orang lain tahu.

Terima kasih telah mengoordinasikan @cgsavard ini

Catatan untuk kontributor: ikuti panduan di bawah: https://scikit-learn.org/stable/developers/contributing.html#guidelines -for-writing-documentation

@cgsavard , Apakah ada daftar kelas yang memiliki perbedaan atau apakah kita harus melalui masing-masing dan memperbaruinya?

@vachanda saya tidak punya daftar, sayangnya. Saya baru saja memeriksa file dan melihat apa yang perlu diperbarui.

Saya sedang mengerjakan AffinityPropagation, SpectralCoclustering, SpectralBiclustering, dan Birch.

Saya sedang mengerjakan FeatureAgglomeration, KMeans, dan MiniBatchKMeans.

Berbicara secara logis, jika param adalah opsional, bukankah seharusnya defaultnya selalu None ? Memiliki parameter dengan nilai default selain None menyarankan itu harus diperlukan.

Jika ada default, ini biasanya berarti bahwa literatur telah menemukan ini sebagai nilai default yang masuk akal yang juga menunjukkan bahwa parameter ini berdampak pada kinerja dan karenanya tidak boleh opsional, tetapi harus menyebutkan apa defaultnya. Itu tampaknya lebih dekat dengan parameter yang diperlukan menurut definisi, kami kebetulan membuat pilihan yang masuk akal bagi pengguna sehingga mereka dapat mengubahnya atau tidak.

Atau lebih praktisnya, apakah saat ini ada parameter opsional yang kami temukan yang memiliki nilai default numerik, tetapi menentukan None akan menimbulkan pengecualian? Itu juga menunjukkan bahwa parameter sebenarnya diperlukan, tetapi default yang masuk akal telah dipilih berdasarkan literatur/penelitian.

Atau mungkin saya selama ini membingungkan arti dari required dan optional ? Tertawa terbahak-bahak. Pasti akan senang membantu dalam hal ini!

@jmwoloso Kami benar-benar tidak konsisten mengenai penggunaan optional dan oleh karena itu kami baru-baru ini memutuskan untuk menghapusnya.

saya ingin berkontribusi juga. bisakah saya melanjutkan ini?

@glemaitre ok, itu masuk akal. jadi kita menghapus kata kerja optional bersama-sama, kan, sambil juga mencatat nilai default dalam string dokumen?

haruskah masing-masing yang kami temukan dibuka sebagai masalah secara terpisah atau bagaimana kami mementaskan semua pekerjaan yang kami lakukan karena banyak orang mengerjakan banyak hal yang berkaitan dengan satu masalah ini?

@cyrus303 @jmwoloso Anda bisa mendapatkan kelas (maksimum modul) dan memperbaikinya. Idenya adalah untuk menghapus opsional dan menambahkan default ketika ada satu (biasanya ada satu). Karena kita menyentuh dokumentasi, kita harus memastikan bahwa gaya pada baris mengikuti panduan gaya baru kita: https://scikit-learn.org/dev/developers/contributing.html#guidelines -for-writing-documentation

Anda dapat menyebutkan kelas/modul mana yang Anda kerjakan, buka tautan PR untuk menghindari upaya duplikat :). Menantikan untuk meninjaunya.

Hai! Saya akan mengerjakan kelas tree ( tree.DecisionTreeClassifier , tree.DecisionTreeRegressor , tree.ExtraTreeClassifier dan tree.ExtraTreeRegressor ).

Saya juga akan memperbaiki masalah ini untuk modul neighbors .

Saya akan mengambil modul ensemble .

@glemaitre ada preferensi pada bool vs. boolean ? melihat campuran keduanya di ensemble , bahkan di kelas yang sama. mungkin juga mendapatkan yang bugar saat saya melakukan default.

EDIT:

sama untuk int vs integer . Saya berasumsi int untuk yang itu, tetapi ingin mengonfirmasi.

EDIT (lagi):

juga melihat docstrings dengan nilai yang tidak konsisten relatif terhadap tanda tangan __init__ untuk kelas itu, misalnya:

min_impurity_split untuk RandomForestClassifier

tanda tangan __init__ memiliki min_impurity_split=None sedangkan dokumen untuknya mengatakan min_impurity_split : float, (default=0) . Saya akan menganggap memperbarui docstrings agar sesuai dengan tanda tangan karena kami ingin menjaga perilaku kelas tetap konsisten (yaitu kami ingin default yang sama diteruskan saat instantiasi)?

@jmwoloso Bisakah Anda merujuk ke https://scikit-learn.org/stable/developers/contributing.html#guidelines -for-writing-documentation. Pada dasarnya Anda harus default ke nama jenis python (bool, str, int, float)

tanda tangan __init__ memiliki min_impurity_split=Tidak ada sedangkan dokumen untuknya mengatakan min_impurity_split : float, (default=0). Saya akan menganggap memperbarui docstrings agar sesuai dengan tanda tangan karena kami ingin menjaga perilaku kelas tetap konsisten (yaitu kami ingin default yang sama diteruskan saat instantiasi)?

Kita harus mencocokkan parameter dalam tanda tangan fungsi. Parameter default nilai ini telah berubah dan docstring tidak diperbarui.

Hai @cgsavard , saya ingin berkontribusi tetapi ini akan menjadi pertama kalinya saya jadi perlu berpegangan tangan. Saya cukup akrab dengan python, agak berguna dengan editor teks dan baru-baru ini melalui fork -> clone -> edit -> tutorial alur kerja PR di sini . Mohon saran langkah selanjutnya... Terima kasih!

Hai @cgsavard ,
Bisakah saya bekerja di Imputer?

Hai @cgsavard , saya ingin mengerjakan kelas linear_model .

Saya juga sedang mengerjakan kelas Neural Network , Decomposition , Feature Extraction , Metrics dan Preprocess .

dapatkah seseorang memeriksa pr #15964 saya dan melihat mengapa kode cov gagal. Ini adalah pertama kalinya saya berkontribusi. Mohon bimbingannya.

Abaikan codecov. Ini adalah positif palsu karena kami tidak menyentuh kode. Saya akan segera meninjau PR

Dikirim dari ponsel saya - maaf singkat dan berpotensi salah eja.

Saya baru saja membuat kontribusi pertama saya #15988

Saya akan mengambil modul naive_bayes .

Saya baru saja membuat kontribusi pertama saya #16019

Hai Semua, sedang mengerjakan sklearn/neighbors , terima kasih.

Berkontribusi pada sklearn/semi_supervised.Terima kasih

Hai @cgsavard , saya ingin berkontribusi juga, saya akan mengambil modul sklearn/svm . Terima kasih

Berkontribusi pada sklearn/semi_supervised.Terima kasih
Apakah ada beberapa pengeditan lebih lanjut yang diperlukan pada PR #16042

@glemaitre di #16105, saya harus menggali sedikit lebih dalam ke konstruksi untuk mengambil nilai default, docstrings tampak tidak akurat dan ketinggalan jaman.

Saya juga mencoba menggunakan cara yang tidak terlalu ambigu, ringkas, dan ketat secara matematis untuk mendefinisikan rentang parameter. misalnya, saya mengubah positive float menjadi float in (0, inf] atau 0<= shrinkage <=1 menjadi float in (0, 1) . Singkat cerita, saya melakukan yang terbaik yang saya bisa untuk menjadi ringkas dan akurat tapi tolong beri perhatian 5% lebih untuk meninjau PR ini. Terima kasih.

@cgsavard , ini adalah masalah yang sangat bagus untuk sprint! Jika Anda setuju dengan itu, saya berencana untuk menambahkannya ke daftar Sprint kami. Saya telah merangkum kelas-kelas yang telah ditangani oleh seorang PR, dan PR koresponden mereka di sini .
Apakah Anda keberatan untuk menautkan intisari dalam deskripsi masalah? Ini akan membuat informasi tersedia sejak awal. Bolehkah saya juga meminta Anda untuk mengklarifikasi dalam uraian bahwa setiap PR harus menangani satu file (maksimal satu modul) pada satu waktu seperti yang dijelaskan di sini ? Ini akan sangat membantu kontributor dan pengulas! Terima kasih banyak!

Bagi mereka yang tertarik dengan masalah ini, perintah

git grep "optional.*default"

akan menampilkan file yang masih terpengaruh oleh masalah ini (terima kasih @ogrisel! :)).

@cgsavard Halo, saya ingin mengerjakan model_selection @WiMLDS

@lopusz dan saya ingin bekerja di random_projection.py

Bersenang-senanglah untuk semua orang!

@adrinjalali @noatamir @WiMLDS

@ETay203 dan saya ingin mengerjakan mean_shift @WiMLDS_Berlin sprint.

@magda-zielinska dan saya ingin bekerja di pipeline.py

@adrinjalali @noatamir @WiMLDS

@lopusz dan @magda-zielinska dan saya ingin bekerja di kernel_approximation.py

Saya akan menangani _optics.py sekarang

Pembukaan kembali: ditutup dengan kata kunci "Perbaikan" di #16216.

Pembukaan kembali: ditutup dengan kata kunci "Perbaikan" di #16207

Saya akan menangani sklearn/linear_model/_coordinate_descent.py sekarang

Saya membersihkan base.py dan mengirimkan PR

Saya membersihkan discriminant_analysis.py dan mengirimkan PR

Saya akan melihat sekarang di sklearn/gaussian_process/*.py

Sudah ada PR panjang untuk GPs

@lopusz saya minta maaf, bahwa PR menyentuh masalah lain dari modul GP, Anda dapat melanjutkan dan mengerjakannya jika Anda tidak keberatan :)

@adrinjalali Terima kasih telah mengawasinya!

Memang, saya belum memindai PR terbuka dengan cukup baik, jadi fakta bahwa dokter tidak diambil lebih merupakan kecelakaan;)

Saya akan memastikan untuk melacak apa yang PRed.

Dan ya PR untuk dokter akan datang ;)

Apakah ada hal lain yang harus dilakukan di sini?

Saya sedang mengerjakan sklearn/decomposition/_dict_learning.py

apa yang tersisa untuk dilakukan? Saya terbuka untuk membantu. . .

Mencari tahu apa yang tersisa mungkin merupakan tempat yang baik untuk mulai membantu :)

Hai, Saya telah melihat-lihat untuk melihat apa yang tersisa, saya pikir masih ada beberapa pembaruan yang harus dilakukan di beberapa modul yang dilihat sebelumnya.
Saya akan mengerjakan ini, dimulai dengan modul cluster dan dapat meningkatkan PR untuk setiap modul saat saya melanjutkan?
Ini adalah kontribusi pertama saya jadi tolong beri tahu saya jika saya tidak mengikuti proses dengan benar, dll.
Terima kasih!

Ini adalah daftar fungsi, kelas, dan modul yang tersisa untuk diperbaiki:

  • [x] sklearn.feature_selection.SelectorMixin
  • [x] sklearn.config_context
  • [x] sklearn.set_config
  • [x] sklearn.calibration.CalibratedClassifierCV
  • [x] sklearn.cluster.OPTICS
  • [x] sklearn.cluster.SpectralClustering
  • [x] sklearn.cluster.affinity_propagation
  • [x] sklearn.cluster.cluster_optics_dbscan
  • [x] sklearn.cluster.cluster_optics_xi
  • [x] sklearn.cluster.compute_optics_graph
  • [x] sklearn.cluster.mean_shift
  • [x] sklearn.cluster.spectral_clustering
  • [x] sklearn.cluster.ward_tree
  • [x] sklearn.cross_decomposition.CCA
  • [x] sklearn.cross_decomposition.PLSCanonical
  • [x] sklearn.cross_decomposition.PLSRegression
  • [x] sklearn.cross_decomposition.PLSSVD
  • [x] sklearn.datasets
  • [x] sklearn.decomposition
  • [x] sklearn.dummy
  • [x] sklearn.ensemble.HistGradientBoostingRegressor (percobaan)
  • [x] sklearn.ensemble.HistGradientBoostingRegressor (percobaan)
  • [x] sklearn.feature_extraction.image.grid_to_graph
  • [x] sklearn.feature_extraction.image.img_to_graph
  • [x] sklearn.feature_extraction.text.CountVectorizer
  • [x] sklearn.feature_extraction.text.HashVectorizer
  • [x] sklearn.feature_selection
  • [x] sklearn.impute
  • [x] sklearn.inspection.partial_dependence
  • [x] sklearn.inspection.permutation_importance
  • [x] sklearn.inspection.permutation_importance
  • [x] sklearn.inspection.PartialDependenceDisplay
  • [x] sklearn.inspection.plot_partial_dependence
  • [x] sklearn.isotonic.IsotonicRegression
  • [x] sklearn.isotonic.check_increasing
  • [x] sklearn.isotonic.isotonic_regression
  • [x] sklearn.kernel_approximation
  • [x] sklearn.kernel_ridge
  • [x] sklearn.linear_model.PassiveAggressiveClassifier
  • [x] sklearn.linear_model.LassoLars
  • [x] sklearn.linear_model.OrthogonalMatchingPursuit
  • [x] sklearn.linear_model.HuberRegressor
  • [x] sklearn.linear_model.RANSACRegressor
  • [x] sklearn.linear_model.TheilSenRegressor
  • [x] sklearn.linear_model.PassiveAggressiveRegressor
  • [x] sklearn.linear_model.orthogonal_mp
  • [x] sklearn.linear_model.orthogonal_mp_gram
  • [x] sklearn.manifold
  • [x] sklearn.metrics (kecuali sklearn.metrics.confusion_matrix , sklearn.metrics.roc_auc_score , sklearn.metrics.max_error sklearn.metrics.mean_poisson_deviance , sklearn.metrics.mean_gamma_deviance , sklearn.metrics.mean_tweedie_deviance , sklearn.metrics.plot_confusion_matrix , sklearn.metrics.plot_precision_recall_curve )
  • [x] sklearn.mixture
  • [x] sklearn.model_selection.GridSearchCV
  • [x] sklearn.model_selection.ParameterGrid
  • [x] sklearn.model_selection.ParameterSampler
  • [x] sklearn.model_selection.RandomizedSearchCV
  • [x] sklearn.model_selection.fit_grid_point
  • [x] sklearn.multiclass
  • [x] sklearn.multioutput
  • [x] sklearn.neural_network
  • [x] sklearn.preprocessing
  • [x] sklearn.random_projection
  • [x] sklearn.tree.export_graphviz
  • [x] sklearn.tree.export_text
  • [x] sklearn.tree.plot_tree
  • [x] sklearn.utils

Semoga saya tidak melewatkan apa pun.

Hai. Saya akan mencoba membuat pass di dokumentasi feature_selection

Kami mengambil bagian sklearn.mixture

Mengambil bagian cross_decomposition

Untuk Scikit-Learn Sprint 2020, @icoder18 dan saya mengambil bagian sklearn.random_projection

@adrinjalali kami menyelesaikan sklearn/campuran

Bekerja pada sklearn.linear_model untuk sprint dengan @genvalen

Ambil sklearn.calibration.CalibratedClassifierCV

Bekerja pada ini untuk sklearn.utils.validation

Selanjutnya kita akan menangani sklearn.utils.random

bekerja di sklearn.impute

Bekerja di sklearn.tree.plot_tree

Tabel 14 akan mengambil sklearn.neural_network

Ambil sklearn.kernel_approximation

Mengambil sklearn.inspection

Tabel 14 akan mengambil sklearn.preprocessing

Mengambil kumpulan data

Mengambil sklearn.mixture #17509

Daftar diperbarui.

Terima kasih semua!

Mengambil sklearn.metrics untuk sprint

Mengambil modul model_selection

@glemaitre Bisakah kami memperbarui deskripsi ini untuk memasukkan yang terbaik adalah mengirimkan satu file pada satu waktu?

Halo saya ingin berkontribusi. Ini adalah pertama kalinya bagi saya ... Dan tidak jelas bagi saya bagaimana saya bisa tahu di modul mana masih ada pekerjaan yang harus dilakukan? Terima kasih !

https://github.com/scikit-learn/scikit-learn/issues/15761#issuecomment -639461778 berisi daftar modul yang harus diperbaiki.

Terima kasih. Ambil sklearn.decomposition kemudian.

Saya sedang mengerjakan 'sklearn.isotonic.isotonic_regression'

Saya sedang mengerjakan 'sklearn.multiclass.py'

Hai, bolehkah saya mencoba mengambil sisa sklearn.tree ? Ini akan menjadi pertama kalinya saya berkontribusi juga.

Terima kasih telah check-in, senang mendapat bantuan Anda! Silakan lanjutkan; Saya pikir semua pembaruan sprint kami telah ditutup.

Pada 4 Juli 2020, pukul 10:45, Ivan Wiryadi [email protected] menulis:


Hai, bolehkah saya mencoba mengambil sisanya di sklearn.tree? Ini akan menjadi pertama kalinya saya berkontribusi juga.


Anda menerima ini karena Anda berkomentar.
Balas email ini secara langsung, lihat di GitHub, atau berhenti berlangganan.

Hai, saya ingin memberikan kontribusi pertama saya. Bisakah saya mengambil sklearn.multioutput?

Saya akan melanjutkan dengan sklearn.utils, dimulai dengan _encode.py

Saya sedang mengerjakan sklearn/decomposition/_dict_learning.py

Saya sedang mengerjakan sklearn.kernel_ridge di sprint

Hai, saya akan mulai mengerjakan sklearn.feature_extraction.image.img_to_graph

Saya sedang mengerjakan sklearn.feature_extraction.text.CountVectorizer

Saya sedang mengerjakan sklearn.sklearn.kernel_ridge

Saya sedang mengerjakan sklearn.ensemble.HistGradientBoostingRegressor

"Aku sedang mengerjakan ini"

hal ini? @Hoda1394

"Aku sedang mengerjakan ini"

hal ini? @Hoda1394

@TahiriNadia dikoreksi.

@cgsavard Hei, Bisakah saya mengerjakan ini? Saya pemula

Saya akan mengerjakan file di sklearn.datasets .

Bisakah saya bekerja di sklearn.linear_model._least_angle.py

@glemaitre Saya sedang mengerjakan sklearn.linear_model._least_angle.py dan saya menemukan ketidakkonsistenan penggunaan method ='lar' kadang-kadang menunjukkan lars kadang-kadang lar , ketidakkonsistenan ini juga dalam kode (tidak hanya dalam dokumentasi), saya dapat melihat bahwa lars adalah yang benar, dapatkah Anda mengkonfirmasinya, dan saya akan membuat PR.

mengerjakan 'sklearn/ensemble/_hist_gradient_boosting/binning.py'

file perlu diubah:

sklearn/_config.py
sklearn/dummy.py
sklearn/multioutput.py
sklearn/linear_model/_huber.py
sklearn/linear_model/_theil_sen.py
sklearn/linear_model/_ridge.py
sklearn/linear_model/_omp.py
sklearn/linear_model/_sag.py
sklearn/externals/_lobpcg.py
sklearn/externals/_lobpcg.py
sklearn/utils/extmath.py
sklearn/utils/__init__.py
sklearn/utils/graph.py
sklearn/utils/_mocking.py
sklearn/utils/sparsefuncs.py
sklearn/neighbors/_base.py
sklearn/gaussian_process/_gpc.py
sklearn/gaussian_process/kernels.py
sklearn/model_selection/_validation.py
~sklearn/decomposition/_fastica.py~
~sklearn/decomposition/_dict_learning.py~
~sklearn/decomposition/_factor_analysis.py~
~sklearn/decomposition/_incremental_pca.py~
~sklearn/decomposition/_lda.py~
~sklearn/decomposition/_pca.py~
~sklearn/decomposition/_truncated_svd.py~
~sklearn/decomposition/_sparse_pca.py~
~sklearn/decomposition/_nmf.py~
sklearn/manifold/_mds.py
sklearn/manifold/_spectral_embedding.py
sklearn/manifold/_t_sne.py
sklearn/ensemble/_hist_gradient_boosting/grower.py
sklearn/ensemble/_hist_gradient_boosting/binning.py
sklearn/metrics/_ranking.py
sklearn/tree/_classes.py
sklearn/preprocessing/_discretization.py
sklearn/preprocessing/_encoders.py baris 620
sklearn/neural_network/_multilayer_perceptron.py baris 1054
sklearn/covariance/_robust_covariance.py

Silakan periksa apakah seseorang sudah mengerjakan/mengerjakan file yang Anda pilih

@sadakmed , untuk semua "file dekomposisi", ada permintaan tarik #17739.

mengerjakan "gaussian_process.GaussianProcessRegressor" dan "neighbors._base.py"

Hai, saya baru, dan saya ingin mulai berkontribusi. Apakah Anda masih memerlukan bantuan untuk masalah ini? apakah ada file yang masih perlu bantuan?

Hai @boricles!

Lihat https://github.com/scikit-learn/scikit-learn/issues/15761#issuecomment -639461778 untuk daftar modul yang masih harus diperbaiki.

@alfaro96 terima kasih. Aku baru saja melihat sekilas. Saya akan memilih modul malam ini, dan mengerjakannya.

Saya sedang mengerjakan sklearn/config_context

Hei, kupikir aku akan melihat apakah aku bisa membantu dengan dokumen.

@alfaro96 Saya ingin mengerjakan sklearn.feature_extraction.text.CountVectorizer , jika belum diambil, terutama karena saya pribadi pernah mengalami beberapa jebakan ketika bekerja dengan Vectorizers di masa lalu.

Juga, saya perhatikan bahwa meskipun sklearn.model_selection.learning_curve telah diperbarui, ada tutorial yang kedaluwarsa menggunakan dokumentasi lama , haruskah saya membiarkannya? Atau apakah itu layak diperbarui?

Hai @alfaro96 ,

setelah diedit:
Saya melihat sklearn.config_context dan sklearn.set_config dari sklearn.config_config.py telah diperbaiki sehingga dapat diperiksa dari daftar tugas .

Saya ingin bekerja pada sklearn.utils . Saya hanya melihat sekali contoh dokumentasi parameter di mana 'opsional' digunakan. Itu berarti saya hanya perlu memperbaiki contoh itu, benar? Itu ada di sklearn.utils._mocking.py

Hei, kupikir aku akan melihat apakah aku bisa membantu dengan dokumen.

Hai @madprogramer ,

@alfaro96 Saya ingin mengerjakan sklearn.feature_extraction.text.CountVectorizer , jika belum diambil, terutama karena saya pribadi pernah mengalami beberapa jebakan ketika bekerja dengan Vectorizers di masa lalu.

~Saya telah melihat daftar periksa dan referensi sklearn.feature_extraction.text.CountVectorizer dan sepertinya tidak diperbaiki. PR akan diterima.~

Sunting: sklearn.feature_extraction.text.CountVectorizer sudah diperbaiki.

Juga, saya perhatikan bahwa meskipun sklearn.model_selection.learning_curve telah diperbarui, ada tutorial yang kedaluwarsa menggunakan dokumentasi lama , haruskah saya membiarkannya? Atau apakah itu layak diperbarui?

Perlu diperbarui, meskipun ini harus dilakukan dalam PR terpisah.

Terima kasih!

Hai @alfaro96 ,

Hai @haiatn ,

setelah diedit:
Saya melihat sklearn.config_context dan sklearn.set_config dari sklearn.config_config.py telah diperbaiki sehingga dapat diperiksa dari daftar tugas .

Saya telah memperbarui daftar periksa .

Saya ingin bekerja pada sklearn.utils . Saya hanya melihat sekali contoh dokumentasi parameter di mana 'opsional' digunakan. Itu berarti saya hanya perlu memperbaiki contoh itu, benar? Itu ada di sklearn.utils._mocking.py

Itulah idenya, meskipun kelas dalam file sklearn.utils._mocking.py bukan bagian dari API publik, jadi menurut saya tidak layak untuk memperbaruinya.

Namun demikian, alangkah baiknya jika Anda dapat bekerja di salah satu fungsi, kelas, dan modul lain yang menunggu untuk diperbaiki.

Terima kasih!

Saya melihat daftar periksa. Dari apa yang saya lihat berikut ini dapat diperiksa dari daftar periksa:

  • sklearn.feature_extraction.image.img_to_graph
  • sklearn.isotonic.IsotonicRegression
  • sklearn.isotonic.check_increasing
  • Saya tidak menemukan file sklearn.ensemble.HistGradientBoostingRegressor tapi semua sklearn.ensemble OK

Bisakah saya bekerja pada sklearn.manifold._spectral_embedding dan sklearn.feature_extraction.text.HashVectorizer ? Saya akan melakukannya di PR terpisah. Saya pikir mereka adalah satu-satunya file yang tersisa yang perlu diperbaiki (dengan asumsi sklearn.feature_extraction.text.CountVectorizer diambil).

Saya melihat daftar periksa. Dari apa yang saya lihat berikut ini dapat diperiksa dari daftar periksa:

  • sklearn.feature_extraction.image.img_to_graph
  • sklearn.isotonic.IsotonicRegression
  • sklearn.isotonic.check_increasing

Terima kasih @haiatn , saya telah memperbarui daftar periksa.

  • Saya tidak menemukan file sklearn.ensemble.HistGradientBoostingRegressor tapi semua sklearn.ensemble OK

sklearn.ensemble.HistGradientBoostingClassifier dan sklearn.ensemble.HistGradientBoostingRegressor ada di file ini: scikit-learn/sklearn/ensemble/_hist_gradient_boosting/gradient_boosting.py . Namun, mereka sudah diperbaiki.

Bisakah saya bekerja pada sklearn.manifold._spectral_embedding dan sklearn.feature_extraction.text.HashVectorizer ? Saya akan melakukannya di PR terpisah. Saya pikir mereka adalah satu-satunya file yang tersisa yang perlu diperbaiki (dengan asumsi sklearn.feature_extraction.text.CountVectorizer diambil).

Saya telah melihat modul sklearn.manifold dan sklearn.feature_extraction.text.HashingVectorizer dan mereka telah diperbaiki (saya telah memperbarui daftar periksa yang sesuai).

Namun demikian, ada beberapa fungsi dalam modul sklearn.utils yang harus tetap diperbaiki.

Terima kasih @haiatn , kami sangat menghargai bantuan Anda!

Sekarang saya akan mengerjakan sklearn.utils._estimator_html_repr , sklearn.utils.deprecation dan sklearn.utils._testing

Saya akan menyelesaikan sklearn.utils. Hanya ada 3 file yang saya temukan yang perlu diperbaiki.

hai @alfaro96 ,
bisakah Anda meninjau permintaan tarik terbuka saya? Saya pikir mereka adalah yang terakhir.

18360 #18385 #18386

Hai @haiatn!

Saya sudah melihat PR terbuka Anda.

Terima kasih!

Sekarang setelah kita menggabungkan apa yang tersisa dari sklearn.utils dan itu adalah yang terakhir di daftar periksa , apakah kita sudah selesai?

Ada satu permintaan tarik terbuka terakhir #18025, maka masalah ini akhirnya bisa ditutup.

Halo,
Saya ingin mulai berkontribusi. Apakah ada kelas yang tertunda untuk memperbaiki dokumen nilai default? Jika ada maka saya bisa mengambilnya.

Hai, baru di open source, saya menantikan untuk memperbaiki doc jika ada kemungkinan ada sesuatu yang tersisa yang perlu diperbaiki

Apakah halaman ini membantu?
0 / 5 - 0 peringkat