Dokumentasi nilai default di banyak kelas tidak disertakan, tidak konsisten dalam cara penulisannya, atau ketinggalan zaman. Saya ingin mengumpulkan beberapa orang untuk mengerjakan dokumentasi nilai default untuk setiap kelas karena ada banyak kelas di mana masalah ini ada. Saya telah diberitahu bahwa nilai default harus didokumentasikan sebagai "default=<'value'>" dan jadi saya membuat masalah ini dengan asumsi itu.
Berikut adalah beberapa hal yang saya lihat untuk parameter yang harus diubah:
Jika beberapa orang mengerjakan beberapa kelas masing-masing, maka ini harus dilakukan dalam waktu singkat! Ini semua harus menjadi perbaikan yang cukup sederhana.
#### Contoh
https://scikit-learn.org/stable/modules/generated/sklearn.cluster.AgglomerativeClustering.html
Tautan di atas adalah contoh di mana nilai default tidak ditunjukkan tetapi parameternya mengatakan "opsional", dan di mana nilai default yang ditunjukkan semuanya didokumentasikan secara tidak konsisten.
Halo @cgsavard , saya ingin mengerjakan ini. Bisakah saya mulai melihat kelas AgglomerativeClustering?
@vachanda Ayo! Kita bisa terus posting disini yang mana yang kita garap agar orang lain tahu.
Terima kasih telah mengoordinasikan @cgsavard ini
Catatan untuk kontributor: ikuti panduan di bawah: https://scikit-learn.org/stable/developers/contributing.html#guidelines -for-writing-documentation
@cgsavard , Apakah ada daftar kelas yang memiliki perbedaan atau apakah kita harus melalui masing-masing dan memperbaruinya?
@vachanda saya tidak punya daftar, sayangnya. Saya baru saja memeriksa file dan melihat apa yang perlu diperbarui.
Saya sedang mengerjakan AffinityPropagation, SpectralCoclustering, SpectralBiclustering, dan Birch.
Saya sedang mengerjakan FeatureAgglomeration, KMeans, dan MiniBatchKMeans.
Berbicara secara logis, jika param adalah opsional, bukankah seharusnya defaultnya selalu None
? Memiliki parameter dengan nilai default selain None
menyarankan itu harus diperlukan.
Jika ada default, ini biasanya berarti bahwa literatur telah menemukan ini sebagai nilai default yang masuk akal yang juga menunjukkan bahwa parameter ini berdampak pada kinerja dan karenanya tidak boleh opsional, tetapi harus menyebutkan apa defaultnya. Itu tampaknya lebih dekat dengan parameter yang diperlukan menurut definisi, kami kebetulan membuat pilihan yang masuk akal bagi pengguna sehingga mereka dapat mengubahnya atau tidak.
Atau lebih praktisnya, apakah saat ini ada parameter opsional yang kami temukan yang memiliki nilai default numerik, tetapi menentukan None
akan menimbulkan pengecualian? Itu juga menunjukkan bahwa parameter sebenarnya diperlukan, tetapi default yang masuk akal telah dipilih berdasarkan literatur/penelitian.
Atau mungkin saya selama ini membingungkan arti dari required
dan optional
? Tertawa terbahak-bahak. Pasti akan senang membantu dalam hal ini!
@jmwoloso Kami benar-benar tidak konsisten mengenai penggunaan optional
dan oleh karena itu kami baru-baru ini memutuskan untuk menghapusnya.
saya ingin berkontribusi juga. bisakah saya melanjutkan ini?
@glemaitre ok, itu masuk akal. jadi kita menghapus kata kerja optional
bersama-sama, kan, sambil juga mencatat nilai default dalam string dokumen?
haruskah masing-masing yang kami temukan dibuka sebagai masalah secara terpisah atau bagaimana kami mementaskan semua pekerjaan yang kami lakukan karena banyak orang mengerjakan banyak hal yang berkaitan dengan satu masalah ini?
@cyrus303 @jmwoloso Anda bisa mendapatkan kelas (maksimum modul) dan memperbaikinya. Idenya adalah untuk menghapus opsional dan menambahkan default ketika ada satu (biasanya ada satu). Karena kita menyentuh dokumentasi, kita harus memastikan bahwa gaya pada baris mengikuti panduan gaya baru kita: https://scikit-learn.org/dev/developers/contributing.html#guidelines -for-writing-documentation
Anda dapat menyebutkan kelas/modul mana yang Anda kerjakan, buka tautan PR untuk menghindari upaya duplikat :). Menantikan untuk meninjaunya.
Hai! Saya akan mengerjakan kelas tree
( tree.DecisionTreeClassifier
, tree.DecisionTreeRegressor
, tree.ExtraTreeClassifier
dan tree.ExtraTreeRegressor
).
Saya juga akan memperbaiki masalah ini untuk modul neighbors
.
Saya akan mengambil modul ensemble
.
@glemaitre ada preferensi pada bool
vs. boolean
? melihat campuran keduanya di ensemble
, bahkan di kelas yang sama. mungkin juga mendapatkan yang bugar saat saya melakukan default.
EDIT:
sama untuk int
vs integer
. Saya berasumsi int
untuk yang itu, tetapi ingin mengonfirmasi.
EDIT (lagi):
juga melihat docstrings dengan nilai yang tidak konsisten relatif terhadap tanda tangan __init__
untuk kelas itu, misalnya:
min_impurity_split
untuk RandomForestClassifier
tanda tangan __init__
memiliki min_impurity_split=None
sedangkan dokumen untuknya mengatakan min_impurity_split : float, (default=0)
. Saya akan menganggap memperbarui docstrings agar sesuai dengan tanda tangan karena kami ingin menjaga perilaku kelas tetap konsisten (yaitu kami ingin default yang sama diteruskan saat instantiasi)?
@jmwoloso Bisakah Anda merujuk ke https://scikit-learn.org/stable/developers/contributing.html#guidelines -for-writing-documentation. Pada dasarnya Anda harus default ke nama jenis python (bool, str, int, float)
tanda tangan __init__ memiliki min_impurity_split=Tidak ada sedangkan dokumen untuknya mengatakan min_impurity_split : float, (default=0). Saya akan menganggap memperbarui docstrings agar sesuai dengan tanda tangan karena kami ingin menjaga perilaku kelas tetap konsisten (yaitu kami ingin default yang sama diteruskan saat instantiasi)?
Kita harus mencocokkan parameter dalam tanda tangan fungsi. Parameter default nilai ini telah berubah dan docstring tidak diperbarui.
Hai @cgsavard , saya ingin berkontribusi tetapi ini akan menjadi pertama kalinya saya jadi perlu berpegangan tangan. Saya cukup akrab dengan python, agak berguna dengan editor teks dan baru-baru ini melalui fork -> clone -> edit -> tutorial alur kerja PR di sini . Mohon saran langkah selanjutnya... Terima kasih!
Hai @cgsavard ,
Bisakah saya bekerja di Imputer?
Hai @cgsavard , saya ingin mengerjakan kelas linear_model
.
Saya juga sedang mengerjakan kelas Neural Network
, Decomposition
, Feature Extraction
, Metrics
dan Preprocess
.
dapatkah seseorang memeriksa pr #15964 saya dan melihat mengapa kode cov gagal. Ini adalah pertama kalinya saya berkontribusi. Mohon bimbingannya.
Abaikan codecov. Ini adalah positif palsu karena kami tidak menyentuh kode. Saya akan segera meninjau PR
Dikirim dari ponsel saya - maaf singkat dan berpotensi salah eja.
Saya baru saja membuat kontribusi pertama saya #15988
Saya akan mengambil modul naive_bayes
.
Saya baru saja membuat kontribusi pertama saya #16019
Hai Semua, sedang mengerjakan sklearn/neighbors
, terima kasih.
Berkontribusi pada sklearn/semi_supervised.Terima kasih
Hai @cgsavard , saya ingin berkontribusi juga, saya akan mengambil modul sklearn/svm
. Terima kasih
Berkontribusi pada sklearn/semi_supervised.Terima kasih
Apakah ada beberapa pengeditan lebih lanjut yang diperlukan pada PR #16042
@glemaitre di #16105, saya harus menggali sedikit lebih dalam ke konstruksi untuk mengambil nilai default, docstrings tampak tidak akurat dan ketinggalan jaman.
Saya juga mencoba menggunakan cara yang tidak terlalu ambigu, ringkas, dan ketat secara matematis untuk mendefinisikan rentang parameter. misalnya, saya mengubah positive float
menjadi float in (0, inf]
atau 0<= shrinkage <=1
menjadi float in (0, 1)
. Singkat cerita, saya melakukan yang terbaik yang saya bisa untuk menjadi ringkas dan akurat tapi tolong beri perhatian 5% lebih untuk meninjau PR ini. Terima kasih.
@cgsavard , ini adalah masalah yang sangat bagus untuk sprint! Jika Anda setuju dengan itu, saya berencana untuk menambahkannya ke daftar Sprint kami. Saya telah merangkum kelas-kelas yang telah ditangani oleh seorang PR, dan PR koresponden mereka di sini .
Apakah Anda keberatan untuk menautkan intisari dalam deskripsi masalah? Ini akan membuat informasi tersedia sejak awal. Bolehkah saya juga meminta Anda untuk mengklarifikasi dalam uraian bahwa setiap PR harus menangani satu file (maksimal satu modul) pada satu waktu seperti yang dijelaskan di sini ? Ini akan sangat membantu kontributor dan pengulas! Terima kasih banyak!
Bagi mereka yang tertarik dengan masalah ini, perintah
git grep "optional.*default"
akan menampilkan file yang masih terpengaruh oleh masalah ini (terima kasih @ogrisel! :)).
@cgsavard Halo, saya ingin mengerjakan model_selection
@WiMLDS
@lopusz dan saya ingin bekerja di random_projection.py
Bersenang-senanglah untuk semua orang!
@adrinjalali @noatamir @WiMLDS
@ETay203 dan saya ingin mengerjakan mean_shift
@WiMLDS_Berlin sprint.
@magda-zielinska dan saya ingin bekerja di pipeline.py
@adrinjalali @noatamir @WiMLDS
@lopusz dan @magda-zielinska dan saya ingin bekerja di kernel_approximation.py
Saya akan menangani _optics.py sekarang
Pembukaan kembali: ditutup dengan kata kunci "Perbaikan" di #16216.
Pembukaan kembali: ditutup dengan kata kunci "Perbaikan" di #16207
Saya akan menangani sklearn/linear_model/_coordinate_descent.py sekarang
Saya membersihkan base.py dan mengirimkan PR
Saya membersihkan discriminant_analysis.py dan mengirimkan PR
Saya akan melihat sekarang di sklearn/gaussian_process/*.py
Sudah ada PR panjang untuk GPs
@lopusz saya minta maaf, bahwa PR menyentuh masalah lain dari modul GP, Anda dapat melanjutkan dan mengerjakannya jika Anda tidak keberatan :)
@adrinjalali Terima kasih telah mengawasinya!
Memang, saya belum memindai PR terbuka dengan cukup baik, jadi fakta bahwa dokter tidak diambil lebih merupakan kecelakaan;)
Saya akan memastikan untuk melacak apa yang PRed.
Dan ya PR untuk dokter akan datang ;)
Apakah ada hal lain yang harus dilakukan di sini?
Saya sedang mengerjakan sklearn/decomposition/_dict_learning.py
apa yang tersisa untuk dilakukan? Saya terbuka untuk membantu. . .
Mencari tahu apa yang tersisa mungkin merupakan tempat yang baik untuk mulai membantu :)
Hai, Saya telah melihat-lihat untuk melihat apa yang tersisa, saya pikir masih ada beberapa pembaruan yang harus dilakukan di beberapa modul yang dilihat sebelumnya.
Saya akan mengerjakan ini, dimulai dengan modul cluster dan dapat meningkatkan PR untuk setiap modul saat saya melanjutkan?
Ini adalah kontribusi pertama saya jadi tolong beri tahu saya jika saya tidak mengikuti proses dengan benar, dll.
Terima kasih!
Ini adalah daftar fungsi, kelas, dan modul yang tersisa untuk diperbaiki:
sklearn.feature_selection.SelectorMixin
sklearn.config_context
sklearn.set_config
sklearn.calibration.CalibratedClassifierCV
sklearn.cluster.OPTICS
sklearn.cluster.SpectralClustering
sklearn.cluster.affinity_propagation
sklearn.cluster.cluster_optics_dbscan
sklearn.cluster.cluster_optics_xi
sklearn.cluster.compute_optics_graph
sklearn.cluster.mean_shift
sklearn.cluster.spectral_clustering
sklearn.cluster.ward_tree
sklearn.cross_decomposition.CCA
sklearn.cross_decomposition.PLSCanonical
sklearn.cross_decomposition.PLSRegression
sklearn.cross_decomposition.PLSSVD
sklearn.datasets
sklearn.decomposition
sklearn.dummy
sklearn.ensemble.HistGradientBoostingRegressor
(percobaan)sklearn.ensemble.HistGradientBoostingRegressor
(percobaan)sklearn.feature_extraction.image.grid_to_graph
sklearn.feature_extraction.image.img_to_graph
sklearn.feature_extraction.text.CountVectorizer
sklearn.feature_extraction.text.HashVectorizer
sklearn.feature_selection
sklearn.impute
sklearn.inspection.partial_dependence
sklearn.inspection.permutation_importance
sklearn.inspection.permutation_importance
sklearn.inspection.PartialDependenceDisplay
sklearn.inspection.plot_partial_dependence
sklearn.isotonic.IsotonicRegression
sklearn.isotonic.check_increasing
sklearn.isotonic.isotonic_regression
sklearn.kernel_approximation
sklearn.kernel_ridge
sklearn.linear_model.PassiveAggressiveClassifier
sklearn.linear_model.LassoLars
sklearn.linear_model.OrthogonalMatchingPursuit
sklearn.linear_model.HuberRegressor
sklearn.linear_model.RANSACRegressor
sklearn.linear_model.TheilSenRegressor
sklearn.linear_model.PassiveAggressiveRegressor
sklearn.linear_model.orthogonal_mp
sklearn.linear_model.orthogonal_mp_gram
sklearn.manifold
sklearn.metrics
(kecuali sklearn.metrics.confusion_matrix
, sklearn.metrics.roc_auc_score
, sklearn.metrics.max_error
sklearn.metrics.mean_poisson_deviance
, sklearn.metrics.mean_gamma_deviance
, sklearn.metrics.mean_tweedie_deviance
, sklearn.metrics.plot_confusion_matrix
, sklearn.metrics.plot_precision_recall_curve
)sklearn.mixture
sklearn.model_selection.GridSearchCV
sklearn.model_selection.ParameterGrid
sklearn.model_selection.ParameterSampler
sklearn.model_selection.RandomizedSearchCV
sklearn.model_selection.fit_grid_point
sklearn.multiclass
sklearn.multioutput
sklearn.neural_network
sklearn.preprocessing
sklearn.random_projection
sklearn.tree.export_graphviz
sklearn.tree.export_text
sklearn.tree.plot_tree
sklearn.utils
Semoga saya tidak melewatkan apa pun.
Hai. Saya akan mencoba membuat pass di dokumentasi feature_selection
Kami mengambil bagian sklearn.mixture
Mengambil bagian cross_decomposition
Untuk Scikit-Learn Sprint 2020, @icoder18 dan saya mengambil bagian sklearn.random_projection
@adrinjalali kami menyelesaikan sklearn/campuran
Bekerja pada sklearn.linear_model untuk sprint dengan @genvalen
Ambil sklearn.calibration.CalibratedClassifierCV
Bekerja pada ini untuk sklearn.utils.validation
Selanjutnya kita akan menangani sklearn.utils.random
bekerja di sklearn.impute
Bekerja di sklearn.tree.plot_tree
Tabel 14 akan mengambil sklearn.neural_network
Ambil sklearn.kernel_approximation
Mengambil sklearn.inspection
Tabel 14 akan mengambil sklearn.preprocessing
Mengambil kumpulan data
Mengambil sklearn.mixture #17509
Daftar diperbarui.
Terima kasih semua!
Mengambil sklearn.metrics untuk sprint
Mengambil modul model_selection
@glemaitre Bisakah kami memperbarui deskripsi ini untuk memasukkan yang terbaik adalah mengirimkan satu file pada satu waktu?
Halo saya ingin berkontribusi. Ini adalah pertama kalinya bagi saya ... Dan tidak jelas bagi saya bagaimana saya bisa tahu di modul mana masih ada pekerjaan yang harus dilakukan? Terima kasih !
https://github.com/scikit-learn/scikit-learn/issues/15761#issuecomment -639461778 berisi daftar modul yang harus diperbaiki.
Terima kasih. Ambil sklearn.decomposition kemudian.
Saya sedang mengerjakan 'sklearn.isotonic.isotonic_regression'
Saya sedang mengerjakan 'sklearn.multiclass.py'
Hai, bolehkah saya mencoba mengambil sisa sklearn.tree
? Ini akan menjadi pertama kalinya saya berkontribusi juga.
Terima kasih telah check-in, senang mendapat bantuan Anda! Silakan lanjutkan; Saya pikir semua pembaruan sprint kami telah ditutup.
Pada 4 Juli 2020, pukul 10:45, Ivan Wiryadi [email protected] menulis:
Hai, bolehkah saya mencoba mengambil sisanya di sklearn.tree? Ini akan menjadi pertama kalinya saya berkontribusi juga.—
Anda menerima ini karena Anda berkomentar.
Balas email ini secara langsung, lihat di GitHub, atau berhenti berlangganan.
Hai, saya ingin memberikan kontribusi pertama saya. Bisakah saya mengambil sklearn.multioutput?
Saya akan melanjutkan dengan sklearn.utils, dimulai dengan _encode.py
Saya sedang mengerjakan sklearn/decomposition/_dict_learning.py
Saya sedang mengerjakan sklearn.kernel_ridge
di sprint
Hai, saya akan mulai mengerjakan sklearn.feature_extraction.image.img_to_graph
Saya sedang mengerjakan sklearn.feature_extraction.text.CountVectorizer
Saya sedang mengerjakan sklearn.sklearn.kernel_ridge
Saya sedang mengerjakan sklearn.ensemble.HistGradientBoostingRegressor
"Aku sedang mengerjakan ini"
hal ini? @Hoda1394
"Aku sedang mengerjakan ini"
hal ini? @Hoda1394
@TahiriNadia dikoreksi.
@cgsavard Hei, Bisakah saya mengerjakan ini? Saya pemula
Saya akan mengerjakan file di sklearn.datasets
.
Bisakah saya bekerja di sklearn.linear_model._least_angle.py
@glemaitre Saya sedang mengerjakan sklearn.linear_model._least_angle.py
dan saya menemukan ketidakkonsistenan penggunaan method ='lar'
kadang-kadang menunjukkan lars
kadang-kadang lar
, ketidakkonsistenan ini juga dalam kode (tidak hanya dalam dokumentasi), saya dapat melihat bahwa lars
adalah yang benar, dapatkah Anda mengkonfirmasinya, dan saya akan membuat PR.
mengerjakan 'sklearn/ensemble/_hist_gradient_boosting/binning.py'
file perlu diubah:
sklearn/_config.py
sklearn/dummy.py
sklearn/multioutput.py
sklearn/linear_model/_huber.py
sklearn/linear_model/_theil_sen.py
sklearn/linear_model/_ridge.py
sklearn/linear_model/_omp.py
sklearn/linear_model/_sag.py
sklearn/externals/_lobpcg.py
sklearn/externals/_lobpcg.py
sklearn/utils/extmath.py
sklearn/utils/__init__.py
sklearn/utils/graph.py
sklearn/utils/_mocking.py
sklearn/utils/sparsefuncs.py
sklearn/neighbors/_base.py
sklearn/gaussian_process/_gpc.py
sklearn/gaussian_process/kernels.py
sklearn/model_selection/_validation.py
~sklearn/decomposition/_fastica.py~
~sklearn/decomposition/_dict_learning.py~
~sklearn/decomposition/_factor_analysis.py~
~sklearn/decomposition/_incremental_pca.py~
~sklearn/decomposition/_lda.py~
~sklearn/decomposition/_pca.py~
~sklearn/decomposition/_truncated_svd.py~
~sklearn/decomposition/_sparse_pca.py~
~sklearn/decomposition/_nmf.py~
sklearn/manifold/_mds.py
sklearn/manifold/_spectral_embedding.py
sklearn/manifold/_t_sne.py
sklearn/ensemble/_hist_gradient_boosting/grower.py
sklearn/ensemble/_hist_gradient_boosting/binning.py
sklearn/metrics/_ranking.py
sklearn/tree/_classes.py
sklearn/preprocessing/_discretization.py
sklearn/preprocessing/_encoders.py baris 620
sklearn/neural_network/_multilayer_perceptron.py baris 1054
sklearn/covariance/_robust_covariance.py
Silakan periksa apakah seseorang sudah mengerjakan/mengerjakan file yang Anda pilih
@sadakmed , untuk semua "file dekomposisi", ada permintaan tarik #17739.
mengerjakan "gaussian_process.GaussianProcessRegressor"
dan "neighbors._base.py"
Hai, saya baru, dan saya ingin mulai berkontribusi. Apakah Anda masih memerlukan bantuan untuk masalah ini? apakah ada file yang masih perlu bantuan?
Hai @boricles!
Lihat https://github.com/scikit-learn/scikit-learn/issues/15761#issuecomment -639461778 untuk daftar modul yang masih harus diperbaiki.
@alfaro96 terima kasih. Aku baru saja melihat sekilas. Saya akan memilih modul malam ini, dan mengerjakannya.
Saya sedang mengerjakan sklearn/config_context
Hei, kupikir aku akan melihat apakah aku bisa membantu dengan dokumen.
@alfaro96 Saya ingin mengerjakan sklearn.feature_extraction.text.CountVectorizer
, jika belum diambil, terutama karena saya pribadi pernah mengalami beberapa jebakan ketika bekerja dengan Vectorizers di masa lalu.
Juga, saya perhatikan bahwa meskipun sklearn.model_selection.learning_curve
telah diperbarui, ada tutorial yang kedaluwarsa menggunakan dokumentasi lama , haruskah saya membiarkannya? Atau apakah itu layak diperbarui?
Hai @alfaro96 ,
setelah diedit:
Saya melihat sklearn.config_context
dan sklearn.set_config
dari sklearn.config_config.py
telah diperbaiki sehingga dapat diperiksa dari daftar tugas .
Saya ingin bekerja pada sklearn.utils
. Saya hanya melihat sekali contoh dokumentasi parameter di mana 'opsional' digunakan. Itu berarti saya hanya perlu memperbaiki contoh itu, benar? Itu ada di sklearn.utils._mocking.py
Hei, kupikir aku akan melihat apakah aku bisa membantu dengan dokumen.
Hai @madprogramer ,
@alfaro96 Saya ingin mengerjakan
sklearn.feature_extraction.text.CountVectorizer
, jika belum diambil, terutama karena saya pribadi pernah mengalami beberapa jebakan ketika bekerja dengan Vectorizers di masa lalu.
~Saya telah melihat daftar periksa dan referensi sklearn.feature_extraction.text.CountVectorizer
dan sepertinya tidak diperbaiki. PR akan diterima.~
Sunting: sklearn.feature_extraction.text.CountVectorizer
sudah diperbaiki.
Juga, saya perhatikan bahwa meskipun
sklearn.model_selection.learning_curve
telah diperbarui, ada tutorial yang kedaluwarsa menggunakan dokumentasi lama , haruskah saya membiarkannya? Atau apakah itu layak diperbarui?
Perlu diperbarui, meskipun ini harus dilakukan dalam PR terpisah.
Terima kasih!
Hai @alfaro96 ,
Hai @haiatn ,
setelah diedit:
Saya melihatsklearn.config_context
dansklearn.set_config
darisklearn.config_config.py
telah diperbaiki sehingga dapat diperiksa dari daftar tugas .
Saya telah memperbarui daftar periksa .
Saya ingin bekerja pada
sklearn.utils
. Saya hanya melihat sekali contoh dokumentasi parameter di mana 'opsional' digunakan. Itu berarti saya hanya perlu memperbaiki contoh itu, benar? Itu ada disklearn.utils._mocking.py
Itulah idenya, meskipun kelas dalam file sklearn.utils._mocking.py
bukan bagian dari API publik, jadi menurut saya tidak layak untuk memperbaruinya.
Namun demikian, alangkah baiknya jika Anda dapat bekerja di salah satu fungsi, kelas, dan modul lain yang menunggu untuk diperbaiki.
Terima kasih!
Saya melihat daftar periksa. Dari apa yang saya lihat berikut ini dapat diperiksa dari daftar periksa:
sklearn.feature_extraction.image.img_to_graph
sklearn.isotonic.IsotonicRegression
sklearn.isotonic.check_increasing
sklearn.ensemble.HistGradientBoostingRegressor
tapi semua sklearn.ensemble
OKBisakah saya bekerja pada sklearn.manifold._spectral_embedding
dan sklearn.feature_extraction.text.HashVectorizer
? Saya akan melakukannya di PR terpisah. Saya pikir mereka adalah satu-satunya file yang tersisa yang perlu diperbaiki (dengan asumsi sklearn.feature_extraction.text.CountVectorizer
diambil).
Saya melihat daftar periksa. Dari apa yang saya lihat berikut ini dapat diperiksa dari daftar periksa:
sklearn.feature_extraction.image.img_to_graph
sklearn.isotonic.IsotonicRegression
sklearn.isotonic.check_increasing
Terima kasih @haiatn , saya telah memperbarui daftar periksa.
- Saya tidak menemukan file
sklearn.ensemble.HistGradientBoostingRegressor
tapi semuasklearn.ensemble
OK
sklearn.ensemble.HistGradientBoostingClassifier
dan sklearn.ensemble.HistGradientBoostingRegressor
ada di file ini: scikit-learn/sklearn/ensemble/_hist_gradient_boosting/gradient_boosting.py
. Namun, mereka sudah diperbaiki.
Bisakah saya bekerja pada
sklearn.manifold._spectral_embedding
dansklearn.feature_extraction.text.HashVectorizer
? Saya akan melakukannya di PR terpisah. Saya pikir mereka adalah satu-satunya file yang tersisa yang perlu diperbaiki (dengan asumsisklearn.feature_extraction.text.CountVectorizer
diambil).
Saya telah melihat modul sklearn.manifold
dan sklearn.feature_extraction.text.HashingVectorizer
dan mereka telah diperbaiki (saya telah memperbarui daftar periksa yang sesuai).
Namun demikian, ada beberapa fungsi dalam modul sklearn.utils
yang harus tetap diperbaiki.
Terima kasih @haiatn , kami sangat menghargai bantuan Anda!
Sekarang saya akan mengerjakan sklearn.utils._estimator_html_repr
, sklearn.utils.deprecation
dan sklearn.utils._testing
Saya akan menyelesaikan sklearn.utils. Hanya ada 3 file yang saya temukan yang perlu diperbaiki.
hai @alfaro96 ,
bisakah Anda meninjau permintaan tarik terbuka saya? Saya pikir mereka adalah yang terakhir.
Hai @haiatn!
Saya sudah melihat PR terbuka Anda.
Terima kasih!
Sekarang setelah kita menggabungkan apa yang tersisa dari sklearn.utils dan itu adalah yang terakhir di daftar periksa , apakah kita sudah selesai?
Ada satu permintaan tarik terbuka terakhir #18025, maka masalah ini akhirnya bisa ditutup.
Halo,
Saya ingin mulai berkontribusi. Apakah ada kelas yang tertunda untuk memperbaiki dokumen nilai default? Jika ada maka saya bisa mengambilnya.
Hai, baru di open source, saya menantikan untuk memperbaiki doc jika ada kemungkinan ada sesuatu yang tersisa yang perlu diperbaiki
Komentar yang paling membantu
Berbicara secara logis, jika param adalah opsional, bukankah seharusnya defaultnya selalu
None
? Memiliki parameter dengan nilai default selainNone
menyarankan itu harus diperlukan.Jika ada default, ini biasanya berarti bahwa literatur telah menemukan ini sebagai nilai default yang masuk akal yang juga menunjukkan bahwa parameter ini berdampak pada kinerja dan karenanya tidak boleh opsional, tetapi harus menyebutkan apa defaultnya. Itu tampaknya lebih dekat dengan parameter yang diperlukan menurut definisi, kami kebetulan membuat pilihan yang masuk akal bagi pengguna sehingga mereka dapat mengubahnya atau tidak.
Atau lebih praktisnya, apakah saat ini ada parameter opsional yang kami temukan yang memiliki nilai default numerik, tetapi menentukan
None
akan menimbulkan pengecualian? Itu juga menunjukkan bahwa parameter sebenarnya diperlukan, tetapi default yang masuk akal telah dipilih berdasarkan literatur/penelitian.Atau mungkin saya selama ini membingungkan arti dari
required
danoptional
? Tertawa terbahak-bahak. Pasti akan senang membantu dalam hal ini!