Scikit-learn: إصلاح وثائق القيم الافتراضية في جميع الفئات

تم إنشاؤها على ٢ ديسمبر ٢٠١٩ · 118تعليقات · مصدر: scikit-learn/scikit-learn

وصف

توثيق القيم الافتراضية في العديد من الفئات إما غير مدرج ، أو غير متسق في كيفية كتابته ، أو قديم. أرغب في جمع عدد قليل من الأشخاص للعمل على توثيق القيمة الافتراضية لكل فصل حيث يوجد عدد كبير من الفصول التي توجد بها هذه المشكلات. لقد تم إخباري أنه يجب توثيق القيم الافتراضية على أنها "افتراضي = <'value'>" ولذا فإنني أقوم بإنشاء هذه المشكلة وفقًا لهذا الافتراض.

المحلول

فيما يلي بعض الأشياء التي رأيتها بالنسبة للمعلمات التي يجب تغييرها:

لا يوجد ذكر لما إذا كان هناك تقصير يجب التحقق منه مقابل الكود لأن بعض المعلمات تفتقد إلى هذا تمامًا
يجب تغيير "اختياري" إلى "افتراضي = <'القيمة'>"
تأكد من أن كيفية توثيق القيم الافتراضية متسقة داخل الفصل ، أي تغيير كل شيء إلى التنسيق "افتراضي = <'value'>"
تعديل ملف واحد لكل PR

إذا كان هناك عدد قليل من الأشخاص يعملون في فصول قليلة لكل منهم ، فيجب القيام بذلك في أي وقت من الأوقات! يجب أن تكون كل هذه إصلاحات بسيطة إلى حد ما.

#### أمثلة
https://scikit-learn.org/stable/modules/generated/sklearn.cluster.AgglomerativeClustering.html
الرابط أعلاه هو مثال حيث لا يتم الإشارة إلى القيم الافتراضية ولكن المعلمات تقول "اختيارية" ، وحيث يتم توثيق جميع القيم الافتراضية المشار إليها بشكل غير متسق.

Sprint good first issue

مصدر

cgsavard

👍5

التعليق الأكثر فائدة

من الناحية المنطقية ، إذا كانت المعلمة اختيارية ، ألا يجب أن تكون القيمة الافتراضية هي None دائمًا؟ يقترح وجود معلمة ذات قيمة افتراضية بخلاف None أنها يجب أن تكون مطلوبة.

إذا كان هناك قيمة افتراضية ، فهذا يعني عادةً أن الأدبيات قد وجدت أن هذه قيمة افتراضية معقولة والتي تشير أيضًا إلى أن هذه المعلمة لها تأثير على الأداء وبالتالي لا ينبغي أن تكون اختيارية ، ولكن يجب أن تذكر فقط ما هو الافتراضي. تلك تبدو أقرب إلى المعلمات المطلوبة بحكم التعريف ، لقد صادفنا للتو اتخاذ خيار معقول للمستخدم حتى يتمكن من تغييره أو لا.

أو من الناحية العملية ، هل هناك حاليًا أي معلمات اختيارية وجدناها تحتوي على قيم افتراضية رقمية ، ولكن تحديد None سيؤدي إلى استثناء؟ قد يشير ذلك أيضًا إلى أن المعلمة مطلوبة بالفعل ، ولكن تم اختيار قيمة افتراضية معقولة بناءً على الأدبيات / الأبحاث.

أو ربما كنت أخلط بين معنى required و optional كل هذه السنوات؟ مضحك جدا. بالتأكيد أحب المساعدة في هذا في كلتا الحالتين!

jmwoloso في ٦ ديسمبر ٢٠١٩

👍4

ال 118 كومينتر

مرحبًا cgsavard ، أود العمل على هذا. هل يمكنني البدء في النظر إلى فئة AgglomerativeClustering؟

vachanda في ٣ ديسمبر ٢٠١٩

vachanda اذهب لذلك! يمكننا الاستمرار في نشر ما نعمل عليه حتى يعرفه الآخرون.

cgsavard في ٣ ديسمبر ٢٠١٩

شكرا لتنسيق هذا cgsavard

ملاحظة للمساهمين: يرجى اتباع الإرشادات الواردة أدناه: https://scikit-learn.org/stable/developers/contributing.html#guidelines -for-write-documents

adrinjalali في ٣ ديسمبر ٢٠١٩

cgsavard ، هل هناك قائمة بالفئات التي بها اختلافات أو هل يتعين علينا

vachanda في ٤ ديسمبر ٢٠١٩

vachanda ليس لدي قائمة ، للأسف. لقد كنت أتصفح الملفات للتو وأرى ما يجب تحديثه.

cgsavard في ٤ ديسمبر ٢٠١٩

أنا أعمل على AffinityPropagation و SpectralCoclustering و SpectralBiclustering و Birch.

cgsavard في ٤ ديسمبر ٢٠١٩

أنا أعمل على FeatureAgglomeration و KMeans و MiniBatchKMeans.

vachanda في ٦ ديسمبر ٢٠١٩

jmwoloso في ٦ ديسمبر ٢٠١٩

👍4

jmwoloso لقد كنا حقًا غير optional ولذلك قررنا مؤخرًا إزالته.

glemaitre في ٦ ديسمبر ٢٠١٩

🚀1

أريد أن أساهم كذلك. هل يمكنني المضي قدما في هذا

cyrus303 في ٦ ديسمبر ٢٠١٩

glemaitre طيب ، هذا منطقي بالتأكيد. سنقوم بإزالة الملف النصي optional معًا ، أليس كذلك ، مع الإشارة أيضًا إلى القيم الافتراضية في سلاسل المستندات؟

هل ينبغي فتح كل من هذه الأمور التي وجدناها كمسألة منفصلة أم كيف نبدأ كل هذا العمل الذي نقوم به نظرًا لأن العديد من الأشخاص يعملون على أشياء متعددة تتعلق بهذه المشكلة الفردية؟

jmwoloso في ٦ ديسمبر ٢٠١٩

@ cyrus303jmwoloso يمكنك الحصول على فصل دراسي (وحدة كحد أقصى) وتصحيحه. الفكرة هي إزالة الخيار الاختياري وإضافة افتراضي عندما يكون هناك واحد (عادة ما يكون هناك واحد). نظرًا لأننا نلمس الوثائق ، يجب أن نتأكد من أن النمط الموجود على الخط يتبع دليل الأسلوب الجديد الخاص بنا: https://scikit-learn.org/dev/developers/contributing.html#guidelines -for-write-documents

يمكنك ذكر أي فئة / وحدة تعمل بها ، افتح رابط العلاقات العامة لتجنب تكرار الجهد :). نتطلع إلى مراجعتها.

glemaitre في ٦ ديسمبر ٢٠١٩

👍1

مهلا! سأعمل على دروس tree ( tree.DecisionTreeClassifier ، tree.DecisionTreeRegressor ، tree.ExtraTreeClassifier و tree.ExtraTreeRegressor ).

alfaro96 في ١١ ديسمبر ٢٠١٩

سأقوم أيضًا بإصلاح هذه المشكلة للوحدة neighbors .

alfaro96 في ١٧ ديسمبر ٢٠١٩

سآخذ الوحدة النمطية ensemble .

jmwoloso في ٢١ ديسمبر ٢٠١٩

glemaitre أي تفضيل على bool مقابل boolean ؟ رؤية مزيج من الاثنين في ensemble ، حتى في نفس الفصل. قد تحصل أيضًا على شكلها أثناء قيامي بالتخلف عن السداد.

تعديل:

نفس الشيء مقابل int مقابل integer . أفترض int على ذلك ، لكنني أردت التأكيد.

تحرير (مرة أخرى):

مشاهدة أيضًا مستندات ذات قيم غير متناسقة بالنسبة للتوقيع __init__ لتلك الفئة ، على سبيل المثال:

min_impurity_split مقابل RandomForestClassifier

التوقيع __init__ يحتوي على min_impurity_split=None بينما تقول سلاسل المستندات الخاصة به min_impurity_split : float, (default=0) . أفترض تحديث السلاسل لتطابق التوقيع لأننا نرغب في الحفاظ على سلوك الفئة متسقًا (أي أننا نريد تمرير نفس الإعدادات الافتراضية عند إنشاء مثيل)؟

jmwoloso في ٢١ ديسمبر ٢٠١٩

jmwoloso هل يمكنك الرجوع إلى https://scikit-learn.org/stable/developers/contributing.html#guidelines -for-write -documents. بشكل أساسي ، يجب أن يكون اسم نوع Python افتراضيًا (bool ، str ، int ، float)

التوقيع __init__ يحتوي على min_impurity_split = لا شيء بينما تشير الوثائق الخاصة به إلى min_impurity_split: float ، (افتراضي = 0). أفترض تحديث السلاسل لتطابق التوقيع لأننا نرغب في الحفاظ على سلوك الفئة متسقًا (أي أننا نريد تمرير نفس الإعدادات الافتراضية عند إنشاء مثيل)؟

يجب أن نطابق المعلمة في توقيع الوظيفة. تم تغيير معلمة القيمة الافتراضية هذه ولم يتم تحديث سلسلة docstring.

glemaitre في ٢١ ديسمبر ٢٠١٩

👍2

مرحبًا cgsavard ، أود المساهمة ولكن هذه ستكون المرة الأولى لي لذا أحتاج إلى بعض الإمساك باليد. أنا على دراية تامة ببايثون ، وهو سهل الاستخدام إلى حد ما مع محرري النصوص ، وقد مررت مؤخرًا بالشوكة -> استنساخ -> تحرير -> دروس سير عمل العلاقات العامة هنا . يرجى تقديم المشورة الخطوة التالية ... شكرا لك!

mghah في ٢٢ ديسمبر ٢٠١٩

مرحبًا cgsavard ،
هل يمكنني من فضلك العمل على Imputer؟

pulkitmehtawork في ٢٢ ديسمبر ٢٠١٩

مرحبًا cgsavard ، أريد العمل في فئة linear_model .

ankishb في ٢٢ ديسمبر ٢٠١٩

أعمل أيضًا على دروس Neural Network و Decomposition و Feature Extraction و Metrics و Preprocess .

ankishb في ٢٢ ديسمبر ٢٠١٩

هل يمكن لأحدهم التحقق من رقم PR # 15964 الخاص بي ومعرفة سبب فشل كود cov. هذه هي المرة الأولى لي للمساهمة. الرجاء التوجيه.

pulkitmehtawork في ٢٤ ديسمبر ٢٠١٩

تجاهل برنامج الترميز. هذه نتيجة إيجابية خاطئة لأننا لا نلمس الكود. سأراجع قريبا العلاقات العامة

تم الإرسال من هاتفي - آسف لكوني مختصرة وربما يكون هناك خطأ إملائي.

glemaitre في ٢٤ ديسمبر ٢٠١٩

👍2

لقد قدمت للتو مساهمتي الأولى # 15988

mghah في ٣٠ ديسمبر ٢٠١٩

سآخذ الوحدة النمطية naive_bayes .

tamirlan1 في ٣ يناير ٢٠٢٠

لقد قدمت للتو مساهمتي الأولى # 16019

tamirlan1 في ٣ يناير ٢٠٢٠

مرحبًا بالجميع ، أعمل على sklearn/neighbors ، شكرًا لك.

mghah في ٤ يناير ٢٠٢٠

ساهم في sklearn / sem_upervised. شكرا

shubchat في ٧ يناير ٢٠٢٠

مرحبًا cgsavard ، أود المساهمة أيضًا ، sklearn/svm . شكرا

tituschristian في ٨ يناير ٢٠٢٠

ساهم في sklearn / sem_upervised. شكرا
هل يلزم إجراء بعض التعديلات الإضافية على PR # 16042

shubchat في ٩ يناير ٢٠٢٠

glemaitre في #

كما حاولت استخدام طريقة أقل غموضًا وموجزة وصارمة من الناحية الحسابية لتحديد نطاقات من المعلمات. على سبيل المثال ، قمت بتغيير positive float إلى float in (0, inf] أو 0<= shrinkage <=1 إلى float in (0, 1) . قصة قصيرة طويلة ، لقد بذلت قصارى جهدي لأكون موجزًا ودقيقًا ، لكن من فضلك أعط مزيدًا من الاهتمام بمراجعة هذا العلاقات العامة بنسبة 5٪. شكرا.

mghah في ١١ يناير ٢٠٢٠

cgsavard ، هذه مشكلة لطيفة جدًا لسباق هنا .
هل تمانع في ربط الجوهر في وصف المشكلة؟ هذا سيجعل المعلومات متاحة من البداية. هل لي أن أطلب منك أيضًا أن توضح في الوصف أن كل ممثل عام يجب أن يتناول ملفًا واحدًا (وحدة واحدة كحد أقصى) في كل مرة كما هو موضح هنا ؟ هذا سوف يساعد حقا المساهمين والمراجعين! شكرا جزيلا!

cmarmo في ١٦ يناير ٢٠٢٠

للراغبين في هذه المسألة ، الأمر

git grep "optional.*default"

سيتم إخراج الملفات التي ما زالت تتأثر بهذه المشكلة (شكرًاogrisel! :)).

cmarmo في ١٦ يناير ٢٠٢٠

🎉1

cgsavard مرحبًا ، أود العمل على WiMLDS model_selection @

marielledado في ٢٥ يناير ٢٠٢٠

lopusz وأريد العمل على random_project.py

استمتع للجميع!

adrinjalalinoatamirWiMLDS

magda-zielinska في ٢٥ يناير ٢٠٢٠

@ ETay203 وأود العمل على mean_shift WiMLDS_Berlin sprint.

mjmolina في ٢٥ يناير ٢٠٢٠

@ magda-zielinska وأنا أريد العمل على خط الأنابيب

adrinjalalinoatamirWiMLDS

lopusz في ٢٥ يناير ٢٠٢٠

lopusz و @ magda-zielinska وأريد العمل على kernel_approximation.py

fraboeni في ٢٥ يناير ٢٠٢٠

سأقوم بمعالجة _optics.py الآن

ETay203 في ٢٥ يناير ٢٠٢٠

إعادة الفتح: تم إغلاقه بواسطة الكلمة الأساسية "Fixes" في # 16216.

cmarmo في ٢٦ يناير ٢٠٢٠

إعادة الفتح: تم إغلاقه بواسطة الكلمة الأساسية "Fixes" في # 16207

cmarmo في ٢٧ يناير ٢٠٢٠

سأقوم بمعالجة sklearn / linear_model / _coordinate_descent.py الآن

hs-nazuna في ٢٩ يناير ٢٠٢٠

قمت بتنظيف base.py وقدمت العلاقات العامة

lopusz في ٢٩ يناير ٢٠٢٠

لقد نظّفتُ التمييزِ المميز وأرسلتُ وثيقة العلاقات العامة

lopusz في ٣٠ يناير ٢٠٢٠

سوف ألقي نظرة الآن على sklearn / gaussian_process / *. py

lopusz في ٢ فبراير ٢٠٢٠

هناك بالفعل علاقات عامة طويلة لـ

adrinjalali في ٢ فبراير ٢٠٢٠

lopusz اعتذاري ، أن العلاقات العامة كانت تلامس مشكلات أخرى في وحدة GP ، يمكنك المضي قدمًا والعمل عليها إذا كنت لا تمانع :)

adrinjalali في ٣ فبراير ٢٠٢٠

adrinjalali شكرًا لك على

في الواقع ، لم أقم بمسح العلاقات العامة المفتوحة جيدًا بما يكفي ، لذا فإن حقيقة عدم أخذ الممارسين العامين هي أكثر من مجرد حادث ؛)

سأحرص على تتبع ما هو PRed.

ونعم قادم العلاقات العامة للأطباء الممارسين ؛)

lopusz في ٥ فبراير ٢٠٢٠

هل هناك أي شيء آخر يجب القيام به هنا؟

andrewasche في ١٩ أبريل ٢٠٢٠

أعمل على sklearn/decomposition/_dict_learning.py

reshamas في ٢٨ مايو ٢٠٢٠

ما تبقى القيام به؟ أنا منفتح على المساعدة. . .

andrewasche في ٣١ مايو ٢٠٢٠

ربما يكون اكتشاف ما تبقى هو مكان جيد لبدء المساعدة :)

adrinjalali في ٥ يونيو ٢٠٢٠

مرحبًا ، لقد كنت أبحث عن ما تبقى ، وأعتقد أنه لا تزال هناك بعض التحديثات التي يجب إجراؤها في بعض الوحدات التي تم فحصها مسبقًا.
كنت سأعمل من خلال هذه ، بدءًا من وحدة الكتلة ويمكن أن أرفع العلاقات العامة لكل وحدة أثناء تقدمي؟
هذه هي مساهمتي الأولى ، لذا يرجى إعلامي إذا كنت لا أتابع العملية بشكل صحيح وما إلى ذلك.
شكرا!

pgithubs في ٥ يونيو ٢٠٢٠

هذه قائمة الوظائف والفئات والوحدات المتبقية لإصلاحها:

[x] sklearn.feature_selection.SelectorMixin
[x] sklearn.config_context
[x] sklearn.set_config
[x] sklearn.calibration.CalibratedClassifierCV
[x] sklearn.cluster.OPTICS
[x] sklearn.cluster.SpectralClustering
[x] sklearn.cluster.affinity_propagation
[x] sklearn.cluster.cluster_optics_dbscan
[x] sklearn.cluster.cluster_optics_xi
[x] sklearn.cluster.compute_optics_graph
[x] sklearn.cluster.mean_shift
[x] sklearn.cluster.spectral_clustering
[x] sklearn.cluster.ward_tree
[x] sklearn.cross_decomposition.CCA
[x] sklearn.cross_decomposition.PLSCanonical
[x] sklearn.cross_decomposition.PLSRegression
[x] sklearn.cross_decomposition.PLSSVD
[x] sklearn.datasets
[x] sklearn.decomposition
[x] sklearn.dummy
[x] sklearn.ensemble.HistGradientBoostingRegressor (تجريبي)
[x] sklearn.ensemble.HistGradientBoostingRegressor (تجريبي)
[x] sklearn.feature_extraction.image.grid_to_graph
[x] sklearn.feature_extraction.image.img_to_graph
[x] sklearn.feature_extraction.text.CountVectorizer
[x] sklearn.feature_extraction.text.HashVectorizer
[x] sklearn.feature_selection
[x] sklearn.impute
[x] sklearn.inspection.partial_dependence
[x] sklearn.inspection.permutation_importance
[x] sklearn.inspection.permutation_importance
[x] sklearn.inspection.PartialDependenceDisplay
[x] sklearn.inspection.plot_partial_dependence
[x] sklearn.isotonic.IsotonicRegression
[x] sklearn.isotonic.check_increasing
[x] sklearn.isotonic.isotonic_regression
[x] sklearn.kernel_approximation
[x] sklearn.kernel_ridge
[x] sklearn.linear_model.PassiveAggressiveClassifier
[x] sklearn.linear_model.LassoLars
[x] sklearn.linear_model.OrthogonalMatchingPursuit
[x] sklearn.linear_model.HuberRegressor
[x] sklearn.linear_model.RANSACRegressor
[x] sklearn.linear_model.TheilSenRegressor
[x] sklearn.linear_model.PassiveAggressiveRegressor
[x] sklearn.linear_model.orthogonal_mp
[x] sklearn.linear_model.orthogonal_mp_gram
[x] sklearn.manifold
[x] sklearn.metrics (باستثناء sklearn.metrics.confusion_matrix ، sklearn.metrics.roc_auc_score ، sklearn.metrics.max_error sklearn.metrics.mean_poisson_deviance ، sklearn.metrics.mean_gamma_deviance ، sklearn.metrics.mean_tweedie_deviance ، sklearn.metrics.plot_confusion_matrix ، sklearn.metrics.plot_precision_recall_curve )
[x] sklearn.mixture
[x] sklearn.model_selection.GridSearchCV
[x] sklearn.model_selection.ParameterGrid
[x] sklearn.model_selection.ParameterSampler
[x] sklearn.model_selection.RandomizedSearchCV
[x] sklearn.model_selection.fit_grid_point
[x] sklearn.multiclass
[x] sklearn.multioutput
[x] sklearn.neural_network
[x] sklearn.preprocessing
[x] sklearn.random_projection
[x] sklearn.tree.export_graphviz
[x] sklearn.tree.export_text
[x] sklearn.tree.plot_tree
[x] sklearn.utils

أتمنى ألا يفوتني أي شيء.

alfaro96 في ٥ يونيو ٢٠٢٠

مرحبا. سأذهب وأحاول القيام بتمرير في وثائق feature_selection

kohakukun في ٦ يونيو ٢٠٢٠

نأخذ جزء sklearn.mixture

violetr في ٦ يونيو ٢٠٢٠

أخذ جزء التحلل المتقاطع

kohakukun في ٦ يونيو ٢٠٢٠

بالنسبة لـ 2020 Scikit-Learn Sprint ، أنا و @ icoder18 نأخذ جزء sklearn.random_project

mobigelow في ٦ يونيو ٢٠٢٠

adrinjalali أكملنا sklearn / mix

violetr في ٦ يونيو ٢٠٢٠

العمل على sklearn.linear_model للسباق مع genvalen @

parthsuresh في ٦ يونيو ٢٠٢٠

خذ sklearn.calibration.CalibratedClassifierCV

asubramaniyan في ٦ يونيو ٢٠٢٠

العمل على هذا من أجل sklearn.utils.validation

neinkeinkaffee في ٦ يونيو ٢٠٢٠

بعد ذلك سنتعامل مع sklearn.utils.random

neinkeinkaffee في ٦ يونيو ٢٠٢٠

العمل على sklearn.impute

mobigelow في ٦ يونيو ٢٠٢٠

العمل على sklearn.tree.plot_tree

madelgi في ٦ يونيو ٢٠٢٠

الجدول 14 سيتناول sklearn.neural_network

amy12xx في ٦ يونيو ٢٠٢٠

خذ sklearn.kernel_approximation

asubramaniyan في ٦ يونيو ٢٠٢٠

أخذ sklearn.inspection

icoder18 في ٦ يونيو ٢٠٢٠

سيتطلب الجدول 14 معالجة sklearn.preprocessing

amy12xx في ٦ يونيو ٢٠٢٠

أخذ مجموعات البيانات

mobigelow في ٦ يونيو ٢٠٢٠

أخذ sklearn.mixture # 17509

amy12xx في ٦ يونيو ٢٠٢٠

تم تحديث القائمة.

شكرا لكم جميعا!

alfaro96 في ٦ يونيو ٢٠٢٠

أخذ sklearn.metrics للعدو

genvalen في ٧ يونيو ٢٠٢٠

أخذ نموذج_الاختيار الوحدة النمطية

kohakukun في ٧ يونيو ٢٠٢٠

glemaitre هل يمكننا تحديث وصف هذا ليشمل أنه من الأفضل إرسال ملف واحد في كل مرة؟

reshamas في ٩ يونيو ٢٠٢٠

مرحبا اود المساهمة. هذه هي المرة الأولى لي رغم ذلك ... وليس من الواضح بالنسبة لي كيف يمكنني معرفة الوحدة التي لا يزال هناك عمل يتعين القيام به؟ شكرا !

clmbst في ١٩ يونيو ٢٠٢٠

https://github.com/scikit-learn/scikit-learn/issues/15761#issuecomment -639461778 يحتوي على قائمة الوحدات المتبقية لإصلاحها.

alfaro96 في ١٩ يونيو ٢٠٢٠

شكرا. خذ sklearn.decomposition إذن.

clmbst في ١٩ يونيو ٢٠٢٠

أنا أعمل على "sklearn.isotonic.isotonic_regression"

Cristinamulas في ٢٠ يونيو ٢٠٢٠

أنا أعمل على "sklearn.multiclass.py"

Cristinamulas في ٢٠ يونيو ٢٠٢٠

مرحبًا ، هل يمكنني محاولة أخذ المتبقي على sklearn.tree ؟ ستكون هذه أول مرة أساهم فيها أيضًا.

m-vd في ٤ يوليو ٢٠٢٠

شكرا لتسجيل الوصول ، من الرائع الحصول على مساعدتك! الرجاء المتابعة؛ أعتقد أنه تم إغلاق جميع تحديثات العدو السريع.

في 4 تموز (يوليو) 2020 ، الساعة 10:45 ، كتب Ivan Wiryadi [email protected] :

مرحبًا ، هل يمكنني محاولة أخذ المتبقي على sklearn.tree؟ ستكون هذه أول مرة أساهم فيها أيضًا.
-
أنت تتلقى هذا لأنك علقت.
قم بالرد على هذه الرسالة الإلكترونية مباشرةً ، أو اعرضها على GitHub ، أو قم بإلغاء الاشتراك.

mobigelow في ٤ يوليو ٢٠٢٠

مرحباً ، أود أن أقدم مساهمتي الأولى. هل يمكنني أخذ sklearn.multioutput؟

franslarsson في ٥ يوليو ٢٠٢٠

سأستمر مع sklearn.utils ، بدءًا من _encode.py

franslarsson في ٨ يوليو ٢٠٢٠

أعمل على sklearn/decomposition/_dict_learning.py

TahiriNadia في ١١ يوليو ٢٠٢٠

أنا أعمل على sklearn.kernel_ridge في السباق

mikeaalv في ١١ يوليو ٢٠٢٠

مرحبًا ، سأبدأ العمل على sklearn.feature_extraction.image.img_to_graph

tijanajovanovic في ١١ يوليو ٢٠٢٠

أعمل على sklearn.feature_extraction.text.CountVectorizer

Probinette4 في ١١ يوليو ٢٠٢٠

أعمل على sklearn.sklearn.kernel_ridge

TahiriNadia في ١١ يوليو ٢٠٢٠

أعمل على sklearn.ensemble.HistGradientBoostingRegressor

Hoda1394 في ١١ يوليو ٢٠٢٠

"أنا أعمل على هذا"

على هذا؟ هدى ١٣٩٤

TahiriNadia في ١١ يوليو ٢٠٢٠

"أنا أعمل على هذا"
على هذا؟ هدى ١٣٩٤

TahiriNadia تصحيح.

Hoda1394 في ١١ يوليو ٢٠٢٠

👍1

cgsavard مرحبًا ، هل يمكنني العمل على هذا؟ أنا أول مرة

Praveenk8051 في ٢٤ يوليو ٢٠٢٠

سأعمل على الملفات في sklearn.datasets .

JinLi711 في ٢٥ يوليو ٢٠٢٠

هل يمكنني العمل على sklearn.linear_model._least_angle.py

sadakmed في ٢ أغسطس ٢٠٢٠

glemaitre أعمل على sklearn.linear_model._least_angle.py ووجدت تضاربًا في استخدام method ='lar' أحيانًا يشير إلى lars أحيانًا lar ، هذا التناقض موجود أيضًا الرمز (ليس فقط في التوثيق) ، أستطيع أن أرى أن lars هو الرمز الصحيح ، هل يمكنك تأكيده ، وسأقوم بعمل PR.

sadakmed في ٢ أغسطس ٢٠٢٠

العمل على 'sklearn/ensemble/_hist_gradient_boosting/binning.py'

sadakmed في ٢ أغسطس ٢٠٢٠

الملفات بحاجة للتغيير:

sklearn / _config.py
sklearn / dummy.py
sklearn / multioutput.py
sklearn / linear_model / _huber.py
sklearn / linear_model / _theil_sen.py
sklearn / linear_model / _ridge.py
sklearn / linear_model / _omp.py
sklearn / linear_model / _sag.py
sklearn / externals / _lobpcg.py
sklearn / externals / _lobpcg.py
sklearn / utils / extmath.py
sklearn / utils / __ init__.py
sklearn / utils / graph.py
sklearn / utils / _mocking.py
sklearn / utils / sparsefuncs.py
sklearn / neighbors / _base.py
sklearn / gaussian_process / _gpc.py
sklearn / gaussian_process / kernels.py
sklearn / model_selection / _validation.py
~ sklearn / التحلل / _fastica.py ~
~ sklearn / التحلل / _dict_learning.py ~
~ sklearn / التحلل / _factor_analysis.py ~
~ sklearn / التحلل / _incremental_pca.py ~
~ sklearn / التحلل / _lda.py ~
~ sklearn / التحلل / _pca.py ~
~ sklearn / decomposition / _truncated_svd.py ~
~ sklearn / التحلل / _sparse_pca.py ~
~ sklearn / التحلل / _nmf.py ~
sklearn / المنوع / _mds.py
sklearn / manifold / _spectral_embedding.py
sklearn / manifold / _t_sne.py
sklearn / ensemble / _hist_gradient_boosting / grower.py
sklearn / ensemble / _hist_gradient_boosting / binning.py
sklearn / metrics / _ranking.py
sklearn / tree / _classes.py
sklearn / preprocessing / _discretization.py
sklearn / preprocessing / _encoders.py line 620
sklearn / neural_network / _multilayer_perceptron.py line 1054
sklearn / covariance / _robust_covariance.py

يرجى التحقق مما إذا كان شخص ما يعمل بالفعل / يعمل على الملف الذي اخترته

sadakmed في ٢ أغسطس ٢٠٢٠

sadakmed ، لجميع "ملفات التحلل" ، هناك طلب سحب مستمر # 17739.

clmbst في ٣ أغسطس ٢٠٢٠

👍1

العمل على "gaussian_process.GaussianProcessRegressor" و "neighbors._base.py"

sadakmed في ٣ أغسطس ٢٠٢٠

مرحبًا ، أنا جديد وأود أن أبدأ بالمساهمة. هل ما زلت بحاجة إلى بعض المساعدة في هذه المسألة؟ هل هناك أي ملف ما زلت بحاجة إلى المساعدة بشأنه؟

boricles في ٣١ أغسطس ٢٠٢٠

ياboricles!

ألق نظرة على https://github.com/scikit-learn/scikit-learn/issues/15761#issuecomment -639461778 للحصول على قائمة بالوحدات التي لا يزال يتعين إصلاحها.

alfaro96 في ٣١ أغسطس ٢٠٢٠

@ alfaro96 شكرا. لقد قمت بإلقاء نظرة سريعة الآن. سأختار وحدة الليلة ، وأعمل عليها.

boricles في ٣١ أغسطس ٢٠٢٠

أنا أعمل على sklearn / config_context

boricles في ١ سبتمبر ٢٠٢٠

مرحبًا ، اعتقدت أنني سأرى ما إذا كان بإمكاني المساعدة في المستندات.

@ alfaro96 أود العمل على sklearn.feature_extraction.text.CountVectorizer ، إذا لم يتم أخذها بالفعل ، خاصة لأنني شخصياً واجهت بعض المزالق عند العمل مع Vectorizers في الماضي.

لاحظت أيضًا أنه على الرغم من تحديث sklearn.model_selection.learning_curve ، إلا أن هناك برنامجًا تعليميًا قديمًا يستخدم الوثائق القديمة ، فهل يجب أن أتركه؟ أم أنها تستحق التحديث؟

madprogramer في ٥ سبتمبر ٢٠٢٠

مرحبا @ alfaro96 ،

بعد التعديلات:
أرى أنه تم إصلاح sklearn.config_context و sklearn.set_config من sklearn.config_config.py لذلك يمكن سحبها من قائمة المهام .

أرغب في العمل على sklearn.utils . لقد رأيت مرة واحدة فقط مثيلاً لوثائق المعلمة حيث يتم استخدام "اختياري" فيه. وهذا يعني أنني بحاجة إلى إصلاح هذا المثال فقط ، أليس كذلك؟ إنه في sklearn.utils._mocking.py

haiatn في ٥ سبتمبر ٢٠٢٠

مرحبًا ، اعتقدت أنني سأرى ما إذا كان بإمكاني المساعدة في المستندات.

مرحبًا madprogramer ،

@ alfaro96 أود العمل على sklearn.feature_extraction.text.CountVectorizer ، إذا لم يتم أخذها بالفعل ، خاصة لأنني شخصياً واجهت بعض المزالق عند العمل مع Vectorizers في الماضي.

~ لقد ألقيت نظرة على قائمة التحقق والمرجع sklearn.feature_extraction.text.CountVectorizer ولا يبدو أنه تم إصلاحه. العلاقات العامة ستكون موضع ترحيب

تحرير: تم إصلاح sklearn.feature_extraction.text.CountVectorizer بالفعل.

لاحظت أيضًا أنه على الرغم من تحديث sklearn.model_selection.learning_curve ، إلا أن هناك برنامجًا تعليميًا قديمًا يستخدم الوثائق القديمة ، فهل يجب أن أتركه؟ أم أنها تستحق التحديث؟

الأمر يستحق التحديث ، على الرغم من أن هذا يجب أن يتم في علاقات عامة منفصلة.

شكرا لك!

alfaro96 في ٦ سبتمبر ٢٠٢٠

👍1

مرحبا @ alfaro96 ،

مرحبًا haiatn ،

بعد التعديلات:
أرى أنه تم إصلاح sklearn.config_context و sklearn.set_config من sklearn.config_config.py لذلك يمكن سحبها من قائمة المهام .

لقد قمت بتحديث قائمة التحقق .

أرغب في العمل على sklearn.utils . لقد رأيت مرة واحدة فقط مثيلاً لوثائق المعلمة حيث يتم استخدام "اختياري" فيه. وهذا يعني أنني بحاجة إلى إصلاح هذا المثال فقط ، أليس كذلك؟ إنه في sklearn.utils._mocking.py

هذه هي الفكرة ، على الرغم من أن الفئات الموجودة في ملف sklearn.utils._mocking.py ليست جزءًا من واجهة برمجة التطبيقات العامة ، لذلك لا أعتقد أن الأمر يستحق تحديثها.

ومع ذلك ، سيكون من الجيد أن تعمل في أي من الوظائف والفئات والوحدات النمطية الأخرى المعلقة ليتم إصلاحها.

شكرا لك!

alfaro96 في ٦ سبتمبر ٢٠٢٠

👍1

نظرت إلى قائمة التحقق. مما رأيته يمكن التحقق من ما يلي من قائمة المراجعة:

sklearn.feature_extraction.image.img_to_graph
sklearn.isotonic.IsotonicRegression
sklearn.isotonic.check_increasing
لم أجد الملف sklearn.ensemble.HistGradientBoostingRegressor لكن كل sklearn.ensemble لا بأس به

هل يمكنني العمل على sklearn.manifold._spectral_embedding و sklearn.feature_extraction.text.HashVectorizer ؟ سأفعل ذلك في علاقات عامة منفصلة. أعتقد أنها الملفات الوحيدة المتبقية التي تحتاج إلى إصلاح (على افتراض أن sklearn.feature_extraction.text.CountVectorizer مأخوذ).

haiatn في ٦ سبتمبر ٢٠٢٠

نظرت إلى قائمة التحقق. مما رأيته يمكن التحقق من ما يلي من قائمة المراجعة:
sklearn.feature_extraction.image.img_to_graph
sklearn.isotonic.IsotonicRegression
sklearn.isotonic.check_increasing

شكرا haiatn ، لقد قمت بتحديث قائمة التحقق.

لم أجد الملف sklearn.ensemble.HistGradientBoostingRegressor لكن كل sklearn.ensemble لا بأس به

sklearn.ensemble.HistGradientBoostingClassifier و sklearn.ensemble.HistGradientBoostingRegressor موجودان في هذا الملف: scikit-learn/sklearn/ensemble/_hist_gradient_boosting/gradient_boosting.py . ومع ذلك ، فقد تم إصلاحها بالفعل.

هل يمكنني العمل على sklearn.manifold._spectral_embedding و sklearn.feature_extraction.text.HashVectorizer ؟ سأفعل ذلك في علاقات عامة منفصلة. أعتقد أنها الملفات الوحيدة المتبقية التي تحتاج إلى إصلاح (على افتراض أن sklearn.feature_extraction.text.CountVectorizer مأخوذ).

لقد ألقيت نظرة على الوحدة النمطية sklearn.manifold و sklearn.feature_extraction.text.HashingVectorizer وتم إصلاحها بالفعل (لقد قمت بتحديث قائمة التحقق وفقًا لذلك).

ومع ذلك ، هناك العديد من الوظائف في الوحدة النمطية sklearn.utils والتي يجب أن تظل ثابتة.

شكرا haiatn ، نحن حقا نقدر مساعدتك!

alfaro96 في ٧ سبتمبر ٢٠٢٠

سأعمل الآن على sklearn.utils._estimator_html_repr و sklearn.utils.deprecation و sklearn.utils._testing

haiatn في ١١ سبتمبر ٢٠٢٠

سوف أنهي sklearn.utils. لا يوجد سوى 3 ملفات وجدتها بحاجة إلى إصلاح.

haiatn في ١٥ سبتمبر ٢٠٢٠

مرحبا @ alfaro96 ،
هل يمكنك مراجعة طلبات السحب المفتوحة الخاصة بي؟ اعتقد انهم الاخير