Scikit-learn: إصلاح وثائق القيم الافتراضية في جميع الفئات

تم إنشاؤها على ٢ ديسمبر ٢٠١٩  ·  118تعليقات  ·  مصدر: scikit-learn/scikit-learn

وصف

توثيق القيم الافتراضية في العديد من الفئات إما غير مدرج ، أو غير متسق في كيفية كتابته ، أو قديم. أرغب في جمع عدد قليل من الأشخاص للعمل على توثيق القيمة الافتراضية لكل فصل حيث يوجد عدد كبير من الفصول التي توجد بها هذه المشكلات. لقد تم إخباري أنه يجب توثيق القيم الافتراضية على أنها "افتراضي = <'value'>" ولذا فإنني أقوم بإنشاء هذه المشكلة وفقًا لهذا الافتراض.

المحلول

فيما يلي بعض الأشياء التي رأيتها بالنسبة للمعلمات التي يجب تغييرها:

  • لا يوجد ذكر لما إذا كان هناك تقصير يجب التحقق منه مقابل الكود لأن بعض المعلمات تفتقد إلى هذا تمامًا
  • يجب تغيير "اختياري" إلى "افتراضي = <'القيمة'>"
  • تأكد من أن كيفية توثيق القيم الافتراضية متسقة داخل الفصل ، أي تغيير كل شيء إلى التنسيق "افتراضي = <'value'>"
  • تعديل ملف واحد لكل PR

إذا كان هناك عدد قليل من الأشخاص يعملون في فصول قليلة لكل منهم ، فيجب القيام بذلك في أي وقت من الأوقات! يجب أن تكون كل هذه إصلاحات بسيطة إلى حد ما.

#### أمثلة
https://scikit-learn.org/stable/modules/generated/sklearn.cluster.AgglomerativeClustering.html
الرابط أعلاه هو مثال حيث لا يتم الإشارة إلى القيم الافتراضية ولكن المعلمات تقول "اختيارية" ، وحيث يتم توثيق جميع القيم الافتراضية المشار إليها بشكل غير متسق.

Sprint good first issue

التعليق الأكثر فائدة

من الناحية المنطقية ، إذا كانت المعلمة اختيارية ، ألا يجب أن تكون القيمة الافتراضية هي None دائمًا؟ يقترح وجود معلمة ذات قيمة افتراضية بخلاف None أنها يجب أن تكون مطلوبة.

إذا كان هناك قيمة افتراضية ، فهذا يعني عادةً أن الأدبيات قد وجدت أن هذه قيمة افتراضية معقولة والتي تشير أيضًا إلى أن هذه المعلمة لها تأثير على الأداء وبالتالي لا ينبغي أن تكون اختيارية ، ولكن يجب أن تذكر فقط ما هو الافتراضي. تلك تبدو أقرب إلى المعلمات المطلوبة بحكم التعريف ، لقد صادفنا للتو اتخاذ خيار معقول للمستخدم حتى يتمكن من تغييره أو لا.

أو من الناحية العملية ، هل هناك حاليًا أي معلمات اختيارية وجدناها تحتوي على قيم افتراضية رقمية ، ولكن تحديد None سيؤدي إلى استثناء؟ قد يشير ذلك أيضًا إلى أن المعلمة مطلوبة بالفعل ، ولكن تم اختيار قيمة افتراضية معقولة بناءً على الأدبيات / الأبحاث.

أو ربما كنت أخلط بين معنى required و optional كل هذه السنوات؟ مضحك جدا. بالتأكيد أحب المساعدة في هذا في كلتا الحالتين!

ال 118 كومينتر

مرحبًا cgsavard ، أود العمل على هذا. هل يمكنني البدء في النظر إلى فئة AgglomerativeClustering؟

vachanda اذهب لذلك! يمكننا الاستمرار في نشر ما نعمل عليه حتى يعرفه الآخرون.

شكرا لتنسيق هذا cgsavard

ملاحظة للمساهمين: يرجى اتباع الإرشادات الواردة أدناه: https://scikit-learn.org/stable/developers/contributing.html#guidelines -for-write-documents

cgsavard ، هل هناك قائمة بالفئات التي بها اختلافات أو هل يتعين علينا

vachanda ليس لدي قائمة ، للأسف. لقد كنت أتصفح الملفات للتو وأرى ما يجب تحديثه.

أنا أعمل على AffinityPropagation و SpectralCoclustering و SpectralBiclustering و Birch.

أنا أعمل على FeatureAgglomeration و KMeans و MiniBatchKMeans.

من الناحية المنطقية ، إذا كانت المعلمة اختيارية ، ألا يجب أن تكون القيمة الافتراضية هي None دائمًا؟ يقترح وجود معلمة ذات قيمة افتراضية بخلاف None أنها يجب أن تكون مطلوبة.

إذا كان هناك قيمة افتراضية ، فهذا يعني عادةً أن الأدبيات قد وجدت أن هذه قيمة افتراضية معقولة والتي تشير أيضًا إلى أن هذه المعلمة لها تأثير على الأداء وبالتالي لا ينبغي أن تكون اختيارية ، ولكن يجب أن تذكر فقط ما هو الافتراضي. تلك تبدو أقرب إلى المعلمات المطلوبة بحكم التعريف ، لقد صادفنا للتو اتخاذ خيار معقول للمستخدم حتى يتمكن من تغييره أو لا.

أو من الناحية العملية ، هل هناك حاليًا أي معلمات اختيارية وجدناها تحتوي على قيم افتراضية رقمية ، ولكن تحديد None سيؤدي إلى استثناء؟ قد يشير ذلك أيضًا إلى أن المعلمة مطلوبة بالفعل ، ولكن تم اختيار قيمة افتراضية معقولة بناءً على الأدبيات / الأبحاث.

أو ربما كنت أخلط بين معنى required و optional كل هذه السنوات؟ مضحك جدا. بالتأكيد أحب المساعدة في هذا في كلتا الحالتين!

jmwoloso لقد كنا حقًا غير optional ولذلك قررنا مؤخرًا إزالته.

أريد أن أساهم كذلك. هل يمكنني المضي قدما في هذا

glemaitre طيب ، هذا منطقي بالتأكيد. سنقوم بإزالة الملف النصي optional معًا ، أليس كذلك ، مع الإشارة أيضًا إلى القيم الافتراضية في سلاسل المستندات؟

هل ينبغي فتح كل من هذه الأمور التي وجدناها كمسألة منفصلة أم كيف نبدأ كل هذا العمل الذي نقوم به نظرًا لأن العديد من الأشخاص يعملون على أشياء متعددة تتعلق بهذه المشكلة الفردية؟

@ cyrus303jmwoloso يمكنك الحصول على فصل دراسي (وحدة كحد أقصى) وتصحيحه. الفكرة هي إزالة الخيار الاختياري وإضافة افتراضي عندما يكون هناك واحد (عادة ما يكون هناك واحد). نظرًا لأننا نلمس الوثائق ، يجب أن نتأكد من أن النمط الموجود على الخط يتبع دليل الأسلوب الجديد الخاص بنا: https://scikit-learn.org/dev/developers/contributing.html#guidelines -for-write-documents

يمكنك ذكر أي فئة / وحدة تعمل بها ، افتح رابط العلاقات العامة لتجنب تكرار الجهد :). نتطلع إلى مراجعتها.

مهلا! سأعمل على دروس tree ( tree.DecisionTreeClassifier ، tree.DecisionTreeRegressor ، tree.ExtraTreeClassifier و tree.ExtraTreeRegressor ).

سأقوم أيضًا بإصلاح هذه المشكلة للوحدة neighbors .

سآخذ الوحدة النمطية ensemble .

glemaitre أي تفضيل على bool مقابل boolean ؟ رؤية مزيج من الاثنين في ensemble ، حتى في نفس الفصل. قد تحصل أيضًا على شكلها أثناء قيامي بالتخلف عن السداد.

تعديل:

نفس الشيء مقابل int مقابل integer . أفترض int على ذلك ، لكنني أردت التأكيد.

تحرير (مرة أخرى):

مشاهدة أيضًا مستندات ذات قيم غير متناسقة بالنسبة للتوقيع __init__ لتلك الفئة ، على سبيل المثال:

min_impurity_split مقابل RandomForestClassifier

التوقيع __init__ يحتوي على min_impurity_split=None بينما تقول سلاسل المستندات الخاصة به min_impurity_split : float, (default=0) . أفترض تحديث السلاسل لتطابق التوقيع لأننا نرغب في الحفاظ على سلوك الفئة متسقًا (أي أننا نريد تمرير نفس الإعدادات الافتراضية عند إنشاء مثيل)؟

jmwoloso هل يمكنك الرجوع إلى https://scikit-learn.org/stable/developers/contributing.html#guidelines -for-write -documents. بشكل أساسي ، يجب أن يكون اسم نوع Python افتراضيًا (bool ، str ، int ، float)

التوقيع __init__ يحتوي على min_impurity_split = لا شيء بينما تشير الوثائق الخاصة به إلى min_impurity_split: float ، (افتراضي = 0). أفترض تحديث السلاسل لتطابق التوقيع لأننا نرغب في الحفاظ على سلوك الفئة متسقًا (أي أننا نريد تمرير نفس الإعدادات الافتراضية عند إنشاء مثيل)؟

يجب أن نطابق المعلمة في توقيع الوظيفة. تم تغيير معلمة القيمة الافتراضية هذه ولم يتم تحديث سلسلة docstring.

مرحبًا cgsavard ، أود المساهمة ولكن هذه ستكون المرة الأولى لي لذا أحتاج إلى بعض الإمساك باليد. أنا على دراية تامة ببايثون ، وهو سهل الاستخدام إلى حد ما مع محرري النصوص ، وقد مررت مؤخرًا بالشوكة -> استنساخ -> تحرير -> دروس سير عمل العلاقات العامة هنا . يرجى تقديم المشورة الخطوة التالية ... شكرا لك!

مرحبًا cgsavard ،
هل يمكنني من فضلك العمل على Imputer؟

مرحبًا cgsavard ، أريد العمل في فئة linear_model .

أعمل أيضًا على دروس Neural Network و Decomposition و Feature Extraction و Metrics و Preprocess .

هل يمكن لأحدهم التحقق من رقم PR # 15964 الخاص بي ومعرفة سبب فشل كود cov. هذه هي المرة الأولى لي للمساهمة. الرجاء التوجيه.

تجاهل برنامج الترميز. هذه نتيجة إيجابية خاطئة لأننا لا نلمس الكود. سأراجع قريبا العلاقات العامة

تم الإرسال من هاتفي - آسف لكوني مختصرة وربما يكون هناك خطأ إملائي.

لقد قدمت للتو مساهمتي الأولى # 15988

سآخذ الوحدة النمطية naive_bayes .

لقد قدمت للتو مساهمتي الأولى # 16019

مرحبًا بالجميع ، أعمل على sklearn/neighbors ، شكرًا لك.

ساهم في sklearn / sem_upervised. شكرا

مرحبًا cgsavard ، أود المساهمة أيضًا ، sklearn/svm . شكرا

ساهم في sklearn / sem_upervised. شكرا
هل يلزم إجراء بعض التعديلات الإضافية على PR # 16042

glemaitre في #

كما حاولت استخدام طريقة أقل غموضًا وموجزة وصارمة من الناحية الحسابية لتحديد نطاقات من المعلمات. على سبيل المثال ، قمت بتغيير positive float إلى float in (0, inf] أو 0<= shrinkage <=1 إلى float in (0, 1) . قصة قصيرة طويلة ، لقد بذلت قصارى جهدي لأكون موجزًا ​​ودقيقًا ، لكن من فضلك أعط مزيدًا من الاهتمام بمراجعة هذا العلاقات العامة بنسبة 5٪. شكرا.

cgsavard ، هذه مشكلة لطيفة جدًا لسباق هنا .
هل تمانع في ربط الجوهر في وصف المشكلة؟ هذا سيجعل المعلومات متاحة من البداية. هل لي أن أطلب منك أيضًا أن توضح في الوصف أن كل ممثل عام يجب أن يتناول ملفًا واحدًا (وحدة واحدة كحد أقصى) في كل مرة كما هو موضح هنا ؟ هذا سوف يساعد حقا المساهمين والمراجعين! شكرا جزيلا!

للراغبين في هذه المسألة ، الأمر

git grep "optional.*default"

سيتم إخراج الملفات التي ما زالت تتأثر بهذه المشكلة (شكرًاogrisel! :)).

cgsavard مرحبًا ، أود العمل على WiMLDS model_selection @

lopusz وأريد العمل على random_project.py

استمتع للجميع!

adrinjalalinoatamirWiMLDS

@ ETay203 وأود العمل على mean_shift WiMLDS_Berlin sprint.

@ magda-zielinska وأنا أريد العمل على خط الأنابيب

adrinjalalinoatamirWiMLDS

lopusz و @ magda-zielinska وأريد العمل على kernel_approximation.py

سأقوم بمعالجة _optics.py الآن

إعادة الفتح: تم إغلاقه بواسطة الكلمة الأساسية "Fixes" في # 16216.

إعادة الفتح: تم إغلاقه بواسطة الكلمة الأساسية "Fixes" في # 16207

سأقوم بمعالجة sklearn / linear_model / _coordinate_descent.py الآن

قمت بتنظيف base.py وقدمت العلاقات العامة

لقد نظّفتُ التمييزِ المميز وأرسلتُ وثيقة العلاقات العامة

سوف ألقي نظرة الآن على sklearn / gaussian_process / *. py

هناك بالفعل علاقات عامة طويلة لـ

lopusz اعتذاري ، أن العلاقات العامة كانت تلامس مشكلات أخرى في وحدة GP ، يمكنك المضي قدمًا والعمل عليها إذا كنت لا تمانع :)

adrinjalali شكرًا لك على

في الواقع ، لم أقم بمسح العلاقات العامة المفتوحة جيدًا بما يكفي ، لذا فإن حقيقة عدم أخذ الممارسين العامين هي أكثر من مجرد حادث ؛)

سأحرص على تتبع ما هو PRed.

ونعم قادم العلاقات العامة للأطباء الممارسين ؛)

هل هناك أي شيء آخر يجب القيام به هنا؟

أعمل على sklearn/decomposition/_dict_learning.py

ما تبقى القيام به؟ أنا منفتح على المساعدة. . .

ربما يكون اكتشاف ما تبقى هو مكان جيد لبدء المساعدة :)

مرحبًا ، لقد كنت أبحث عن ما تبقى ، وأعتقد أنه لا تزال هناك بعض التحديثات التي يجب إجراؤها في بعض الوحدات التي تم فحصها مسبقًا.
كنت سأعمل من خلال هذه ، بدءًا من وحدة الكتلة ويمكن أن أرفع العلاقات العامة لكل وحدة أثناء تقدمي؟
هذه هي مساهمتي الأولى ، لذا يرجى إعلامي إذا كنت لا أتابع العملية بشكل صحيح وما إلى ذلك.
شكرا!

هذه قائمة الوظائف والفئات والوحدات المتبقية لإصلاحها:

  • [x] sklearn.feature_selection.SelectorMixin
  • [x] sklearn.config_context
  • [x] sklearn.set_config
  • [x] sklearn.calibration.CalibratedClassifierCV
  • [x] sklearn.cluster.OPTICS
  • [x] sklearn.cluster.SpectralClustering
  • [x] sklearn.cluster.affinity_propagation
  • [x] sklearn.cluster.cluster_optics_dbscan
  • [x] sklearn.cluster.cluster_optics_xi
  • [x] sklearn.cluster.compute_optics_graph
  • [x] sklearn.cluster.mean_shift
  • [x] sklearn.cluster.spectral_clustering
  • [x] sklearn.cluster.ward_tree
  • [x] sklearn.cross_decomposition.CCA
  • [x] sklearn.cross_decomposition.PLSCanonical
  • [x] sklearn.cross_decomposition.PLSRegression
  • [x] sklearn.cross_decomposition.PLSSVD
  • [x] sklearn.datasets
  • [x] sklearn.decomposition
  • [x] sklearn.dummy
  • [x] sklearn.ensemble.HistGradientBoostingRegressor (تجريبي)
  • [x] sklearn.ensemble.HistGradientBoostingRegressor (تجريبي)
  • [x] sklearn.feature_extraction.image.grid_to_graph
  • [x] sklearn.feature_extraction.image.img_to_graph
  • [x] sklearn.feature_extraction.text.CountVectorizer
  • [x] sklearn.feature_extraction.text.HashVectorizer
  • [x] sklearn.feature_selection
  • [x] sklearn.impute
  • [x] sklearn.inspection.partial_dependence
  • [x] sklearn.inspection.permutation_importance
  • [x] sklearn.inspection.permutation_importance
  • [x] sklearn.inspection.PartialDependenceDisplay
  • [x] sklearn.inspection.plot_partial_dependence
  • [x] sklearn.isotonic.IsotonicRegression
  • [x] sklearn.isotonic.check_increasing
  • [x] sklearn.isotonic.isotonic_regression
  • [x] sklearn.kernel_approximation
  • [x] sklearn.kernel_ridge
  • [x] sklearn.linear_model.PassiveAggressiveClassifier
  • [x] sklearn.linear_model.LassoLars
  • [x] sklearn.linear_model.OrthogonalMatchingPursuit
  • [x] sklearn.linear_model.HuberRegressor
  • [x] sklearn.linear_model.RANSACRegressor
  • [x] sklearn.linear_model.TheilSenRegressor
  • [x] sklearn.linear_model.PassiveAggressiveRegressor
  • [x] sklearn.linear_model.orthogonal_mp
  • [x] sklearn.linear_model.orthogonal_mp_gram
  • [x] sklearn.manifold
  • [x] sklearn.metrics (باستثناء sklearn.metrics.confusion_matrix ، sklearn.metrics.roc_auc_score ، sklearn.metrics.max_error sklearn.metrics.mean_poisson_deviance ، sklearn.metrics.mean_gamma_deviance ، sklearn.metrics.mean_tweedie_deviance ، sklearn.metrics.plot_confusion_matrix ، sklearn.metrics.plot_precision_recall_curve )
  • [x] sklearn.mixture
  • [x] sklearn.model_selection.GridSearchCV
  • [x] sklearn.model_selection.ParameterGrid
  • [x] sklearn.model_selection.ParameterSampler
  • [x] sklearn.model_selection.RandomizedSearchCV
  • [x] sklearn.model_selection.fit_grid_point
  • [x] sklearn.multiclass
  • [x] sklearn.multioutput
  • [x] sklearn.neural_network
  • [x] sklearn.preprocessing
  • [x] sklearn.random_projection
  • [x] sklearn.tree.export_graphviz
  • [x] sklearn.tree.export_text
  • [x] sklearn.tree.plot_tree
  • [x] sklearn.utils

أتمنى ألا يفوتني أي شيء.

مرحبا. سأذهب وأحاول القيام بتمرير في وثائق feature_selection

نأخذ جزء sklearn.mixture

أخذ جزء التحلل المتقاطع

بالنسبة لـ 2020 Scikit-Learn Sprint ، أنا و @ icoder18 نأخذ جزء sklearn.random_project

adrinjalali أكملنا sklearn / mix

العمل على sklearn.linear_model للسباق مع genvalen @

خذ sklearn.calibration.CalibratedClassifierCV

العمل على هذا من أجل sklearn.utils.validation

بعد ذلك سنتعامل مع sklearn.utils.random

العمل على sklearn.impute

العمل على sklearn.tree.plot_tree

الجدول 14 سيتناول sklearn.neural_network

خذ sklearn.kernel_approximation

أخذ sklearn.inspection

سيتطلب الجدول 14 معالجة sklearn.preprocessing

أخذ مجموعات البيانات

أخذ sklearn.mixture # 17509

تم تحديث القائمة.

شكرا لكم جميعا!

أخذ sklearn.metrics للعدو

أخذ نموذج_الاختيار الوحدة النمطية

glemaitre هل يمكننا تحديث وصف هذا ليشمل أنه من الأفضل إرسال ملف واحد في كل مرة؟

مرحبا اود المساهمة. هذه هي المرة الأولى لي رغم ذلك ... وليس من الواضح بالنسبة لي كيف يمكنني معرفة الوحدة التي لا يزال هناك عمل يتعين القيام به؟ شكرا !

https://github.com/scikit-learn/scikit-learn/issues/15761#issuecomment -639461778 يحتوي على قائمة الوحدات المتبقية لإصلاحها.

شكرا. خذ sklearn.decomposition إذن.

أنا أعمل على "sklearn.isotonic.isotonic_regression"

أنا أعمل على "sklearn.multiclass.py"

مرحبًا ، هل يمكنني محاولة أخذ المتبقي على sklearn.tree ؟ ستكون هذه أول مرة أساهم فيها أيضًا.

شكرا لتسجيل الوصول ، من الرائع الحصول على مساعدتك! الرجاء المتابعة؛ أعتقد أنه تم إغلاق جميع تحديثات العدو السريع.

في 4 تموز (يوليو) 2020 ، الساعة 10:45 ، كتب Ivan Wiryadi [email protected] :


مرحبًا ، هل يمكنني محاولة أخذ المتبقي على sklearn.tree؟ ستكون هذه أول مرة أساهم فيها أيضًا.

-
أنت تتلقى هذا لأنك علقت.
قم بالرد على هذه الرسالة الإلكترونية مباشرةً ، أو اعرضها على GitHub ، أو قم بإلغاء الاشتراك.

مرحباً ، أود أن أقدم مساهمتي الأولى. هل يمكنني أخذ sklearn.multioutput؟

سأستمر مع sklearn.utils ، بدءًا من _encode.py

أعمل على sklearn/decomposition/_dict_learning.py

أنا أعمل على sklearn.kernel_ridge في السباق

مرحبًا ، سأبدأ العمل على sklearn.feature_extraction.image.img_to_graph

أعمل على sklearn.feature_extraction.text.CountVectorizer

أعمل على sklearn.sklearn.kernel_ridge

أعمل على sklearn.ensemble.HistGradientBoostingRegressor

"أنا أعمل على هذا"

على هذا؟ هدى ١٣٩٤

"أنا أعمل على هذا"

على هذا؟ هدى ١٣٩٤

TahiriNadia تصحيح.

cgsavard مرحبًا ، هل يمكنني العمل على هذا؟ أنا أول مرة

سأعمل على الملفات في sklearn.datasets .

هل يمكنني العمل على sklearn.linear_model._least_angle.py

glemaitre أعمل على sklearn.linear_model._least_angle.py ووجدت تضاربًا في استخدام method ='lar' أحيانًا يشير إلى lars أحيانًا lar ، هذا التناقض موجود أيضًا الرمز (ليس فقط في التوثيق) ، أستطيع أن أرى أن lars هو الرمز الصحيح ، هل يمكنك تأكيده ، وسأقوم بعمل PR.

العمل على 'sklearn/ensemble/_hist_gradient_boosting/binning.py'

الملفات بحاجة للتغيير:

sklearn / _config.py
sklearn / dummy.py
sklearn / multioutput.py
sklearn / linear_model / _huber.py
sklearn / linear_model / _theil_sen.py
sklearn / linear_model / _ridge.py
sklearn / linear_model / _omp.py
sklearn / linear_model / _sag.py
sklearn / externals / _lobpcg.py
sklearn / externals / _lobpcg.py
sklearn / utils / extmath.py
sklearn / utils / __ init__.py
sklearn / utils / graph.py
sklearn / utils / _mocking.py
sklearn / utils / sparsefuncs.py
sklearn / neighbors / _base.py
sklearn / gaussian_process / _gpc.py
sklearn / gaussian_process / kernels.py
sklearn / model_selection / _validation.py
~ sklearn / التحلل / _fastica.py ~
~ sklearn / التحلل / _dict_learning.py ~
~ sklearn / التحلل / _factor_analysis.py ~
~ sklearn / التحلل / _incremental_pca.py ~
~ sklearn / التحلل / _lda.py ~
~ sklearn / التحلل / _pca.py ~
~ sklearn / decomposition / _truncated_svd.py ~
~ sklearn / التحلل / _sparse_pca.py ~
~ sklearn / التحلل / _nmf.py ~
sklearn / المنوع / _mds.py
sklearn / manifold / _spectral_embedding.py
sklearn / manifold / _t_sne.py
sklearn / ensemble / _hist_gradient_boosting / grower.py
sklearn / ensemble / _hist_gradient_boosting / binning.py
sklearn / metrics / _ranking.py
sklearn / tree / _classes.py
sklearn / preprocessing / _discretization.py
sklearn / preprocessing / _encoders.py line 620
sklearn / neural_network / _multilayer_perceptron.py line 1054
sklearn / covariance / _robust_covariance.py

يرجى التحقق مما إذا كان شخص ما يعمل بالفعل / يعمل على الملف الذي اخترته

sadakmed ، لجميع "ملفات التحلل" ، هناك طلب سحب مستمر # 17739.

العمل على "gaussian_process.GaussianProcessRegressor" و "neighbors._base.py"

مرحبًا ، أنا جديد وأود أن أبدأ بالمساهمة. هل ما زلت بحاجة إلى بعض المساعدة في هذه المسألة؟ هل هناك أي ملف ما زلت بحاجة إلى المساعدة بشأنه؟

ياboricles!

ألق نظرة على https://github.com/scikit-learn/scikit-learn/issues/15761#issuecomment -639461778 للحصول على قائمة بالوحدات التي لا يزال يتعين إصلاحها.

@ alfaro96 شكرا. لقد قمت بإلقاء نظرة سريعة الآن. سأختار وحدة الليلة ، وأعمل عليها.

أنا أعمل على sklearn / config_context

مرحبًا ، اعتقدت أنني سأرى ما إذا كان بإمكاني المساعدة في المستندات.

@ alfaro96 أود العمل على sklearn.feature_extraction.text.CountVectorizer ، إذا لم يتم أخذها بالفعل ، خاصة لأنني شخصياً واجهت بعض المزالق عند العمل مع Vectorizers في الماضي.

لاحظت أيضًا أنه على الرغم من تحديث sklearn.model_selection.learning_curve ، إلا أن هناك برنامجًا تعليميًا قديمًا يستخدم الوثائق القديمة ، فهل يجب أن أتركه؟ أم أنها تستحق التحديث؟

مرحبا @ alfaro96 ،

بعد التعديلات:
أرى أنه تم إصلاح sklearn.config_context و sklearn.set_config من sklearn.config_config.py لذلك يمكن سحبها من قائمة المهام .

أرغب في العمل على sklearn.utils . لقد رأيت مرة واحدة فقط مثيلاً لوثائق المعلمة حيث يتم استخدام "اختياري" فيه. وهذا يعني أنني بحاجة إلى إصلاح هذا المثال فقط ، أليس كذلك؟ إنه في sklearn.utils._mocking.py

مرحبًا ، اعتقدت أنني سأرى ما إذا كان بإمكاني المساعدة في المستندات.

مرحبًا madprogramer ،

@ alfaro96 أود العمل على sklearn.feature_extraction.text.CountVectorizer ، إذا لم يتم أخذها بالفعل ، خاصة لأنني شخصياً واجهت بعض المزالق عند العمل مع Vectorizers في الماضي.

~ لقد ألقيت نظرة على قائمة التحقق والمرجع sklearn.feature_extraction.text.CountVectorizer ولا يبدو أنه تم إصلاحه. العلاقات العامة ستكون موضع ترحيب

تحرير: تم إصلاح sklearn.feature_extraction.text.CountVectorizer بالفعل.

لاحظت أيضًا أنه على الرغم من تحديث sklearn.model_selection.learning_curve ، إلا أن هناك برنامجًا تعليميًا قديمًا يستخدم الوثائق القديمة ، فهل يجب أن أتركه؟ أم أنها تستحق التحديث؟

الأمر يستحق التحديث ، على الرغم من أن هذا يجب أن يتم في علاقات عامة منفصلة.

شكرا لك!

مرحبا @ alfaro96 ،

مرحبًا haiatn ،

بعد التعديلات:
أرى أنه تم إصلاح sklearn.config_context و sklearn.set_config من sklearn.config_config.py لذلك يمكن سحبها من قائمة المهام .

لقد قمت بتحديث قائمة التحقق .

أرغب في العمل على sklearn.utils . لقد رأيت مرة واحدة فقط مثيلاً لوثائق المعلمة حيث يتم استخدام "اختياري" فيه. وهذا يعني أنني بحاجة إلى إصلاح هذا المثال فقط ، أليس كذلك؟ إنه في sklearn.utils._mocking.py

هذه هي الفكرة ، على الرغم من أن الفئات الموجودة في ملف sklearn.utils._mocking.py ليست جزءًا من واجهة برمجة التطبيقات العامة ، لذلك لا أعتقد أن الأمر يستحق تحديثها.

ومع ذلك ، سيكون من الجيد أن تعمل في أي من الوظائف والفئات والوحدات النمطية الأخرى المعلقة ليتم إصلاحها.

شكرا لك!

نظرت إلى قائمة التحقق. مما رأيته يمكن التحقق من ما يلي من قائمة المراجعة:

  • sklearn.feature_extraction.image.img_to_graph
  • sklearn.isotonic.IsotonicRegression
  • sklearn.isotonic.check_increasing
  • لم أجد الملف sklearn.ensemble.HistGradientBoostingRegressor لكن كل sklearn.ensemble لا بأس به

هل يمكنني العمل على sklearn.manifold._spectral_embedding و sklearn.feature_extraction.text.HashVectorizer ؟ سأفعل ذلك في علاقات عامة منفصلة. أعتقد أنها الملفات الوحيدة المتبقية التي تحتاج إلى إصلاح (على افتراض أن sklearn.feature_extraction.text.CountVectorizer مأخوذ).

نظرت إلى قائمة التحقق. مما رأيته يمكن التحقق من ما يلي من قائمة المراجعة:

  • sklearn.feature_extraction.image.img_to_graph
  • sklearn.isotonic.IsotonicRegression
  • sklearn.isotonic.check_increasing

شكرا haiatn ، لقد قمت بتحديث قائمة التحقق.

  • لم أجد الملف sklearn.ensemble.HistGradientBoostingRegressor لكن كل sklearn.ensemble لا بأس به

sklearn.ensemble.HistGradientBoostingClassifier و sklearn.ensemble.HistGradientBoostingRegressor موجودان في هذا الملف: scikit-learn/sklearn/ensemble/_hist_gradient_boosting/gradient_boosting.py . ومع ذلك ، فقد تم إصلاحها بالفعل.

هل يمكنني العمل على sklearn.manifold._spectral_embedding و sklearn.feature_extraction.text.HashVectorizer ؟ سأفعل ذلك في علاقات عامة منفصلة. أعتقد أنها الملفات الوحيدة المتبقية التي تحتاج إلى إصلاح (على افتراض أن sklearn.feature_extraction.text.CountVectorizer مأخوذ).

لقد ألقيت نظرة على الوحدة النمطية sklearn.manifold و sklearn.feature_extraction.text.HashingVectorizer وتم إصلاحها بالفعل (لقد قمت بتحديث قائمة التحقق وفقًا لذلك).

ومع ذلك ، هناك العديد من الوظائف في الوحدة النمطية sklearn.utils والتي يجب أن تظل ثابتة.

شكرا haiatn ، نحن حقا نقدر مساعدتك!

سأعمل الآن على sklearn.utils._estimator_html_repr و sklearn.utils.deprecation و sklearn.utils._testing

سوف أنهي sklearn.utils. لا يوجد سوى 3 ملفات وجدتها بحاجة إلى إصلاح.

مرحبا @ alfaro96 ،
هل يمكنك مراجعة طلبات السحب المفتوحة الخاصة بي؟ اعتقد انهم الاخير

18360 # 18385 # 18386

ياhaiatn!

لقد ألقيت بالفعل نظرة على العلاقات العامة المفتوحة الخاصة بك.

شكرا لك!

الآن بعد أن دمجنا ما تم استبعاده من sklearn.utils وكان الأخير في قائمة التحقق ، هل انتهينا؟

يوجد طلب سحب أخير مفتوح # 18025 ، ثم يمكن إغلاق هذه المشكلة في النهاية.

مرحبا،
أريد أن أبدأ المساهمة. هل هناك أي فئة معلقة لإصلاح مستند القيم الافتراضية؟ إن وجدت ، يمكنني تناولها.

مرحبًا بك جديد في المصدر المفتوح ، فأنا أتطلع إلى إصلاح المستند بأي فرصة يتم ترك شيء يحتاج إلى الإصلاح

هل كانت هذه الصفحة مفيدة؟
0 / 5 - 0 التقييمات