توثيق القيم الافتراضية في العديد من الفئات إما غير مدرج ، أو غير متسق في كيفية كتابته ، أو قديم. أرغب في جمع عدد قليل من الأشخاص للعمل على توثيق القيمة الافتراضية لكل فصل حيث يوجد عدد كبير من الفصول التي توجد بها هذه المشكلات. لقد تم إخباري أنه يجب توثيق القيم الافتراضية على أنها "افتراضي = <'value'>" ولذا فإنني أقوم بإنشاء هذه المشكلة وفقًا لهذا الافتراض.
فيما يلي بعض الأشياء التي رأيتها بالنسبة للمعلمات التي يجب تغييرها:
إذا كان هناك عدد قليل من الأشخاص يعملون في فصول قليلة لكل منهم ، فيجب القيام بذلك في أي وقت من الأوقات! يجب أن تكون كل هذه إصلاحات بسيطة إلى حد ما.
#### أمثلة
https://scikit-learn.org/stable/modules/generated/sklearn.cluster.AgglomerativeClustering.html
الرابط أعلاه هو مثال حيث لا يتم الإشارة إلى القيم الافتراضية ولكن المعلمات تقول "اختيارية" ، وحيث يتم توثيق جميع القيم الافتراضية المشار إليها بشكل غير متسق.
مرحبًا cgsavard ، أود العمل على هذا. هل يمكنني البدء في النظر إلى فئة AgglomerativeClustering؟
vachanda اذهب لذلك! يمكننا الاستمرار في نشر ما نعمل عليه حتى يعرفه الآخرون.
شكرا لتنسيق هذا cgsavard
ملاحظة للمساهمين: يرجى اتباع الإرشادات الواردة أدناه: https://scikit-learn.org/stable/developers/contributing.html#guidelines -for-write-documents
cgsavard ، هل هناك قائمة بالفئات التي بها اختلافات أو هل يتعين علينا
vachanda ليس لدي قائمة ، للأسف. لقد كنت أتصفح الملفات للتو وأرى ما يجب تحديثه.
أنا أعمل على AffinityPropagation و SpectralCoclustering و SpectralBiclustering و Birch.
أنا أعمل على FeatureAgglomeration و KMeans و MiniBatchKMeans.
من الناحية المنطقية ، إذا كانت المعلمة اختيارية ، ألا يجب أن تكون القيمة الافتراضية هي None
دائمًا؟ يقترح وجود معلمة ذات قيمة افتراضية بخلاف None
أنها يجب أن تكون مطلوبة.
إذا كان هناك قيمة افتراضية ، فهذا يعني عادةً أن الأدبيات قد وجدت أن هذه قيمة افتراضية معقولة والتي تشير أيضًا إلى أن هذه المعلمة لها تأثير على الأداء وبالتالي لا ينبغي أن تكون اختيارية ، ولكن يجب أن تذكر فقط ما هو الافتراضي. تلك تبدو أقرب إلى المعلمات المطلوبة بحكم التعريف ، لقد صادفنا للتو اتخاذ خيار معقول للمستخدم حتى يتمكن من تغييره أو لا.
أو من الناحية العملية ، هل هناك حاليًا أي معلمات اختيارية وجدناها تحتوي على قيم افتراضية رقمية ، ولكن تحديد None
سيؤدي إلى استثناء؟ قد يشير ذلك أيضًا إلى أن المعلمة مطلوبة بالفعل ، ولكن تم اختيار قيمة افتراضية معقولة بناءً على الأدبيات / الأبحاث.
أو ربما كنت أخلط بين معنى required
و optional
كل هذه السنوات؟ مضحك جدا. بالتأكيد أحب المساعدة في هذا في كلتا الحالتين!
jmwoloso لقد كنا حقًا غير optional
ولذلك قررنا مؤخرًا إزالته.
أريد أن أساهم كذلك. هل يمكنني المضي قدما في هذا
glemaitre طيب ، هذا منطقي بالتأكيد. سنقوم بإزالة الملف النصي optional
معًا ، أليس كذلك ، مع الإشارة أيضًا إلى القيم الافتراضية في سلاسل المستندات؟
هل ينبغي فتح كل من هذه الأمور التي وجدناها كمسألة منفصلة أم كيف نبدأ كل هذا العمل الذي نقوم به نظرًا لأن العديد من الأشخاص يعملون على أشياء متعددة تتعلق بهذه المشكلة الفردية؟
@ cyrus303jmwoloso يمكنك الحصول على فصل دراسي (وحدة كحد أقصى) وتصحيحه. الفكرة هي إزالة الخيار الاختياري وإضافة افتراضي عندما يكون هناك واحد (عادة ما يكون هناك واحد). نظرًا لأننا نلمس الوثائق ، يجب أن نتأكد من أن النمط الموجود على الخط يتبع دليل الأسلوب الجديد الخاص بنا: https://scikit-learn.org/dev/developers/contributing.html#guidelines -for-write-documents
يمكنك ذكر أي فئة / وحدة تعمل بها ، افتح رابط العلاقات العامة لتجنب تكرار الجهد :). نتطلع إلى مراجعتها.
مهلا! سأعمل على دروس tree
( tree.DecisionTreeClassifier
، tree.DecisionTreeRegressor
، tree.ExtraTreeClassifier
و tree.ExtraTreeRegressor
).
سأقوم أيضًا بإصلاح هذه المشكلة للوحدة neighbors
.
سآخذ الوحدة النمطية ensemble
.
glemaitre أي تفضيل على bool
مقابل boolean
؟ رؤية مزيج من الاثنين في ensemble
، حتى في نفس الفصل. قد تحصل أيضًا على شكلها أثناء قيامي بالتخلف عن السداد.
تعديل:
نفس الشيء مقابل int
مقابل integer
. أفترض int
على ذلك ، لكنني أردت التأكيد.
تحرير (مرة أخرى):
مشاهدة أيضًا مستندات ذات قيم غير متناسقة بالنسبة للتوقيع __init__
لتلك الفئة ، على سبيل المثال:
min_impurity_split
مقابل RandomForestClassifier
التوقيع __init__
يحتوي على min_impurity_split=None
بينما تقول سلاسل المستندات الخاصة به min_impurity_split : float, (default=0)
. أفترض تحديث السلاسل لتطابق التوقيع لأننا نرغب في الحفاظ على سلوك الفئة متسقًا (أي أننا نريد تمرير نفس الإعدادات الافتراضية عند إنشاء مثيل)؟
jmwoloso هل يمكنك الرجوع إلى https://scikit-learn.org/stable/developers/contributing.html#guidelines -for-write -documents. بشكل أساسي ، يجب أن يكون اسم نوع Python افتراضيًا (bool ، str ، int ، float)
التوقيع __init__ يحتوي على min_impurity_split = لا شيء بينما تشير الوثائق الخاصة به إلى min_impurity_split: float ، (افتراضي = 0). أفترض تحديث السلاسل لتطابق التوقيع لأننا نرغب في الحفاظ على سلوك الفئة متسقًا (أي أننا نريد تمرير نفس الإعدادات الافتراضية عند إنشاء مثيل)؟
يجب أن نطابق المعلمة في توقيع الوظيفة. تم تغيير معلمة القيمة الافتراضية هذه ولم يتم تحديث سلسلة docstring.
مرحبًا cgsavard ، أود المساهمة ولكن هذه ستكون المرة الأولى لي لذا أحتاج إلى بعض الإمساك باليد. أنا على دراية تامة ببايثون ، وهو سهل الاستخدام إلى حد ما مع محرري النصوص ، وقد مررت مؤخرًا بالشوكة -> استنساخ -> تحرير -> دروس سير عمل العلاقات العامة هنا . يرجى تقديم المشورة الخطوة التالية ... شكرا لك!
مرحبًا cgsavard ،
هل يمكنني من فضلك العمل على Imputer؟
مرحبًا cgsavard ، أريد العمل في فئة linear_model
.
أعمل أيضًا على دروس Neural Network
و Decomposition
و Feature Extraction
و Metrics
و Preprocess
.
هل يمكن لأحدهم التحقق من رقم PR # 15964 الخاص بي ومعرفة سبب فشل كود cov. هذه هي المرة الأولى لي للمساهمة. الرجاء التوجيه.
تجاهل برنامج الترميز. هذه نتيجة إيجابية خاطئة لأننا لا نلمس الكود. سأراجع قريبا العلاقات العامة
تم الإرسال من هاتفي - آسف لكوني مختصرة وربما يكون هناك خطأ إملائي.
لقد قدمت للتو مساهمتي الأولى # 15988
سآخذ الوحدة النمطية naive_bayes
.
لقد قدمت للتو مساهمتي الأولى # 16019
مرحبًا بالجميع ، أعمل على sklearn/neighbors
، شكرًا لك.
ساهم في sklearn / sem_upervised. شكرا
مرحبًا cgsavard ، أود المساهمة أيضًا ، sklearn/svm
. شكرا
ساهم في sklearn / sem_upervised. شكرا
هل يلزم إجراء بعض التعديلات الإضافية على PR # 16042
glemaitre في #
كما حاولت استخدام طريقة أقل غموضًا وموجزة وصارمة من الناحية الحسابية لتحديد نطاقات من المعلمات. على سبيل المثال ، قمت بتغيير positive float
إلى float in (0, inf]
أو 0<= shrinkage <=1
إلى float in (0, 1)
. قصة قصيرة طويلة ، لقد بذلت قصارى جهدي لأكون موجزًا ودقيقًا ، لكن من فضلك أعط مزيدًا من الاهتمام بمراجعة هذا العلاقات العامة بنسبة 5٪. شكرا.
cgsavard ، هذه مشكلة لطيفة جدًا لسباق هنا .
هل تمانع في ربط الجوهر في وصف المشكلة؟ هذا سيجعل المعلومات متاحة من البداية. هل لي أن أطلب منك أيضًا أن توضح في الوصف أن كل ممثل عام يجب أن يتناول ملفًا واحدًا (وحدة واحدة كحد أقصى) في كل مرة كما هو موضح هنا ؟ هذا سوف يساعد حقا المساهمين والمراجعين! شكرا جزيلا!
للراغبين في هذه المسألة ، الأمر
git grep "optional.*default"
سيتم إخراج الملفات التي ما زالت تتأثر بهذه المشكلة (شكرًاogrisel! :)).
cgsavard مرحبًا ، أود العمل على WiMLDS model_selection
@
lopusz وأريد العمل على random_project.py
استمتع للجميع!
adrinjalalinoatamirWiMLDS
@ ETay203 وأود العمل على mean_shift
WiMLDS_Berlin sprint.
@ magda-zielinska وأنا أريد العمل على خط الأنابيب
adrinjalalinoatamirWiMLDS
lopusz و @ magda-zielinska وأريد العمل على kernel_approximation.py
سأقوم بمعالجة _optics.py الآن
إعادة الفتح: تم إغلاقه بواسطة الكلمة الأساسية "Fixes" في # 16216.
إعادة الفتح: تم إغلاقه بواسطة الكلمة الأساسية "Fixes" في # 16207
سأقوم بمعالجة sklearn / linear_model / _coordinate_descent.py الآن
قمت بتنظيف base.py وقدمت العلاقات العامة
لقد نظّفتُ التمييزِ المميز وأرسلتُ وثيقة العلاقات العامة
سوف ألقي نظرة الآن على sklearn / gaussian_process / *. py
هناك بالفعل علاقات عامة طويلة لـ
lopusz اعتذاري ، أن العلاقات العامة كانت تلامس مشكلات أخرى في وحدة GP ، يمكنك المضي قدمًا والعمل عليها إذا كنت لا تمانع :)
adrinjalali شكرًا لك على
في الواقع ، لم أقم بمسح العلاقات العامة المفتوحة جيدًا بما يكفي ، لذا فإن حقيقة عدم أخذ الممارسين العامين هي أكثر من مجرد حادث ؛)
سأحرص على تتبع ما هو PRed.
ونعم قادم العلاقات العامة للأطباء الممارسين ؛)
هل هناك أي شيء آخر يجب القيام به هنا؟
أعمل على sklearn/decomposition/_dict_learning.py
ما تبقى القيام به؟ أنا منفتح على المساعدة. . .
ربما يكون اكتشاف ما تبقى هو مكان جيد لبدء المساعدة :)
مرحبًا ، لقد كنت أبحث عن ما تبقى ، وأعتقد أنه لا تزال هناك بعض التحديثات التي يجب إجراؤها في بعض الوحدات التي تم فحصها مسبقًا.
كنت سأعمل من خلال هذه ، بدءًا من وحدة الكتلة ويمكن أن أرفع العلاقات العامة لكل وحدة أثناء تقدمي؟
هذه هي مساهمتي الأولى ، لذا يرجى إعلامي إذا كنت لا أتابع العملية بشكل صحيح وما إلى ذلك.
شكرا!
هذه قائمة الوظائف والفئات والوحدات المتبقية لإصلاحها:
sklearn.feature_selection.SelectorMixin
sklearn.config_context
sklearn.set_config
sklearn.calibration.CalibratedClassifierCV
sklearn.cluster.OPTICS
sklearn.cluster.SpectralClustering
sklearn.cluster.affinity_propagation
sklearn.cluster.cluster_optics_dbscan
sklearn.cluster.cluster_optics_xi
sklearn.cluster.compute_optics_graph
sklearn.cluster.mean_shift
sklearn.cluster.spectral_clustering
sklearn.cluster.ward_tree
sklearn.cross_decomposition.CCA
sklearn.cross_decomposition.PLSCanonical
sklearn.cross_decomposition.PLSRegression
sklearn.cross_decomposition.PLSSVD
sklearn.datasets
sklearn.decomposition
sklearn.dummy
sklearn.ensemble.HistGradientBoostingRegressor
(تجريبي)sklearn.ensemble.HistGradientBoostingRegressor
(تجريبي)sklearn.feature_extraction.image.grid_to_graph
sklearn.feature_extraction.image.img_to_graph
sklearn.feature_extraction.text.CountVectorizer
sklearn.feature_extraction.text.HashVectorizer
sklearn.feature_selection
sklearn.impute
sklearn.inspection.partial_dependence
sklearn.inspection.permutation_importance
sklearn.inspection.permutation_importance
sklearn.inspection.PartialDependenceDisplay
sklearn.inspection.plot_partial_dependence
sklearn.isotonic.IsotonicRegression
sklearn.isotonic.check_increasing
sklearn.isotonic.isotonic_regression
sklearn.kernel_approximation
sklearn.kernel_ridge
sklearn.linear_model.PassiveAggressiveClassifier
sklearn.linear_model.LassoLars
sklearn.linear_model.OrthogonalMatchingPursuit
sklearn.linear_model.HuberRegressor
sklearn.linear_model.RANSACRegressor
sklearn.linear_model.TheilSenRegressor
sklearn.linear_model.PassiveAggressiveRegressor
sklearn.linear_model.orthogonal_mp
sklearn.linear_model.orthogonal_mp_gram
sklearn.manifold
sklearn.metrics
(باستثناء sklearn.metrics.confusion_matrix
، sklearn.metrics.roc_auc_score
، sklearn.metrics.max_error
sklearn.metrics.mean_poisson_deviance
، sklearn.metrics.mean_gamma_deviance
، sklearn.metrics.mean_tweedie_deviance
، sklearn.metrics.plot_confusion_matrix
، sklearn.metrics.plot_precision_recall_curve
)sklearn.mixture
sklearn.model_selection.GridSearchCV
sklearn.model_selection.ParameterGrid
sklearn.model_selection.ParameterSampler
sklearn.model_selection.RandomizedSearchCV
sklearn.model_selection.fit_grid_point
sklearn.multiclass
sklearn.multioutput
sklearn.neural_network
sklearn.preprocessing
sklearn.random_projection
sklearn.tree.export_graphviz
sklearn.tree.export_text
sklearn.tree.plot_tree
sklearn.utils
أتمنى ألا يفوتني أي شيء.
مرحبا. سأذهب وأحاول القيام بتمرير في وثائق feature_selection
نأخذ جزء sklearn.mixture
أخذ جزء التحلل المتقاطع
بالنسبة لـ 2020 Scikit-Learn Sprint ، أنا و @ icoder18 نأخذ جزء sklearn.random_project
adrinjalali أكملنا sklearn / mix
العمل على sklearn.linear_model للسباق مع genvalen @
خذ sklearn.calibration.CalibratedClassifierCV
العمل على هذا من أجل sklearn.utils.validation
بعد ذلك سنتعامل مع sklearn.utils.random
العمل على sklearn.impute
العمل على sklearn.tree.plot_tree
الجدول 14 سيتناول sklearn.neural_network
خذ sklearn.kernel_approximation
أخذ sklearn.inspection
سيتطلب الجدول 14 معالجة sklearn.preprocessing
أخذ مجموعات البيانات
أخذ sklearn.mixture # 17509
تم تحديث القائمة.
شكرا لكم جميعا!
أخذ sklearn.metrics للعدو
أخذ نموذج_الاختيار الوحدة النمطية
glemaitre هل يمكننا تحديث وصف هذا ليشمل أنه من الأفضل إرسال ملف واحد في كل مرة؟
مرحبا اود المساهمة. هذه هي المرة الأولى لي رغم ذلك ... وليس من الواضح بالنسبة لي كيف يمكنني معرفة الوحدة التي لا يزال هناك عمل يتعين القيام به؟ شكرا !
https://github.com/scikit-learn/scikit-learn/issues/15761#issuecomment -639461778 يحتوي على قائمة الوحدات المتبقية لإصلاحها.
شكرا. خذ sklearn.decomposition إذن.
أنا أعمل على "sklearn.isotonic.isotonic_regression"
أنا أعمل على "sklearn.multiclass.py"
مرحبًا ، هل يمكنني محاولة أخذ المتبقي على sklearn.tree
؟ ستكون هذه أول مرة أساهم فيها أيضًا.
شكرا لتسجيل الوصول ، من الرائع الحصول على مساعدتك! الرجاء المتابعة؛ أعتقد أنه تم إغلاق جميع تحديثات العدو السريع.
في 4 تموز (يوليو) 2020 ، الساعة 10:45 ، كتب Ivan Wiryadi [email protected] :
مرحبًا ، هل يمكنني محاولة أخذ المتبقي على sklearn.tree؟ ستكون هذه أول مرة أساهم فيها أيضًا.-
أنت تتلقى هذا لأنك علقت.
قم بالرد على هذه الرسالة الإلكترونية مباشرةً ، أو اعرضها على GitHub ، أو قم بإلغاء الاشتراك.
مرحباً ، أود أن أقدم مساهمتي الأولى. هل يمكنني أخذ sklearn.multioutput؟
سأستمر مع sklearn.utils ، بدءًا من _encode.py
أعمل على sklearn/decomposition/_dict_learning.py
أنا أعمل على sklearn.kernel_ridge
في السباق
مرحبًا ، سأبدأ العمل على sklearn.feature_extraction.image.img_to_graph
أعمل على sklearn.feature_extraction.text.CountVectorizer
أعمل على sklearn.sklearn.kernel_ridge
أعمل على sklearn.ensemble.HistGradientBoostingRegressor
"أنا أعمل على هذا"
على هذا؟ هدى ١٣٩٤
"أنا أعمل على هذا"
على هذا؟ هدى ١٣٩٤
TahiriNadia تصحيح.
cgsavard مرحبًا ، هل يمكنني العمل على هذا؟ أنا أول مرة
سأعمل على الملفات في sklearn.datasets
.
هل يمكنني العمل على sklearn.linear_model._least_angle.py
glemaitre أعمل على sklearn.linear_model._least_angle.py
ووجدت تضاربًا في استخدام method ='lar'
أحيانًا يشير إلى lars
أحيانًا lar
، هذا التناقض موجود أيضًا الرمز (ليس فقط في التوثيق) ، أستطيع أن أرى أن lars
هو الرمز الصحيح ، هل يمكنك تأكيده ، وسأقوم بعمل PR.
العمل على 'sklearn/ensemble/_hist_gradient_boosting/binning.py'
الملفات بحاجة للتغيير:
sklearn / _config.py
sklearn / dummy.py
sklearn / multioutput.py
sklearn / linear_model / _huber.py
sklearn / linear_model / _theil_sen.py
sklearn / linear_model / _ridge.py
sklearn / linear_model / _omp.py
sklearn / linear_model / _sag.py
sklearn / externals / _lobpcg.py
sklearn / externals / _lobpcg.py
sklearn / utils / extmath.py
sklearn / utils / __ init__.py
sklearn / utils / graph.py
sklearn / utils / _mocking.py
sklearn / utils / sparsefuncs.py
sklearn / neighbors / _base.py
sklearn / gaussian_process / _gpc.py
sklearn / gaussian_process / kernels.py
sklearn / model_selection / _validation.py
~ sklearn / التحلل / _fastica.py ~
~ sklearn / التحلل / _dict_learning.py ~
~ sklearn / التحلل / _factor_analysis.py ~
~ sklearn / التحلل / _incremental_pca.py ~
~ sklearn / التحلل / _lda.py ~
~ sklearn / التحلل / _pca.py ~
~ sklearn / decomposition / _truncated_svd.py ~
~ sklearn / التحلل / _sparse_pca.py ~
~ sklearn / التحلل / _nmf.py ~
sklearn / المنوع / _mds.py
sklearn / manifold / _spectral_embedding.py
sklearn / manifold / _t_sne.py
sklearn / ensemble / _hist_gradient_boosting / grower.py
sklearn / ensemble / _hist_gradient_boosting / binning.py
sklearn / metrics / _ranking.py
sklearn / tree / _classes.py
sklearn / preprocessing / _discretization.py
sklearn / preprocessing / _encoders.py line 620
sklearn / neural_network / _multilayer_perceptron.py line 1054
sklearn / covariance / _robust_covariance.py
يرجى التحقق مما إذا كان شخص ما يعمل بالفعل / يعمل على الملف الذي اخترته
sadakmed ، لجميع "ملفات التحلل" ، هناك طلب سحب مستمر # 17739.
العمل على "gaussian_process.GaussianProcessRegressor"
و "neighbors._base.py"
مرحبًا ، أنا جديد وأود أن أبدأ بالمساهمة. هل ما زلت بحاجة إلى بعض المساعدة في هذه المسألة؟ هل هناك أي ملف ما زلت بحاجة إلى المساعدة بشأنه؟
ياboricles!
ألق نظرة على https://github.com/scikit-learn/scikit-learn/issues/15761#issuecomment -639461778 للحصول على قائمة بالوحدات التي لا يزال يتعين إصلاحها.
@ alfaro96 شكرا. لقد قمت بإلقاء نظرة سريعة الآن. سأختار وحدة الليلة ، وأعمل عليها.
أنا أعمل على sklearn / config_context
مرحبًا ، اعتقدت أنني سأرى ما إذا كان بإمكاني المساعدة في المستندات.
@ alfaro96 أود العمل على sklearn.feature_extraction.text.CountVectorizer
، إذا لم يتم أخذها بالفعل ، خاصة لأنني شخصياً واجهت بعض المزالق عند العمل مع Vectorizers في الماضي.
لاحظت أيضًا أنه على الرغم من تحديث sklearn.model_selection.learning_curve
، إلا أن هناك برنامجًا تعليميًا قديمًا يستخدم الوثائق القديمة ، فهل يجب أن أتركه؟ أم أنها تستحق التحديث؟
مرحبا @ alfaro96 ،
بعد التعديلات:
أرى أنه تم إصلاح sklearn.config_context
و sklearn.set_config
من sklearn.config_config.py
لذلك يمكن سحبها من قائمة المهام .
أرغب في العمل على sklearn.utils
. لقد رأيت مرة واحدة فقط مثيلاً لوثائق المعلمة حيث يتم استخدام "اختياري" فيه. وهذا يعني أنني بحاجة إلى إصلاح هذا المثال فقط ، أليس كذلك؟ إنه في sklearn.utils._mocking.py
مرحبًا ، اعتقدت أنني سأرى ما إذا كان بإمكاني المساعدة في المستندات.
مرحبًا madprogramer ،
@ alfaro96 أود العمل على
sklearn.feature_extraction.text.CountVectorizer
، إذا لم يتم أخذها بالفعل ، خاصة لأنني شخصياً واجهت بعض المزالق عند العمل مع Vectorizers في الماضي.
~ لقد ألقيت نظرة على قائمة التحقق والمرجع sklearn.feature_extraction.text.CountVectorizer
ولا يبدو أنه تم إصلاحه. العلاقات العامة ستكون موضع ترحيب
تحرير: تم إصلاح sklearn.feature_extraction.text.CountVectorizer
بالفعل.
لاحظت أيضًا أنه على الرغم من تحديث
sklearn.model_selection.learning_curve
، إلا أن هناك برنامجًا تعليميًا قديمًا يستخدم الوثائق القديمة ، فهل يجب أن أتركه؟ أم أنها تستحق التحديث؟
الأمر يستحق التحديث ، على الرغم من أن هذا يجب أن يتم في علاقات عامة منفصلة.
شكرا لك!
مرحبا @ alfaro96 ،
مرحبًا haiatn ،
بعد التعديلات:
أرى أنه تم إصلاحsklearn.config_context
وsklearn.set_config
منsklearn.config_config.py
لذلك يمكن سحبها من قائمة المهام .
لقد قمت بتحديث قائمة التحقق .
أرغب في العمل على
sklearn.utils
. لقد رأيت مرة واحدة فقط مثيلاً لوثائق المعلمة حيث يتم استخدام "اختياري" فيه. وهذا يعني أنني بحاجة إلى إصلاح هذا المثال فقط ، أليس كذلك؟ إنه فيsklearn.utils._mocking.py
هذه هي الفكرة ، على الرغم من أن الفئات الموجودة في ملف sklearn.utils._mocking.py
ليست جزءًا من واجهة برمجة التطبيقات العامة ، لذلك لا أعتقد أن الأمر يستحق تحديثها.
ومع ذلك ، سيكون من الجيد أن تعمل في أي من الوظائف والفئات والوحدات النمطية الأخرى المعلقة ليتم إصلاحها.
شكرا لك!
نظرت إلى قائمة التحقق. مما رأيته يمكن التحقق من ما يلي من قائمة المراجعة:
sklearn.feature_extraction.image.img_to_graph
sklearn.isotonic.IsotonicRegression
sklearn.isotonic.check_increasing
sklearn.ensemble.HistGradientBoostingRegressor
لكن كل sklearn.ensemble
لا بأس بههل يمكنني العمل على sklearn.manifold._spectral_embedding
و sklearn.feature_extraction.text.HashVectorizer
؟ سأفعل ذلك في علاقات عامة منفصلة. أعتقد أنها الملفات الوحيدة المتبقية التي تحتاج إلى إصلاح (على افتراض أن sklearn.feature_extraction.text.CountVectorizer
مأخوذ).
نظرت إلى قائمة التحقق. مما رأيته يمكن التحقق من ما يلي من قائمة المراجعة:
sklearn.feature_extraction.image.img_to_graph
sklearn.isotonic.IsotonicRegression
sklearn.isotonic.check_increasing
شكرا haiatn ، لقد قمت بتحديث قائمة التحقق.
- لم أجد الملف
sklearn.ensemble.HistGradientBoostingRegressor
لكن كلsklearn.ensemble
لا بأس به
sklearn.ensemble.HistGradientBoostingClassifier
و sklearn.ensemble.HistGradientBoostingRegressor
موجودان في هذا الملف: scikit-learn/sklearn/ensemble/_hist_gradient_boosting/gradient_boosting.py
. ومع ذلك ، فقد تم إصلاحها بالفعل.
هل يمكنني العمل على
sklearn.manifold._spectral_embedding
وsklearn.feature_extraction.text.HashVectorizer
؟ سأفعل ذلك في علاقات عامة منفصلة. أعتقد أنها الملفات الوحيدة المتبقية التي تحتاج إلى إصلاح (على افتراض أنsklearn.feature_extraction.text.CountVectorizer
مأخوذ).
لقد ألقيت نظرة على الوحدة النمطية sklearn.manifold
و sklearn.feature_extraction.text.HashingVectorizer
وتم إصلاحها بالفعل (لقد قمت بتحديث قائمة التحقق وفقًا لذلك).
ومع ذلك ، هناك العديد من الوظائف في الوحدة النمطية sklearn.utils
والتي يجب أن تظل ثابتة.
شكرا haiatn ، نحن حقا نقدر مساعدتك!
سأعمل الآن على sklearn.utils._estimator_html_repr
و sklearn.utils.deprecation
و sklearn.utils._testing
سوف أنهي sklearn.utils. لا يوجد سوى 3 ملفات وجدتها بحاجة إلى إصلاح.
مرحبا @ alfaro96 ،
هل يمكنك مراجعة طلبات السحب المفتوحة الخاصة بي؟ اعتقد انهم الاخير
ياhaiatn!
لقد ألقيت بالفعل نظرة على العلاقات العامة المفتوحة الخاصة بك.
شكرا لك!
الآن بعد أن دمجنا ما تم استبعاده من sklearn.utils وكان الأخير في قائمة التحقق ، هل انتهينا؟
يوجد طلب سحب أخير مفتوح # 18025 ، ثم يمكن إغلاق هذه المشكلة في النهاية.
مرحبا،
أريد أن أبدأ المساهمة. هل هناك أي فئة معلقة لإصلاح مستند القيم الافتراضية؟ إن وجدت ، يمكنني تناولها.
مرحبًا بك جديد في المصدر المفتوح ، فأنا أتطلع إلى إصلاح المستند بأي فرصة يتم ترك شيء يحتاج إلى الإصلاح
التعليق الأكثر فائدة
من الناحية المنطقية ، إذا كانت المعلمة اختيارية ، ألا يجب أن تكون القيمة الافتراضية هي
None
دائمًا؟ يقترح وجود معلمة ذات قيمة افتراضية بخلافNone
أنها يجب أن تكون مطلوبة.إذا كان هناك قيمة افتراضية ، فهذا يعني عادةً أن الأدبيات قد وجدت أن هذه قيمة افتراضية معقولة والتي تشير أيضًا إلى أن هذه المعلمة لها تأثير على الأداء وبالتالي لا ينبغي أن تكون اختيارية ، ولكن يجب أن تذكر فقط ما هو الافتراضي. تلك تبدو أقرب إلى المعلمات المطلوبة بحكم التعريف ، لقد صادفنا للتو اتخاذ خيار معقول للمستخدم حتى يتمكن من تغييره أو لا.
أو من الناحية العملية ، هل هناك حاليًا أي معلمات اختيارية وجدناها تحتوي على قيم افتراضية رقمية ، ولكن تحديد
None
سيؤدي إلى استثناء؟ قد يشير ذلك أيضًا إلى أن المعلمة مطلوبة بالفعل ، ولكن تم اختيار قيمة افتراضية معقولة بناءً على الأدبيات / الأبحاث.أو ربما كنت أخلط بين معنى
required
وoptional
كل هذه السنوات؟ مضحك جدا. بالتأكيد أحب المساعدة في هذا في كلتا الحالتين!