لقد أضفنا مؤخرًا مسردًا إلى وثائقنا ، والذي يصف المعايير المشتركة من بين أشياء أخرى. يجب علينا الآن استبدال أوصاف المعلمات random_state
لجعلها أكثر إيجازًا وإفادة (انظر # 10415). على سبيل المثال ، بدلاً من
random_state : int, RandomState instance or None, optional, default: None
If int, random_state is the seed used by the random number generator;
If RandomState instance, random_state is the random number generator;
If None, the random number generator is the RandomState instance used
by `np.random`.
في كل من KMeans و MiniBatchKMeans ، قد يكون لدينا:
KMeans:
random_state : int, RandomState instance, default=None
Determines random number generation for centroid initialization.
Pass an int for reproducible results across multiple function calls.
See :term:`Glossary <random_state>`.
MiniBatchKMeans:
random_state : int, RandomState instance, default=None
Determines random number generation for centroid initialization and
random reassignment.
Pass an int for reproducible results across multiple function calls.
See :term:`Glossary <random_state>`.
لذلك ، يجب أن يركز الوصف على تأثير random_state
على الخوارزمية.
يجب على المساهمين المهتمين بالمساهمة في هذا التغيير أن يأخذوا وحدة واحدة في كل مرة ، في البداية.
قائمة المقدر التي سيتم تعديلها هي كما يلي:
قائمة الملفات المراد تعديلها باستخدام البرنامج النصي kwinata
[x] [sklearn / ensemble / _hist_gradient_boosting / binning.py] (https://github.com/scikit-learn/scikit-learn/blob/master/sklearn/ensemble/_hist_gradient_boosting/binning.py) - 37 ، 112
[x] [sklearn / ensemble / _bagging.py] (https://github.com/scikit-learn/scikit-learn/blob/master/sklearn/ensemble/_bagging.py) - 503 ، 902
مرحبًا jnothman ، هل يمكنني التعامل مع هذه المشكلة؟ شكرا
اطلب وحدة / حزمة فرعية واذهب ...
في 30 يناير 2018 الساعة 00:24 ، كتبت Somya Anand [email protected] :
مرحبًا jnothman https://github.com/jnothman ، هل يمكنني التعامل مع هذه المشكلة؟ شكرا
-
أنت تتلقى هذا لأنه تم ذكرك.
قم بالرد على هذا البريد الإلكتروني مباشرة ، وقم بعرضه على GitHub
https://github.com/scikit-learn/scikit-learn/issues/10548#issuecomment-361243951 ،
أو كتم الخيط
https://github.com/notifications/unsubscribe-auth/AAEz62ie2pMFVg7uM6_MVnmWKRX-efgHks5tPcaHgaJpZM4Rwij3
.
jnothman أنا آسف لكوني ساذجًا ولكن هل يمكنك توضيح الوحدة / الوحدة الفرعية؟ أعني هل تشير إلى حزمة فرعية مثل Kmeans على سبيل المثال؟
أعتقد أن ما تعنيهjnothman هو مجرد البدء بملف واحد ، على سبيل المثال sklearn / الكتلة / k_means_.py ، قم بتحديث docstring random_state
كما في المنشور العلوي وافتح العلاقات العامة.
الحزمة الفرعية هي شيء مثل sklearn.cluster
شكرا. سيفعل ذلك ويفتح العلاقات العامة.
أهلا! تضمين التغريدة
هل ترغب أيضًا في استبدال التعليقات التالية كما هو موضح في Grid_search.py؟ لديهم خط إضافي مقارنة بالخط الذي تشاركه.
random_state : int, RandomState instance or None, optional (default=None)
Pseudo random number generator state used for random uniform sampling
from lists of possible values instead of scipy.stats distributions.
If int, random_state is the seed used by the random number generator;
If RandomState instance, random_state is the random number generator;
If None, the random number generator is the RandomState instance used
by `np.random`.
يمكنني أخذ Grid_search.py و k_means.py (KMeans).
اترك Grid_search.py وشأنه. تم إهماله. الفكرة هي تقليل
المحتوى المكرر والمتوفر في المسرد حتى نتمكن من ذلك
إعطاء المستخدمين وصفًا أكثر إفادة حول دور random_state في
مقدر معين.
شكراjnothman. هل سأحتاج إلى فهم هذه الخوارزميات قبل أن أتمكن من استبدال معلومات الحالة العشوائية هذه؟
ستحتاج إلى فهم الخوارزميات على نطاق واسع ، ولكن ليس كل تفاصيل
تنفيذها. سوف تحتاج إلى أن تكون قادرًا على العثور على مكان عشوائي
إذا كانت العشوائية في الخوارزمية غير واضحة تمامًا.
في بعض الحالات ، قد يكون من المناسب عدم إعطاء تفاصيل أكثر من
مجرد ربط معجم المصطلحات ؛ علينا أن نرى كيف ستسير الأمور.
حسنا شكرا لك. سأبدأ في استعراض الخوارزميات ببطء.
يعتبر،
شيفام راستوجي
لقد فتحت طلب سحب # 10614
منذ @ aby0 لم يطالب بوحدة sklearn.cluster حتى الآن. أود المطالبة بالوحدة بأكملها. يرجى إعلامي إذا كان بإمكاني العمل على ذلك أو يجب أن أعمل على شيء آخر.
أي تحديث يا شباب؟ إنها عطلة طويلة بالنسبة لنا ، لذا يرجى إعلامي إذا كان بإمكاني اختيار هذا.
سآخذ الوحدة النمطية datasets
نظرًا لأنني أتجول بالفعل في سلاسل المستندات هناك لـ # 10731.
أطالب بالوحدة linear_model
. سوف ترفع العلاقات العامة قريبا. # 11900 مرفوع.
المطالبة بالوحدة التالية decomposition
.
قائمة مرجعية للوحدات التي يلزم القيام بذلك فيها:
واجهتنا بعض الصعوبات في التوصل إلى إجماع حول كيفية تحقيق التوازن الصحيح
هنا ، iirc
لذلك انتبه إلى العلاقات العامة السابقة المدمجة أعلاه
jnothman شكرا! سيتم تحديث PRs لذكر قابلية التكاثر عند تمرير عدد صحيح.
على استعداد لتناول جميع الوحدات الأخرى في علاقات عامة أخرى ، بمجرد مراجعتها ...
أنا أدعي التغاير.
BlackTeaAndCoffee ، يرجى العلم ، لم يتم الانتهاء من تنسيق سلسلة المستند بعد ، وقد جرت المناقشات حول العلاقات العامة الأخرى المدرجة هنا. لذلك قد ترغب في إلقاء نظرة أيضًا.
أنا أدعي feature_extraction
jnothman ، NicolasHug ، اكتشفت للتو # 15222 وعددًا من العلاقات العامة المتعلقة به لم
من أجل توضيح الأمور للعدو السريع ، أتساءل عما إذا كان بإمكاننا إغلاق إحدى هاتين المسألتين: إذا كانت الإجابة بنعم ، أيهما؟ كما يمكنني تجنب تكرار المعلومات. شكرا لتعاونك.
لم أكن على علم بهذه المشكلة (كان ينبغي التحقق بشكل أفضل) ، ويسعدني إغلاق https://github.com/scikit-learn/scikit-learn/issues/15222 لصالح هذه المشكلة
باتباع تعليق jnothman ، ربما تستحق هذه المشكلة تصنيف "معتدل"؟
نريد العمل على المجموعة / _hist_gradient_boosting / binning.
mojc وأنا.
أنا و
#wimlds #SciKitLearnSprint
@ daphn3k وسأعمل على sklearn / gaussian_process /
نريد العمل على sklearn / preprocessing / _data.py - 2178، 2607
rachelcjordan و @ fabi-cast
أنا و Malesche نرغب في الحصول على sklearn / التفتيش / _permutation_importance.py
مطالبة بملف sklearn / metrics / الكتلة / _unsupervised.py! # شمر
@ daphn3k وأنا أيضًا نأخذ التباين المشترك / * والجيران / * #wimlds
مطالبة:
sklearn / dummy.py - 59
sklearn / multioutput.py - 578 ، 738
sklearn / kernel_approximation.py - 41، 143، 470
687- عبدالله
sklearn / random_project.py - 178 ، 245 ، 464 ، 586
PSA: الرجاء استخدام الجملة الأصلية
قم بتمرير int للحصول على نتائج قابلة للتكرار عبر مكالمات وظائف متعددة.
بدلاً من ما أراه في العلاقات العامة في الوقت الحالي:
استخدم int لجعل العشوائية حتمية
وهذا ليس صحيحًا ، نظرًا لأن RNG دائمًا حتمية بغض النظر عن ما تم تمريره
CCadrinjalali لأنني أعتقد أنك في السباق
العمل على الشبكة العصبية والمزيج
PSA: الرجاء استخدام الجملة الأصلية
قم بتمرير int للحصول على نتائج قابلة للتكرار عبر مكالمات وظائف متعددة.
بدلاً من ما أراه في العلاقات العامة في الوقت الحالي:
استخدم int لجعل العشوائية حتمية
وهذا ليس صحيحًا ، نظرًا لأن RNG دائمًا حتمية بغض النظر عن ما تم تمريره
CCadrinjalali لأنني أعتقد أنك في السباق
مرحبًا NicolasHug ، كان هذا يعني التعليق على العلاقات العامة على ما أعتقد ... أيهما؟ :)
ذاهب للعمل على scikit-learn / sklearn / model_selection / _validation.py
cmarmo كان هذا تعليقًا عامًا لجميع
cmarmo كان هذا تعليقًا عامًا لجميع
آسف NicolasHug ،
NicolasHug تم تصحيح الجملة الأصلية في الالتزامات من anaisabeldhero وأنا
يدعي Me andOlks أن sklearn / utils / extmath.py - 185 ، 297
المطالبة sklearn / ensemble / _iforest.py - 109
المطالبة sklearn / neural_network / _multilayer_perceptron.py - 782 ، 1174
المطالبة sklearn / ensemble / _weight_boosting.py - 188 ، 324 ، 479 ، 900 ، 1022
المطالبة sklearn / multioutput.py - 578 ، 738
مطالبة :
166
139
sklearn / mix / _gaussian_mixture.py - 504
المطالبة sklearn / ensemble / _gb.py - 887 ، 1360
المطالبة sklearn / ensemble / _hist_gradient_boosting / gradient_boosting.py - 736، 918
المطالبة sklearn / neural_network / _rbm.py - 59
مطالبة :
sklearn / svm / _classes.py - 90 ، 312 ، 546 ، 752
853
مطالبة:
sklearn / feature_selection / _mutual_info.py - 226 ، 335 ، 414
sklearn / metrics / الكتلة / _unsupervised.py - 80
521
sklearn / utils / init.py - 478 ، 623
مطالبة :
sklearn / dummy.py - 59
sklearn / random_project.py - 178 ، 245 ، 464 ، 586
DatenBieneGregoireMialon شكرا لجميع مساهماتكم خلال سباق الماضي. لا يوجد سوى 3 وحدات تركت دون رادع!
هل ستكون مهتمًا / لديك الوقت / لديك الدافع للتعامل مع هؤلاء (بدون ضغط!)؟
مرحبًا Jérémie! سأحاول إلقاء نظرة عليه قريبًا
لو مير. 12 فبراير. 2020، 15:53، جيرمي دو بوازبرانغر <
[email protected]> بريد إلكتروني:
DatenBiene https://github.com/DatenBieneGregoireMialon
https://github.com/GregoireMialon شكرًا لجميع مساهماتك
خلال آخر سباق. لا يوجد سوى 3 وحدات تركت دون رادع!هل ستكون مهتمًا / لديك وقت / لديك دافع للتعامل مع هؤلاء (لا
الضغط !) ؟-
أنت تتلقى هذا لأنه تم ذكرك.
قم بالرد على هذا البريد الإلكتروني مباشرة ، وقم بعرضه على GitHub
https://github.com/scikit-learn/scikit-learn/issues/10548؟email_source=notifications&email_token=AFY4624NQL3EAFLBGPUNAE3RCQEO3A5CNFSM4EOCFD32YY3PNVWWK3TUL52HS4DFVREXG43VMVMv
أو إلغاء الاشتراك
https://github.com/notifications/unsubscribe-auth/AFY4625457AU7OL4E4EUVOTRCQEO3ANCNFSM4EOCFD3Q
.
مرحباjeremiedbb! سأحاول إنهاء الوحدات الثلاث المتبقية اليوم 😃
مطالبة:
sklearn / kernel_approximation.py - 41، 143، 470
687- عبدالله
52
مرحبًا jnothman و jeremiedbb ، يبدو أن جميع الملفات تم تعديلها. يسعدني تقديم المساعدة إذا وجدت أي مشكلات متبقية.
شكرًا جزيلاً DatenBiene وجميع المساهمين الذين عملوا على إغلاق هذه المشكلة!
أعتقد أنه يمكننا إغلاق هذا الضخم!
لا تتردد في فتح مشكلات محددة جديدة إذا كان هناك شيء لا يزال مفقودًا حول وصف random_state
.
التعليق الأكثر فائدة
نريد العمل على sklearn / preprocessing / _data.py - 2178، 2607
rachelcjordan و @ fabi-cast
wimlds #SciKitLearnSprint