μ°λ¦¬λ μ΅κ·Όμ λ€λ₯Έ κ²λ€ μ¬μ΄μμ κ³΅ν΅ λ§€κ°λ³μλ₯Ό μ€λͺ
νλ μ©μ΄μ§ μ λ¬Έμμ μΆκ°νμ΅λλ€. μ΄μ random_state
맀κ°λ³μμ λν μ€λͺ
μ λ체νμ¬ λ³΄λ€ κ°κ²°νκ³ μ 보λ₯Ό μ 곡ν΄μΌ ν©λλ€(#10415 μ°Έμ‘°). μλ₯Ό λ€μ΄ λμ
random_state : int, RandomState instance or None, optional, default: None
If int, random_state is the seed used by the random number generator;
If RandomState instance, random_state is the random number generator;
If None, the random number generator is the RandomState instance used
by `np.random`.
KMeansμ MiniBatchKMeans λͺ¨λμμ λ€μμ΄ μμ μ μμ΅λλ€.
KMeans:
random_state : int, RandomState instance, default=None
Determines random number generation for centroid initialization.
Pass an int for reproducible results across multiple function calls.
See :term:`Glossary <random_state>`.
MiniBatchKMeans:
random_state : int, RandomState instance, default=None
Determines random number generation for centroid initialization and
random reassignment.
Pass an int for reproducible results across multiple function calls.
See :term:`Glossary <random_state>`.
λ°λΌμ random_state
κ° μκ³ λ¦¬μ¦μ λ―ΈμΉλ μν₯μ λν΄ μ€λͺ
ν΄μΌ ν©λλ€.
μ΄ λ³κ²½μ κΈ°μ¬νλ λ° κ΄μ¬μ΄ μλ κΈ°μ¬μλ μ²μμ ν λ²μ νλμ λͺ¨λμ μνν΄μΌ ν©λλ€.
μμ ν estimator λͺ©λ‘μ λ€μκ³Ό κ°μ΅λλ€.
kwinata μ€ν¬λ¦½νΈλ₯Ό μ¬μ©νμ¬ μμ ν νμΌ λͺ©λ‘
[x] [sklearn/ensemble/_hist_gradient_boosting/binning.py](https://github.com/scikit-learn/scikit-learn/blob/master/sklearn/ensemble/_hist_gradient_boosting/binning.py) - 37 , 112
[x] [sklearn/ensemble/_bagging.py](https://github.com/scikit-learn/scikit-learn/blob/master/sklearn/ensemble/_bagging.py) - 503 , 902
μλ νμΈμ @jnothman , μ΄ λ¬Έμ λ₯Ό
λͺ¨λ/νμ ν¨ν€μ§λ₯Ό μμ²νκ³ κ°μμμ€...
2018λ 1μ 30μΌ 00:24μ Somya Anand [email protected]μ΄ λ€μκ³Ό κ°μ΄ μΌμ΅λλ€.
μλ νμΈμ @jnothman https://github.com/jnothman , μ΄ λ¬Έμ λ₯Ό ν΄κ²°ν μ μμ΅λκΉ? κ°μ¬ ν΄μ
β
λΉμ μ΄ μΈκΈλμκΈ° λλ¬Έμ μ΄κ²μ λ°λ κ²μ λλ€.
μ΄ μ΄λ©μΌμ μ§μ λ΅μ₯νκ³ GitHubμμ νμΈνμΈμ.
https://github.com/scikit-learn/scikit-learn/issues/10548#issuecomment-361243951 ,
λλ μ€λ λ μμκ±°
https://github.com/notifications/unsubscribe-auth/AAEz62ie2pMFVg7uM6_MVnmWKRX-efgHks5tPcaHgaJpZM4Rwij3
.
@jnothman μμ§ν΄μ μ£μ‘νμ§λ§ λͺ¨λ/νμ λͺ¨λμ λν΄ μμΈν μ€λͺ ν΄ μ£Όμκ² μ΅λκΉ? μλ₯Ό λ€μ΄ Kmeansμ κ°μ νμ ν¨ν€μ§λ₯Ό λ§μνμλ 건κ°μ?
@jnothmanμ΄ μλ―Ένλ λ°λ μλ₯Ό λ€μ΄ sklearn/cluster/k_means_.pyμ κ°μ΄ νλμ νμΌλ‘ μμνκ³ λ§¨ μ κ²μλ¬Όμμμ κ°μ΄ random_state
λ
μ€νΈλ§μ μ
λ°μ΄νΈνκ³ PRμ μ¬λ κ²μ
λλ€.
νμ ν¨ν€μ§λ sklearn.clusterμ κ°μ΅λλ€.
κ°μ¬ ν΄μ. κ·Έλ κ² νκ³ PRμ μ΄ κ²μ λλ€.
μλ νμΈμ! @jnothman
grid_search.pyμ νμλ λ€μ μ£Όμλ κ΅μ²΄νμκ² μ΅λκΉ? κ·νκ° κ³΅μ ν κ²κ³Ό λΉκ΅νμ¬ μΆκ° νμ μ΄ μμ΅λλ€.
random_state : int, RandomState instance or None, optional (default=None)
Pseudo random number generator state used for random uniform sampling
from lists of possible values instead of scipy.stats distributions.
If int, random_state is the seed used by the random number generator;
If RandomState instance, random_state is the random number generator;
If None, the random number generator is the RandomState instance used
by `np.random`.
grid_search.py ββλ° k_means.py(KMeans)λ₯Ό μ¬μ©ν μ μμ΅λλ€.
grid_search.pyλ₯Ό κ·Έλλ‘ λμμμ€. λ μ΄μ μ¬μ©λμ§ μμ΅λλ€. μ΅μννμλ μ·¨μ§λ€.
λ°λ³΅λκ³ μ©μ΄μ§μμ μ¬μ©ν μ μλ μ½ν
μΈ λ₯Ό
μ¬μ©μμκ² random_stateμ μν μ λν κ°μ₯ μ μ΅ν μ€λͺ
μ μ 곡ν©λλ€.
νΉμ μΆμ κΈ°.
@jnothman κ°μ¬ν©λλ€. μ΄ random_state μ 보λ₯Ό λ체νκΈ° μ μ μ΄λ¬ν μκ³ λ¦¬μ¦μ μ΄ν΄ν΄μΌ ν©λκΉ?
μκ³ λ¦¬μ¦μ κ΄λ²μνκ² μ΄ν΄ν΄μΌ νμ§λ§ λͺ¨λ μΈλΆ μ¬νμ μλλλ€.
κ·Έλ€μ ꡬν. random_state μμΉλ₯Ό μ°Ύμ μ μμ΄μΌ ν©λλ€.
μκ³ λ¦¬μ¦μ 무μμνκ° μμ ν λͺ
ννμ§ μμ κ²½μ° μ¬μ©λ©λλ€.
μ΄λ€ κ²½μ°μλ λ€μλ³΄λ€ ν¨μ¬ λ μμΈν μ 보λ₯Ό μ 곡νμ§ μλ κ²μ΄ μ μ ν μλ μμ΅λλ€.
μ©μ΄μ§μ μ°κ²°νκΈ°λ§ νλ©΄ λ©λλ€. μ΄λ»κ² λλμ§ μ§μΌλ΄μΌ ν κ²μ
λλ€.
μ’μ κ°μ¬ν©λλ€. μκ³ λ¦¬μ¦μ μ²μ²ν μ΄ν΄λ³΄κ² μ΅λλ€.
λ¬Έμ μΈμ¬,
μλ°€ λΌμ€ν κΈ°
ν 리νμ€νΈ #10614λ₯Ό μ΄μμ΅λλ€.
@aby0 μ μμ§ sklearn.cluster λͺ¨λμ μꡬνμ§
μ λ°μ΄νΈκ° μμ΅λκΉ? μ°λ¦¬μκ²λ κΈ΄ ν΄κ°μ΄λ―λ‘ λ΄κ° μ΄κ²μ μ νν μ μλμ§ μλ €μ£Όμμμ€.
μ΄λ―Έ #10731μ λν λ
μ€νΈλ§μ μ΄ν΄λ³΄κ³ μμΌλ―λ‘ datasets
λͺ¨λμ μ¬μ©νκ² μ΅λλ€.
λλ linear_model
λͺ¨λμ μ£Όμ₯νκ³ μμ΅λλ€. 곧 PRμ μ¬λ¦΄ κ²μ
λλ€. #11900 μ κΈ°.
λ€μμ decomposition
λͺ¨λμ μ²κ΅¬ν©λλ€.
μ΄ μμ μ μνν΄μΌ νλ λͺ¨λμ 체ν¬λ¦¬μ€νΈ:
μ¬λ°λ₯Έ κ· νμ μ μ§νλ λ°©λ²μ λν ν©μμ λλ¬νλ λ° λ¬Έμ κ° μμμ΅λλ€.
μ¬κΈ°, iirc
λ°λΌμ μμ λ³ν©λ μ΄μ PRμ μ£Όμλ₯Ό κΈ°μΈμ΄μμμ€.
@jnothman κ°μ¬ν©λλ€! intλ₯Ό μ λ¬ν λ μ¬νμ±μ μΈκΈνκΈ° μν΄ PRμ μ λ°μ΄νΈν©λλ€.
κ²ν κ° μλ£λλ©΄ λ€λ₯Έ PRμ λ€λ₯Έ λͺ¨λ λͺ¨λμ κΈ°κΊΌμ΄ μ¬μ©ν©λλ€...
곡λΆμ°μ μ£Όμ₯νκ³ μμ΅λλ€.
@BlackTeaAndCoffee λ λ¬Έμ λ¬Έμμ΄ νμμ΄ μμ§ νμ λμ§ μμμΌλ©° μ¬κΈ°μ λμ΄λ λ€λ₯Έ PRμ λν΄ λ Όμκ° μ§ν
λλ feature_extractionμ μ£Όμ₯νκ³ μλ€
@jnothman , @NicolasHug , λ°©κΈ #15222 λ° μ΄μ κ΄λ ¨λ λ§μ PRμ λ°κ²¬
μ€νλ¦°νΈμ λν΄ λͺ
ννκ² νκΈ° μν΄ λ κ°μ§ λ¬Έμ μ€ νλλ₯Ό μ’
λ£ν μ μλμ§ κΆκΈν©λλ€. κ·Έλ λ€λ©΄ μ΄λ€ λ¬Έμ μΈκ°μ? μ€λ³΅ μ 보λ₯Ό νΌν μ μκΈ° λλ¬Έμ
λλ€. νμ‘°ν΄ μ£Όμ
μ κ°μ¬ν©λλ€.
μ΄ λ¬Έμ μ λν΄ μμ§ λͺ»νμ΅λλ€(λ μ νμΈνμ΄μΌ ν¨). μ΄ λ¬Έμ λ₯Ό μν΄ https://github.com/scikit-learn/scikit-learn/issues/15222 λ₯Ό λ«κ² λμ΄ κΈ°μ©λλ€.
@jnothman μ견μ λ°λΌ μ΄ λ¬Έμ κ° '보ν΅' λ μ΄λΈμ λ°μ μκ²©μ΄ μμ΅λκΉ?
μ°λ¦¬λ μμλΈ/_hist_gradient_boosting/binningμμ μμ
νκ³ μΆμ΅λλ€.
@mojc μ λ.
@anaisabeldhero μ μ λ 맀λν΄λμμ μμ
νκ³ μΆμ΅λλ€/*
#wimlds #SciKitLearnSprint
@daphn3k κ·Έλ¦¬κ³ λλ sklearn/gaussian_process/μμ μμ ν κ²μ λλ€
sklearn/preprocessing/_data.py - 2178, 2607μμ μμ
νκ³ μΆμ΅λλ€.
@rachelcjordan λ° @fabi-cast
λμ @Malesche λ sklearn/inspection/_permutation_importance.pyλ₯Ό λ°κ³ μΆμ΅λλ€.
sklearn/metrics/cluster/_unsupervised.py νμΌμ μꡬν©λλ€! #wimlds
@daphn3k μ λλ 곡λΆμ°/*κ³Ό μ΄μ/*λ μ·¨νλ€ #wimlds
μ£Όμ₯νλ€:
sklearn/dummy.py - 59
sklearn/multioutput.py - 578, 738
sklearn/kernel_approximation.py - 41, 143, 470
sklearn/multiclass.py - 687
sklearn/random_projection.py - 178, 245, 464, 586
PSA: μλ¬Έμ μ¬μ©νμΈμ.
μ¬λ¬ ν¨μ νΈμΆμμ μ¬ν κ°λ₯ν κ²°κ³Όλ₯Ό μν΄ intλ₯Ό μ λ¬ν©λλ€.
νμ¬ PRμμ λ³΄κ³ μλ κ² λμ :
μμμ±μ κ²°μ μ μΌλ‘ λ§λ€λ €λ©΄ intλ₯Ό μ¬μ©νμμμ€.
RNGλ μ λ¬λ λ΄μ©μ κ΄κ³μμ΄ νμ κ²°μ μ μ΄λ―λ‘ μ ννμ§ μμ΅λλ€.
CC @adrinjalali λΉμ μ΄ μ€νλ¦°νΈμ μλ€κ³ μκ°νκΈ° λλ¬Έμ
μ κ²½λ§ λ° νΌν© μμ
PSA: μλ¬Έμ μ¬μ©νμΈμ.
μ¬λ¬ ν¨μ νΈμΆμμ μ¬ν κ°λ₯ν κ²°κ³Όλ₯Ό μν΄ intλ₯Ό μ λ¬ν©λλ€.
νμ¬ PRμμ λ³΄κ³ μλ κ² λμ :
μμμ±μ κ²°μ μ μΌλ‘ λ§λ€λ €λ©΄ intλ₯Ό μ¬μ©νμμμ€.
RNGλ μ λ¬λ λ΄μ©μ κ΄κ³μμ΄ νμ κ²°μ μ μ΄λ―λ‘ μ ννμ§ μμ΅λλ€.
CC @adrinjalali λΉμ μ΄ μ€νλ¦°νΈμ μλ€κ³ μκ°νκΈ° λλ¬Έμ
μλ νμΈμ @NicolasHug μ΄κ²μ PRμ λκΈμ λ¬κΈ° μν κ²μ΄μμ΅λλ€... μ΄λ μͺ½μΈκ°μ? :)
scikit-learn/sklearn/model_selection/_validation.pyμμ μμ ν μμ μ λλ€.
@cmarmo λͺ¨λ PRμ λν μΌλ°μ μΈ μ견μ΄μμ΅λλ€. λλ νλλ₯Ό λ³΄κ³ κ±°κΈ°μ λκΈμ λ¬μκ³ , λ λ²μ§Έ κ²μ λ³΄κ³ κ·Έκ²μ΄ μμ€μμ λ μ λ€λ£¨μ΄μ§ ν¨ν΄μ΄λΌλ κ²μ μμλμ΅λλ€.
@cmarmo λͺ¨λ PRμ λν μΌλ°μ μΈ μ견μ΄μμ΅λλ€. λλ νλλ₯Ό λ³΄κ³ κ±°κΈ°μ λκΈμ λ¬μκ³ , λ λ²μ§Έ κ²μ λ³΄κ³ κ·Έκ²μ΄ μμ€μμ λ μ λ€λ£¨μ΄μ§ ν¨ν΄μ΄λΌλ κ²μ μμλμ΅λλ€.
μ£μ‘ν©λλ€ @NicolasHug , μ£μ‘ν©λλ€. λκΈμ μ½κ² μΆμ ν μ μμμ΅λλ€.
@NicolasHug @anaisabeldhero μ μ μ 컀λ°μμ μλ³Έ λ¬Έμ₯μ΄ μμ λμμ΅λλ€.
λμ @Olks λ sklearn/utils/extmath.pyλ₯Ό μ£Όμ₯ν©λλ€ - 185, 297
sklearn/ensemble/_iforest.py μ²κ΅¬ - 109
sklearn/neural_network/_multilayer_perceptron.py μ²κ΅¬ - 782, 1174
sklearn/ensemble/_weight_boosting.py μ²κ΅¬ - 188, 324, 479, 900, 1022
sklearn/multioutput.py μ²κ΅¬ - 578, 738
μ£Όμ₯νλ€ :
sklearn/νΌν©/_bayesian_mixture.py - 166
sklearn/νΌν©/_base.py - 139
sklearn/mixture/_gaussian_mixture.py - 504
sklearn/ensemble/_gb.py μ²κ΅¬ - 887, 1360
sklearn/ensemble/_hist_gradient_boosting/gradient_boosting.py μ²κ΅¬ - 736, 918
sklearn/neural_network/_rbm.py μ²κ΅¬ - 59
μ£Όμ₯νλ€ :
sklearn/svm/_classes.py - 90, 312, 546, 752
sklearn/svm/_base.py - 853
μ£Όμ₯νλ€:
sklearn/feature_selection/_mutual_info.py - 226, 335, 414
sklearn/metrics/cluster/_unsupervised.py - 80
sklearn/utils/_testing.py - 521
sklearn/utils/init.py - 478, 623
μ£Όμ₯νλ€ :
sklearn/dummy.py - 59
sklearn/random_projection.py - 178, 245, 464, 586
@DatenBiene @GregoireMialon μ§λ μ€νλ¦°νΈ λμ λͺ¨λ κΈ°μ¬μ κ°μ¬λ립λλ€. 체ν¬λμ§ μμ λͺ¨λμ 3κ°λΏμ λλ€!
κ΄μ¬μ΄ μμΌμλκΉ / μκ°μ΄ μμΌμλκΉ / κ·Έλ¬ν λ¬Έμ λ₯Ό ν΄κ²°ν λκΈ°κ° μμΌμλκΉ (μλ° μμ!) ?
μλ νμΈμ μ λ λ―Έμ λλ€! μ‘°λ§κ° νλ² λ³΄λλ‘ ν κ²μ
λ₯΄λ©λ₯΄. 12μ΄ 2020 Γ 15:53, JΓ©rΓ©mie du Boisberranger <
[email protected]> μν¬λ¦¬νΈ:
@DatenBiene https://github.com/DatenBiene @GregoireMialon
https://github.com/GregoireMialon λͺ¨λ κΈ°μ¬μ κ°μ¬λ립λλ€
μ§λ μ€νλ¦°νΈ λμ. 체ν¬λμ§ μμ λͺ¨λμ 3κ°λΏμ λλ€!κ΄μ¬μ΄ μμΌμλκΉ / μκ°μ΄ μμΌμλκΉ / κ·Έλ¬ν λ¬Έμ λ₯Ό ν΄κ²°ν λκΈ°κ° μμ΅λκΉ?
μλ ₯ !) ?β
λΉμ μ΄ μΈκΈλμκΈ° λλ¬Έμ μ΄κ²μ λ°λ κ²μ λλ€.
μ΄ μ΄λ©μΌμ μ§μ λ΅μ₯νκ³ GitHubμμ νμΈνμΈμ.
https://github.com/scikit-learn/scikit-learn/issues/10548?email_source=notifications&email_token=AFY4624NQL3EAFLBGPUNAE3RCQEO3A5CNFSM4EOCFD32YY3PNVWWK3TUL52HS4VVEXG4
λλ ꡬλ μ·¨μ
https://github.com/notifications/unsubscribe-auth/AFY4625457AU7OL4E4EUVOTRCQEO3ANCNFSM4EOCFD3Q
.
μλ νμΈμ @jeremiedbbμ λλ€! μ€λ λ¨μ λͺ¨λ 3κ°λ₯Ό μμ±νλλ‘ λ Έλ ₯νκ² μ΅λλ€ π
μ£Όμ₯νλ€:
sklearn/kernel_approximation.py - 41, 143, 470
sklearn/multiclass.py - 687
sklearn/μμλΈ/_base.py - 52
μλ νμΈμ @jnothman λ° @jeremiedbb , μμ λ λͺ¨λ νμΌμ²λΌ 보μ λλ€. λ¨μ μλ λ¬Έμ λ₯Ό μ°ΎμΌλ©΄ κΈ°κΊΌμ΄ λμλλ¦¬κ² μ΅λλ€.
@DatenBiene κ³Ό μ΄ λ¬Έμ λ₯Ό λ§λ¬΄λ¦¬νκΈ° μν΄ λ
Έλ ₯ν λͺ¨λ κΈ°μ¬μμκ² κ°μ¬λ립λλ€!
λλ μ°λ¦¬κ° μ΄ κ±°λν κ²μ λ«μ μ μλ€κ³ μκ°ν©λλ€!
random_state
μ€λͺ
μ λν΄ μ¬μ ν λλ½λ κ²μ΄ μλ κ²½μ° μλ‘μ΄ νΉμ λ¬Έμ λ₯Ό μμ λ‘κ² μ¬μμμ€.
κ°μ₯ μ μ©ν λκΈ
sklearn/preprocessing/_data.py - 2178, 2607μμ μμ νκ³ μΆμ΅λλ€.
@rachelcjordan λ° @fabi-cast
wimlds #SciKitLearnSprint