Scikit-learn: рдЧреЛрд╡рд░ рд╕рдорд╛рдирддрд╛ рдЧреБрдгрд╛рдВрдХ рд▓рд╛рдЧреВ рдХрд░реЗрдВ

рдХреЛ рдирд┐рд░реНрдорд┐рдд 19 рдирд╡ре░ 2015  ┬╖  51рдЯрд┐рдкреНрдкрдгрд┐рдпрд╛рдБ  ┬╖  рд╕реНрд░реЛрдд: scikit-learn/scikit-learn

рдЬреИрд╕рд╛ рдХрд┐ @lesshaste . рджреНрд╡рд╛рд░рд╛ рд╕реБрдЭрд╛рдпрд╛ рдЧрдпрд╛ рд╣реИ

рдкреЗрдкрд░ - http://cbio.ensmp.fr/~jvert/svn/bibli/local/Gower1971general.pdf

рдкрд░реНрдпрд╛рдкреНрдд рд░реБрдЪрд┐ рд╣реЛрдиреЗ рдкрд░ рдореИрдВ рдЗрд╕реЗ рд▓рд╛рдЧреВ рдХрд░ рд╕рдХрддрд╛ рд╣реВрдВ?

@jnothman @amueller @agramfort

рд╕рдмрд╕реЗ рдЙрдкрдпреЛрдЧреА рдЯрд┐рдкреНрдкрдгреА

рдирдорд╕реНрддреЗ,

рдХрд┐рд╕реА рддрд░рд╣ рдпреЛрдЧрджрд╛рди рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП, рдореИрдВрдиреЗ рдореВрд▓ рдкреЗрдкрд░ рдХреЗ рдЕрдиреБрд╕рд╛рд░, рдФрд░ pdist рдореЙрдбреНрдпреВрд▓ рдореЗрдВ рдЖрд╡рд╢реНрдпрдХ рд╕рдВрдмрдВрдзрд┐рдд рдЕрдиреБрдХреВрд▓рди рдХреЗ рдЕрдиреБрд╕рд╛рд░, рдЧреЙрд╡рд░ рдлрд╝рдВрдХреНрд╢рди рдХреЛ рд▓рд╛рдЧреВ рдХрд┐рдпрд╛, рдХреНрдпреЛрдВрдХрд┐ рдЖрдВрддрд░рд┐рдХ рд░реВрдк рд╕реЗ pdist рдХрдИ рд╕рдВрдЦреНрдпрд╛рддреНрдордХ рдкрд░рд┐рд╡рд░реНрддрди рдХрд░рддрд╛ рд╣реИ рдЬреЛ рдорд┐рд╢реНрд░рд┐рдд рдбреЗрдЯрд╛ рдХреЗ рд╕рд╛рде рдореИрдЯреНрд░рд┐рдХреНрд╕ рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рдиреЗ рдкрд░ рд╡рд┐рдлрд▓ рд╣реЛ рдЬрд╛рдПрдЧрд╛ред

рдЗрд╕рдХреЗ рд╕рд╛рде рдореБрдЭреЗ рдЕрдм рддрдХ рдЬреЛ рдкрд░рд┐рдгрд╛рдо рдорд┐рд▓реЗ рд╣реИрдВ, рд╡реЗ R┬┤s рдбреЗрдЬрд╝реА рдлрдВрдХреНрд╢рди рд╕реЗ рд╕рдорд╛рди рд╣реИрдВред

рд╕реНрд░реЛрдд рдХреЛрдб рдЗрд╕ рдЬреНрдпреВрдкрд┐рдЯрд░ рдиреЛрдЯрдмреБрдХ рдкрд░ рдЙрдкрд▓рдмреНрдз рд╣реИ: https://sourceforge.net/projects/gower-distance-4python/files/

рдЗрд╕рдХрд╛ рдЗрд╕реНрддреЗрдорд╛рд▓ рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рд╕реНрд╡рддрдВрддреНрд░ рдорд╣рд╕реВрд╕ рдХрд░реЗрдВ

рд╕рднреА 51 рдЯрд┐рдкреНрдкрдгрд┐рдпрд╛рдБ

рдзрдиреНрдпрд╡рд╛рджред

R рд╕реЗ daisy рд▓рд┐рдП рдпрд╣ рджрд╕реНрддрд╛рд╡реЗрдЬрд╝реАрдХрд░рдг рднреА рдкреНрд░рд╛рд╕рдВрдЧрд┐рдХ рд╣реЛ рд╕рдХрддрд╛ рд╣реИ https://stat.ethz.ch/R-manual/R-devel/library/cluster/html/daisy.html рдХреНрдпреЛрдВрдХрд┐ рдпрд╣ рдЗрд╕рдХреЗ рд▓рд┐рдП рдПрдХ рд▓реЛрдХрдкреНрд░рд┐рдп рдЙрдкрдпреЛрдЧ рдорд╛рдорд▓рд╛ рд╣реИ рдЧреЛрд╡рд░ рдЧреБрдгрд╛рдВрдХред

рд╕реБрдЭрд╛рд╡ рджрд┐рдпрд╛ рдХрд╣рд╛рдБ? рдХрд┐рд╕ рд╕рдВрджрд░реНрдн рдореЗрдВ?

@agramfort рдореИрдВрдиреЗ рдЗрд╕реЗ daisy() рдкрд╣рд▓реЗ рдЙрд▓реНрд▓реЗрдЦ рдХрд┐рдпрд╛ рдЧрдпрд╛ рд╣реИ рдЬрдм рдорд┐рд╢реНрд░рд┐рдд рдкреНрд░рдХрд╛рд░ рдХреЗ рд╕рд╛рде рдбреЗрдЯрд╛ рдХреНрд▓рд╕реНрдЯрд░рд┐рдВрдЧ (https://cran.r-project.org/web/packages/cluster/cluster.pdf рдХрд╛ рдкреГрд╖реНрда 27 рджреЗрдЦреЗрдВ) . рдЕрдзрд┐рдХ рд╕рд╛рдорд╛рдиреНрдпрддрдГ http://www.clustan.talktalk.net/gower_similarity.html рдХрд╛ рджрд╛рд╡рд╛ рд╣реИ "рдЧреЛрд╡рд░ рдХрд╛ рд╕рд╛рдорд╛рдиреНрдп рд╕рдорд╛рдирддрд╛ рдЧреБрдгрд╛рдВрдХ рдорд┐рд╢реНрд░рд┐рдд рдбреЗрдЯрд╛ рдкреНрд░рдХрд╛рд░реЛрдВ рдХреЗ рд▓рд┐рдП рдирд┐рдХрдЯрддрд╛ рдХреЗ рд╕рдмрд╕реЗ рд▓реЛрдХрдкреНрд░рд┐рдп рдЙрдкрд╛рдпреЛрдВ рдореЗрдВ рд╕реЗ рдПрдХ рд╣реИред" рдЬреЛ рдПрдХ рдкреНрд░рд╢рдВрд╕рдиреАрдп рджрд╛рд╡реЗ рдХреА рддрд░рд╣ рд▓рдЧрддрд╛ рд╣реИред

рдХреНрдпрд╛ рдХреЛрдИ рдмреЗрдВрдЪрдорд╛рд░реНрдХ рдпрд╛ рдареЛрд╕ рдЙрджрд╛рд╣рд░рдг рд╣реИ рдЬреЛ рдЗрд╕реЗ рдкреНрд░реЗрд░рд┐рдд рдХрд░реЗрдЧрд╛?

@agramfort рдореБрдЭреЗ рд▓рдЧрддрд╛ рд╣реИ рдХрд┐ рдпрд╣ рдЕрдзрд┐рдХ рд╣реИ рдХрд┐ рд╡рд░реНрддрдорд╛рди рдореЗрдВ рдорд┐рд╢реНрд░рд┐рдд рдбреЗрдЯрд╛ рдкреНрд░рдХрд╛рд░реЛрдВ рдХреЗ рд▓рд┐рдП рдЕрд╕рдорд╛рдирддрд╛ рдЧреБрдгрд╛рдВрдХ рдХреА рдЧрдгрдирд╛ рдХрд░рдиреЗ рдХрд╛ рд╣рдорд╛рд░реЗ рдкрд╛рд╕ рдХреЛрдИ рдЕрдиреНрдп рддрд░реАрдХрд╛ рдирд╣реАрдВ рд╣реИ рдФрд░ рдпрд╣ рдорд╛рдирдХ рдкреНрд░рддреАрдд рд╣реЛрддрд╛ рд╣реИред рдореБрдЭреЗ рдмрд╣реБрдд рд╕рд╛рд░реЗ рдЙрджрд╛рд╣рд░рдг рдФрд░ рдкреНрд░рд╢реНрди/рдЙрддреНрддрд░ рдСрдирд▓рд╛рдЗрди рдорд┐рд▓ рд╕рдХрддреЗ рд╣реИрдВ рдЬрд╣рд╛рдВ рд▓реЛрдЧ рд╕рдордЭрд╛рддреЗ рд╣реИрдВ рдХрд┐ рдЧреЛрд╡рд░ рдЧреБрдгрд╛рдВрдХ рдХреНрдпрд╛ рд╣реИ рдпрд╛ рдорд┐рд╢реНрд░рд┐рдд рдбреЗрдЯрд╛ рдкреНрд░рдХрд╛рд░реЛрдВ рдХреЗ рд▓рд┐рдП рдЗрд╕рдХреЗ рдЙрдкрдпреЛрдЧ рдХрд╛ рд╕реБрдЭрд╛рд╡ рджреЗрддрд╛ рд╣реИ рд▓реЗрдХрд┐рди рдХреБрдЫ рднреА рдореИрдВ рдЕрднреА рддрдХ рдмреЗрдВрдЪрдорд╛рд░реНрдХ рдирд╣реАрдВ рдХрд╣ рд╕рдХрддрд╛ред Google рд╡рд┐рджреНрд╡рд╛рди рдХреЗ рдЕрдиреБрд╕рд╛рд░ рдореВрд▓ рдкреЗрдкрд░ рдХреЛ 2298 рдмрд╛рд░ рдЙрджреНрдзреГрдд рдХрд┐рдпрд╛ рдЧрдпрд╛ рд╣реИред

рдареАрдХ рд╣реИ рдореИрдВ рдЖрд╢реНрд╡рд╕реНрдд рд╣реВрдБ :)

@agramfort рдмрдврд╝рд┐рдпрд╛! рдпрд╣ рдкрд░рд┐рд╡рд░реНрддрди https://github.com/scikit-learn/scikit-learn/pull/4899 рдЕрдЪреНрдЫреА рддрд░рд╣ рд╕реЗ рдкреВрд░рдХ рд╣реЛрдЧрд╛ рдЬреЛ рдкреЗрдбрд╝реЛрдВ рдХреЗ рд▓рд┐рдП рдореВрд▓ рд╢реНрд░реЗрдгреАрдмрджреНрдз рдЪрд░ рд╕рдорд░реНрдерди рдХрд╛ рдкрд░рд┐рдЪрдп рджреЗрддрд╛ рд╣реИред

рдРрд╕рд╛ рдХрд╣рдиреЗ рдХреЗ рдмрд╛рдж, рдЕрдм рдореБрдЭреЗ рдПрд╣рд╕рд╛рд╕ рд╣реБрдЖ рд╣реИ рдХрд┐ рд╕реНрдХрд┐рдХрд┐рдЯ-рд▓рд░реНрди рдХреЗ рдкрд╛рд╕ рд╡рд░реНрддрдорд╛рди рдореЗрдВ рдСрд░реНрдбрд┐рдирд▓реНрд╕ рдХреЗ рд▓рд┐рдП рдХреЛрдИ рдореВрд▓ рд╕рдорд░реНрдерди рдирд╣реАрдВ рд╣реИ, рдЗрд╕рд▓рд┐рдП рдореЗрд░реЗ рд╕реБрдЭрд╛рд╡ рдХрд╛ рдпрд╣ рд╣рд┐рд╕реНрд╕рд╛ рдЕрдкрдиреЗ рд╕рдордп рд╕реЗ рдереЛрдбрд╝рд╛ рдЖрдЧреЗ рд╣реЛрдЧрд╛ред рдореБрдЭреЗ рд▓рдЧрддрд╛ рд╣реИ рдХрд┐ рдХреЛрдИ рдЗрд╕реЗ рд╕рдХрд╛рд░рд╛рддреНрдордХ рд░реВрдк рд╕реЗ рдХреНрд░рдорд┐рдХ рд╕реБрд╡рд┐рдзрд╛рдУрдВ рдХреЗ рд╕рдорд░реНрдерди рдореЗрдВ рдкрд╣рд▓рд╛ рдХрджрдо рдорд╛рди рд╕рдХрддрд╛ рд╣реИред

@amueller рдХреЛ [New Feature] рд╕рд╛рде рдЯреИрдЧ рдХрд┐рдпрд╛ рдЬрд╛рдирд╛ рд╣реИ ...

рдирдорд╕реНрддреЗ,

рдХрд┐рд╕реА рддрд░рд╣ рдпреЛрдЧрджрд╛рди рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП, рдореИрдВрдиреЗ рдореВрд▓ рдкреЗрдкрд░ рдХреЗ рдЕрдиреБрд╕рд╛рд░, рдФрд░ pdist рдореЙрдбреНрдпреВрд▓ рдореЗрдВ рдЖрд╡рд╢реНрдпрдХ рд╕рдВрдмрдВрдзрд┐рдд рдЕрдиреБрдХреВрд▓рди рдХреЗ рдЕрдиреБрд╕рд╛рд░, рдЧреЙрд╡рд░ рдлрд╝рдВрдХреНрд╢рди рдХреЛ рд▓рд╛рдЧреВ рдХрд┐рдпрд╛, рдХреНрдпреЛрдВрдХрд┐ рдЖрдВрддрд░рд┐рдХ рд░реВрдк рд╕реЗ pdist рдХрдИ рд╕рдВрдЦреНрдпрд╛рддреНрдордХ рдкрд░рд┐рд╡рд░реНрддрди рдХрд░рддрд╛ рд╣реИ рдЬреЛ рдорд┐рд╢реНрд░рд┐рдд рдбреЗрдЯрд╛ рдХреЗ рд╕рд╛рде рдореИрдЯреНрд░рд┐рдХреНрд╕ рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рдиреЗ рдкрд░ рд╡рд┐рдлрд▓ рд╣реЛ рдЬрд╛рдПрдЧрд╛ред

рдЗрд╕рдХреЗ рд╕рд╛рде рдореБрдЭреЗ рдЕрдм рддрдХ рдЬреЛ рдкрд░рд┐рдгрд╛рдо рдорд┐рд▓реЗ рд╣реИрдВ, рд╡реЗ R┬┤s рдбреЗрдЬрд╝реА рдлрдВрдХреНрд╢рди рд╕реЗ рд╕рдорд╛рди рд╣реИрдВред

рд╕реНрд░реЛрдд рдХреЛрдб рдЗрд╕ рдЬреНрдпреВрдкрд┐рдЯрд░ рдиреЛрдЯрдмреБрдХ рдкрд░ рдЙрдкрд▓рдмреНрдз рд╣реИ: https://sourceforge.net/projects/gower-distance-4python/files/

рдЗрд╕рдХрд╛ рдЗрд╕реНрддреЗрдорд╛рд▓ рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рд╕реНрд╡рддрдВрддреНрд░ рдорд╣рд╕реВрд╕ рдХрд░реЗрдВ

рдореИрдВ рдмрд╕ рд╕реЛрдЪ рд░рд╣рд╛ рдерд╛ рдХрд┐ рдХреНрдпрд╛ рдЗрд╕ рдкрд░ рдХреЛрдИ рдЕрдкрдбреЗрдЯ рдерд╛? рд╕рд╛рде рд╣реА, рдХреНрдпрд╛ @marcelobeckmann рджреНрд╡рд╛рд░рд╛ рдиреЛрдЯ рдХрд┐рдпрд╛ рдЧрдпрд╛ рдореБрджреНрджрд╛ рдЕрднреА рднреА рдкреНрд░рд╛рд╕рдВрдЧрд┐рдХ рд╣реИ?

@ ashimb9 рдРрд╕рд╛ рд▓рдЧрддрд╛ рд╣реИ рдХрд┐ рд╣рдореЗрдВ @marcelobeckmann . рд╕реЗ рдХреЛрдб рдХреЛ рдПрдХреАрдХреГрдд рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рдХрд┐рд╕реА рдХреА рдЖрд╡рд╢реНрдпрдХрддрд╛ рд╣реИ

@agramfort рд╣рдореНрдо, рдЙрд╕ рд╕реНрдерд┐рддрд┐ рдореЗрдВ рдЬрдм рдореЗрд░реЗ рдкрд╛рд╕ рдХреБрдЫ рдЦрд╛рд▓реА рд╕рдордп рд╣реЛрдЧрд╛ рддреЛ рдореБрдЭреЗ рдЬрд╛рдирд╛ рд╣реЛрдЧрд╛ред рд╡реИрд╕реЗ, рдХреНрдпрд╛ рдЖрдкрдХреЛ рдКрдкрд░ рдмрддрд╛рдП рдЧрдП рдореБрджреНрджреЗ рдХреА рд╡рд░реНрддрдорд╛рди рд╕реНрдерд┐рддрд┐ рдХреЗ рдмрд╛рд░реЗ рдореЗрдВ рдХреБрдЫ рднреА рдкрддрд╛ рд╣реИ: "pdist рдореЙрдбреНрдпреВрд▓ рдореЗрдВ, рдХреНрдпреЛрдВрдХрд┐ рдЖрдВрддрд░рд┐рдХ рд░реВрдк рд╕реЗ pdist рдХрдИ рд╕рдВрдЦреНрдпрд╛рддреНрдордХ рдкрд░рд┐рд╡рд░реНрддрди рдХрд░рддрд╛ рд╣реИ рдЬреЛ рдорд┐рд╢реНрд░рд┐рдд рдбреЗрдЯрд╛ рдХреЗ рд╕рд╛рде рдореИрдЯреНрд░рд┐рдХреНрд╕ рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рдиреЗ рдкрд░ рд╡рд┐рдлрд▓ рд╣реЛ рдЬрд╛рдПрдЧрд╛"

рдирдорд╕реНрддреЗ, pdist рдореЗрдВ рдХреБрдЫ рдирд┐рдЬреА рдХрд╛рд░реНрдп (рдЬреИрд╕реЗ, _convert_to_double, _copy_array_if_base_present) рд╣реИрдВ рдЬреЛ рдорд╛рдирддреЗ рд╣реИрдВ рдХрд┐ рдЕрдВрддрд░реНрдирд┐рд╣рд┐рдд рдбреЗрдЯрд╛ рдкреВрд░реА рддрд░рд╣ рд╕реЗ рд╕рдВрдЦреНрдпрд╛рддреНрдордХ рд╣реИ, рдЬреЛ рддрдм рд╕рддреНрдп рдирд╣реАрдВ рд╣реИ рдЬрдм рдЖрдкрдХреЗ рдкрд╛рд╕ рд╢реНрд░реЗрдгреАрдмрджреНрдз рдбреЗрдЯрд╛ рдХреЗ рд╕рд╛рде рдбреЗрдЯрд╛рдлрд╝реНрд░реЗрдо рд╣реЛред

рдореИрдВ рд╕реНрд╡реЗрдЪреНрдЫрд╛ рд╕реЗ рдЗрд╕ рдХреЛрдб рдХреЛ рдПрдХреАрдХреГрдд рдХрд░рддрд╛ рд╣реВрдВ рдФрд░ рдЗрд╕реЗ рдПрдХ рдХрд╛рдВрдЯреЗ рдореЗрдВ рдЙрдкрд▓рдмреНрдз рдХрд░рд╛рддрд╛ рд╣реВрдВ, рдЖрдк рдореБрдЭреЗ рдпрд╣ рдЯрд┐рдХрдЯ рджреЗ рд╕рдХрддреЗ рд╣реИрдВред

рдЬреАрдердм рдЕрд╕рд╛рдЗрдирдореЗрдВрдЯ рдлреАрдЪрд░ рдХреЗрд╡рд▓ рдЯреАрдо рдХреЗ рд╕рджрд╕реНрдпреЛрдВ рдХреЗ рд▓рд┐рдП рдХрд╛рдо рдХрд░рддрд╛ рд╣реИ

17 рдЬреБрд▓рд╛ 2017 7:32 pm рдкрд░, "marcelobeckmann" [email protected] рд▓рд┐рдЦрд╛ рд╣реИ:

рдирдорд╕реНрддреЗ, рдХреБрдЫ рдирд┐рдЬреА рдХрд╛рд░реНрдп рд╣реИрдВ (рдЬреИрд╕реЗ, _convert_to_double,
_copy_array_if_base_present) pdist рдореЗрдВ рдЬреЛ рдорд╛рди рд▓реЗрддреЗ рд╣реИрдВ рдХрд┐ рдЕрдВрддрд░реНрдирд┐рд╣рд┐рдд рдбреЗрдЯрд╛ рд╣реИ
рдкреВрд░реА рддрд░рд╣ рд╕реЗ рд╕рдВрдЦреНрдпрд╛рддреНрдордХ, рдЬреЛ рд╕рдЪ рдирд╣реАрдВ рд╣реИ рдЬрдм рдЖрдкрдХреЗ рдкрд╛рд╕ рдбреЗрдЯрд╛рдлрд╝реНрд░реЗрдо рд╣реИ
рд╕реБрд╕реНрдкрд╖реНрдЯ рдбреЗрдЯрд╛ред

рдореИрдВ рд╕реНрд╡реЗрдЪреНрдЫрд╛ рд╕реЗ рдЗрд╕ рдХреЛрдб рдХреЛ рдПрдХреАрдХреГрдд рдХрд░рддрд╛ рд╣реВрдВ рдФрд░ рдЗрд╕реЗ рдПрдХ рдХрд╛рдВрдЯреЗ рдореЗрдВ рдЙрдкрд▓рдмреНрдз рдХрд░рд╛рддрд╛ рд╣реВрдВ, рдЖрдк
рдпрд╣ рдЯрд┐рдХрдЯ рдореБрдЭреЗ рд╕реМрдВрдк рд╕рдХрддреЗ рд╣реИрдВред

-
рдЖрдк рдЗрд╕реЗ рдкреНрд░рд╛рдкреНрдд рдХрд░ рд░рд╣реЗ рд╣реИрдВ рдХреНрдпреЛрдВрдХрд┐ рдЖрдкрдХрд╛ рдЙрд▓реНрд▓реЗрдЦ рдХрд┐рдпрд╛ рдЧрдпрд╛ рдерд╛ред
рдЗрд╕ рдИрдореЗрд▓ рдХрд╛ рд╕реАрдзреЗ рдЙрддреНрддрд░ рджреЗрдВ, рдЗрд╕реЗ GitHub рдкрд░ рджреЗрдЦреЗрдВ
https://github.com/scikit-learn/scikit-learn/issues/5884#issuecomment-315707830 ,
рдпрд╛ рдереНрд░реЗрдб рдХреЛ рдореНрдпреВрдЯ рдХрд░реЗрдВ
https://github.com/notifications/unsubscribe-auth/AAEz62L3HHzGsSerW5G3n-Z8rrNoV6mwks5sOyoTgaJpZM4Glm0p
.

рдХреЛрдИ рдЪрд┐рдВрддрд╛ рдирд╣реАрдВ, рдореИрдВ рдЗрд╕реЗ рдлреЛрд░реНрдХ рдХрд░ рджреВрдВрдЧрд╛ рдФрд░ рдЖрдк рдмрд╛рдж рдореЗрдВ рдХреЛрдб рдкреНрд░рд╛рдкреНрдд рдХрд░ рд╕рдХрддреЗ рд╣реИрдВред рдореЗрд░реЗ рд▓рд┐рдП рдпреЛрдЧрджрд╛рди рджреЗрдирд╛ рдорд╣рддреНрд╡рдкреВрд░реНрдг рд╣реИред рдкреВрд░рд╛ рд╣реЛрдиреЗ рдкрд░ рдореИрдВ рдЖрдкрдХреЛ рдмрддрд╛ рджреВрдВрдЧрд╛ред

рдЗрд╕реЗ рд▓реЗрдиреЗ рдХреЗ рд▓рд┐рдП рдзрдиреНрдпрд╡рд╛рдж @marcelobeckmann ред рдЬрдм рдЖрдк рдЗрд╕ рдкрд░ рд╣реИрдВ (рдФрд░ рдпрджрд┐ рдпрд╣ рдЖрдкрдХреЗ рд▓рд┐рдП рд╕рдВрднрд╡ рд╣реИ), рддреЛ рдореИрдВ рд╕реЛрдЪ рд░рд╣рд╛ рдерд╛ рдХрд┐ рдХреНрдпрд╛ рдЖрдк NaN рдорд╛рдиреЛрдВ рдХреЗ рд╕рд╛рде рдбреЗрдЯрд╛ рдкрд░ рдЧреЙрд╡рд░ рдЧрдгрдирд╛ рдХреЗ рд▓рд┐рдП рд╕рдорд░реНрдерди рдЬреЛрдбрд╝рдиреЗ рдкрд░ рд╡рд┐рдЪрд╛рд░ рдХрд░реЗрдВрдЧреЗ, рдЬреИрд╕рд╛ рдХрд┐ R рдореЗрдВ рдбреЗрдЬрд╝реА рдкреИрдХреЗрдЬ рдореЗрдВ рд▓рд╛рдЧреВ рдХрд┐рдпрд╛ рдЧрдпрд╛ рд╣реИ (рдЬрд┐рд╕реЗ рдЖрдкрдиреЗ рдКрдкрд░ рднреА рд╕рдВрджрд░реНрднрд┐рдд рдХрд┐рдпрд╛ рд╣реИ) ?

рдореИрдВрдиреЗ рдЧреЙрд╡рд░ рдХрд╛ sklearn.metrics.pairwise рдореЗрдВ рдПрдХреАрдХрд░рдг рд╕рдорд╛рдкреНрдд рдХрд░ рджрд┐рдпрд╛ (NaN рдорд╛рдиреЛрдВ рдХреЗ рдЙрдкрдЪрд╛рд░ рдХреЛ рднреА рджреЗрдЦрддреЗ рд╣реБрдП)ред рдореИрдВ рдЕрдкрдирд╛ рдлреЛрд░реНрдХрдб рдХреЛрдб рдЬрдорд╛ рдХрд░рдиреЗ рд╕реЗ рдкрд╣рд▓реЗ рдХреБрдЫ рдпреВрдирд┐рдЯ рдкрд░реАрдХреНрд╖рдг рддреИрдпрд╛рд░ рдХрд░рдиреЗ рдЬрд╛ рд░рд╣рд╛ рд╣реВрдВред

@marcelobeckmann рдЧреНрд░реЗрдЯ! рд╡рд┐рд╢реЗрд╖ рд░реВрдк рд╕реЗ NaN рд╕рдорд░реНрдерди рдХреЛ рд╢рд╛рдорд┐рд▓ рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рдЖрдкрдХрд╛ рдмрд╣реБрдд-рдмрд╣реБрдд рдзрдиреНрдпрд╡рд╛рдж! :)

рдкреАрдПрд╕: рдЕрдЧрд░ рдореИрдВ рд╕реБрдЭрд╛рд╡ рджреЗ рд╕рдХрддрд╛ рд╣реВрдВ, рддреЛ рдЖрдк рдкреБрд▓ рдЕрдиреБрд░реЛрдз рд╢реБрд░реВ рдХрд░рдиреЗ рдкрд░ рд╡рд┐рдЪрд╛рд░ рдХрд░рдирд╛ рдЪрд╛рд╣реЗрдВрдЧреЗ рддрд╛рдХрд┐ рдЬрдм рдЖрдк рдпреВрдирд┐рдЯ рдкрд░реАрдХреНрд╖рдгреЛрдВ рдкрд░ рдХрд╛рдо рдХрд░рддреЗ рд╣реИрдВ рддреЛ рд╕рдореАрдХреНрд╖рдХ рдЖрдкрдХреЗ рдХреЛрдб рдХреЛ рджреЗрдЦрдирд╛ рд╢реБрд░реВ рдХрд░ рд╕рдХреЗрдВред

рдореИрдВрдиреЗ рдХреБрдЫ рджрд┐рди рдкрд╣рд▓реЗ рдПрдХ рдкреБрд▓ рдЕрдиреБрд░реЛрдз рдХрд┐рдпрд╛ рдерд╛, b5884ред

рд╣рд╛рдВ, рдпрд╣ рд╕рдореАрдХреНрд╖рд╛ рдХреЗ рд▓рд┐рдП рдХрддрд╛рд░ рдореЗрдВ рд╣реИред

17 рдЕрдЧрд╕реНрдд 2017 рдХреЛ 23:40 рдмрдЬреЗ, рдорд╛рд░реНрд╕реЗрд▓реЛ рдмреЗрдХрдореИрди рдиреЛрдЯрд┐рдлрд┐рдХреЗрд╢рди @github.com
рд▓рд┐рдЦрд╛ рдерд╛:

рдореИрдВрдиреЗ рдХреБрдЫ рджрд┐рди рдкрд╣рд▓реЗ рдПрдХ рдкреБрд▓ рдЕрдиреБрд░реЛрдз рдХрд┐рдпрд╛ рдерд╛, b5884ред

-
рдЖрдк рдЗрд╕реЗ рдкреНрд░рд╛рдкреНрдд рдХрд░ рд░рд╣реЗ рд╣реИрдВ рдХреНрдпреЛрдВрдХрд┐ рдЖрдкрдХрд╛ рдЙрд▓реНрд▓реЗрдЦ рдХрд┐рдпрд╛ рдЧрдпрд╛ рдерд╛ред
рдЗрд╕ рдИрдореЗрд▓ рдХрд╛ рд╕реАрдзреЗ рдЙрддреНрддрд░ рджреЗрдВ, рдЗрд╕реЗ GitHub рдкрд░ рджреЗрдЦреЗрдВ
https://github.com/scikit-learn/scikit-learn/issues/5884#issuecomment-323076581 ,
рдпрд╛ рдереНрд░реЗрдб рдХреЛ рдореНрдпреВрдЯ рдХрд░реЗрдВ
https://github.com/notifications/unsubscribe-auth/AAEz69uMu0XsoAUfvwWikkadjGCk5yvKks5sZELKgaJpZM4Glm0p
.

рдореИрдВрдиреЗ рд╕реАрдЖрдИ рджреНрд╡рд╛рд░рд╛ рдЖрд╡рд╢реНрдпрдХ рдкрд░рд┐рд╡рд░реНрддрди рдХрд┐рдП рд╣реИрдВ, рдФрд░ рд╕рднреА рдЪреЗрдХ рдкрд╛рд╕ рд╣реЛ рдЧрдП рд╣реИрдВред

@marcelobeckmann рдорд╣рд╛рди рдХрд╛рдо! рдЖрдк рдкрдВрдХреНрддрд┐ 659 рдХреЛ рдХреБрдЫ рдЗрд╕ рддрд░рд╣ рдмрджрд▓рдирд╛ рдЪрд╛рд╣ рд╕рдХрддреЗ рд╣реИрдВ:
ranges_of_numeric[col] = (1 - min / max, 0)[max == 0] if (max!=0) else 0.0

рдореИрдВ рдЕрдиреНрдпрдерд╛ рдЖрдкрдХреЗ рджреВрд╕рд░реЗ рдкрд░реАрдХреНрд╖рдг рдорд╛рдорд▓реЗ рдореЗрдВ рд╢реВрдиреНрдп-рдЪреЗрддрд╛рд╡рдиреА рд╕реЗ рд╡рд┐рднрд╛рдЬрди рдкреНрд░рд╛рдкреНрдд рдХрд░ рд░рд╣рд╛ рд╣реВрдВред

рдирдорд╕реНрддреЗ, рдореИрдВрдиреЗ рдкрд┐рдпрд░реЗ рд╡реЗрд╕рдореИрди рджреНрд╡рд╛рд░рд╛ рдкреНрд░рд╕реНрддрд╛рд╡рд┐рдд рдЪреЗрддрд╛рд╡рдирд┐рдпреЛрдВ рд╕реЗ рдмрдЪрдиреЗ рдХреЗ рд▓рд┐рдП рдХреЛрдб рдмрджрд▓ рджрд┐рдпрд╛ рд╣реИ, рдФрд░ рд╕реАрдЖрдИ рд╣рд░рд╛ рд╣реИред рдореБрдЭреЗ рдЕрдкрдиреЗ рдХреЛрдб рдХреА рд╕рдореАрдХреНрд╖рд╛ рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рдХрд┐рд╕реА рдХреА рдЖрд╡рд╢реНрдпрдХрддрд╛ рд╣реИред

@marcelobeckmann рдФрд░ рд╕рдВрднрд╛рд╡рд┐рдд рд░реВрдк рд╕реЗ рдЕрдиреНрдпред

рд╣рд╛рдп рдорд╛рд░реНрд╕реЗрд▓реЛ (рдпрд╛ рд╕рдВрднрд╛рд╡рд┐рдд рд░реВрдк рд╕реЗ рдЕрдиреНрдп), рдЧреЙрд╡рд░ рдЧреБрдгрд╛рдВрдХ рдХреЗ рдЖрдкрдХреЗ рдХрд╛рд░реНрдпрд╛рдиреНрд╡рдпрди рдХреЗ рд╕рдВрдмрдВрдз рдореЗрдВ рдХреБрдЫ рддреНрд╡рд░рд┐рдд рдкреНрд░рд╢реНрди рдкреНрд░рд╛рдкреНрдд рд╣реБрдП рд╣реИрдВ рдЬрд┐рдиреНрд╣реЗрдВ рдЖрдкрдиреЗ рдпрд╣рд╛рдВ рд░рдЦрд╛ рд╣реИ: https://sourceforge.net/projects/gower-distance-4python/files/ред

  1. рдХреНрдпрд╛ рдореБрдЭреЗ рдореВрд▓ рдбреЗрдЯрд╛ рдХреЛ рдлрд╝рдВрдХреНрд╢рди рдореЗрдВ рдлреАрдб рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рдПрдХ рдкрд╛рдВрдбрд╛ рдбреЗрдЯрд╛рдлрд╝реНрд░реЗрдо рдХреА рдЖрд╡рд╢реНрдпрдХрддрд╛ рд╣реИ рдпрд╛ рдХреНрдпрд╛ рдореИрдВ рдПрдХ рд╕реБрдиреНрди рд╕рд░рдгреА рдХрд╛ рднреА рдЙрдкрдпреЛрдЧ рдХрд░ рд╕рдХрддрд╛ рд╣реВрдВ?

  2. рдореИрдВ рдЕрдкрдирд╛ рдбреЗрдЯрд╛ рдПрдХ numpy рд╕рд░рдгреА рдореЗрдВ рдЖрдпрд╛рдд рдХрд░ рд░рд╣рд╛ рд╣реВрдБред рд╕рднреА рдХреЙрд▓рдо рдкрд╣рд▓реЗ рдХреЙрд▓рдо рдХреЗ рдЕрд▓рд╛рд╡рд╛ рд╕рдВрдЦреНрдпрд╛рддреНрдордХ рд╡рд╛рд╕реНрддрд╡рд┐рдХ рд╕рдВрдЦреНрдпрд╛рдПрдВ рд╣реИрдВ рдЬреЛ рдЕрджреНрд╡рд┐рддреАрдп рдЖрдИрдбреА рд╣реИред рдореБрдЭреЗ рджреЛ рдореБрджреНрджреЗ рдорд┐рд▓ рд░рд╣реЗ рд╣реИрдВ,

  • рд╕рдмрд╕реЗ рдкрд╣рд▓реЗ, рдЬрдм рдореИрдВ рдлрд╝рдВрдХреНрд╢рди рдЪрд▓рд╛рддрд╛ рд╣реВрдВ, рддреЛ рдпрд╣ рдбреЗрдЯрд╛ рд░реВрдкрд╛рдВрддрд░рдг рдЪреЗрддрд╛рд╡рдиреА рджреЗрддрд╛ рд╣реИ рдЬрд┐рд╕рдореЗрдВ рдХрд╣рд╛ рдЧрдпрд╛ рд╣реИ рдХрд┐ dtype U7 рдХреЛ рдСрдмреНрдЬреЗрдХреНрдЯ рдореЗрдВ рдмрджрд▓ рджрд┐рдпрд╛ рдЧрдпрд╛ рдерд╛ !!ред рдореБрдЭреЗ рд▓рдЧрддрд╛ рд╣реИ рдХрд┐ рдРрд╕рд╛ рдЗрд╕рд▓рд┐рдП рдерд╛ рдХреНрдпреЛрдВрдХрд┐ рдХрд┐рд╕реА рдХрд╛рд░рдг рд╕реЗ рд╕рд░рдгреА рдкреНрд░рд╡рд┐рд╖реНрдЯрд┐рдпрд╛рдВ рдЙрджреНрдзрд░рдг рдЪрд┐рд╣реНрдиреЛрдВ рдореЗрдВ рджрд┐рдЦрд╛рдИ рджреЗрддреА рд╣реИрдВ рдФрд░ рдЗрд╕рд▓рд┐рдП рд╕реНрдЯреНрд░рд┐рдВрдЧ рд╣реИрдВред рдЗрд╕рд▓рд┐рдП рдореИрдВрдиреЗ рдЙрджрд╛рд╣рд░рдг рдХреЗ рд▓рд┐рдП int32 рдореЗрдВ рд╕рд░рдгреА рдкреНрд░рд╡рд┐рд╖реНрдЯрд┐рдпреЛрдВ рдХрд╛ рдкреНрд░рдХрд╛рд░ рдбрд╛рд▓рд╛ рдФрд░ рдпрд╣ рдЕрднреА рднреА рд░реВрдкрд╛рдВрддрд░рдг рддреНрд░реБрдЯрд┐ рджреЗрддрд╛ рд╣реИ рдЬрд┐рд╕рдореЗрдВ рдХрд╣рд╛ рдЧрдпрд╛ рд╣реИ рдХрд┐ int32 рд╡рд╕реНрддреБрдУрдВ рдореЗрдВ рдкрд░рд┐рд╡рд░реНрддрд┐рдд рд╣реЛ рдЧрдпрд╛ рдерд╛

  • рджреВрд╕рд░рд╛, рдФрд░ рд╢рд╛рдпрдж рдКрдкрд░ рд╕реЗ рдЬреБрдбрд╝рд╛ рд╣реБрдЖ рд╣реИ, рд╣рд░ рдмрд╛рд░ рдЬрдм рдореИрдВ рдлрд╝рдВрдХреНрд╢рди рдЪрд▓рд╛рддрд╛ рд╣реВрдВ рдФрд░ рдкрд░рд┐рдгрд╛рдо рдХреА рд╕рд╛рдЬрд┐рд╢ рдХрд░рддрд╛ рд╣реВрдВ рддреЛ рдореБрдЭреЗ рдПрдХ рдЕрд▓рдЧ рд╡рд┐рдЬрд╝реБрдЕрд▓рд╛рдЗрдЬрд╝реЗрд╢рди (рдЕрдВрдХреЛрдВ рдХрд╛ рдЕрд▓рдЧ рдлреИрд▓рд╛рд╡) рдкреНрд░рд╛рдкреНрдд рд╣реЛрддрд╛ рд╣реИред

рдХреНрдпрд╛ рдЖрдк рдХреГрдкрдпрд╛ рдореБрдЭреЗ рдЙрдкрд░реЛрдХреНрдд рдкрд░ рд╕рд▓рд╛рд╣ рджреЗ рдкрд╛рдПрдВрдЧреЗ?

рдмрд╣реБрдд рдмрд╣реБрдд рдзрдиреНрдпрд╡рд╛рдж

рд╣рд╛рдп рдЕрд▓реА,

рдЧреЛрд╡рд░ рджреВрд░реА рдХреЗ рдЗрд╕ рдХрд╛рд░реНрдпрд╛рдиреНрд╡рдпрди рдореЗрдВ рдЖрдкрдХреА рд░реБрдЪрд┐ рдХреЗ рд▓рд┐рдП рдзрдиреНрдпрд╡рд╛рджред

рдЬрдмрдХрд┐ рдХреЛрдб рдЬрд┐рд╕реЗ рдореИрдВрдиреЗ рдкреБрд▓ рдЕрдиреБрд░реЛрдз рдХрд┐рдпрд╛ рдерд╛, рд╡рд╣ рд╕реНрдХрд┐рдХрд┐рдЯ рд▓рд░реНрди рдХрдорд┐рдЯрд░реНрд╕ рджреНрд╡рд╛рд░рд╛ рдЕрдиреБрдореЛрджрд┐рдд рдирд╣реАрдВ рд╣реИ (рд╕реАрдЖрдИ рд╣рд░рд╛ рд╣реИ рдФрд░ рд╕рд┐рд░реНрдл рдПрдХ рд╕рдореАрдХреНрд╖рд╛ рдХреА рдкреНрд░рддреАрдХреНрд╖рд╛ рдХрд░ рд░рд╣рд╛ рд╣реИ), рдореИрдВрдиреЗ рдЗрд╕ рдирд╡реАрдирддрдо рдФрд░ рд╕реНрдерд┐рд░ рдХрд╛рд░реНрдпрд╛рдиреНрд╡рдпрди рдХреЛ рдЖрдЧреЗ рдмрдврд╝рд╛рдпрд╛: https://sourceforge.net/projects/gower-distance -4python/files/gower_function-v3.ipynb/download

рдЖрдЗрдП рдЖрдкрдХреЗ рдкреНрд░рд╢реНрдиреЛрдВ рдХреЗ рд▓рд┐рдП рдЪрд▓рддреЗ рд╣реИрдВ:

  1. рдХреНрдпрд╛ рдореБрдЭреЗ рдореВрд▓ рдбреЗрдЯрд╛ рдХреЛ рдлрд╝рдВрдХреНрд╢рди рдореЗрдВ рдлреАрдб рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рдкрд╛рдВрдбрд╛ рдбреЗрдЯрд╛рдлрд╝реНрд░реЗрдо рдХреА рдЖрд╡рд╢реНрдпрдХрддрд╛ рд╣реИ рдпрд╛ рдХреНрдпрд╛ рдореИрдВ рдПрдХ рд╕реБрдиреНрди рд╕рд░рдгреА рдХрд╛ рднреА рдЙрдкрдпреЛрдЧ рдХрд░ рд╕рдХрддрд╛ рд╣реВрдВ?

рдЙрддреНрддрд░: рдЖрдк рдЗрд╕ рдирдП рд╕рдВрд╕реНрдХрд░рдг 3 рдореЗрдВ DataFrame рдпрд╛ Numpy рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░ рд╕рдХрддреЗ рд╣реИрдВред рд╕реНрдкрд╛рд░реНрд╕ рдореИрдЯреНрд░рд┐рд╕реЗрд╕ рднреА рд╕рдорд░реНрдерд┐рдд рд╣реИрдВред

  1. . рдореИрдВ рдЕрдкрдирд╛ рдбреЗрдЯрд╛ рдПрдХ numpy рд╕рд░рдгреА рдореЗрдВ рдЖрдпрд╛рдд рдХрд░ рд░рд╣рд╛ рд╣реВрдБред рд╕рднреА рдХреЙрд▓рдо рдкрд╣рд▓реЗ рдХреЙрд▓рдо рдХреЗ рдЕрд▓рд╛рд╡рд╛ рд╕рдВрдЦреНрдпрд╛рддреНрдордХ рд╡рд╛рд╕реНрддрд╡рд┐рдХ рд╕рдВрдЦреНрдпрд╛рдПрдВ рд╣реИрдВ рдЬреЛ рдЕрджреНрд╡рд┐рддреАрдп рдЖрдИрдбреА рд╣реИред рдореБрдЭреЗ рджреЛ рдореБрджреНрджреЗ рдорд┐рд▓ рд░рд╣реЗ рд╣реИрдВ,
  • рд╕рдмрд╕реЗ рдкрд╣рд▓реЗ, рдЬрдм рдореИрдВ рдлрд╝рдВрдХреНрд╢рди рдЪрд▓рд╛рддрд╛ рд╣реВрдВ, рддреЛ рдпрд╣ рдбреЗрдЯрд╛ рд░реВрдкрд╛рдВрддрд░рдг рдЪреЗрддрд╛рд╡рдиреА рджреЗрддрд╛ рд╣реИ рдЬрд┐рд╕рдореЗрдВ рдХрд╣рд╛ рдЧрдпрд╛ рд╣реИ рдХрд┐ dtype U7 рдХреЛ рдСрдмреНрдЬреЗрдХреНрдЯ рдореЗрдВ рдмрджрд▓ рджрд┐рдпрд╛ рдЧрдпрд╛ рдерд╛ !!ред рдореБрдЭреЗ рд▓рдЧрддрд╛ рд╣реИ рдХрд┐ рдРрд╕рд╛ рдЗрд╕рд▓рд┐рдП рдерд╛ рдХреНрдпреЛрдВрдХрд┐ рдХрд┐рд╕реА рдХрд╛рд░рдг рд╕реЗ рд╕рд░рдгреА рдкреНрд░рд╡рд┐рд╖реНрдЯрд┐рдпрд╛рдВ рдЙрджреНрдзрд░рдг рдЪрд┐рд╣реНрдиреЛрдВ рдореЗрдВ рджрд┐рдЦрд╛рдИ рджреЗрддреА рд╣реИрдВ рдФрд░ рдЗрд╕рд▓рд┐рдП рд╕реНрдЯреНрд░рд┐рдВрдЧ рд╣реИрдВред рдЗрд╕рд▓рд┐рдП рдореИрдВрдиреЗ рдЙрджрд╛рд╣рд░рдг рдХреЗ рд▓рд┐рдП int32 рдореЗрдВ рд╕рд░рдгреА рдкреНрд░рд╡рд┐рд╖реНрдЯрд┐рдпреЛрдВ рдХрд╛ рдкреНрд░рдХрд╛рд░ рдбрд╛рд▓рд╛ рдФрд░ рдпрд╣ рдЕрднреА рднреА рд░реВрдкрд╛рдВрддрд░рдг рддреНрд░реБрдЯрд┐ рджреЗрддрд╛ рд╣реИ рдЬрд┐рд╕рдореЗрдВ рдХрд╣рд╛ рдЧрдпрд╛ рд╣реИ рдХрд┐ int32 рд╡рд╕реНрддреБрдУрдВ рдореЗрдВ рдкрд░рд┐рд╡рд░реНрддрд┐рдд рд╣реЛ рдЧрдпрд╛ рдерд╛

рдЙрддреНрддрд░: рдпрд╣ рдирдпрд╛ рд╕рдВрд╕реНрдХрд░рдг рд╕рдВрдЦреНрдпрд╛рддреНрдордХ рд╢реНрд░реЗрдгреАрдмрджреНрдз рд╡рд┐рд╢реЗрд╖рддрд╛рдУрдВ рдХрд╛ рд╕рдорд░реНрдерди рдХрд░рддрд╛ рд╣реИ, рдПрдХ рдЕрддрд┐рд░рд┐рдХреНрдд рдкреИрд░рд╛рдореАрдЯрд░ categorical_features рд╣реИ, рдХрд┐ рдЖрдк рдЭреВрдареА (рд╕рдВрдЦреНрдпрд╛рддреНрдордХ рд╡рд┐рд╢реЗрд╖рддрд╛рдУрдВ рдХреЗ рд▓рд┐рдП) рдпрд╛ рд╕рддреНрдп (рд╢реНрд░реЗрдгреАрдмрджреНрдз рд▓реЛрдЧреЛрдВ рдХреЗ рд▓рд┐рдП) рдХреЗ рд╕рд╛рде рдПрдХ рд╕рд░рдгреА рд╕реЗрдЯ рдХрд░ рд╕рдХрддреЗ рд╣реИрдВред

  • рджреВрд╕рд░рд╛, рдФрд░ рд╢рд╛рдпрдж рдКрдкрд░ рд╕реЗ рдЬреБрдбрд╝рд╛ рд╣реБрдЖ рд╣реИ, рд╣рд░ рдмрд╛рд░ рдЬрдм рдореИрдВ рдлрд╝рдВрдХреНрд╢рди рдЪрд▓рд╛рддрд╛ рд╣реВрдВ рдФрд░ рдкрд░рд┐рдгрд╛рдо рдХреА рд╕рд╛рдЬрд┐рд╢ рдХрд░рддрд╛ рд╣реВрдВ рддреЛ рдореБрдЭреЗ рдПрдХ рдЕрд▓рдЧ рд╡рд┐рдЬрд╝реБрдЕрд▓рд╛рдЗрдЬрд╝реЗрд╢рди (рдЕрдВрдХреЛрдВ рдХрд╛ рдЕрд▓рдЧ рдлреИрд▓рд╛рд╡) рдкреНрд░рд╛рдкреНрдд рд╣реЛрддрд╛ рд╣реИред

рдЙрддреНрддрд░: рдореИрдВрдиреЗ рдЬрд┐рд╕ рдирдП рд╕рдВрд╕реНрдХрд░рдг рдХреЛ рдЖрдЧреЗ рдмрдврд╝рд╛рдпрд╛, рдЙрд╕рд╕реЗ рдЗрд╕ рд╕рдорд╕реНрдпрд╛ рдХрд╛ рд╕рдорд╛рдзрд╛рди рд╣реЛ рдЧрдпрд╛ред

рдзреНрдпрд╛рди рджреЗрдВ рдХрд┐ рдореИрдВ рдЗрд╕ рдкреАрдЖрд░ рдХреА рд╕рдореАрдХреНрд╖рд╛ рдХрд░рдиреЗ рдХрд╛ рдЗрд░рд╛рджрд╛ рд░рдЦрддрд╛ рд╣реВрдВ, рд▓реЗрдХрд┐рди рдпрд╣ рдмрд╣реБрдд рдЬреНрдпрд╛рджрд╛ рдирд╣реАрдВ рд╣реИ
рдкреНрд░рд╛рдердорд┐рдХрддрд╛ рдПрдЯреАрдПрдо

рд╣рд╛рдп рдЕрд▓реА,

  1. рдирд╡реАрдирддрдо gower_function-v3.ipynb рд╣реИ, рдФрд░ рд╣рд╛рдБ рдпрд╣ nan . рд╕реЗ рд╕рдВрдмрдВрдзрд┐рдд рд╣реИ
    рдкреНрд░рдЪрд╛рд░

  2. рдЖрдк gower_distance(X) рдХрд╛ рдЙрдкрдпреЛрдЧ рдХреЗрд╡рд▓ рддрднреА рдХрд░ рд╕рдХрддреЗ рд╣реИрдВ, рдЬрдм рдЖрдкрдХрд╛ рдХреИрдЯреЗрдЧрд░реАрдХрд▓ att рдирд╣реАрдВ рд╣реИ
    рд╕рдВрдЦреНрдпрд╛рддреНрдордХ, рдпрд╛ gower_distance(X, categorical_features=[рдЧрд▓рдд, рд╕рд╣реА,
    False,...]), рдпрджрд┐ рдЖрдкрдХреА рдмрд┐рд▓реНрд▓реА attr рдХреЛ рдЕрдВрдХреАрдп рдХреЗ рд░реВрдк рдореЗрдВ рджрд░реНрд╢рд╛рдпрд╛ рдЧрдпрд╛ рд╣реИред

рдЕрдЧрд░ рдЖрдкрдХреЛ рдХреЛрдИ рд╕рдорд╕реНрдпрд╛ рд╣реИ рддреЛ рдореБрдЭреЗ рдирд┐рдЬреА рддреМрд░ рдкрд░ рдмрддрд╛рдПрдВ, рдХреНрдпреЛрдВрдХрд┐ рдпрд╣ рдХрд╛рд░реНрдпрд╛рдиреНрд╡рдпрди
рдореИрдВрдиреЗ рдЗрдВрдЯрд░рдиреЗрдЯ рдкрд░ рдзрдХреЗрд▓ рджрд┐рдпрд╛, рд╕реНрдХрд┐рдХрд┐рдЯ рд▓рд░реНрдирд┐рдВрдЧ рдХреА рдЪрд┐рдВрддрд╛ рдирд╣реАрдВ рд╣реЛрдиреА рдЪрд╛рд╣рд┐рдП, рдЙрдирдХреЗ рдкрд╛рд╕ a
рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рдмрд╣реБрдд рдХреБрдЫ рд╣реИ, рдФрд░ рдпрд╣рд╛рдБ рдЗрд╕ рдкрд░ рдЪрд░реНрдЪрд╛ рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рд╕рдмрд╕реЗ рдЕрдЪреНрдЫреА рдЬрдЧрд╣ рдирд╣реАрдВ рд╣реИред

30 рдирд╡рдВрдмрд░ 2017 11:51 рдХреЛ, "рдЕрд▓реА-рд░реА" рдиреЛрдЯрд┐рдлрд┐рдХреЗрд╢рди @github.com рдиреЗ рд▓рд┐рдЦрд╛:

@marcelobeckmann https://github.com/marcelobeckmann

рд╣рд╛рдп рдорд╛рд░реНрд╕реЗрд▓реЛ (рдпрд╛ рд╕рдВрднрд╛рд╡рд┐рдд рд░реВрдк рд╕реЗ рдЕрдиреНрдп), рдЖрдкрдХреЗ рд╕рдВрдмрдВрдз рдореЗрдВ рдПрдХ рддреНрд╡рд░рд┐рдд рдкреНрд░рд╢реНрди рд╣реИ
рдЧреЙрд╡рд░ рдЧреБрдгрд╛рдВрдХ рдХрд╛ рдХрд╛рд░реНрдпрд╛рдиреНрд╡рдпрди рдЬреЛ рдЖрдкрдиреЗ рдпрд╣рд╛рдВ рд░рдЦрд╛ рд╣реИ:
https://sourceforge.net/projects/gower-distance-4python/files/

1.

рдХреНрдпрд╛ gower_single_function-v2.ipynb рдЕрдВрддрд┐рдо рд╕рдВрд╕реНрдХрд░рдг рд╣реИ рдФрд░ рдЗрд╕рд╕реЗ рд╕рдВрдмрдВрдзрд┐рдд рд╣реИ
рдиреИрди рднреА?
2.

рдЗрд╕рд╕реЗ рднреА рдорд╣рддреНрд╡рдкреВрд░реНрдг рдмрд╛рдд рдпрд╣ рд╣реИ рдХрд┐ рдХреНрдпрд╛ рдпрд╣ рдХрд╛рд░реНрдпрд╛рдиреНрд╡рдпрди рдЖрдкрдХреЛ рдкреНрд░рд╛рдкреНрдд рдХрд░рдиреЗ рдХреА рдЕрдиреБрдорддрд┐ рджреЗрддрд╛ рд╣реИ
рдПрдХ рдПрдХрд▓ рдирдореВрдирд╛ рдбреЗрдЯрд╛ рдХреЗ рднреАрддрд░ рд╕рдорд╛рдирддрд╛рдПрдВ? рдХреНрдпреЛрдВрдХрд┐ рдЬреНрдпрд╛рджрд╛рддрд░ рдорд╛рдорд▓реЛрдВ рдореЗрдВ рдЖрдк рдХреНрдпрд╛
рдкреНрд░рддреНрдпреЗрдХ рдЬреЛрдбрд╝реА рдХреЗ рдЕрд╡рд▓реЛрдХрди рдХреЗ рдмреАрдЪ рдЧреЙрд╡рд░ рджреВрд░реА рдкреНрд░рд╛рдкреНрдд рдХрд░рдиреЗ рдХреА рдЖрд╡рд╢реНрдпрдХрддрд╛ рд╣реИ
рджреЛ рдЕрд▓рдЧ-рдЕрд▓рдЧ рдирдореВрдирд╛ рдбреЗрдЯрд╛ рдХреА рддреБрд▓рдирд╛ рдХрд░рдиреЗ рдХреЗ рд╡рд┐рд░реЛрдз рдореЗрдВ рдПрдХ рдПрдХрд▓ рдирдореВрдирд╛ рдбреЗрдЯрд╛ред

рдмрд╣реБрдд рдмрд╣реБрдд рдзрдиреНрдпрд╡рд╛рдж

-
рдЖрдк рдЗрд╕реЗ рдкреНрд░рд╛рдкреНрдд рдХрд░ рд░рд╣реЗ рд╣реИрдВ рдХреНрдпреЛрдВрдХрд┐ рдЖрдкрдХрд╛ рдЙрд▓реНрд▓реЗрдЦ рдХрд┐рдпрд╛ рдЧрдпрд╛ рдерд╛ред
рдЗрд╕ рдИрдореЗрд▓ рдХрд╛ рд╕реАрдзреЗ рдЙрддреНрддрд░ рджреЗрдВ, рдЗрд╕реЗ GitHub рдкрд░ рджреЗрдЦреЗрдВ
https://github.com/scikit-learn/scikit-learn/issues/5884#issuecomment-348166596 ,
рдпрд╛ рдереНрд░реЗрдб рдХреЛ рдореНрдпреВрдЯ рдХрд░реЗрдВ
https://github.com/notifications/unsubscribe-auth/AA3G79jWVbpBNdAFOAim7wJS92-QGl0dks5s7pa8gaJpZM4Glm0p
.

рд╣рд╛рдп рдЕрд▓реА,

  1. рдирд╡реАрдирддрдо рд╣реИ gower_function-v3.ipynb, рдФрд░ рдпрд╣ рдЙрд╕реА рдХреА рдПрдХ рдкреНрд░рддрд┐ рд╣реИ рдЬрд┐рд╕реЗ рдореИрдВрдиреЗ рд╕реНрдХрд┐рдХрд┐рдЯ рд▓рд░реНрдирд┐рдВрдЧ рдкрд░ рдзрдХреЗрд▓рд╛ рд╣реИ, рдФрд░ рд╣рд╛рдБ, рдпрд╣ рдиреИрди рдкреНрд░рдЪрд╛рд░ рд╕реЗ рд╕рдВрдмрдВрдзрд┐рдд рд╣реИ

  2. рдЖрдк gower_distance(X) рдХрд╛ рдЙрдкрдпреЛрдЧ рдХреЗрд╡рд▓ рддрднреА рдХрд░ рд╕рдХрддреЗ рд╣реИрдВ, рдЬрдм рдЖрдкрдХреА рд╢реНрд░реЗрдгреАрдмрджреНрдз att рд╕рдВрдЦреНрдпрд╛рддреНрдордХ рдирд╣реАрдВ рд╣реИ, рдпрд╛ gower_distance(X, categorical_features=[False, True, False,...]), рдпрджрд┐ рдЖрдкрдХреЗ рд╢реНрд░реЗрдгреАрдмрджреНрдз attr рдХреЛ рдЕрдВрдХреАрдп рдХреЗ рд░реВрдк рдореЗрдВ рджрд░реНрд╢рд╛рдпрд╛ рдЧрдпрд╛ рд╣реИред

рдХреГрдкрдпрд╛ рдореБрдЭреЗ рдирд┐рдЬреА рддреМрд░ рдкрд░ рдмрддрд╛рдПрдВ рдпрджрд┐ рдЖрдкрдХреЛ рдХреЛрдИ рд╕рдорд╕реНрдпрд╛ рд╣реИ, рдХреНрдпреЛрдВрдХрд┐ рдпрд╣ рдХрд╛рд░реНрдпрд╛рдиреНрд╡рдпрди рдЬрд┐рд╕реЗ рдореИрдВрдиреЗ рдЗрдВрдЯрд░рдиреЗрдЯ рдкрд░ рдзрдХреЗрд▓ рджрд┐рдпрд╛ рд╣реИ, рд╡рд╣ рд╕реНрдХрд┐рдХрд┐рдЯ рд▓рд░реНрдирд┐рдВрдЧ рдХреА рдЪрд┐рдВрддрд╛ рдирд╣реАрдВ рд╣реЛрдиреА рдЪрд╛рд╣рд┐рдП, рдЙрдирдХреЗ рдкрд╛рд╕ рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рдмрд╣реБрдд рдХреБрдЫ рд╣реИ, рдФрд░ рдпрд╣рд╛рдВ рдХрд┐рд╕реА рдРрд╕реА рдЪреАрдЬ рдкрд░ рдЪрд░реНрдЪрд╛ рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рд╕рдмрд╕реЗ рдЕрдЪреНрдЫреА рдЬрдЧрд╣ рдирд╣реАрдВ рд╣реИ рдЬреЛ рд╕реНрдХрд┐рдХрд┐рдЯ рд╕реЗ рдмрд╛рд╣рд░ рд╣реИред рдкрд░рд┐рдпреЛрдЬрдирд╛ рд╕реАрдЦреЛред

@marcelobeckmann рд╣реИрд▓реЛ рдорд╛рд░реНрд╕реЗрд▓реЛ,
рдпрджрд┐ рд╣рдорд╛рд░реЗ рдкрд╛рд╕ рдПрдХ рд╕рдВрдЦреНрдпрд╛рддреНрдордХ рдкреНрд░рд╛рд░реВрдк рдореЗрдВ рдПрдиреНрдХреЛрдб рдХрд┐рдП рдЧрдП рд╢реНрд░реЗрдгреАрдмрджреНрдз рдЪрд░ рд╣реИрдВ, рддреЛ рдХреНрдпрд╛ categorical_features рдкреИрд░рд╛рдореАрдЯрд░ рдХрд╛ рдорд╛рди рд╕рд╣реА рдпрд╛ рдЧрд▓рдд рд╣реЛрдирд╛ рдЪрд╛рд╣рд┐рдП?

рдореБрдЭреЗ рдирд┐рдореНрди рддреНрд░реБрдЯрд┐ рднреА рдорд┐рд▓рддреА рд╣реИ:
ValueError: 0 рдирдореВрдиреЗ (рдЖрдХрд╛рд░ = (0, 0)) рдХреЗ рд╕рд╛рде рдорд┐рд▓рд╛ рд╕рд░рдгреА, рдЬрдмрдХрд┐ check_pairwise_arrays рджреНрд╡рд╛рд░рд╛ рдиреНрдпреВрдирддрдо 1 рдХреА рдЖрд╡рд╢реНрдпрдХрддрд╛ рд╣реЛрддреА рд╣реИред

рдпрд╣ рдкрд╣рд▓реЗ рдЙрд╕реА рдбреЗрдЯрд╛ рдореЗрдВ рд╕рдлрд▓ рдХрд╛рдо рдХрд░рддрд╛ рдерд╛, рд▓реЗрдХрд┐рди рдЕрдм рдпрд╣ рдРрд╕реА рддреНрд░реБрдЯрд┐ рджреЗрддрд╛ рд╣реИред рдпрд╣ рдХреНрдпреЛрдВ рд╣реЛ рд╕рдХрддрд╛ рд╣реИ?

рд╣рд╛рдп @bendiste ,

рдпрджрд┐ рдЖрдк 1 рдФрд░ 0 рдХреЗ рд░реВрдк рдореЗрдВ рд╕рд╣реА рдФрд░ рдЧрд▓рдд рдХрд╛ рдкреНрд░рддрд┐рдирд┐рдзрд┐рддреНрд╡ рдХрд░рддреЗ рд╣реИрдВ рддреЛ рдЖрдкрдХреЛ рд╡рд╣реА рдкрд░рд┐рдгрд╛рдо рдорд┐рд▓реЗрдВрдЧреЗред

рдХреНрдпрд╛ рдЖрдк рдирд╡реАрдирддрдо рдиреЛрдЯрдмреБрдХ gower_function-v6.4.ipynb in . рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░ рд░рд╣реЗ рд╣реИрдВ?
https://sourceforge.net/projects/gower-distance-4python/files/
?

рдореИрдВ рдПрдХ рд▓реЗрдЦ рд▓рд┐рдЦрдирд╛ рд╕рдорд╛рдкреНрдд рдХрд░ рд░рд╣рд╛ рд╣реВрдВ, рдЙрдореНрдореАрдж рд╣реИ рдХрд┐ рдЗрд╕ рдорд╣реАрдиреЗ рдореИрдВ рдЕрдкрдиреЗ рдХрд╛рд░реНрдпрд╛рдиреНрд╡рдпрди рдХреЛ рдорд╛рд╕реНрдЯрд░ рдСрдл рд╕реНрдХрд┐рдХрд┐рдЯ-рд▓рд░реНрди рдореЗрдВ рд╕реНрд╡реАрдХрд╛рд░ рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рдЕрдиреБрд░реЛрдзрд┐рдд рдкрд░рд┐рд╡рд░реНрддрди рдХрд░реВрдВрдЧрд╛ред

рд╣рд╛рдп @marcelobeckmann , рдЖрдкрдХреЗ рдЙрддреНрддрд░ рдХреЗ рд▓рд┐рдП рдзрдиреНрдпрд╡рд╛рджред рдФрд░ рд╣рд╛рдВ, рдореИрдВ рдЖрдкрдХреЗ рджреНрд╡рд╛рд░рд╛ рдмрддрд╛рдП рдЧрдП рдирд╡реАрдирддрдо рд╕рдВрд╕реНрдХрд░рдг рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░ рд░рд╣рд╛ рд╣реВрдВред рдЬрдм рдореИрдВрдиреЗ рдЗрд╕реЗ рдлрд┐рд░ рд╕реЗ рдбрд╛рдЙрдирд▓реЛрдб рдХрд┐рдпрд╛, рддреЛ рдЗрд╕рдиреЗ рд╕рдлрд▓рддрд╛рдкреВрд░реНрд╡рдХ рдХрд╛рдо рдХрд┐рдпрд╛ред рдЬрдм рд╕реЗ рдореИрдВ рдорд╢реАрди рд▓рд░реНрдирд┐рдВрдЧ рдореЗрдВ рдиреМрд╕рд┐рдЦрд┐рдпрд╛ рд╣реВрдБ, рдореИрдВ рдХреБрдЫ рдмрд╛рддреЗрдВ рдкреВрдЫрдирд╛ рдЪрд╛рд╣рддрд╛ рд╣реВрдБ:
1- рдХреНрдпрд╛ рдореИрдВ рдкрджрд╛рдиреБрдХреНрд░рдорд┐рдд рдХреНрд▓рд╕реНрдЯрд░рд┐рдВрдЧ рдПрд▓реНрдЧреЛрд░рд┐рджрдо рдХреЗ рдЗрдирдкреБрдЯ рдХреЗ рд░реВрдк рдореЗрдВ рдЖрдпрд╛рдореЛрдВ рдХреЛ рдХрдо рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рдХреЗрдкреАрд╕реАрдП рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░ рд╕рдХрддрд╛ рд╣реВрдВ?
2- рдпрд╛ рдХреНрдпрд╛ рдореБрдЭреЗ рдкрджрд╛рдиреБрдХреНрд░рдорд┐рдд рдХреНрд▓рд╕реНрдЯрд░рд┐рдВрдЧ рдХреЗ рдЗрдирдкреБрдЯ рдХреЗ рд░реВрдк рдореЗрдВ рдЙрдЪреНрдЪ рдЖрдпрд╛рдореАрддрд╛ рд╡рд╛рд▓реЗ рдкреВрд░реЗ рдбреЗрдЯрд╛рд╕реЗрдЯ рдХрд╛ рдЙрдкрдпреЛрдЧ рдХрд░рдирд╛ рд╣реИ?

рд╣рд╛рдп @marcelobeckmann ,
рдЗрд╕ рдХрд╛рд░реНрдпрд╛рдиреНрд╡рдпрди рдХреЗ рд▓рд┐рдП рдзрдиреНрдпрд╡рд╛рдж!

рдореИрдВрдиреЗ gower_function-v6.4 рд╕рдВрд╕реНрдХрд░рдг рдХреА рдХреЛрд╢рд┐рд╢ рдХреА рд╣реИред
рдореИрдВ рджреЗрдЦ рд╕рдХрддрд╛ рд╣реВрдВ рдХрд┐ рдЖрдкрдХреЗ рдпреВрдирд┐рдЯ рдкрд░реАрдХреНрд╖рдгреЛрдВ рдореЗрдВ рджреВрд░рд┐рдпрд╛рдВ рд╕рдорд╛рди рд╣реИрдВ, рднрд▓реЗ рд╣реА рдЖрдк рд╢реНрд░реЗрдгреАрдмрджреНрдз рдХреЙрд▓рдо рдирд┐рд░реНрджрд┐рд╖реНрдЯ рдХрд░реЗрдВ рдпрд╛ рдирд╣реАрдВред рдореИрдВрдиреЗ рдЕрдкрдиреЗ рд╕реНрд╡рдпрдВ рдХреЗ рдбреЗрдЯрд╛ рдХреЗ рд╕рд╛рде рднреА рдХреЛрд╢рд┐рд╢ рдХреА рд╣реИ, рдЬрд╣рд╛рдВ рдпрд╣ рдкрд░рд┐рдгрд╛рдо рдХреЛ рднреА рдкреНрд░рднрд╛рд╡рд┐рдд рдирд╣реАрдВ рдХрд░рддрд╛ рд╣реИред

рдХреНрдпрд╛ рдпрд╣ рд╕рд╣реА рд╣реИ?

рд╢реБрдХреНрд░рд┐рдпрд╛!

рд╣рд╛рдп @annelaura ,

рдЙрддреНрддрд░ рджреЗрдиреЗ рдореЗрдВ рджреЗрд░реА рдХреЗ рд▓рд┐рдП рдЦреЗрдж рд╣реИред рд╣рд╛рдБ, рдпрд╣ рд╕рд╣реА рд╣реИ, рд╡рд╣ рдкрд░реАрдХреНрд╖рдг рд╕рд┐рд░реНрдл рдпрд╣ рдЬрд╛рдБрдЪрдиреЗ рдХреЗ рд▓рд┐рдП рдерд╛ рдХрд┐ рдХреНрдпрд╛ categorical_features=[0, 1] рдкреИрд░рд╛рдореАрдЯрд░ рдкрд░рд┐рдгрд╛рдореЛрдВ рдХреЛ рдкреНрд░рднрд╛рд╡рд┐рдд рдирд╣реАрдВ рдХрд░реЗрдВрдЧреЗ, рдпрджрд┐ рдЧреИрд░-рд╕рдВрдЦреНрдпрд╛рддреНрдордХ рд╕реНрддрдВрднреЛрдВ рдХреЛ рднреА рд╡рд╕реНрддреБрдУрдВ рдХреЗ рд░реВрдк рдореЗрдВ рдкрд╣рдЪрд╛рдирд╛ рдЬрд╛ рд╕рдХрддрд╛ рд╣реИред рдЗрдирдкреБрдЯ рдбреЗрдЯрд╛ рд╕рдорд╛рди рд╣реИ, рдЗрд╕рд▓рд┐рдП рдкрд░рд┐рдгрд╛рдо рд╕рдорд╛рди рд╣реЛрдирд╛ рдЪрд╛рд╣рд┐рдПред

рдХреБрдЫ рдХрд╛рдЧрдЬрд╛рдд рд╕рдорд╛рдкреНрдд рдХрд░рдиреЗ рдХреЗ рдмрд╛рдж, рдореИрдВ рдХрд╛рдо рдкрд░ рд╡рд╛рдкрд╕ рдЖ рдЧрдпрд╛ рд╣реВрдВ рдФрд░ рдЕрдВрдд рдореЗрдВ рд╕реНрдХрд┐рдХрд┐рдЯ рдорд╛рд╕реНрдЯрд░ рд╢рд╛рдЦрд╛ рдХреЛ рдЕрдкрдиреЗ рдХрд╛рд░реНрдпрд╛рдиреНрд╡рдпрди рдХрд╛ рдкреНрд░рд╕реНрддрд╛рд╡ рджреЗрддрд╛ рд╣реВрдВ! :)

@marcelobeckmann рдЗрд╕ рдмрд╛рд░реЗ рдореЗрдВ рдХреЛрдИ рдЦрдмрд░? :)

рд╣рд╛рдп рдПрд▓реЗрдХреНрд╕, рдореИрдВрдиреЗ рдкреБрд▓ рдЕрдиреБрд░реЛрдз рдореЗрдВ рд╕рдореАрдХреНрд╖рдХреЛрдВ рджреНрд╡рд╛рд░рд╛ рдЕрдм рддрдХ рдкреВрдЫреЗ рдЧрдП рд╕рднреА рд╕рдВрд╢реЛрдзрдиреЛрдВ рдХреЛ рд╕рдорд╛рдкреНрдд рдХрд░ рджрд┐рдпрд╛ рд╣реИ, рдФрд░ рд╕реАрдЖрдИ рд╣рд░рд╛ рд╣реИред рдореИрдВрдиреЗ рд╕рдореАрдХреНрд╖рдХреЛрдВ рдХреЛ рдпрд╣ рдЬрд╛рдВрдЪрдиреЗ рдХреЗ рд▓рд┐рдП рднреА рдкрд┐рдВрдЧ рдХрд┐рдпрд╛ рдХрд┐ рдХреНрдпрд╛ рд╡реЗ рдЦреБрд╢ рд╣реИрдВ, рддреЛ рд╣рдо рдЗрд╕ рдкреБрд▓ рдЕрдиреБрд░реЛрдз рдХреЛ рдмрдВрдж рдХрд░ рд╕рдХрддреЗ рд╣реИрдВ рдФрд░ рдЗрд╕реЗ рд░рд┐рд▓реАрдЬ рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рдзрдХреНрдХрд╛ рджреЗ рд╕рдХрддреЗ рд╣реИрдВред

рдХреЛрдИ рдЕрдкрдбреЗрдЯреНрд╕? @marcelobeckmann

рд╕рдореАрдХреНрд╖рд╛ рдХреЗ рдмрд╛рдж рдХрд╛рд░реНрдп рдкреНрд░рдЧрддрд┐ рдкрд░ рд╣реИред

рдХреНрдпрд╛ рдЬрдирд╕рдВрдкрд░реНрдХ рдХреЛ рдордВрдЬреВрд░реА рджреА рдЧрдИ рд╣реИ? @marcelobeckmann

рдЕрднреА рдирд╣реАрдВ, рдХреБрдЫ рд╣рд╛рд▓рд┐рдпрд╛ рдХреЛрдб рд╕рдореАрдХреНрд╖рд╛ рдХреЗ рдмрд╛рдж рдХрд╛рдо рдкреНрд░рдЧрддрд┐ рдкрд░ рд╣реИред

рдмрд╣реБрдд рдмреБрд░рд╛ рдореБрдЭреЗ рдЗрд╕рдХреА рдЬрд╝рд░реВрд░рдд рд╣реИред

рдХреНрдпрд╛ рд╕рд┐рд░реНрдл рдлрдВрдХреНрд╢рди рдХрд╣реАрдВ рдЙрдкрд▓рдмреНрдз рд╣реИ? рдЗрд╕рд▓рд┐рдП рдореИрдВ рдЗрд╕реЗ рдЕрдкрдиреЗ рджрдо рдкрд░ рдЗрд╕реНрддреЗрдорд╛рд▓ рдХрд░ рд╕рдХрддрд╛ рд╣реВрдВ (рдЕрдиреБрд╕рдВрдзрд╛рди рдЙрджреНрджреЗрд╢реНрдп рдХреЗ рд▓рд┐рдП)

рдзрдиреНрдпрд╡рд╛рдж

рдЖрдк рдЗрд╕ рдкреАрдЖрд░ рдореЗрдВ рдЗрд╕ рд╕рдорд╛рд░реЛрд╣ рдХреА рдирд╡реАрдирддрдо рдкреНрд░рддрд┐рдмрджреНрдзрддрд╛ рд▓реЗ рд╕рдХрддреЗ рд╣реИрдВ:
https://github.com/scikit-learn/scikit-learn/pull/9555

рдореИрдВ рдЗрд╕реЗ рд╕реНрдерд╛рдиреАрдп рд░реВрдк рд╕реЗ рдХрд╛рдо рдХрд░рдиреЗ рдореЗрдВ рдХрд╛рдордпрд╛рдм рд░рд╣рд╛ред рдзрдиреНрдпрд╡рд╛рдж!

рдЗрд╕ рдЯрд┐рдХрдЯ рдкрд░ рдмрд╕ рдПрдХ рддреНрд╡рд░рд┐рдд +1! рдЗрд╕ рдкрд░ рд╕рднреА рдХрд╛рдо рдХреЗ рд▓рд┐рдП рдзрдиреНрдпрд╡рд╛рджред

рдЯрдХреНрдХрд░ред рдпрд╣ рдПрдХ рдмрдврд╝рд┐рдпрд╛ рдЬреЛрдбрд╝ рд╣реЛрдЧрд╛ред рдореБрдЭреЗ рд╡рд┐рд╢реНрд╡рд╛рд╕ рдирд╣реАрдВ рд╣реЛ рд░рд╣рд╛ рд╣реИ рдХрд┐ рдЗрд╕реЗ рд╕реНрдХреЗрд▓реЗрд░ рдмрдирд╛рдиреЗ рдореЗрдВ рдЕрдкреЗрдХреНрд╖рд╛рдХреГрдд рд╕рд░рд▓ рдЧрдгрдирд╛ рдХреЗ рд▓рд┐рдП 4 рд╕рд╛рд▓ рд▓рдЧ рдЧрдП рд╣реИрдВ !!

рдпрд╛ рдЖрдк рдХрд╣ рд╕рдХрддреЗ рд╣реИрдВ: рдЪрд╛рд░ рд╡рд░реНрд╖реЛрдВ рдореЗрдВ рдЖрдкрдХреЗ рд╕рдорд░реНрдкрд┐рдд рджреГрдврд╝рддрд╛ рдХреЗ рд▓рд┐рдП рдзрдиреНрдпрд╡рд╛рдж
рд╕реНрд╡реЗрдЪреНрдЫрд╛ рд╕реЗ рдкреНрд░рдпрд╛рд╕!

рдпрд╛ рдЖрдк рдХрд╣ рд╕рдХрддреЗ рд╣реИрдВ: рдЪрд╛рд░ рд╡рд░реНрд╖реЛрдВ рдХреЗ рд╕реНрд╡реИрдЪреНрдЫрд┐рдХ рдкреНрд░рдпрд╛рд╕ рдореЗрдВ рдЖрдкрдХреА рд╕рдорд░реНрдкрд┐рдд рджреГрдврд╝рддрд╛ рдХреЗ рд▓рд┐рдП рдзрдиреНрдпрд╡рд╛рдж!

рддреБрдо рд╕рд╣реА рд╣реЛ, рдХреНрд╖рдорд╛ рдХрд░реЗрдВред рдореЗрд░рд╛ рдорддрд▓рдм рдЕрд╕рднреНрдп рдХреЗ рд░реВрдк рдореЗрдВ рдЖрдиреЗ рдХрд╛ рдирд╣реАрдВ рдерд╛ред рдореИрдВ рдкреНрд░рдпрд╛рд╕ рдХреА рдмрд╣реБрдд рд╕рд░рд╛рд╣рдирд╛ рдХрд░рддрд╛ рд╣реВрдВред рдореИрдВ рдЗрд╕реЗ рд╕реНрдерд╛рдиреАрдп рд░реВрдк рд╕реЗ рдХреБрдЫ рд╕рдордп рд╕реЗ рдЙрдкрдпреЛрдЧ рдХрд░ рд░рд╣рд╛ рд╣реВрдВ, рдФрд░ рдЗрд╕реЗ рдЬреЛрдбрд╝рдХрд░ рджреЗрдЦрдирд╛ рдмрд╣реБрдд рдЕрдЪреНрдЫрд╛ рд╣реЛрдЧрд╛ред рдорд┐рд╢реНрд░рд┐рдд рдбреЗрдЯрд╛ рдкреНрд░рдХрд╛рд░реЛрдВ рдХреЗ рд▓рд┐рдП рдпрд╣ рдПрдХрдорд╛рддреНрд░ рджреВрд░реА рдореАрдЯреНрд░рд┐рдХ рд╣реИ рдЬрд┐рд╕реЗ рдореИрдВ рдЬрд╛рдирддрд╛ рд╣реВрдВред

рд╕реНрд╡рдпрдВрд╕реЗрд╡реА рдкреНрд░рдпрд╛рд╕ рдХреЗ рдЕрд▓рд╛рд╡рд╛, рдФрд░ рдпрд╣ рдХрд┐ рдореВрд▓ рджреЗрд╡реЛрдВ рдиреЗ рд╡рд┐рдЪрд╛рд░ рдирд╣реАрдВ рдХрд┐рдпрд╛ рд╣реИ
рдпрд╣ рдЬрд░реВрд░реА рд╣реИ, рдорд┐рд╢реНрд░рд┐рдд рдкреНрд░рдХрд╛рд░реЛрдВ рдХреЛ рдХреИрд╕реЗ рд╕рдВрднрд╛рд▓рдирд╛ рд╣реИ, рдЗрд╕рдХреЗ рдмрд╛рд░реЗ рдореЗрдВ рд╡рд╛рд╕реНрддрд╡ рдореЗрдВ рдЪреБрдиреМрддрд┐рдпрд╛рдВ рд╣реИрдВ,
рдФрд░ рдЯреНрд░реЗрди-рдкрд░реАрдХреНрд╖рдг рд╕реЗрдЯрдЕрдк рдореЗрдВ рд╕реНрдХреЗрд▓рд┐рдВрдЧ рдХреИрд╕реЗ рдХрд░реЗрдВред

sklearn рдореЗрдВ рдЗрд╕рдХреЗ рд▓рд┐рдП рддрддреНрдкрд░ рд╣реИрдВред

рдХреЛрдИ рд╣реИ рдЬреЛ рдЗрд╕ рдзрд╛рдЧреЗ рд╕реЗ " рдЙрдзрд╛рд░ рд╡рд┐рдЪрд╛рд░ " рд╣реЛрдиреЗ рдХрд╛ рджрд╛рд╡рд╛ рдХрд░рддрд╛ рд╣реИ, рдЙрд╕рдиреЗ рдЧреЛрд╡рд░ рджреВрд░реА (рд╕рдорд╛рдирддрд╛, рддрдХрдиреАрдХреА рд░реВрдк рд╕реЗ) рдХреА рдЧрдгрдирд╛ рдХрд░рдиреЗ рдХреЗ рд▓рд┐рдП рдЬреАрдердм рдкрд░ рдПрдХ рдкреИрдХреЗрдЬ рдЬрд╛рд░реА рдХрд┐рдпрд╛ рд╣реИред рджреВрд░реА рдФрд░ рд╕рдорд╛рдирддрд╛ рдХреА рдмрд╛рдд рдХрд░реЗрдВ рддреЛ, рдЙрджрд╛рд╣рд░рдг @marcelobeckmann рдХреЗ рдЙрджрд╛рд╣рд░рдг рдХреЗ рд╕рдорд╛рди рд╣реИред рдореИрдВрдиреЗ рдЕрднреА рддрдХ рдХреЗрд╡рд▓ рдХреЛрдб рдкрд░ рдирдЬрд╝рд░ рдбрд╛рд▓реА рд╣реИ, рд▓реЗрдХрд┐рди рдпрд╣рд╛рдБ рдПрдХ рдЭрд▓рдХ рд╣реИ:

@marcelobeckmann рдХреА рдиреЛрдЯрдмреБрдХ рд╕реЗ:

    # This is to normalize the numeric values between 0 and 1.
    X_num = np.divide(X_num ,max_of_numeric,out=np.zeros_like(X_num), where=max_of_numeric!=0)

"рдорд╛рдЗрдХрд▓ рдпрд╛рди" рд╕реЗ:

    # This is to normalize the numeric values between 0 and 1.
    Z_num = np.divide(Z_num ,num_max,out=np.zeros_like(Z_num), where=num_max!=0)

рдирдорд╕реНрдХрд╛рд░ рджреЛрд╕реНрддреЛрдВ, рдЗрд╕ рдкрд░ рдирдЬрд░ рд░рдЦрдиреЗ рдХреЗ рд▓рд┐рдП рдзрдиреНрдпрд╡рд╛рджред

рдореБрдЭреЗ рдЦреБрд╢реА рд╣реИ рдХрд┐ рд▓реЛрдЧ рдХреЛрдб рд▓реЗ рд░рд╣реЗ рд╣реИрдВ рдФрд░ рдЗрд╕реЗ рд╕реБрдзрд╛рд░рдиреЗ рдХреА рдХреЛрд╢рд┐рд╢ рдХрд░ рд░рд╣реЗ рд╣реИрдВ, рдХреБрдЫ рдХреНрд░реЗрдбрд┐рдЯ рдХреА рд╕рд░рд╛рд╣рдирд╛ рдХреЗ рдмрд╛рд╡рдЬреВрдж рдУрдкрди рд╕реЛрд░реНрд╕ рд╣реЛрдиреЗ рдХрд╛ рдпрд╣реА рдЙрджреНрджреЗрд╢реНрдп рд╣реИред

рдЙрдореНрдореАрдж рд╣реИ рдХрд┐ рдпрд╣ рдХреЛрдб рд╕реНрдХрд┐рдХрд┐рдЯ-рд▓рд░реНрди рдХрд╛ рд╣рд┐рд╕реНрд╕рд╛ рд╣реЛрдЧрд╛, рдЕрдЧрд░ рдпрд╣ рдкреАрдЖрд░ #9555 рд╕реНрд╡реАрдХрд╛рд░ рдХрд┐рдпрд╛ рдЬрд╛рддрд╛ рд╣реИред

рд╕рд╛рджрд░,

рдорд╛рд░реНрд╕реЗрд▓реЛ рдмреЗрдХрдореИрди

рдкреНрд░рдХреНрд░рд┐рдпрд╛ рдореЗрдВ рд╢реБрднрдХрд╛рдордирд╛рдПрдБ !!

рдХреНрдпрд╛ рдпрд╣ рдкреГрд╖реНрда рдЙрдкрдпреЛрдЧреА рдерд╛?
0 / 5 - 0 рд░реЗрдЯрд┐рдВрдЧреНрд╕

рд╕рдВрдмрдВрдзрд┐рдд рдореБрджреНрджреЛрдВ

jrbourbeau picture jrbourbeau  ┬╖  3рдЯрд┐рдкреНрдкрдгрд┐рдпрд╛рдБ

ben519 picture ben519  ┬╖  3рдЯрд┐рдкреНрдкрдгрд┐рдпрд╛рдБ

celiafish picture celiafish  ┬╖  4рдЯрд┐рдкреНрдкрдгрд┐рдпрд╛рдБ

yinruiqing picture yinruiqing  ┬╖  3рдЯрд┐рдкреНрдкрдгрд┐рдпрд╛рдБ

ArtyomKaltovich picture ArtyomKaltovich  ┬╖  3рдЯрд┐рдкреНрдкрдгрд┐рдпрд╛рдБ