Numpy: Enh: Функция создания массива объектов

Созданный на 2 июн. 2015 · 4Комментарии · Источник: numpy/numpy

Как обсуждалось в выпуске № 5303, в настоящее время невозможно создавать массивы объектов dtype, содержащие последовательности одинаковой длины, поскольку последовательность автоматически считывается как элементы массива. Есть предложение делать это только для списков, но это будет серьезным нарушением обратной совместимости и потребует длительного периода устаревания.

Другой подход состоял бы в том, чтобы явно иметь функцию для создания массивов с объектом dtype. Возможно, это можно было бы назвать «objectarray». По умолчанию эта функция принимает последовательность и рассматривает каждый элемент последовательности как элемент в массиве одномерных объектов.

Однако функция может иметь необязательный аргумент «ndim» или «depth», который можно использовать для указания того, сколько уровней последовательности следует считать частью массива. По умолчанию это значение равно 0 (учитывается только самый внешний уровень). Это вызовет исключение, если размеры не совпадают.

Обратите внимание, что этот подход не является взаимоисключающим с альтернативным, но имеет то преимущество, что он не нарушит обратную совместимость.

Так, например:

>>> arr = objectarray([((1, 2, 3), (4, 5, 6)), ((7, 8, 9), (10, 11, 12))])
>>> arr
array([((1, 2, 3), (4, 5, 6)), ((7, 8, 9), (10, 11, 12))], dtype=object)
>>> arr.shape
(2,)

>>> arr = objectarray([((1, 2, 3), (4, 5, 6)), ((7, 8, 9), (10, 11, 12))], depth=1)
>>> arr
array([[(1, 2, 3), (4, 5, 6)],
       [(7, 8, 9), (10, 11, 12)]], dtype=object)
>>> arr.shape
(2, 2)

>>> arr = objectarray([((1, 2, 3), (4, 5, 6)), ((7, 8, 9), (10, 11, 12))], depth=2)
>>> arr
array([[[1, 2, 3],
        [4, 5, 6]],

       [[7, 8, 9],
        [10, 11, 12]]], dtype=object)
>>> arr.shape
(2, 2, 3)

Источник

toddrjen

Самый полезный комментарий

Надеюсь, я ничего не упустил, но мне кажется, что аргумент ndmax не только решил бы проблему, о которой сообщают («_создавать массивы объектов dtype, содержащие последовательности одинаковой длины_»), но и дал бы прирост производительности в те случаи, когда, например, последний объект на входе не является списком (или представляет собой список другой длины). Также см. этот вопрос .

toobaz 4 дек. 2017

👍3

Все 4 Комментарий

Я думаю, что самый простой способ получить списки одинакового размера в массиве объектов состоит из двух шагов:

>>> a = empty((2,), dtype=np.object)
>>> a[:] = [[1,2,3],[4,5,6]]

>>> b = empty((2,3), dtype=np.object)
>>> b[:] = [[1,2,3],[4,5,6]]

Вероятно, реализация objectarray будет работать так.

ahaldane 18 июл. 2015

Да, в настоящее время это лучший способ, но он излишне многословен. Отсюда эта идея.

Хотелось бы надеяться, что реализация этой идеи сможет просто обойти автоматическое преобразование, используемое в функции array , и заменить конструктор ndarray своим собственным.

toddrjen 21 июл. 2015

toobaz 4 дек. 2017

👍3

Есть ли прогресс или планы по внедрению ndmax ? Что я делаю прямо сейчас:

np.array([*data, None])[:-1]

# This would look a lot cleaner:
np.array(data, ndmax=1)

bergkvist 14 июн. 2020

Была ли эта страница полезной?

0 / 5 - 0 рейтинги

Смежные вопросы

np.dot вылетает на некоторых системах с numpy 1.14.5

valentinstn · 61Комментарии

Проблема с трекером для поддержки BLIS в NumPy

njsmith · 97Комментарии

ОШИБКА: np.min не всегда распространяет NaN

andyfaff · 65Комментарии

Иногда supress_warnings пропускает один из своих атрибутов

olebole · 60Комментарии

Подсказка / аннотация типа (PEP 484) для ndarray, dtype и ufunc

InonS · 70Комментарии