Occa: Запрос функции: добавить опцию остановки синтаксического анализатора для замены определенных переменных их значениями.

Созданный на 29 июл. 2018 · 10Комментарии · Источник: libocca/occa

В настоящее время, если для p_N определено значение 5, то при анализе ядра и выводе все экземпляры p_N заменяются на 5.

Было бы полезно добавить опцию парсера, чтобы #define включались в сгенерированный исходный код, а переменные компилятора, такие как p_N, оставались в сгенерированном исходном коде.

Это значительно упростит чтение сгенерированного кода.

feature parser

Источник

tcew

Самый полезный комментарий

Это звучит разумно

Есть несколько функций, которые необходимо добавить в первую очередь.

Создавайте глобальные переменные из числовых определений, переданных как свойства ядра, а не #define
- :warning: Сделать это для всех #defines слишком сложно, так как нам нужно будет отслеживать, где они определены и какие области видимости они затрагивают после преобразований.
[Новая функция] Во время parser::getExpression замените constexpr их значениями.
- Изначально только переменные const
- Расширение до constexpr функций
Добавьте строки #define наверх, как обычно.

dmed256 30 июл. 2018

👍2

Все 10 Комментарий

К сожалению, все определения должны быть расширены для применения преобразований кода.
Значения #define можно найти в двух местах.

raw_source.cpp

> head ~/.occa/cache/c8141715ac4e4272/raw_source.cpp 
#define  block 256

/* The MIT License (MIT)
 *

build.json

> cat ~/.occa/cache/c8141715ac4e4272/build.json | jq .kernel.props.defines
{
  "block": 256
}

dmed256 29 июл. 2018

Я согласен, что это полезно сделать для извлечения фактических границ цикла, и я полагаю, что синтаксический анализатор предназначен для этого. Однако кажется маловероятным, что невозможно сохранить определения в коде. Отслеживание того, как вычисляются значения, избавило бы от необходимости печатать их числовые значения.

tcew 29 июл. 2018

Поддерживать код и преобразовывать его сложнее, чем кажется.
Определяет может быть что угодно, даже частичный код

#define foo 3 +

for (int i = 0; i < foo 5; ++i) {}

Сохранение строк #define также может вызвать проблемы, поскольку компилятор по-прежнему будет запускать препроцессор.

dmed256 29 июл. 2018

... а если Define - это просто числовая константа... ?

tcew 30 июл. 2018

...и зачем нам для этого лишняя логика....?

dmed256 30 июл. 2018

Это пример выходного ядра

extern "C" __global__ void _occa_ellipticPreconCoarsenHex3D_0(const int Nelements,
                                                              const double * __restrict__ R,
                                                              const double * __restrict__ qf,
                                                              double * __restrict__ qc) {
  {
    int e = 0 + blockIdx.x;
    __shared__ double s_qfff[8][8][8];
    __shared__ double s_qcff[2][8][8];
    __shared__ double s_qccf[2][2][8];
    __shared__ double s_qccc[2][2][2];
    __shared__ double s_R[2][8];
    {
      int k = 0 + threadIdx.z;
      {
        int j = 0 + threadIdx.y;
        {
          int i = 0 + threadIdx.x;
          const int id = i + j * 8 + k * 8 * 8 + e * 512;
          s_qfff[k][j][i] = qf[id];
          if ((k == 0) && (j < 2)) {
            s_R[j][i] = R[j * 8 + i];
          }
        }
      }
    }

Ядра теряют читабельность при переводе. Все эти номера были определены.

tcew 30 июл. 2018

Сделав шаг назад, причина запроса функции заключалась в том, чтобы

сделать сгенерированный код намного легче для чтения

Сгенерированный код предназначен для компилятора, а не для пользователей (аналогично предварительно обработанным выводам компилятора). Если есть проблема с синтаксическим анализом, особенно потому, что синтаксический анализатор еще не разработан, это может помочь взглянуть на него. Однако со временем эти проблемы должны быть решены.

Если цель состоит в том, чтобы упростить отладку, я согласен, что мы должны добавить #line , чтобы он соответствовал исходному исходному коду.

dmed256 30 июл. 2018

Согласен, что для отладки это было бы настоящим бонусом — хорошая идея!

Я должен был яснее пояснить причину этого запроса: один важный вариант использования, который я предполагаю для новых инструментов генерации кода в OCCA 1.0, — это транслятор с OKL на родной язык потоков для приложений, отличных от OCCA. В этом случае будет важно сохранить удобочитаемость, так как сгенерированный код CUDA/OpenCL/HIP/OpenMP будет отделен от кода OKL.

tcew 30 июл. 2018

👍1

Это звучит разумно

Есть несколько функций, которые необходимо добавить в первую очередь.

Создавайте глобальные переменные из числовых определений, переданных как свойства ядра, а не #define
- :warning: Сделать это для всех #defines слишком сложно, так как нам нужно будет отслеживать, где они определены и какие области видимости они затрагивают после преобразований.
[Новая функция] Во время parser::getExpression замените constexpr их значениями.
- Изначально только переменные const
- Расширение до constexpr функций
Добавьте строки #define наверх, как обычно.

dmed256 30 июл. 2018

👍2

Спасибо за рассмотрение запроса функции!

tcew 30 июл. 2018

Была ли эта страница полезной?

0 / 5 - 0 рейтинги

Смежные вопросы

Новый макрос квалификатора ядра

tcew · 22Комментарии

🌟 Кто использует ОССА?

dmed256 · 4Комментарии

Сбой компиляции с компилятором PGI

awehrfritz · 7Комментарии

поддержка cmake

amikstcyr · 11Комментарии

libCEED Travis CI с ошибкой OCCA

jeremylt · 12Комментарии