Orientdb: Поддержка больших данных для хэш-индекса

Созданный на 22 окт. 2013 · 3Комментарии · Источник: orientechnologies/orientdb

Текущая реализация хеш-индекса требует только одного ввода-вывода для чтения и максимум 3 ввода-вывода для записи, но мы по-прежнему страдаем от случайных операций ввода-вывода. В среднем случайный ввод-вывод занимает 20 мс, это чертовски медленно. Текущая оптимизация кеша записи амортизирует эти накладные расходы, но мы все равно будем страдать от них в случае огромных вставок. Чтобы избежать этих накладных расходов, хорошо иметь оптимизации, которые применялись для попыток LSM. В nutshed LSM дереве есть отсортированный словарь, один экземпляр которого в памяти, а второй на диске, эти экземпляры объединяются в фоновом режиме с использованием очень больших фрагментов данных, поэтому у нас будет не 3 ввода-вывода для записи, а около 3/16 операций ввода-вывода. для одиночной записи, которая намного быстрее, если мы также учтем, что будут применяться дополнительные оптимизации кэша записи, у нас будет очень-очень быстрая реализация индекса. Дополнительной оптимизацией является использование фильтра Блума, но не считая того, что приводит к полной трате ресурсов сервера.

Но это тоже ресурсоемко, 4 месяца на одного человека и около 2,5 месяцев на двоих. Но результат должен быть действительно ценным.

Эта оптимизация должна быть реализована после выпуска https://github.com/orientechnologies/orientdb/issues/1756 .

enhancement

Источник

laa

👍1

Самый полезный комментарий

@saeedtabrizi также WiredTiger не использует транзакции, и это значительно упрощает реализацию таких вещей, теперь мы концентрируемся на фрактальных индексах, которые имеют хороший потенциал для интеграции в системы, основанные на транзакциях.

laa 3 февр. 2017

👍2 ❤1 🎉1

Все 3 Комментарий

@laa, основываясь на этом отчете , я думаю, что реализация дерева LSM - самый ценный шаг для роста orientdb.

saeedtabrizi 3 февр. 2017

@saeedtabrizi , этот отчет немного обманывает, он не принимает во внимание случаи, когда дерево LSM имеет много уровней, усиление записи настолько велико, что на этом вся запись останавливается.

laa 3 февр. 2017

😄1 👍1

laa 3 февр. 2017

👍2 ❤1 🎉1

Была ли эта страница полезной?

0 / 5 - 0 рейтинги

Смежные вопросы

Конфликт зависимостей: повторяющиеся классы «com.orientechnologies.orient.server.network.protocol.http.OHttpGraphResponse» в разных JAR-файлах имеют разные имплементации.

PandaMonkey · 3Комментарии

OrientDB 3.0 -.OCommandExecutionException: невозможно выполнить запрос для неидемпотентного оператора:

careerscale · 4Комментарии

Фильтр по свойствам вложенных отношений

snig-b · 5Комментарии

Когда я закрываю tomcat, он выдает несколько ошибок, связанных с OrientDB. Эта проблема, я думаю, похожа на эту, # 2508.

Dante-666 · 5Комментарии

SELECT возвращает очень разные результаты для эквивалентных запросов

codelimner · 4Комментарии