Несколько месяцев назад я описывал методику расчета производительности хранилища данных с помощью теории вероятностей. Суть ее заключалась в экстраполяции экспериментальных данных о нагрузке, создаваемой одним пользователем хранилища, на большое их количество. Теперь попробуем решить эту же задачу, но с другого конца: имея уже готовое работающее хранилище, проанализируем его нагрузку и попытаемся вывести закон, ее описывающий. Если с первой статьей вы еще не знакомы, настоятельно рекомендую сделать это, прежде чем читать дальше.
Записи с меткой «хранилище данных»
ЭВМ/ Расчет производительности хранилища данных
08.11.2010В наше время глобализации, виртуализации и облачных технологий одним из краеугольных камней любой серьезной IT инфраструктуры становится общее хранилище данных. Это может быть как традиционные NAS или SAN, так и специализированная система вроде Amazon Dynamo. При этом при проектировании инфраструктуры первым встает вопрос оценки требуемой производительности хранилища. Конечно, в архитектуру всегда стараются заложить возможность легкого масштабирования, чтобы наращивать производительность по мере надобности. Однако это не отменяет полностью задачу первоначальной оценки.
Простейшие грубые оценки часто оказываются либо слишком заниженными, либо чересчур завышенными. В первом случае сразу после ввода системы в эксплуатацию начинаются лихорадочные работы по ее расширению. Во втором случае получается экономически неэффективное решение, которое потом не знают, куда девать. Далее будет продемонстрирован простой метод получения хороших оценок, не страдающих ни излишним оптимизмом, ни излишним пессимизмом.