Рецензия
Текст рецензии:
Рецензия на статью "Dynamic Interval Specific Probability Transformation" by M. Melnichuk and V. A. Bogatyrev
%%%%%%%%%%%%%%%%%%%%%%%%%%
1. Тема является несомненно актуальной. В задачах моделирования сложных систем (теория массового обслуживания, надежность, риск-анализ) часто возникает потребность искусственно изменить вероятность определенных диапазонов значений случайной величины (например, <<утяжелить хвост>> распределения или усилить нагрузку в стресс-тестах), но при этом сохранить внутреннюю структуру вероятностных соотношений. Существующие методы (усечение, взвешенная выборка) либо искажают эти соотношения, либо стохастичны, либо вычислительно сложны. Предложенный авторами детерминированный метод, сохраняющий относительные вероятности, действительно заполняет важную нишу. Особую практическую ценность работе придаёт апробация на реальных данных из Kubernetes-кластера.
%%%%%%%%%%%%%%%%%%%%%%%%%%
2. В целом, математический аппарат изложен корректно. Доказательства теорем 1 и 2 (сохранение нормировки и относительных пропорций) элементарны и не вызывают сомнений. Метод позволяет за один проход пересчитать плотность/массу на произвольном объединении интервалов с помощью единственного параметра \( r \).
%%%%%%%%%%%%%%%%%%%%%%%%%%
Однако, ключевые заявления о новизне и преимуществах требуют критического анализа и уточнения.
%%%%%%%%%%%%%%%%%%%%%%%%%%
Приведу сначала содержательные и методические недостатки:
%%%%%%%%%%%%%%%%%%%%%%%%%%
1. Предложенное преобразование (формула 3) по сути является кусочно-линейным масштабированием плотности постоянными множителями \( r/w \) на \( I \) и \( (1-r)/(1-w) \) на \( I^c \). Это прямое следствие условий нормировки и требования сохранения пропорций. Пожалуй, эти результаты не соответствует уровню научной новизны для журнала ВАК. Свойство RPP (Relative Probability Preservation) вытекает из линейности преобразования, а не из какой-либо глубокой теоремы.
%%%%%%%%%%%%%%%%%%%%%%%%%%
2. Авторы заявляют, что их метод детерминирован и прост, в отличие от методов усечения или важностной выборки. Однако, следует отметить, что методы усечения (truncation) тоже детерминированы и не требуют случайности. Критика их за <<искажение пропорций>> верна, но вовсе не за <<стохастичность>>. Важностная выборка (importance sampling) никогда не ставила целью сохранение пропорций внутри интервала, так как у нее другая задача, заключающаяся в снижении дисперсии при оценке редких событий. Сравнение с ней, пожалуй, в данном контексте методологически некорректно. Далее, утверждение, что метод Токмачева <<не имеет настраиваемого коэффициента>> является верным, но сам DISPT при \( r \neq w \) нарушает непрерывность плотности, в то время как метод Токмачева сохраняет её (если исходная была непрерывной). Авторы этот важный недостаток своего метода (разрывы плотности на границах \( I \)) не обсуждают, что снижает добросовестность анализа.
%%%%%%%%%%%%%%%%%%%%%%%%%%
3. Из текста неясно, как именно была получена <<эмпирическая оценка распределения числа запросов за 1 мс>>. Если это гистограмма частот, то применение DISPT к ней есть просто пересчет столбцов. Показано ли, что после преобразования распределение остается пуассоновским (или любым другим аналитическим)? Судя по всему, нет, авторы просто меняют веса интервалов, а затем подставляют новое среднее \( \lambda \) в M/M/s. Но M/M/s требует пуассоновского входящего потока. Будет ли преобразованное распределение интервалов между заявками по-прежнему экспоненциальным? Авторы этот фундаментальный вопрос игнорируют. Преобразование плотности вероятности мгновенной интенсивности (если это оно) не приводит к пуассоновскому потоку в общем случае.
%%%%%%%%%%%%%%%%%%%%%%%%%%
Результат <<хватит 11 серверов, L=28.28, W=1.534 мс>> приведён без доверительных интервалов и без сравнения с моделированием. Нет проверки, что система действительно ведёт себя предсказуемо при такой трансформации.
%%%%%%%%%%%%%%%%%%%%%%%%%%
Перечислю далее найденные мной стилистические и оформительские недостатки:
%%%%%%%%%%%%%%%%%%%%%%%%%%
1. Язык аннотации (абстракт) на английском содержит грамматические ошибки и неестественные обороты. Например, "It's computational efficiency" -- грубая ошибка: должно быть "its computational efficiency".
"This makes the DISPT a particularly valuable tool" -- лишний артикль "the" перед названием метода.
%%%%%%%%%%%%%%%%%%%%%%%%%%
2. Есть опечатки и несоответствия в тексте. Например, в русской аннотации: <<преимущество ИСПВ в его универсальности применим как к непрерывным...>> -- грамматическая ошибка (<<применим>> заменить на <<применимости>> или разбить предложение). В английском тексте секции 1.1: "Digging deeper for the reasons" -- неакадемический стиль (разговорное "digging deeper"). В формуле для дискретного случая (стр. 5) используется \( dx \) под знаком суммы, что недопустимо. Рис. 1: подпись "Exhibits the original Gamma (\alpha=1.99) continues distribution as a red curve" должно быть "continuous". Рис. 3: подпись "Analogous to Fig. 2`s continues Gamma (pdf) case": сравнение не с рис. 2 (uniform), а с рис. 1. Ошибка ссылки? В ссылке [12] (Von Neumann) присутствует число 13, не понятно.
%%%%%%%%%%%%%%%%%%%%%%%%%%
Итак, статья затрагивает полезную и актуальную тему, предлагает работоспособный и простой метод преобразования распределений. Однако уровень представленного материала не соответствует требованиям рецензируемого научного журнала (ВАК) по следующим причинам:
- Низкая научная новизна: метод тривиален и является прямым следствием условий нормировки и требования сохранения пропорций.
- Методологические ошибки в интерпретации модели M/M/s (применение преобразования к эмпирическому распределению интенсивности как к пуассоновскому потоку без обоснования).
- Небрежность в математических обозначениях (смешение интеграла и подынтегрального выражения, \( dx \) под суммой).
- Стилистические и грамматические ошибки в англоязычном абстракте и по тексту.
%%%%%%%%%%%%%%%%%%%%%%%%%%
На мой взгляд, статья нуждается в серьезной доработке:
1. Следует честно указать, что метод сводится к кусочно-постоянному перемасштабированию плотности, и ограничить <<теоремы>> до простых утверждений или лемм.
2. Переписать пример с Kubernetes, четко указав, как из преобразованного распределения интервалов получаются характеристики M/M/s (или перейти к имитационному моделированию).
3. Устранить грамматические и стилистические ошибки, привести математические обозначения к корректному виду.
4. Добавить обсуждение разрывов плотности на границах интервалов.
%%%%%%%%%%%%%%%%%%%%%%%%%%
После доработки статью рекомендую направить для повторного рецензирования.
Согласен на размещение в eLibrary:
Согласен на размещение текста рецензии в eLibrary в анонимном виде
- 17 просмотров