Рецензия
Текст рецензии:
Рецензия на статью «Численное решение задачи стохастического оптимального управления
с несогласованностью во времени для диффузионно-скачкообразных процессов»
Статья посвящена в целом актуальной проблеме -- численному решению задач стохастического оптимального управления с временной несогласованностью (time inconsistency), возникающей из-за наличия экстремальных мер в функционале качества. Авторы обобщают существующую теорию на случай динамики с диффузией и скачками, что соответствует реальным моделям финансовых рынков. Предложен двухуровневый алгоритм: внешний уровень решается градиентными методами, внутренний -- через численное решение уравнения Гамильтона–Якоби–Беллмана (ГЯБ) с аппроксимацией марковской цепью. Проведены численные эксперименты для двух риск-метрик (CVaR и дисперсия). Работа имеет выраженную прикладную направленность (управление портфелем, риск-менеджмент).
_________________________________________
К сильным сторонам статьи можно отнести новую постановка задачи с указанием на несогласованность во времени и обоснованным сведением к двухуровневой оптимизации. Авторы, на мой взгляд, вполне корректно используют соответствующий математический аппарат (лемма Ито для скачкообразных процессов, вязкостные решения, аппроксимация марковскими цепями). Авторы достаточно подробно описывают предлагаемый алгоритм (Алгоритм 1), включая детали его реализации, что ценно для воспроизводимости полученных ими результатов. Проводится сравнение двух риск-метрик и стратегии «купи и держи».
_________________________________________
Однако следует отметить некоторые недостатки и замечания.
_________________________________________
1. В разделе 3 авторы утверждают: «можно показать сходимость дискретного решения к
вязкостному решению», ссылаясь на некоторые работы. Однако, возможно, следует сделать этот фрагмент более подробным, учитывая специфику задачи (как она влияет на доказательства этих трех пунктов).
Ведь рассматривается довольно специфическое уравнение с управлением в аргументе скачковой меры γ(a, j).
Непонятно, нарушается или нет условие равномерной эллиптичности и как это влияет на сходимость.
Нужен комментарий, выполнено ли ключевое условие «локальной состоятельности» (consistency)
для аппроксимации интеграла скачков с управлением.
_________________________________________
2. Веса в п. 1 алгоритма вычисляются один раз и не пересчитываются далее на каждой итерации. Нет ли туту противоречия (несогласованности), т.к. в формуле перед (8) веса зависят от меняющихся параметров.
_________________________________________
3. В таблице 2 описаны значения параметров эксперимента. Может ли процесс выходить
за пределы с ненулевой вероятностью? Если да, то следует привести оценку вероятности
выхода за границы и обсудить, как обрабатываются такие траектории.
_________________________________________
4. В п. 4 замечания 5 сказано, что градиентный шаг приведен без какого-либо правила выбора. В результатах не приведено, сколько итераций внешнего уровня потребовалось для сходимости.
_________________________________________
5. В разделе 5 упоминается: «Настройка кода происходила на похожей задаче, у которой есть аналитическое решение». Но какой именно пример? Каковы параметры? Какая точность достигнута? Без этого нельзя оценить, насколько хорошо работает аппроксимация марковской цепью для скачкообразных процессов.
_________________________________________
6. Рисунки не имеют подписей осей. Без подписей графики малопонятны.
_________________________________________
7. Какова сложность Алгоритма 1? Авторы не приводят время работы и не обсуждают, как это масштабируется.
_________________________________________
8. Вывод «CVaR эффективнее в смысле управления хвостовым риском» сделан на основе визуального сравнения по рисункам. Однако, возможно, следует использовать к.-л. количественные метрики и провести статистический тест значимости различий.
_________________________________________
На взгляд рецензента, статья представляет вполне интересную и практически значимую разработку, однако в текущем виде содержит некоторые пробелы и методические неясности, которые не позволяют считать результаты полностью обоснованными.
_________________________________________
Рекомендую принять статью к повторному рассмотрению после обязательной доработки с учётом указанных замечаний.
Согласен на размещение в eLibrary:
Согласен на размещение текста рецензии в eLibrary в анонимном виде
- 15 reads