Известия Саратовского университета. Новая серия.
ISSN 1816-9791 (Print)
ISSN 2541-9005 (Online)


Рецензия

Текст рецензии: 
Рецензия на статью «Модель динамического ценообразования без отрицательных примеров на основе безградиентной выпуклой оптимизации с неточным оракулом» Авторы: А. Н. Курганский, А. Ю. Максимова, С. А. Корнев Статья посвящена задаче динамического ценообразования (dynamic pricing) в условиях неполных данных. Авторы рассматривают сценарий, когда в распоряжении продавца имеются данные лишь о совершённых покупках (положительные примеры), а информация об отказах от покупки при заданной цене (отрицательные примеры) отсутствует. Это соответствует реалиям многих электронных торговых площадок и сервисов, где фиксируются транзакции, но не фиксируются факты просмотра цены без последующей покупки. Актуальность работы подкрепляется ссылками на современные исследования в области стохастической оптимизации и управления ценами. Цель статьи -- предложить алгоритм нахождения оптимальной цены, максимизирующей выручку, в рамках однопродуктовой и однопользовательской модели, используя методы безградиентной стохастической выпуклой оптимизации с неточным оракулом нулевого порядка. Поставленная задача решается через оригинальный приём линеаризации: переход к максимизации логарифма целевой функции и случайное разбиение клиентского сегмента на два подсегмента на каждой итерации для получения двухточечной оценки. Во введении корректно обоснована актуальность, дан краткий обзор современных работ и четко сформулирована ниша исследования — работа с данными без негативных примеров при неизвестном и переменном потоке покупателей. В постановке задачи (Раздел 1) вводится ключевое понятие "чувствительности к цене" p(x) как вероятности покупки, формализуются основные допущения модели. Важным является предположение о невозрастающей полуэластичности функции p(x), которое в дальнейшем доказывается как достаточное условие выпуклости преобразованной задачи. Основной теоретический вклад (Раздел 2) заключается в предложенной модели решения. Авторы предлагают: 1. Переход от максимизации выручки E(x)=xp(x) к максимизации log E(x). Это шаг, позволяющий работать в парадигме выпуклой оптимизации. 2. Для оценки градиента в условиях неизвестного и варьирующегося числа покупателей M_k на каждой итерации клиентский сегмент случайным образом делится на две части. Им предлагаются две близкие цены, что при достаточно большом сегменте обеспечивает M_k ≈ M'_k и позволяет получить несмещённую оценку приращения логарифма выручки. 3. При условии невозрастающей полуэластичности p(x) функция log E(x) является выпуклой. Это корректно обосновывает применение методов выпуклой оптимизации. 4. Показано, что после преобразований задача сводится к задаче безградиентной стохастической выпуклой оптимизации с неточным оракулом, для которой существуют разработанные методы (ссылки [4-8]). Верификация модели (Раздел 3) проводится на синтетическом примере с логистической функцией чувствительности p(x; μ,σ). Результаты симуляции для 100 прогонов демонстрируют сходимость алгоритма к известному оптимуму, что подтверждает практическую работоспособность предложенной схемы. Величина Regret (сожаления) приводится как метрика эффективности. Основное замечание -- сильная упрощённость рассматриваемого сценария (один продукт, один сегмент, стационарная функция спроса). В статье не проводится сравнительный анализ с другими методами решения схожих задач при отсутствии негативных примеров (например, с методами обучения с подкреплением или иными эвристиками). Это затрудняет оценку конкурентных преимуществ предложенного алгоритма. Синтетический пример служит скорее иллюстрацией сходимости, чем полноценным валидационным исследованием. Не хватает анализа чувствительности алгоритма к выбору гиперпараметров (начальная цена, шаг Δx, размер сегмента, разброс M_k), а также тестирования на более сложных (например, зашумленных) данных. Работа соответствует критериям научной новизны, обоснованности и воспроизводимости. Статья может быть рекомендована к публикации в представленном виде, однако авторам на будущее рекомендуется расширить экспериментальную часть, включая анализ устойчивости и сравнение с бенчмарками, рассмотреть возможность ослабления предположений, например, о стационарности функции p(x), более детально проработать переход к иерархическим моделям, анонсированный в дискуссии. Статья вносит некоторый вклад в область математического моделирования и оптимизации в экономике. Рекомендую к печати в журнале в текущем виде.
Согласен на размещение в eLibrary: 
Не согласен на размещение текста рецензии в eLibrary в анонимном виде