Иерархическое прогнозирование: текущий статус, проблемы и перспективыСегодня (
вдохновившись сразу несколькими интересными статьями в последнем номере 2023 года International Journal of Forecasting) поговорим об иерархических прогнозах.
Иерархический прогноз предполагает, что вы прогнозируете
набор временных рядов, связанных друг с другом какой-то
иерархией: к примеру, общие продажи магазина и отдельно продажи по категориям (
которые в сумме дают общие продажи). В такой ситуации у вас есть три простых способа построения прогноза:
-
Снизу вверх: делаем прогноз низкоуровневых рядов (продаж по категориям), суммируем в верхний уровень
-
Сверху вниз: делаем прогноз высокоуровневых рядов (суммарных продаж), дезагрегируем на нижний уровень (
к примеру, используя веса, посчитанные по историческим данным)
-
Начиная от середины: прогнозируется средний уровень иерархии, из него суммируем в верхние уровни, дезагрегируем в нижние
Почему не прогнозировать ряды просто отдельно друг от друга? Потому что почти наверняка получившиеся прогнозы будут
не когерентны: для них не будут выполнены определяющиеся иерархией рядов соотношения (
сумма прогнозов по категориям не будет равна прогнозу суммарных продаж!). А
когерентность для иерархических прогнозов - штука очень важная.
Более сложные подходы к прогнозированию иерархических рядов подразумевают прогнозирование
всех рядов, но построенное таким образом, чтобы когерентность выполнялась: таким образом мы и не теряем информацию (как в любом из простых методов), и сохраняем взаимосвязи между показателями.
Но и здесь появляются проблемы: к примеру, оказывается (см.
статью), что для
сохранения когерентности нужно выбирать модели,
оптимальные по MSE или RMSE, но
не по MAE или MAPE (или их модификациям, включая MASE). Причина проста: среднеквадратичную ошибку (MSE/RMSE) минимизирует матожидание, а сумма матожиданий равна матожиданию суммы. А MAE, к примеру, минимизируется медианой, и для медианы такое соотношение не выполняется. Вроде бы мелочь, но важная!
Другая важная мысль работы - это практически полное отсутствие исследований по
интервальному прогнозированию для иерархических рядов. Сами авторы предлагают использовать
копулы для получения таких прогнозов.
Собственно, это два главных вывода работы: если хотите когерентные прогнозы, оценивайте ошибки по (R)MSE, а самое перспективное направление для исследований в иерархическом прогнозировании - это интервальные прогнозы.
Теперь, кстати, лонгриды формата "читаем статьи за вас" будут обозначаться отдельным тегом #статьи для удобства поиска! :)#лонгрид#статьи