Несколько раз замечал, что xG-модель от Ла Лиги (некоторые удары прямо в лайв-трансляциях рейтингуются с её помощью) завышает свои оценки для ударов с прямых штрафных с расстояния в пределах 6-7 метров до штрафной. Попадалось немало оценок с >0,1 xG, удару Гарсии с картинки и вовсе дали 0,16 — моменты с такой вероятностью на успех в глазах некоторых уже уходят в категорию "явные"
Нюанс в том, что за прошлый сезон реализация таких ударов (прямой штрафной, меньше 6 метров до линии) ни в одной из топ-5 лиг не поднималась выше 7-8%. Есть большие основания полагать, что модель Ла Лиги учитывает количество соперников в радиусе N метров от мяча (в данном случае значение будет 0) — понятно, что в случае с ударом со штрафного эта инфа как таковой ценности не имеет, так как любой оппонент априори не может находиться ближе 9,15 м к мячу, соперник создаёт помехи способом (стенка), который за счёт "игроков в N метрах от мяча" оценить не получится
Вопросов было бы куда меньше, публикуй лига на нормальном уровне (если про xG, то по всем ударам, а не выборочно что в лайве, что после) продвинутый статс, которым она хвастается в трансляциях — к слову, на их сайте раздел beyond stats в этом сезоне не обновляется. Но по тому, что есть, выглядит так, что либо есть проблема с оценкой специфических ударов — от этого никто не застрахован (даже если у вас есть возможность передавать вертикальную координату мяча в момент удара), но это будет по вам бить, если вы выдаёте результаты модели в таком виде (не собираете по дистанции и/или публикуете данные по матчу в целом, а даёте по отдельно взятому действию на фоне его прокрутки на видео). Другой вариант — характеристика того, как и кем модель обучалась: условно, передаётся количество соперников в радиусе N от мяча, ещё какие-то вещи, завязанные на трекинге — просто потому что "они могут", но нет инфы о ситуации (free_kick) и типе удара (со штрафного, без розыгрыша)
В целом не импонирует то, как Ла Лига пользуется имеющимися у неё статс-ресурсами — у вас есть доступ к трекингу, причём возможность хотя бы часть из этих "серьёзных" данных выдавать в лайве. В это мешаете с подсчётом голевых моментов на уровне "удар в пустые с пяти метров = удар мимо в 30 см от штанги с 35 метров", так как оба пойдут в биг-шансы по вашей трактовке. Плюс выборочная публикация данных, которая не даёт внятно оценить качество работы (вместо гаданий по обрывкам), но при этом не спасает от засветов фэйлов ваших моделей