Поиск аналогичных периодов по базе

Общая идея данного этапа найти игроков, у которых динамика стоимости на одном из этапов их развития напоминала бы наш случай. На данном этапе есть большое количество переменных, которые можно настраивать.

1. Рассматриваемый промежуток времени. Мы можем рассматривать динамику интересующего футболиста как за последние 2-3 года, так и за последние 10 лет. Скорее всего, этот параметр должен настраиваться индивидуально. У молодого футболиста нет динамики за 10 лет. Чем больше промежуток будет взят, тем меньше аналогов мы получим. Надо выбирать некое оптимальное число, исходя из получения оптимальной дисперсии.

На итоговое распределение будет влиять количество найденных игроков и разница между найденными игроками и исследуемым. Диапазон, в котором будет находиться стоимость игрока через какое-то время с заданной вероятностью, будет увеличиваться с течением времени. То есть предсказание на пол года вперед будет точнее чем на 3 года.

2. Алгоритм сравнения. Необходимо сравнить 2 непрерывные функции. (Непрерывными они стали во время сглаживания). Есть множество способов и метрик это сделать. Выбор метрики является одним из ключевых факторов успеха.

3. Метрика. Две функции будут считаться идентичными, если метрика между ними будет меньше некой величины α. Этот параметр α также влияет на дисперсию.

4. Построение аспределения

a. По базе мы найдем несколько игроков схожих с нашим. Чем меньше метрика между ними тем большее влияние игрок окажет на наше предсказание.

b. Для каждой пары игроков (исследуемый+найденный) будет построено распределение (предсказание по найденному игроку по нашему). На это распределение влияет кривая для найденного игрока и метрика между игроками. Мы найдем для каждого времени мат. Ожидание и дисперсию, построим нормальное распределение.

c. Получим множество распределений, по количеству найденных игроков. Усредним их с весами, полученными в зависимости от метрики между найденными игроками и нашим.

d. Для каждого из промежутков времени построим итоговое распределение, говорящее о развитие таланта.

Обратный учет факторов

Средняя стоимость игрока на рынке

У нас была набрана статистика по средней стоимости игроков на рынке за последние годы. Нам необходимо предсказать какова будет средняя стоимость в будущем. Это можно делать как в абсолютных значениях, так и построив распределение средней стоимости в разные моменты времени. Более достоверна модель, где мы строим распределение.

Перемножив 2 распределения, мы получим стоимость нашего игрока с учетом средней стоимости игроков на рынке.

Возраст игрока

Необходимо наш прогноз в каждой из точек помножить на среднюю стоимость по возрасту, в котором будет исследуемый игрок. Таким образом, мы обратно станем учитывать возраст игрока при прогнозе его стоимости.

Необходимо рассчитать вероятность окончания карьеры игроком не из-за травмы. Необходимо придумать, как это можно сделать. Видимо эта вероятность возрастает с возрастом, но непонятен закон и как ее можно рассчитать. Можно попробовать на основе других футболистов, но наверняка есть много скрытых факторов, которые индивидуально влияют на каждого футболиста.

Травматичность

Необходимо по всей базе построить зависимость средней травматичности от возраста. Далее аналогично со стоимостью мы нормализуем травматичность нашего игрока относительно возраста, ищем схожих игроков, используя метрику 2 функций и параметр α. Строим распределение травматичности в будущем и производим обратный учет травм на прогноз стоимости.

Можно разбить травмы по разным типам и предсказывать по отдельности.
Можно оценивать травматичность игрока по проценту пропущенных матчей за сезон.

Таким образом, мы получим вероятности получения легкой травмы, средней и тяжелой. Мат. ожидание времени, которое игрок пропустит, пока будет травмированным. Вероятность получения травмы, которая приведет к завершению карьеры.

Вероятности различных травм весьма существенным образом повлияют на прогноз стоимости игрока. Необходимо провести анализ влияния различных по тяжести травм на стоимость игрока для различных возрастов. Эти коэффициенты вместе с вероятностью получения этих травм игроком могут повлиять на прогнозируемую стоимость игрока.

Мы построим распределение коэффициентов влияния травм на стоимость игрока и перемножим это распределение с нашим.

Отчет о футболисте

1. В отчете основной результат это несколько распределений стоимости игрока через различные временные периоды. Логичная частота графиков раз в полгода, что будет повторять частоту трансферных окон.

2. Необходимо получить вероятности получения различных травм за различные промежутки времени. Опять же логичный временной шаг это полгода. Также необходимо мат. ожидание количества различных травм и мат. ожидание времени, которое футболист пропустит из-за травм. Вероятность получения травмы, из-за которой игрок окончит карьеру и вероятность окончания карьеры.

3. Необходимо рассчитать оптимальный срок контракта с учет стоимостей перезаключения, ожидаемой стоимости игрока, различных вероятностей, связанных с возможным окончанием карьеры или возрастающей травматичностью.