Улучшенный Глобальный Винный Медальный Рейтинг (GWMR) или “Быстрее, Выше, Сильнее!”
Промежуточные итоги (Быстрее!)
Более полутора лет прошло с момента зарождения идеи Глобального Медального Винного Рейтинга. В течении всего этого довольно продолжительного времени проект совершенно не стоял на месте и, наоборот, упорно двигался к своей, казавшейся поначалу неимоверно далекой цели: единому сквозному рейтингу всех вин мира, получавших награды на значимых профессиональных винных конкурсах.
Это была изнурительный марафонский забег, где главным соперником был неукротимый вал все новых и новых медалей, выдаваемых на сотнях профессиональных конкурсов. При этом маршрут гонки пролегал по весьма пересеченной местности. Команде приходилось искать узкие тропинки оптимизации в колючих дебрях технических проблем, случайных ошибок и организационных неурядиц.
Было изучено более 350 мероприятий, выдавших в течении последних двух с половиной лет более 250 000 медалей. Последующая обработка данной информации привела к созданию обширной базы о более чем 140 000 винах от более чем 27 000 производителей из 76 разных стран мира. И даже весьма обширный на старте справочник сортов винограда быстро разросся до более чем 1 000 записей.
Но вот уже видна финишная лента. Заканчивается обработка информации по медалям за 2020–2021 год, но, перед тем как подводить промежуточные итоги, мы решили вернуться к математике и свежим взглядом переоценить существующие алгоритмы подсчета рейтинга.
Усовершенствование алгоритмов (Выше!)
После накопления достаточного объема данных по винам и их медалям, у нас, наконец, появилась возможность оценить его корреляцию с другими винными рейтингами в рамках весьма обширных и репрезентативных выборок. Полученные результаты натолкнули нас на несколько возможных решений, которые позволят качественно улучшить математическую составляющую и вывести алгоритмы расчета на новый, действительно высокий уровень.
Если расчет значимости конкурса (coefficient of notoriety — kNoT) особых нареканий не вызывал, и оказался вполне адекватным и справедливым, то расчет рейтинга конкретного винтажа подвергся детальному изучению и последовательному улучшению.
Рассмотрим распределение медалей и оценок на одном из самых известных винных конкурсов Decanter World Wine Awards. Он один из немногих, где организаторы публикуют и точные баллы по каждому вину.
Диапазон присуждаемых наград на DWWA следующий
Бронза — 86–89,99
Серебро — 90–94.99
Золото — 95–100
Мы специально пока не принимаем во внимание награды “Platinum” и “Best in Show”, так как эти награды присуждаются по результатам первичного присвоения.
Как видно из диаграммы, распределение баллов и наград для всех 3-х лет в принципе схожи. Попытаемся определить эту закономерность.
График имеет довольно четкую структуру и явно выраженные границы переходов. Можно высказать гипотезу, что данный тип распределения является типичным для состязаний где присваиваются баллы и присуждаются призовые места. Например, спортивные состязания, где критерии не имеют строгих границ, такие как фигурное катание, прыжки в воду, спортивные танцы, и др. Скорее всего данный тип распределения типичен и для оценок различного тестирования, где имеются пограничные зоны «допущен/не допущен». Назовем данное распределение Award Points Distribution. Можно также предположить, что данный тип распределения не является беспрерывным и имеет точки разрыва в границах между категориями наград.
Можно заметить, что для сегмента соответствующего бронзовым медалям график распределения имеет уникальный вид, а для всех последующих сегментов графики схожи.
Для начала рассмотрим участок «серебро». Последующие участки имею в принципе ту же структуру.
Данный участок имеет явно выраженную экспоненциальную составляющую вида:
Эмпирическим путем мы получили значение λ=π/N , где N количество сегментов в данном диапазоне награды. В нашем случае N = 94–90 = 4. Для данного типа распределения среднее значение равно 1/λ , таким образом среднее значение оценки в диапазоне серебряных наград составит 90+ N/π , что равно 91.273 и значительно отличается от простого арифметического среднего 92. Данный принцип применим для всех диапазонов кроме первого («бронзового»).
Рассмотрим теперь распределение на первом сегменте, «бронза».
При увеличении количества сегментов, т.е. диапазона балов, «хвост» значительно удлиняется, «обрыв» справа фактически сохраняется на уровне N-1.
В общем виде, данное распределение выглядит так:
К минимальному значению «бронзового» диапазона следует добавлять средние значение данного распределения.
Таким образом, на первом этапе для конкурсов где указаны только тип награды и диапазон баллов, рассчитываем среднее значение и присваиваем это значение данному вину на данном конкурсе.
Где Xmax — верхний предел диапазона баллов соответствующей награды, Xmin — нижний предел диапазона баллов, ti — соответствующий элемент распределения.
Таким образом, мы заменили диапазон оценок на среднее значение в интервале оценок каждой награды. Следует отметить, что так как диапазон баллов может отличаться для различных конкурсов, среднее значение рассчитано в каждом интервале отдельно. Так например, для «серебряных» интервалов 88–92 и 85–95, средние значения будут 89.27 и 88.18 соответственно.
В случае наличия наград только в одной категории, достаточно получить среднее значение. Однако, при наградах различного достоинства необходимо провести корректировку каждого значения, по тем оценкам где были диапазон оценок, с учетом количество наград в других категориях. Ясно, что в присутствии наград большего достоинства, необходимо сдвинуть первоначальную оценку вверх, а для наград меньшего достоинства — вниз. Данная методика применима только для оценок, рассчитанных взамен диапазона, для оценок с изначально фиксированной оценкой данное не применяется.
Для сдвига оценок применим следующий алгоритм
Где Xavg это арифметическое среднее всех баллов для соответствующей награды, |X| — количество наград в данной категории.
После расчета новых значений, они заменяют рассчитанные ранее средние одновременно для всех категорий.
На следующем этапе рассчитываем финальный рейтинг вина, с учетом коэффициентов конкурса.
где M — общее количество медалей вина, ri — баллы за конкретную медаль, kNoTj — коэффициент значимости конкурса.
Примененная методика позволяет рассчитать очень взвешенный рейтинг вина, так как принимает во внимание множество факторов — оценки, выставленные не одиночным экспертом, а компетентным жюри, статистическое распределение оценок по различным типам наград, коэффициенты значимости конкурсов. Можно с уверенностью сказать, что на сегодняшний день это один из наиболее «честных» способов определения рейтинга вина.
В результате проведенной работы мы улучшили алгоритм таким-то образом, что, по предварительным оценкам, увеличило релевантность GWMR рейтинга на 30%. Командой Gustos уже собрана внушительная база данных по более чем 190 тыс. различных медалей на 205 международных конкурсах. Для оценки качества алгоритма была проведена сверка с престижным порталом wine-searcher.com по более 1000 вин. Среднее отклонение составило всего 0.51 пункта, при том, что wine-searcher публикует рейтинг в целых числах, а рейтинг GWMR рассчитан с точностью двух знаков после запятой. Следует отметить, что точное сравнение по всей базе данных затруднено ввиду разного написания тех же вин. В следующей статье мы планируем привести данные подобного сравнения с детальным описанием преимущества рейтинга GWMR.
Готовые продукты и решения (Сильнее!)
Еще более года назад мы рассуждали о практическом применении результатов расчета GWMR рейтинга для большинства медалированных вин мира. И вот готовые к использованию решения уже доступны для многих участников международного рынка.
В первую очередь мы реализовали обещанный виджет, но в более интересном формате чем планировалось изначально. Помимо отображения непосредственно GWMR рейтинга и последних полученных медалей, виджет опционально отображает и рейтинг Vivino.
Однако, связка между винами в нашей базе данных и их аналогами в системе Vivino является довольно трудоемким процессом и будет продолжаться еще какое-то время. В дальнейшем, мы планируем такую-же интеграцию с другими рейтинговыми системами, как например Wine Searcher.
Размещение виджета на любых внешних страницах абсолютно бесплатно и легко реализуемо. По техническим вопросам имплементации просим вас обращаться: ar@gmail.com
Вторым, но намного более значимым результатом проделанной работы стало создание Global Wine Medals & Competitions Report, который на более чем 2000 страницах описывает полную картину глобального рынка винных конкурсов, медалей и медалированных вин!
Данный отчет будет доступен к скачиванию 14-го Октября но уже открыта возможность предзаказа с значительной 50% скидкой.
- Для ознакомления с образцом отчета перейдите по данной ссылке.
- Чтобы приобрести отчет, перейдите по данной ссылке.
Помимо обычной опции отчета , также возможен заказ Персонального отчета для Винодельни, где помимо полной версии основного отчета будет отдельный персонализированный файл который содержит:
- Ваши показатели как производителя и занимаемое вами место в рамках Мира, Континента и Страны по целому ряду параметров.
- Успехи ваших топовых вин и занимаемое ими место в рамках Мира, Континента и Страны по каждой отдельной из категорий вин.
- Сравнительный анализ ваших показателей со средними значениями в рамках страны и винодельческого региона.
Также есть опция заказа Специального отчета для Дистрибьюторов, который де помимо полной версии основного отчета будет содержать несколько объемных таблиц:
- Таблица производителей по странам с их модельными показателями по категориям наград, а также в динамике за несколько лет.
- Таблица лучших вин по странам с их модельными показателями по категориям наград, а также в динамике за несколько лет.
Авторы:
- Анатолий Поятэ (профиль в Linkedin)
- Андрей Радул (профиль в Linkedin)
- Вячеслав Кунев (профиль в Linkedin)