Чемпионат мира по футболу: вся статистика за 96 лет в анимированных графиках
Я футбол не смотрю. Честно: ни одного матча не досмотрел до конца, максимум пролистываю хайлайты в ленте. Но когда полстраны вбивает в поиск «чемпионат мира по футболу статистика», а у меня под рукой оказывается датасет со всеми матчами турнира с 1930 года, дата-аналитик во мне уже не может пройти мимо. Так я и залип на неделю: не на игре, а на цифрах.
Меня зовут Алексей, я дата-аналитик. Обычно я считаю выручку и конверсии, но сегодня посчитаю голы. В этой статье вся статистика чемпионатов мира по футболу: 1053 матча, без малого три тысячи голов и 44 миллиона зрителей на трибунах, упакованные в графики и четыре анимированные гонки (bar chart race). Спойлер: главный «вечный» рекорд турнира пал, пока я писал этот текст.
Вот та самая гонка: 96 лет борьбы бомбардиров, спрессованные в полминуты. Досмотрите до конца, там и случилось главное.
Гонка бомбардиров чемпионатов мира, 1930–2026.
Ниже я разберу, как она собиралась и что за рекорд пал, а по дороге покажу ещё три гонки и полдюжины графиков. Если захотите повторить их самостоятельно, про код и грабли в данных будет отдельный разбор (готовлю продолжение).
96 лет и почти 3000 голов: как менялся футбол
Есть расхожее мнение: раньше забивали больше. Проверим по данным.

Результативность ЧМ по годам: пик 1954-го и стабилизация после реформ правил в 1990-х.
И это правда. На ЧМ-1954 в Швейцарии забивали 5,38 гола за матч, и этот рекорд не будет побит уже, кажется, никогда. Тогда Венгрия отгрузила восемь мячей сборной Германии ещё в группе, а в четвертьфинале Австрия и Швейцария выдали 7:5, до сих пор самый результативный матч в истории турнира.
Дальше футбол становился прагматичнее, и у каждого излома на графике есть причина. Обвал конца 1950-х чисто тактический: Италия довела до ума катеначчо, остальные подтянулись, и оборона впервые в истории догнала атаку. Дно пробили на Италии-90 с показателем 2,21 гола за матч (тот самый турнир, что вошёл в историю как один из самых скучных). ФИФА испугалась за зрелищность и ответила правилами: в 1992-м вратарям запретили брать руками пас от своих, в 1994-м за победу в группе стали давать три очка вместо двух, и отсиживаться в обороне сразу стало невыгодно. Сработало: с 1994 года результативность отскочила к 2,5–2,8 гола и держится там уже 30 лет. С точки зрения аналитика это красивый пример равновесия системы, которое сдвинули изменением правил. В продуктовой аналитике мы бы назвали это удачным изменением механики.
Пунктирная точка справа, идущий ЧМ-2026, показывает 2,92 гола за матч. Если темп удержится до финала, это будет самый результативный турнир с 1970 года, и причина снова в изменении правил, теперь формата: 48 сборных вместо 32 принесли и перестрелки новичков, и разгромы вроде 7:1 Германии над Кюрасао или 6:0 Канады над Катаром.
А вот трибуны, наоборот, только растут:

Средняя посещаемость матчей ЧМ. Рекорд США-1994 держится до сих пор.
Здесь тренд объясняется банально: посещаемость определяется вместимостью стадионов, а не любовью к футболу. Провал 1954–1962 годов дали маленькие арены Швейцарии, Швеции и Чили. Рекорд держится с США-1994 (почти 69 тысяч в среднем), потому что американцы играли на огромных стадионах для американского футбола. И у рекорда есть все шансы пасть прямо сейчас: ЧМ-2026 проходит на тех же аренах NFL, а финал примет стадион на 82 тысячи мест.
Заодно проверил дисциплину, и тут снова рулят не нравы, а правила. Скачок удалений в 1990-е выглядит как эпидемия грубости, но на деле ФИФА просто ужесточила кодекс: с 1990-го красную стали давать за фол последней надежды, с 1998-го за подкат сзади. Пик пришёлся на ЧМ-2006 в Германии, 26 удалений за турнир (привет Зидану и Матерацци), после чего кривая поехала вниз: игроки адаптировались, а VAR сделал наказания точнее. Серия пенальти тоже моложе, чем кажется: в правилах она с 1978 года, первая случилась в 1982-м (ФРГ против Франции, полуфинал), зато в Катаре-2022 их набралось сразу пять.

Удаления и серии пенальти по турнирам: рост объясняется изменениями в правилах.
Лучшие бомбардиры чемпионатов мира: гонка длиной в век
Вернёмся к той гонке из начала статьи. Статичный топ бомбардиров вы видели сто раз, а вот как он собирался, почти никто, и именно это показывает анимация выше: голы нарастающим итогом, турнир за турниром, включая идущий ЧМ-2026. Пройдёмся по ней эпоха за эпохой, у каждой свой герой:
- 1930–1950-е. Сначала лидирует аргентинец Гильермо Стабиле (8 голов на первом же ЧМ), потом венгры. Шандор Кочиш забивает 11 мячей за один турнир-1954, и тут же появляется Жюст Фонтен с 13 голами на ЧМ-1958. Тринадцать. За шесть матчей. Этот рекорд одного турнира стоит уже 68 лет и, похоже, вечен.
- 1970-е. Герд Мюллер обгоняет всех с 14 голами и держит первую строчку 32 года, дольше всех в истории.
- 2000-е. Бразилец Роналдо (тот самый, «Зубастик») добирается до 15 и снимает корону Мюллера в 2006-м.
- 2014. Мирослав Клозе, никогда не бывший самой яркой звездой своей сборной, методично, по 4–5 голов за турнир, доводит счёт до 16. Двенадцать лет этот рекорд считали заделом на десятилетия вперёд.
- 2026. А потом пришёл этот турнир, и вечный рекорд пал дважды за две недели. Лионель Месси на своём шестом чемпионате мира выдал 7 голов и довёл счёт до 20. Килиан Мбаппе идёт следом с 18, и он на одиннадцать лет моложе. Гарри Кейн тем временем тихо вышел на 13, вровень с Фонтеном и выше Пеле.
Отдельное удовольствие: смотреть, как последний кадр гонки перечёркивает всю её вековую логику. Топ, который десятилетиями строили марафонцы по 4–5 голов за турнир, взломали два спринтера разом. Оба ещё в сетке плей-офф, так что финальный кадр может устареть до конца месяца.
Статистика сборных: Бразилия против Германии, 96 лет погони
Второй race командный: забитые голы всех сборных нарастающим итогом. Здесь я объединил ФРГ и современную Германию (это одна федерация, а отдельная ГДР осталась отдельной строкой), иначе половина немецкой истории повисает в воздухе.
Голы сборных на ЧМ нарастающим итогом.
Сюжет получился почти детективный. В 1930-е лидируют Аргентина и Италия, с 1950-го вперёд выходит Бразилия и дальше 70 с лишним лет отбивается от Германии. Самое вкусное: за всю историю Германия перехватывала лидерство ровно один раз, в 2014-м. Да-да, в том самом году, когда случилось 7:1 в Белу-Оризонти: те семь мячей и вывели немцев на первую строчку. В 2018-м Бразилия вернула её обратно и держит до сих пор, хотя счёт на сегодня почти теннисный: 246 голов у Бразилии против 243 у Германии. Три мяча разницы после 96 лет футбола, и идущий турнир погоню только обострил: немцы успели наколотить одиннадцать мячей, прежде чем вылететь.
По победам картина та же, но с нюансами:
Выигранные матчи сборных нарастающим итогом.
79 побед у Бразилии, 70 у Германии, дальше с заметным отрывом Аргентина (51) и Италия (45). Победой я считал выигрыш в основное или дополнительное время; матчи, решённые в серии пенальти, в счёт побед не шли, иначе пришлось бы объяснять, почему проигранный по игре матч записан в выигранные.
А вот по титулам, то есть по главному, ради чего всё затевается, расклад другой:
Титулы чемпионов мира нарастающим итогом.
Первые сорок лет кубок делят Уругвай и Италия, потом начинается эра Бразилии: 5 титулов, и с 1970 года первую строчку она никому не отдавала. У Италии и Германии по 4, у Аргентины 3, и она подбирается. Обратите внимание на Германию: единственная команда из топа, которая побеждала реже, чем выходила в финалы, семь финалов при четырёх титулах. И да, у Англии с Испанией по одному кубку при их-то футбольной родословной: турнир беспощаден к репутациям.
Счёт врёт, xG нет: что метрика ожидаемых голов говорит о ЧМ
С 2018 года FIFA публикует xG (expected goals), вероятностную оценку того, сколько команда «должна была» забить с учётом качества моментов. Для аналитика это подарок: можно измерить, насколько результат матча заслужен. Я сравнил счёт и суммарный xG каждого матча двух последних чемпионатов:

Счёт против xG в каждом матче ЧМ-2018 и ЧМ-2022.
Точки над пунктиром: матчи, где забили больше, чем «положено». Под ним: матчи, где атаки стоили больше, чем показало табло. Два любимых примера:
- Англия против Ирана 6:2 на ЧМ-2022: восемь голов при суммарном xG 3,5. Тот случай, когда залетало всё.
- Южная Корея против Германии 2:0 в 2018-м: по моментам ближе к победе была Германия (xG 2,7 против 1,7 у корейцев), а на табло ноль и вылет действующих чемпионов из группы. xG честно показывает: ту группу немцы проиграли не по игре, а по реализации. Что, впрочем, совсем не утешает.
Мораль для коллег-аналитиков: одна метрика не заменяет результат, но объясняет его происхождение. Счёт фиксирует факт, xG добавляет контекст.
Что статистика говорит о ЧМ-2026
Теперь к текущему турниру. Формат раздулся до 48 сборных и 104 матчей, на 40 матчей больше, чем в Катаре. Для статистики это событие: выборка одного турнира выросла в полтора раза, и все средние показатели «на турнир» с 2026 года придётся нормировать (в графиках выше я это уже учёл, везде средние на матч, а не суммы).
Плей-офф тем временем уже выдал сюжетов на отдельную статью. Германия и Нидерланды вылетели в 1/16 финала в сериях пенальти, от Парагвая и Марокко соответственно. Марокко после этого ещё и разгромило Канаду 3:0 и первым вышло в четвертьфинал: восхождение с 22-й строчки рейтинга, начатое в Катаре, продолжается. Аргентина дожала Кабо-Верде, дебютанта, добравшегося до плей-офф, лишь в дополнительное время, 3:2. А Норвегия, впервые попавшая на ЧМ с 1998 года, дошла до 1/8, и Холанн с пятью голами уже в гонке бомбардиров турнира.
Как изменилась расстановка сил за четыре года, показывает рейтинг FIFA:

Рейтинг FIFA: топ-15 перед ЧМ-2026 и их позиции четыре года назад.
Главные сюжеты этого слоуп-чарта:
- Аргентина въехала в турнир первой ракеткой мира: чемпионский цикл продолжается.
- Бразилия упала с 1-го места на 6-е. Впервые за долгое время «селесао» подходит к чемпионату мира не фаворитом, а исторический топ по голам и победам, как мы выяснили выше, в плей-офф не играет.
- Марокко взлетело с 22-й строчки на 7-ю: полуфинал Катара был не случайностью, а началом тренда.
- Италия сползла с 6-го на 12-е место. Четырёхкратные чемпионы уже два цикла живут в статусе «тёмной лошадки».
Если верить цифрам, финал 19 июля должен разыграться между Аргентиной, Испанией и Францией, все трое, к слову, ещё в сетке. Но на то он и чемпионат мира, что раз в турнир какая-нибудь Южная Корея обнуляет чей-нибудь xG: спросите у Германии, как это работает в 1/16 финала против Парагвая. Именно этот шум и делает футбол таким неудобным для прогнозов и таким интересным для анализа.
Вместо выводов
Что я вынес из недели с этим датасетом:
- Футбол стал стабильнее. Результативность не меняется 30 лет, а рекорды 1950-х (5,38 гола за матч, 13 голов Фонтена) уже недостижимы: сама структура игры их больше не позволяет.
- Кумулятивные рекорды берут марафонцы, пока не приходит аномалия. Девяносто лет топ бомбардиров строили те, кто стабильно приносил 4–5 голов за турнир, как Клозе. А потом Месси и Мбаппе перекрыли «вечный» рекорд за один недоигранный чемпионат. В аналитике это называется сдвигом распределения: когда старая модель перестаёт описывать данные, пора перестраивать модель, а не спорить с данными.
- Данные знают о матче больше, чем табло. xG появился в официальной статистике только в 2018-м, но уже поменял то, как мы понимаем игру.
Все графики собраны на Python из открытого датасета Kaggle (964 матча с составами, судьями, посещаемостью и, начиная с 2018 года, xG), к которому я добавил результаты идущего турнира по состоянию на 4 июля. Как парсить голы из строк вида Lionel Messi · 108, зачем объединять ФРГ с Германией и как собрать такой же bar chart race на чистом matplotlib, я разберу в следующей статье и выложу там же и скрипты, и данные.
А пока цифры такие: Месси 20, Мбаппе 18, оба ещё в игре, и такой дуэли бомбардиров всех времён история турнира ещё не видела. Гонку перерисую после финала. Подпишитесь, чтобы не пропустить.