WyścigPKB · metodologia

Indeks Globalnego Wpływu Publicznego (IGW)

Otwarty wskaźnik łączący globalną uwagę, obecność medialną, własny zasięg komunikacyjny i szacowaną władzę decyzyjną osób publicznych. IGW nie ocenia, czy wpływ jest dobry, pokazuje, jak duża jest zdolność osoby do bycia widzianą, słyszaną i sprawczą w skali globalnej. Skala 0-1000.

v2.02010-202619 osób narracyjnych~600 osób w benchmarku

1. Czym jest IGW

Po zamknięciu Klout w 2018 i zakończeniu rankingu Forbes „World's Most Powerful People" w tym samym roku w przestrzeni publicznej nie ma jednego, otwartego, cross-domenowego wskaźnika wpływu. Listy typu Time 100 są jakościowe; rankingi miliarderów mierzą tylko majątek; liczniki obserwujących w social media premiują celebrytów nad politykami. IGW to próba zebrania sześciu komplementarnych sygnałów w jeden wskaźnik porównywalny między prezydentem, miliarderem, papieżem, sportowcem i artystą.

Wersja 2.0 (2026) jest świadomą zmianą filozofii względem v1.0. IGW v1.0 mieszał trzy zjawiska: widzialność publiczną, zainteresowanie informacyjne i realną władzę decyzyjną. v2.0 rozdziela te wymiary, każdy ma własny komponent i własny subindeks, a wynik łączny prezentowany jest jako jeden z kilku możliwych przekrojów, nie „ostateczna prawda".

2. Jak interpretować wynik

Najważniejsze zdanie metodologii: IGW nie jest oceną moralną, rankingiem zasług ani miarą pozytywnego wpływu. Wysoki wynik oznacza dużą zdolność osoby publicznej do przyciągania uwagi, kształtowania agendy lub podejmowania decyzji odczuwalnych przez duże grupy ludzi. Wpływ może być pozytywny, negatywny albo ambiwalentny.

IGW prezentujemy nie jako „ostateczny ranking wpływu", lecz jako otwarty radar globalnego wpływu publicznego. Jeden wskaźnik nigdy nie odpowie, czy Cristiano Ronaldo, Xi Jinping, Taylor Swift i Elon Musk są „naprawdę" porównywalni, dlatego obok wyniku łącznego publikujemy cztery subindeksy oraz test wrażliwości wag.

3. Formuła v2.0

IGW v2.0 to ważona suma sześciu znormalizowanych komponentów (każdy 0-100), pomnożona przez 10, co daje końcową skalę 0-1000:

IGW v2.0 = 10 × (
    0.20·A   Attention Demand
  + 0.20·M   Media Agenda
  + 0.15·O   Owned Audience
  + 0.25·D   Decision Power
  + 0.10·N   Network Centrality
  + 0.10·T   Temporal Persistence
)

Wagi i co mierzą

KomponentWagaCo mierzy
(A) Attention Demand20%Wikipedia pageviews + Google Trends momentum. Realny popyt na informację o osobie i dynamika zainteresowania.
(M) Media Agenda20%GDELT: wzmianki znormalizowane do wolumenu medialnego roku, różnorodność źródeł i języków.
(O) Owned Audience15%Social media: log followersów, liczba aktywnych platform, opcjonalnie engagement proxy.
(D) Decision Power25%Władza formalna, kapitałowa, instytucjonalna lub organizacyjna wg matrycy scoringowej.
(N) Network Centrality10%Centralność osoby w sieci innych osób, organizacji i tematów (graf GDELT GKG).
(T) Temporal Persistence10%Stabilność wpływu w czasie, 3-letnia średnia ważona z dyskontem.

Dlaczego v2.0 inaczej niż v1.0: w v1.0 łączna waga komponentów uwagi (W+S+G) wynosiła 70%, a władza decyzyjna tylko 10%. W praktyce IGW v1.0 mierzył uwagę z korektą o władzę. v2.0 podnosi D do 25% i wyodrębnia dwa nowe wymiary (Network, Temporal), które ograniczają premię za jednoroczny skandal lub viral.

4. Komponenty

(A) Attention Demand

Złożony komponent łączący popyt informacyjny i jego dynamikę:

A = 0.60·Wikipedia + 0.40·Google Trends Momentum

Wikipedia (60% komponentu A)

Suma dziennych wyświetleń stron biograficznych w dziesięciu najpopularniejszych językach (en, es, zh, hi, ru, ar, pt, ja, de, fr) zagregowana do średniej rocznej, transformacja log10. Źródło: Wikimedia Pageviews API.

Ograniczenie: Pageviews API podaje dane od 1 lipca 2015. Lata 2010-2014 mają niższą klasę wiarygodności (C/D) i są rekonstruowane z Wikipedia stats.grok.se oraz interpolacji wokół znanych kamieni milowych.

Google Trends Momentum (40% komponentu A)

Google Trends mierzy względną dynamikę zainteresowania daną osobą w czasie, wartości 0-100 są normalizowane wewnątrz zapytania. Nie jest to absolutna miara popularności między osobami. Dlatego w v2.0 traktujemy Trends jako momentum, nie wolumen, i używamy stałych anchor terms (kilka globalnie znanych nazw, np. „Barack Obama", „football", „COVID") do skalowania zapytań we wspólnej ramie porównawczej. Szczegóły metody: Google Trends Understanding the data.

(M) Media Agenda

Obecność osoby w agendzie medialnej, znormalizowana do rosnącego wolumenu internetu:

M = log(mentions_osoby / mentions_total_GDELT_year)
    × source_diversity
    × language_diversity

Źródło: GDELT Project, konkretnie Global Knowledge Graph 2.0 (dostępny od 1 kwietnia 2013). Dla lat 2010-2012 używamy GDELT Event Database 1.0 z klasą wiarygodności C.

Dlaczego normalizacja do rocznego wolumenu: bez niej 2024 automatycznie wygląda „większy" niż 2012, bo internet i monitoring danych są większe, nie dlatego że konkretna osoba ma więcej wpływu. source_diversitylanguage_diversity chronią przed nadmiernym premiowaniem osób popularnych w jednym kraju lub w jednym typie źródła.

(O) Owned Audience

Własny kanał komunikacji osoby:

O = 0.70·log(suma_followers)
  + 0.15·multi-platform breadth
  + 0.15·engagement proxy

Followersi sumowani z X/Twitter, Instagram, TikTok, YouTube, Weibo, Facebook (publiczny profil), stan na styczeń każdego roku. multi-platform breadth = liczba platform z aktywną obecnością. engagement proxy (gdzie dostępny) = mediana like-rate ostatnich 30 postów. Gdzie engagement nie jest pobieralny historycznie, używamy uproszczonego wariantu:

O = 0.80·log(followers) + 0.20·liczba aktywnych platform

Źródła: Social Blade, archiwum publicznych liczników, Wayback Machine dla lat 2010-2014.

Świadome ograniczenie: komponent O premiuje osoby publicznie aktywne. Przywódcy zamknięci (Xi Jinping, Ali Chamenei) mają O bliskie zero, mimo realnej władzy, dlatego waga O wynosi tylko 15% (a nie 40-50%, jak miał Klout) i jest balansowana przez wysoką wagę D.

(D) Decision Power

Najważniejszy filozoficznie komponent v2.0 i jednocześnie najmocniej dopracowany względem v1.0. Wpływ może być formalny, kapitałowy, kulturowy, infrastrukturalny, epistemiczny lub mobilizacyjny, D próbuje uchwycić wszystkie te wymiary za pomocą jawnej matrycy scoringowej zamiast jednej liczby ekspertyzy.

Każda osoba dostaje wynik 0-100 wg matrycy przypisanej do jej typu:

Politycy

Bazapopulacja kraju × PKB kraju × zakres kompetencji urzędu
Korektarealna koncentracja władzy, ograniczenia parlamentarne/sądowe, długość kadencji, formalna vs faktyczna kontrola

CEO / Founderzy

Bazakapitalizacja / wartość organizacji × udział w kontroli × centralność sektora
Korektaczy osoba nadal decyduje operacyjnie, czy jest twarzą bez kontroli

Liderzy religijni

Bazaliczba wiernych × centralizacja instytucji
Korektarealna dyscyplina organizacyjna, globalna rozpoznawalność, wpływ na instytucje polityczne lub społeczne

Artyści / Sportowcy

Bazapubliczność × zdolność mobilizacji
Korektaudokumentowany wpływ polityczny, kulturowy, ekonomiczny, kampanie społeczne, efekt na zachowania grup

Aktywiści

Bazawidzialność sprawy × efekt instytucjonalny
Korektawpływ na regulacje, instytucje, debatę, protesty, agendę międzynarodową

Pełna tabela D z uzasadnieniem per osoba publikowana jest razem z danymi w influence.json. Zapraszamy do sporu, D jest najsilniej narażony na krytykę i dlatego ma jawną strukturę zamiast czarnej skrzynki.

(N) Network Centrality

Centralność osoby w sieci innych osób, organizacji i tematów liczona z grafu współwystępowań GDELT GKG. Im częściej osoba jest wzmiankowana razem z różnymi instytucjami i innymi osobami, tym wyższe N. Komponent karze izolowanych celebrytów i nagradza osoby działające w sieci, m.in. dlatego sędziowie SN, szefowie banków centralnych i dyplomaci są w v2.0 lepiej widoczni niż w v1.0.

(T) Temporal Persistence

3-letnia średnia ważona z dyskontem 0.5/0.3/0.2 (rok bieżący/poprzedni/dwa lata wstecz) aplikowana do sumy A+M+O+D+N. Komponent karze jednoroczne wzloty (skandal, viral) i nagradza trwałą obecność. Bez T ranking byłby silnie podatny na sezonowe wahania, np. Greta Thunberg 2019 lub Putin 2022 dominowałyby cały okres.

5. Normalizacja

Każdy komponent jest sprowadzany do skali 0-100 przez przeskalowanie percentyli w szerokim uniwersum referencyjnym ~600 osób publicznych, nie tylko 19 osób narracyjnych. To kluczowa zmiana względem v1.0.

Dlaczego to ważne: jeżeli normalizujesz tylko względem 19 osób, wynik każdej osoby zależy od tego, kogo akurat włączyłeś do koszyka, usunięcie Cristiano Ronaldo zmienia wynik wszystkich pozostałych w komponencie O. Indeks nie jest wtedy stabilny jako skala.

Procedura normalizacji per komponent i rok:

  1. Zbierz wartości surowe dla wszystkich ~600 osób w uniwersum benchmarkowym.
  2. Zastosuj transformację log10 dla komponentów z rozkładem heavy-tail (Wikipedia, GDELT, followersi).
  3. Zwinsoryzuj outliery na poziomie 1. i 99. percentyla.
  4. Przeskaluj percentyl do skali 0-100, z ustalonymi kotwicami: 0 = 5. percentyl, 50 = mediana, 100 = 99. percentyl.
  5. Pokaż w animacji wybrane 19 osób narracyjnych.

Kotwice są stałe między edycjami, wynik 70 w komponencie A w 2024 i 2026 oznacza tę samą pozycję względem populacji odniesienia, nie względem chwilowego top 19.

6. Klasy wiarygodności danych

Każda kombinacja (komponent × osoba × rok) ma przypisaną klasę jakości danych:

KlasaZnaczenieTypowe lata
ADane bezpośrednie, kompletne (API zwraca pełną historię)2015-2026 dla Wikipedia/GDELT; 2018-2026 dla TikTok
BDane bezpośrednie, częściowo niekompletne2013-2014 dla GDELT GKG; 2010-2014 dla Wikipedia stats.grok.se
CRekonstrukcja z proxy lub interpolacja wokół kamieni milowych2010-2012 dla większości komponentów
DEstymacja ekspercka / brak pełnych danychkomponent D dla wszystkich lat (z definicji)
Konsekwencja praktyczna: wyniki z lat 2010-2014 publikujemy z niższą klasą wiarygodności. Różnic mniejszych niż 25-50 punktów w tym okresie nie należy interpretować jako jednoznacznej przewagi jednej osoby nad drugą.

7. Subindeksy

Obok wyniku łącznego publikujemy cztery profile wpływu. Ten sam zestaw komponentów, ale inne wagi, pokazują, jaki typ wpływu dominuje u osoby:

SubindeksCo pokazujeDominujące komponenty
Attention RankKto najbardziej przyciąga uwagę?A (60%) + M (40%)
Power RankKto ma największą formalną/instytucjonalną sprawczość?D (70%) + N (30%)
Media Agenda RankKto dominuje w mediach?M (70%) + N (30%)
Audience RankKto ma największy własny kanał komunikacji?O (100%)

Dzięki subindeksom widać, że Taylor Swift dominuje w Audience i Attention, a Xi Jinping w Power i Network, i nie trzeba udawać, że są porównywalni jednym płaskim typem wpływu.

8. Confidence score

Każdy wynik IGW ma przypisany poziom pewności A/B/C/D, zależny od kompletności danych, liczby źródeł, jakości danych historycznych, zgodności wariantów wag i stabilności wyniku między metodami:

ConfidenceZnaczenie
ADane mocne, wynik stabilny między wariantami wag
BDane dobre, umiarkowana niepewność
CDane częściowo rekonstruowane lub silnie zależne od wag
DWynik poglądowy, nie nadaje się do ostrego porównania

Przykład: Donald Trump 2024: IGW 880 / confidence A · Xi Jinping 2024: IGW 780 / confidence B · Dalajlama 2024: IGW 400 / confidence C+ · Papież Leon XIV 2025: IGW 780 / confidence C (krótka kadencja, mało danych post-elekcyjnych).

9. Test wrażliwości wag

Ponieważ IGW jest wskaźnikiem kompozytowym, wynik zależy od decyzji o wagach, normalizacji i doborze źródeł. Dlatego przy każdej dużej edycji publikujemy siedem wariantów alternatywnych i porównujemy stabilność pozycji:

  1. Wagi bazowe v2.0 (referencja)
  2. Równe wagi (każdy komponent 1/6)
  3. Bez Owned Audience (waga O = 0, redystrybucja)
  4. Bez Decision Power (waga D = 0, redystrybucja)
  5. Attention-only (A + M, reszta = 0)
  6. Power-heavy (D = 50%, reszta proporcjonalnie)
  7. Media-heavy (M = 40%, reszta proporcjonalnie)

Osoby, których pozycja pozostaje stabilna w większości wariantów, dostają confidence A lub B. Osoby, których pozycja zależy silnie od jednej wagi, dostają C lub D i są wyraźnie oznaczone na wykresie.

10. Selekcja osób

v2.0 rozdziela dwie rzeczy:

Uniwersum kalibracyjne (~600 osób)

Szeroki benchmark globalnych osób publicznych używany do normalizacji każdego komponentu. Pochodzi z przecięcia: top 1000 Wikipedia pageviews 2015-2025 (10 języków), top 200 GDELT GKG persons per rok, oraz osoby z list Time 100 / Forbes Powerful People / Bloomberg Billionaires 2010-2026. Uniwersum kalibracyjne nie jest pokazywane w animacji, służy wyłącznie do stabilizacji skali.

Lista narracyjna (19 osób)

Osoby pokazywane w animacji i rankingu. Kryteria doboru: (1) globalna rozpoznawalność, (2) co najmniej jeden rok w czołówce Time/Forbes/Atlantic 2010-2026, (3) równowaga geograficzna (USA, Chiny, Europa, Indie, Ameryka Południowa, Bliski Wschód), (4) różnorodność profesji (polityka, biznes, religia, sport, kultura, aktywizm, technologia).

Pełna lista: Barack Obama, Donald Trump, Xi Jinping, Władimir Putin, Narendra Modi, Angela Merkel, Papież Franciszek, Papież Leon XIV, Dalajlama, Elon Musk, Bill Gates, Mark Zuckerberg, Jeff Bezos, Sam Altman, Taylor Swift, Cristiano Ronaldo, Lionel Messi, Greta Thunberg, Beyoncé.

11. Zakres i ograniczenia

Zakres wskaźnika

IGW mierzy globalny wpływ publiczny osób żyjących i publicznie mierzalnych. Nie obejmuje: osób anonimowych, funkcjonariuszy służb, niejawnych decydentów ani osób, których wpływ jest realny, ale niewidoczny w otwartych danych (np. szefowie funduszy hedgingowych operujący poza mediami, oligarchowie unikający publiczności, anonimowi szefowie wywiadów).

Znane biasy

  • Bias językowy. Wikipedia, GDELT i Trends są mocniej zasiedlone w językach zachodnich, osoby aktywne głównie w chińskim Internecie (Weibo, Baidu, Toutiao) są niedoszacowane mimo trzech języków azjatyckich w koszyku Wikipedii.
  • Bias recencji. M, A i Trends premiują bieżące wydarzenia. T (Temporal Persistence) częściowo to łagodzi, ale nie eliminuje.
  • Bias social media. Komponent O premiuje osoby publicznie aktywne, dlatego waga wynosi tylko 15% i jest balansowana wysokim D.
  • Rekonstrukcja danych 2010-2014. Większość API z tego okresu nie istnieje. Lata te mają klasę wiarygodności B-C, oznaczone osobno na wykresie (niższa opacity bar).
  • Komponent D jest oceną ekspercką. Mimo matrycy scoringowej pozostaje subiektywny. Dlatego publikujemy wariant „bez D" w teście wrażliwości.
  • Anchor terms w Trends. Skalowanie do wspólnej ramy poprzez koszyk kotwic redukuje, ale nie eliminuje problemu względności Google Trends.

12. Changelog

WersjaDataZmiany
v1.02026-01Pierwsza wersja publiczna. Pięć komponentów (W/S/N/G/P), wagi 30/25/20/15/10, normalizacja względem 18 osób, jakościowy P.
v1.12026-03Doprecyzowanie interpretacji, dodanie disclaimera „nie ranking moralny", oznaczenie lat 2010-2014 jako niższej klasy wiarygodności. Wagi bez zmian.
v2.02026-05Nowa formuła sześciokomponentowa (A/M/O/D/N/T). Wprowadzenie uniwersum kalibracyjnego ~600 osób. Matryca scoringowa dla D. Subindeksy, confidence score, test wrażliwości wag. Anchor terms dla Google Trends. Normalizacja GDELT do rocznego wolumenu.

13. Cytowanie

Jeśli używasz IGW w artykule, prezentacji lub na wykresie, prosimy o link do tej strony oraz wskazanie wersji, np.:

IGW v2.0, WyścigPKB, https://wyscigpkb.pl/metodologia

14. Źródła i punkty weryfikacji

WyścigPKB · wyscigpkb.pl · IGW v2.0 (2026-05).
Otwarte dane, surowe komponenty i tabela D z uzasadnieniami: info@wyscigpkb.pl.
IGW jest projektem otwartym, zachęcamy do krytyki, replikacji i forkowania metody.

WyścigPKB · methodology

Global Public Influence Index (IGW)

An open indicator combining global attention, media presence, owned-channel reach and an estimate of decision power for public figures. IGW does not judge whether someone's influence is good, it shows how large a person's ability to be seen, heard and consequential is on a global scale. Scale 0-1000.

v2.02010-202619 narrative figures~600 in benchmark

1. What IGW is

After Klout shut down in 2018 and Forbes ended its "World's Most Powerful People" ranking the same year, there is no single open cross-domain indicator of influence in public circulation. Lists like Time 100 are qualitative; billionaire rankings only measure wealth; social-media follower counts reward celebrities over politicians. IGW is an attempt to combine six complementary signals into one indicator that is comparable across a president, a billionaire, a pope, an athlete and an artist.

Version 2.0 (2026) is a deliberate philosophical shift from v1.0. IGW v1.0 mixed three phenomena: public visibility, information interest and real decision power. v2.0 separates these dimensions, each has its own component and its own sub-index, and the combined score is presented as one of several possible cross-sections, not "the final truth".

2. How to interpret the score

The most important sentence in this methodology: IGW is not a moral judgment, a merit ranking or a measure of positive influence. A high score means a public figure has a large capacity to attract attention, shape the agenda or take decisions that are felt by large groups of people. Influence can be positive, negative or ambivalent.

We present IGW not as a "final ranking of influence" but as an open radar of global public influence. No single indicator will ever answer whether Cristiano Ronaldo, Xi Jinping, Taylor Swift and Elon Musk are "really" comparable, which is why alongside the combined score we publish four sub-indices and a weight-sensitivity test.

3. v2.0 formula

IGW v2.0 is the weighted sum of six normalized components (each 0-100), multiplied by 10, giving a final 0-1000 scale:

IGW v2.0 = 10 × (
    0.20·A   Attention Demand
  + 0.20·M   Media Agenda
  + 0.15·O   Owned Audience
  + 0.25·D   Decision Power
  + 0.10·N   Network Centrality
  + 0.10·T   Temporal Persistence
)

Weights and what they measure

ComponentWeightWhat it measures
(A) Attention Demand20%Wikipedia pageviews + Google Trends momentum. Real demand for information about the person, plus the dynamics of interest.
(M) Media Agenda20%GDELT: mentions normalized to the year's total media volume, source diversity and language diversity.
(O) Owned Audience15%Social media: log of followers, number of active platforms, optionally an engagement proxy.
(D) Decision Power25%Formal, capital, institutional or organizational power per the scoring matrix.
(N) Network Centrality10%The person's centrality in the network of other people, organizations and topics (GDELT GKG graph).
(T) Temporal Persistence10%Stability of influence over time, a 3-year discounted weighted average.

Why v2.0 differs from v1.0: in v1.0 the combined weight of attention components (W+S+G) was 70% and decision power only 10%. In practice IGW v1.0 measured attention with a power correction. v2.0 raises D to 25% and introduces two new dimensions (Network, Temporal) that dampen the premium for a one-off scandal or viral moment.

4. Components

(A) Attention Demand

A composite combining information demand and its dynamics:

A = 0.60·Wikipedia + 0.40·Google Trends Momentum

Wikipedia (60% of A)

Sum of daily biographical pageviews in the ten most-popular languages (en, es, zh, hi, ru, ar, pt, ja, de, fr), aggregated to an annual average with a log10 transform. Source: Wikimedia Pageviews API.

Limitation: the Pageviews API only goes back to 1 July 2015. Years 2010-2014 have a lower data-quality class (C/D) and are reconstructed from Wikipedia stats.grok.se and interpolation around known milestones.

Google Trends Momentum (40% of A)

Google Trends measures the relative dynamics of interest in a person over time; values 0-100 are normalized within the query. It is not an absolute measure of popularity across people. So in v2.0 we treat Trends as momentum, not volume, and use fixed anchor terms (a few globally known names, e.g. "Barack Obama", "football", "COVID") to scale queries into a common comparison frame. Method details: Google Trends Understanding the data.

(M) Media Agenda

The person's presence in the media agenda, normalized to the internet's growing volume:

M = log(person_mentions / total_GDELT_mentions_in_year)
    × source_diversity
    × language_diversity

Source: GDELT Project, specifically Global Knowledge Graph 2.0 (available from 1 April 2013). For 2010-2012 we use GDELT Event Database 1.0 with a class-C confidence flag.

Why normalize by yearly volume: without it, 2024 automatically looks "bigger" than 2012 because the internet and media monitoring are larger, not because a given person has more influence. source_diversity and language_diversity guard against over-rewarding people popular in one country or one source type.

(O) Owned Audience

The person's own communication channel:

O = 0.70·log(total_followers)
  + 0.15·multi-platform breadth
  + 0.15·engagement proxy

Followers summed across X/Twitter, Instagram, TikTok, YouTube, Weibo, Facebook (public profile), measured at January each year. multi-platform breadth = count of platforms with active presence. engagement proxy (where available) = median like-rate of the last 30 posts. Where engagement cannot be retrieved historically we use the simplified variant:

O = 0.80·log(followers) + 0.20·number of active platforms

Sources: Social Blade, archives of public counters, Wayback Machine for 2010-2014.

Deliberate limitation: component O rewards publicly active people. Closed leaders (Xi Jinping, Ali Khamenei) score near zero on O despite real power, which is why the weight is only 15% (not 40-50% as Klout had) and is balanced by a high D weight.

(D) Decision Power

The most important component philosophically in v2.0 and the one most strongly reworked from v1.0. Influence can be formal, capital-based, cultural, infrastructural, epistemic or mobilizational; D tries to capture all these dimensions through an explicit scoring matrix instead of a single expert number.

Every person receives a 0-100 score per the matrix assigned to their type:

Politicians

Basecountry population × country GDP × scope of office competencies
Adjustmentreal concentration of power, parliamentary/judicial constraints, term length, formal vs. de-facto control

CEOs / Founders

Basemarket cap / organizational value × ownership / control share × sector centrality
Adjustmentdoes the person still decide operationally, or are they a figurehead without control

Religious leaders

Basenumber of faithful × institutional centralization
Adjustmentactual organizational discipline, global recognition, influence on political or social institutions

Artists / Athletes

Baseaudience × mobilization capacity
Adjustmentdocumented political, cultural, economic influence, social campaigns, effect on group behavior

Activists

Basecause visibility × institutional effect
Adjustmentinfluence on regulation, institutions, debate, protests, international agenda

The full D table with per-person justifications is published together with the data in influence.json. We welcome disagreement; D is the component most exposed to criticism, which is why it has an explicit structure rather than a black box.

(N) Network Centrality

The person's centrality in the network of other people, organizations and topics, computed from the GDELT GKG co-occurrence graph. The more often a person is co-mentioned with diverse institutions and other people, the higher N. The component penalizes isolated celebrities and rewards people who operate inside networks, which is part of why supreme-court justices, central-bank governors and diplomats are better surfaced in v2.0 than in v1.0.

(T) Temporal Persistence

A 3-year discounted weighted average (0.5/0.3/0.2 for current/previous/two-years-back) applied to the A+M+O+D+N total. The component penalizes one-year spikes (scandal, viral) and rewards sustained presence. Without T the ranking would be highly vulnerable to seasonal swings, e.g. Greta Thunberg 2019 or Putin 2022 would dominate the entire period.

5. Normalization

Each component is brought to a 0-100 scale by percentile-rescaling against a broad reference universe of ~600 public figures, not only the 19 narrative figures. This is the key change from v1.0.

Why this matters: if you normalize only against 19 people, every person's score depends on whom you happen to include in the basket; removing Cristiano Ronaldo changes everyone else's O score. The index is then not stable as a scale.

Normalization procedure per component per year:

  1. Collect raw values for all ~600 people in the benchmark universe.
  2. Apply a log10 transform for heavy-tailed components (Wikipedia, GDELT, followers).
  3. Winsorize outliers at the 1st and 99th percentiles.
  4. Rescale percentile to 0-100 with fixed anchors: 0 = 5th percentile, 50 = median, 100 = 99th percentile.
  5. Display the 19 narrative figures in the animation.

Anchors are stable across editions; a score of 70 in component A in 2024 and 2026 means the same position relative to the reference population, not relative to the current top 19.

6. Data-quality classes

Every (component × person × year) combination has an assigned data-quality class:

ClassMeaningTypical years
ADirect data, complete (API returns full history)2015-2026 for Wikipedia/GDELT; 2018-2026 for TikTok
BDirect data, partially incomplete2013-2014 for GDELT GKG; 2010-2014 for Wikipedia stats.grok.se
CReconstruction from proxies or interpolation around milestones2010-2012 for most components
DExpert estimate / no complete datacomponent D for all years (by definition)
Practical consequence: we publish 2010-2014 results with a lower data-quality class. Differences smaller than 25-50 points in that period should not be interpreted as one person unambiguously outranking another.

7. Sub-indices

Alongside the combined score we publish four influence profiles. Same set of components, different weights, showing which type of influence dominates for a person:

Sub-indexWhat it showsDominant components
Attention RankWho attracts the most attention?A (60%) + M (40%)
Power RankWho has the most formal/institutional agency?D (70%) + N (30%)
Media Agenda RankWho dominates the media?M (70%) + N (30%)
Audience RankWho has the largest owned communication channel?O (100%)

Sub-indices make it visible that Taylor Swift dominates in Audience and Attention while Xi Jinping dominates in Power and Network, and there is no need to pretend they are comparable on a single flat type of influence.

8. Confidence score

Every IGW result has an A/B/C/D confidence level based on data completeness, number of sources, quality of historical data, agreement across weight variants and result stability across methods:

ConfidenceMeaning
AStrong data, result stable across weight variants
BGood data, moderate uncertainty
CData partially reconstructed or strongly weight-dependent
DIndicative result, not fit for sharp comparison

Example: Donald Trump 2024: IGW 880 / confidence A · Xi Jinping 2024: IGW 780 / confidence B · Dalai Lama 2024: IGW 400 / confidence C+ · Pope Leo XIV 2025: IGW 780 / confidence C (short tenure, sparse post-election data).

9. Weight-sensitivity test

Because IGW is a composite indicator, the result depends on decisions about weights, normalization and source selection. So with every major edition we publish seven alternative variants and compare position stability:

  1. Baseline v2.0 weights (reference)
  2. Equal weights (each component 1/6)
  3. No Owned Audience (O = 0, redistributed)
  4. No Decision Power (D = 0, redistributed)
  5. Attention-only (A + M, rest = 0)
  6. Power-heavy (D = 50%, rest proportional)
  7. Media-heavy (M = 40%, rest proportional)

People whose position stays stable across most variants get confidence A or B. People whose position depends heavily on a single weight get C or D and are clearly marked on the chart.

10. Person selection

v2.0 separates two things:

Calibration universe (~600 people)

A broad benchmark of global public figures used to normalize every component. It comes from the intersection of: top 1000 Wikipedia pageviews 2015-2025 (10 languages), top 200 GDELT GKG persons per year, and people from Time 100 / Forbes Powerful People / Bloomberg Billionaires 2010-2026 lists. The calibration universe is not shown in the animation; it exists only to stabilize the scale.

Narrative list (19 people)

The people shown in the animation and ranking. Selection criteria: (1) global recognition, (2) at least one year in the top of Time/Forbes/Atlantic 2010-2026, (3) geographic balance (USA, China, Europe, India, South America, Middle East), (4) profession diversity (politics, business, religion, sport, culture, activism, technology).

Full list: Barack Obama, Donald Trump, Xi Jinping, Vladimir Putin, Narendra Modi, Angela Merkel, Pope Francis, Pope Leo XIV, Dalai Lama, Elon Musk, Bill Gates, Mark Zuckerberg, Jeff Bezos, Sam Altman, Taylor Swift, Cristiano Ronaldo, Lionel Messi, Greta Thunberg, Beyoncé.

11. Scope & limitations

Indicator scope

IGW measures the global public influence of living and publicly measurable people. It does not cover: anonymous individuals, intelligence officers, undisclosed decision-makers, or people whose influence is real but invisible in open data (e.g. hedge-fund heads operating outside the media, oligarchs avoiding publicity, anonymous intelligence chiefs).

Known biases

  • Language bias. Wikipedia, GDELT and Trends are more heavily populated in Western languages; people active primarily on the Chinese internet (Weibo, Baidu, Toutiao) are underestimated despite three Asian languages in the Wikipedia basket.
  • Recency bias. M, A and Trends reward current events. T (Temporal Persistence) softens this but does not eliminate it.
  • Social-media bias. Component O rewards publicly active people, which is why its weight is only 15% and is balanced by a high D.
  • 2010-2014 reconstruction. Most APIs from that period don't exist. Those years have data-quality class B-C, marked separately on the chart (lower bar opacity).
  • Component D is an expert assessment. Despite the scoring matrix, it remains subjective. That is why we publish a "no-D" variant in the sensitivity test.
  • Trends anchor terms. Scaling to a common frame through an anchor basket reduces but does not eliminate the relativity problem of Google Trends.

12. Changelog

VersionDateChanges
v1.02026-01First public version. Five components (W/S/N/G/P), weights 30/25/20/15/10, normalization against 18 people, qualitative P.
v1.12026-03Clarified interpretation, added "not a moral ranking" disclaimer, flagged 2010-2014 as lower data-quality class. Weights unchanged.
v2.02026-05New six-component formula (A/M/O/D/N/T). Introduction of a ~600-person calibration universe. Scoring matrix for D. Sub-indices, confidence score, weight-sensitivity test. Anchor terms for Google Trends. GDELT normalization to yearly volume.

13. Citation

If you use IGW in an article, presentation or chart, please link back to this page and cite the version, e.g.:

IGW v2.0, WyścigPKB, https://wyscigpkb.pl/metodologia

14. Sources & verification points

WyścigPKB · wyscigpkb.pl · IGW v2.0 (2026-05).
Open data, raw components and the D table with justifications: info@wyscigpkb.pl.
IGW is an open project, we welcome criticism, replication and forking of the method.

WyścigPKB · metodologia

Polska Lista Bestsellerów

Skumulowana sprzedaż książek w Polsce dla 20 najczęściej kupowanych autorów, narastająco od stycznia 2010 do maja 2026. Skala w milionach egzemplarzy. Lista obejmuje autorów polskich oraz tłumaczonych autorów zagranicznych dystrybuowanych na polskim rynku.

v1.02010-202620 autorówmln egz.

Co mierzymy

Polska Lista Bestsellerów to prosta miara: łączna liczba egzemplarzy sprzedanych w Polsce przez autora od 1 stycznia 2010 do dnia publikacji. Liczone razem są wszystkie tytuły danego autora, we wszystkich kanałach dystrybucji: księgarnie sieciowe (Empik), księgarnie internetowe (Bonito, Książki Hand-Made), aplikacje czytelnicze (Bookmate, Storytel, Legimi), kioski prasowe, a także sprzedaż lektur szkolnych. Książki audio i e-booki są wliczane jako pełne egzemplarze.

To inny wskaźnik niż IGW. Ranking bestsellerów mierzy liczbę sprzedanych książek, nie globalny wpływ publiczny. Dlatego nie stosujemy tu sześciu komponentów A/M/O/D/N/T, kalibracji do uniwersum 600 osób, confidence score ani testu wrażliwości wag. Te narzędzia są opisane w zakładce Wpływ.

Co nie jest liczone

  • Sprzedaż przed 1 stycznia 2010 (klasycy mają więc niskie wartości startowe).
  • Sprzedaż za granicą, nawet jeśli książkę wydaje polski autor.
  • Sprzedaż na rynku wtórnym (Allegro, OLX, antykwariaty).
  • Egzemplarze rozdane w ramach akcji promocyjnych, kongresów, bibliotek darowiznowych.

Klasy wiarygodności

KlasaZnaczenie
ADane bezpośrednie z raportu wydawcy lub publicznego oświadczenia (np. raport roczny Empik)
BListy bestsellerów Empik / Bonito / Bookmate, agregacja tygodniowa do roku
CSzacunek na podstawie liczby wydań i tygodni na listach, wyrównany do dostępnych potwierdzeń

Źródła danych

Znane biasy

  • Bias szkolny. Sienkiewicz, Mickiewicz, Prus, Lem, Tokarczuk (Bieguni jako lektura uzupełniająca), Gombrowicz korzystają z corocznych zakupów szkolnych. Modyfikacja listy lektur w 2024 zmieniła trend.
  • Bias gier i Netflixa. Sapkowski rośnie skokowo po Wiedźminie 3 (2015) i Netflixie (2019).
  • Bias autora wielokrotnego. Mróz wydaje 4-8 powieści rocznie. Sumaryczna sprzedaż rośnie szybciej niż u autorów wydających rzadziej.
  • Bias tłumaczeń. Hity zagraniczne (50 Twarzy Greya, Harry Potter) wchodzą skokowo i po kilku latach saturują się.
WyścigPKB · methodology

Poland's Top Book Sales

Cumulative book sales in Poland for the 20 most-bought authors, counted from 1 January 2010 to the publication date. Scale in millions of copies. Includes Polish authors and translated foreign authors distributed on the Polish market.

v1.02010-202620 authorsmillions of copies

What we measure

Poland's Top Book Sales is a simple metric: the total number of copies an author has sold in Poland from 1 January 2010 to the publication date. All of an author's titles are counted together, across every distribution channel: chain bookstores (Empik), online bookstores (Bonito, Książki Hand-Made), reading apps (Bookmate, Storytel, Legimi), newsstands, and school-reading sales. Audiobooks and e-books count as full copies.

This is a different indicator than IGW. The bestseller ranking measures copies sold, not global public influence. So we do not use the six A/M/O/D/N/T components, the 600-person calibration universe, confidence scores or weight-sensitivity tests. Those tools are described in the Influence tab.

What is not counted

  • Sales before 1 January 2010 (so classics start with low base values).
  • Sales abroad, even if the book is by a Polish author.
  • Second-hand sales (Allegro, OLX, antique bookshops).
  • Copies given away in promo campaigns, congresses, library donations.

Data-quality classes

ClassMeaning
ADirect data from a publisher report or public statement (e.g. Empik annual report)
BEmpik / Bonito / Bookmate bestseller lists, weekly data aggregated to the year
CEstimate based on number of editions and weeks on the lists, calibrated to available confirmations

Data sources

Known biases

  • School bias. Sienkiewicz, Mickiewicz, Prus, Lem, Tokarczuk (Flights as supplementary reading), Gombrowicz benefit from annual school purchases. The 2024 reading-list reform changed the trend.
  • Games and Netflix bias. Sapkowski jumps sharply after The Witcher 3 (2015) and Netflix (2019).
  • Prolific-author bias. Mróz publishes 4-8 novels a year. Cumulative sales rise faster than for authors who publish rarely.
  • Translation bias. Foreign hits (50 Shades of Grey, Harry Potter) spike on release and saturate within a few years.