Indeks Globalnego Wpływu Publicznego (IGW)
Otwarty wskaźnik łączący globalną uwagę, obecność medialną, własny zasięg komunikacyjny i szacowaną władzę decyzyjną osób publicznych. IGW nie ocenia, czy wpływ jest dobry, pokazuje, jak duża jest zdolność osoby do bycia widzianą, słyszaną i sprawczą w skali globalnej. Skala 0-1000.
v2.02010-202619 osób narracyjnych~600 osób w benchmarku
1. Czym jest IGW
Po zamknięciu Klout w 2018 i zakończeniu rankingu Forbes „World's Most Powerful People" w tym samym roku w przestrzeni publicznej nie ma jednego, otwartego, cross-domenowego wskaźnika wpływu. Listy typu Time 100 są jakościowe; rankingi miliarderów mierzą tylko majątek; liczniki obserwujących w social media premiują celebrytów nad politykami. IGW to próba zebrania sześciu komplementarnych sygnałów w jeden wskaźnik porównywalny między prezydentem, miliarderem, papieżem, sportowcem i artystą.
Wersja 2.0 (2026) jest świadomą zmianą filozofii względem v1.0. IGW v1.0 mieszał trzy zjawiska: widzialność publiczną, zainteresowanie informacyjne i realną władzę decyzyjną. v2.0 rozdziela te wymiary, każdy ma własny komponent i własny subindeks, a wynik łączny prezentowany jest jako jeden z kilku możliwych przekrojów, nie „ostateczna prawda".
2. Jak interpretować wynik
IGW prezentujemy nie jako „ostateczny ranking wpływu", lecz jako otwarty radar globalnego wpływu publicznego. Jeden wskaźnik nigdy nie odpowie, czy Cristiano Ronaldo, Xi Jinping, Taylor Swift i Elon Musk są „naprawdę" porównywalni, dlatego obok wyniku łącznego publikujemy cztery subindeksy oraz test wrażliwości wag.
3. Formuła v2.0
IGW v2.0 to ważona suma sześciu znormalizowanych komponentów (każdy 0-100), pomnożona przez 10, co daje końcową skalę 0-1000:
IGW v2.0 = 10 × (
0.20·A Attention Demand
+ 0.20·M Media Agenda
+ 0.15·O Owned Audience
+ 0.25·D Decision Power
+ 0.10·N Network Centrality
+ 0.10·T Temporal Persistence
)
Wagi i co mierzą
| Komponent | Waga | Co mierzy |
|---|---|---|
| (A) Attention Demand | 20% | Wikipedia pageviews + Google Trends momentum. Realny popyt na informację o osobie i dynamika zainteresowania. |
| (M) Media Agenda | 20% | GDELT: wzmianki znormalizowane do wolumenu medialnego roku, różnorodność źródeł i języków. |
| (O) Owned Audience | 15% | Social media: log followersów, liczba aktywnych platform, opcjonalnie engagement proxy. |
| (D) Decision Power | 25% | Władza formalna, kapitałowa, instytucjonalna lub organizacyjna wg matrycy scoringowej. |
| (N) Network Centrality | 10% | Centralność osoby w sieci innych osób, organizacji i tematów (graf GDELT GKG). |
| (T) Temporal Persistence | 10% | Stabilność wpływu w czasie, 3-letnia średnia ważona z dyskontem. |
Dlaczego v2.0 inaczej niż v1.0: w v1.0 łączna waga komponentów uwagi (W+S+G) wynosiła 70%, a władza decyzyjna tylko 10%. W praktyce IGW v1.0 mierzył uwagę z korektą o władzę. v2.0 podnosi D do 25% i wyodrębnia dwa nowe wymiary (Network, Temporal), które ograniczają premię za jednoroczny skandal lub viral.
4. Komponenty
(A) Attention Demand
Złożony komponent łączący popyt informacyjny i jego dynamikę:
A = 0.60·Wikipedia + 0.40·Google Trends Momentum
Wikipedia (60% komponentu A)
Suma dziennych wyświetleń stron biograficznych w dziesięciu najpopularniejszych językach (en, es, zh, hi, ru, ar, pt, ja, de, fr) zagregowana do średniej rocznej, transformacja log10. Źródło: Wikimedia Pageviews API.
Ograniczenie: Pageviews API podaje dane od 1 lipca 2015. Lata 2010-2014 mają niższą klasę wiarygodności (C/D) i są rekonstruowane z Wikipedia stats.grok.se oraz interpolacji wokół znanych kamieni milowych.
Google Trends Momentum (40% komponentu A)
Google Trends mierzy względną dynamikę zainteresowania daną osobą w czasie, wartości 0-100 są normalizowane wewnątrz zapytania. Nie jest to absolutna miara popularności między osobami. Dlatego w v2.0 traktujemy Trends jako momentum, nie wolumen, i używamy stałych anchor terms (kilka globalnie znanych nazw, np. „Barack Obama", „football", „COVID") do skalowania zapytań we wspólnej ramie porównawczej. Szczegóły metody: Google Trends Understanding the data.
(M) Media Agenda
Obecność osoby w agendzie medialnej, znormalizowana do rosnącego wolumenu internetu:
M = log(mentions_osoby / mentions_total_GDELT_year)
× source_diversity
× language_diversity
Źródło: GDELT Project, konkretnie Global Knowledge Graph 2.0 (dostępny od 1 kwietnia 2013). Dla lat 2010-2012 używamy GDELT Event Database 1.0 z klasą wiarygodności C.
Dlaczego normalizacja do rocznego wolumenu: bez niej 2024 automatycznie wygląda „większy" niż 2012, bo internet i monitoring danych są większe, nie dlatego że konkretna osoba ma więcej wpływu. source_diversity i language_diversity chronią przed nadmiernym premiowaniem osób popularnych w jednym kraju lub w jednym typie źródła.
(O) Owned Audience
Własny kanał komunikacji osoby:
O = 0.70·log(suma_followers)
+ 0.15·multi-platform breadth
+ 0.15·engagement proxy
Followersi sumowani z X/Twitter, Instagram, TikTok, YouTube, Weibo, Facebook (publiczny profil), stan na styczeń każdego roku. multi-platform breadth = liczba platform z aktywną obecnością. engagement proxy (gdzie dostępny) = mediana like-rate ostatnich 30 postów. Gdzie engagement nie jest pobieralny historycznie, używamy uproszczonego wariantu:
O = 0.80·log(followers) + 0.20·liczba aktywnych platform
Źródła: Social Blade, archiwum publicznych liczników, Wayback Machine dla lat 2010-2014.
Świadome ograniczenie: komponent O premiuje osoby publicznie aktywne. Przywódcy zamknięci (Xi Jinping, Ali Chamenei) mają O bliskie zero, mimo realnej władzy, dlatego waga O wynosi tylko 15% (a nie 40-50%, jak miał Klout) i jest balansowana przez wysoką wagę D.
(D) Decision Power
Najważniejszy filozoficznie komponent v2.0 i jednocześnie najmocniej dopracowany względem v1.0. Wpływ może być formalny, kapitałowy, kulturowy, infrastrukturalny, epistemiczny lub mobilizacyjny, D próbuje uchwycić wszystkie te wymiary za pomocą jawnej matrycy scoringowej zamiast jednej liczby ekspertyzy.
Każda osoba dostaje wynik 0-100 wg matrycy przypisanej do jej typu:
Politycy
| Baza | populacja kraju × PKB kraju × zakres kompetencji urzędu |
| Korekta | realna koncentracja władzy, ograniczenia parlamentarne/sądowe, długość kadencji, formalna vs faktyczna kontrola |
CEO / Founderzy
| Baza | kapitalizacja / wartość organizacji × udział w kontroli × centralność sektora |
| Korekta | czy osoba nadal decyduje operacyjnie, czy jest twarzą bez kontroli |
Liderzy religijni
| Baza | liczba wiernych × centralizacja instytucji |
| Korekta | realna dyscyplina organizacyjna, globalna rozpoznawalność, wpływ na instytucje polityczne lub społeczne |
Artyści / Sportowcy
| Baza | publiczność × zdolność mobilizacji |
| Korekta | udokumentowany wpływ polityczny, kulturowy, ekonomiczny, kampanie społeczne, efekt na zachowania grup |
Aktywiści
| Baza | widzialność sprawy × efekt instytucjonalny |
| Korekta | wpływ na regulacje, instytucje, debatę, protesty, agendę międzynarodową |
Pełna tabela D z uzasadnieniem per osoba publikowana jest razem z danymi w influence.json. Zapraszamy do sporu, D jest najsilniej narażony na krytykę i dlatego ma jawną strukturę zamiast czarnej skrzynki.
(N) Network Centrality
Centralność osoby w sieci innych osób, organizacji i tematów liczona z grafu współwystępowań GDELT GKG. Im częściej osoba jest wzmiankowana razem z różnymi instytucjami i innymi osobami, tym wyższe N. Komponent karze izolowanych celebrytów i nagradza osoby działające w sieci, m.in. dlatego sędziowie SN, szefowie banków centralnych i dyplomaci są w v2.0 lepiej widoczni niż w v1.0.
(T) Temporal Persistence
3-letnia średnia ważona z dyskontem 0.5/0.3/0.2 (rok bieżący/poprzedni/dwa lata wstecz) aplikowana do sumy A+M+O+D+N. Komponent karze jednoroczne wzloty (skandal, viral) i nagradza trwałą obecność. Bez T ranking byłby silnie podatny na sezonowe wahania, np. Greta Thunberg 2019 lub Putin 2022 dominowałyby cały okres.
5. Normalizacja
Każdy komponent jest sprowadzany do skali 0-100 przez przeskalowanie percentyli w szerokim uniwersum referencyjnym ~600 osób publicznych, nie tylko 19 osób narracyjnych. To kluczowa zmiana względem v1.0.
Procedura normalizacji per komponent i rok:
- Zbierz wartości surowe dla wszystkich ~600 osób w uniwersum benchmarkowym.
- Zastosuj transformację log10 dla komponentów z rozkładem heavy-tail (Wikipedia, GDELT, followersi).
- Zwinsoryzuj outliery na poziomie 1. i 99. percentyla.
- Przeskaluj percentyl do skali 0-100, z ustalonymi kotwicami: 0 = 5. percentyl, 50 = mediana, 100 = 99. percentyl.
- Pokaż w animacji wybrane 19 osób narracyjnych.
Kotwice są stałe między edycjami, wynik 70 w komponencie A w 2024 i 2026 oznacza tę samą pozycję względem populacji odniesienia, nie względem chwilowego top 19.
6. Klasy wiarygodności danych
Każda kombinacja (komponent × osoba × rok) ma przypisaną klasę jakości danych:
| Klasa | Znaczenie | Typowe lata |
|---|---|---|
| A | Dane bezpośrednie, kompletne (API zwraca pełną historię) | 2015-2026 dla Wikipedia/GDELT; 2018-2026 dla TikTok |
| B | Dane bezpośrednie, częściowo niekompletne | 2013-2014 dla GDELT GKG; 2010-2014 dla Wikipedia stats.grok.se |
| C | Rekonstrukcja z proxy lub interpolacja wokół kamieni milowych | 2010-2012 dla większości komponentów |
| D | Estymacja ekspercka / brak pełnych danych | komponent D dla wszystkich lat (z definicji) |
7. Subindeksy
Obok wyniku łącznego publikujemy cztery profile wpływu. Ten sam zestaw komponentów, ale inne wagi, pokazują, jaki typ wpływu dominuje u osoby:
| Subindeks | Co pokazuje | Dominujące komponenty |
|---|---|---|
| Attention Rank | Kto najbardziej przyciąga uwagę? | A (60%) + M (40%) |
| Power Rank | Kto ma największą formalną/instytucjonalną sprawczość? | D (70%) + N (30%) |
| Media Agenda Rank | Kto dominuje w mediach? | M (70%) + N (30%) |
| Audience Rank | Kto ma największy własny kanał komunikacji? | O (100%) |
Dzięki subindeksom widać, że Taylor Swift dominuje w Audience i Attention, a Xi Jinping w Power i Network, i nie trzeba udawać, że są porównywalni jednym płaskim typem wpływu.
8. Confidence score
Każdy wynik IGW ma przypisany poziom pewności A/B/C/D, zależny od kompletności danych, liczby źródeł, jakości danych historycznych, zgodności wariantów wag i stabilności wyniku między metodami:
| Confidence | Znaczenie |
|---|---|
| A | Dane mocne, wynik stabilny między wariantami wag |
| B | Dane dobre, umiarkowana niepewność |
| C | Dane częściowo rekonstruowane lub silnie zależne od wag |
| D | Wynik poglądowy, nie nadaje się do ostrego porównania |
Przykład: Donald Trump 2024: IGW 880 / confidence A · Xi Jinping 2024: IGW 780 / confidence B · Dalajlama 2024: IGW 400 / confidence C+ · Papież Leon XIV 2025: IGW 780 / confidence C (krótka kadencja, mało danych post-elekcyjnych).
9. Test wrażliwości wag
Ponieważ IGW jest wskaźnikiem kompozytowym, wynik zależy od decyzji o wagach, normalizacji i doborze źródeł. Dlatego przy każdej dużej edycji publikujemy siedem wariantów alternatywnych i porównujemy stabilność pozycji:
- Wagi bazowe v2.0 (referencja)
- Równe wagi (każdy komponent 1/6)
- Bez Owned Audience (waga O = 0, redystrybucja)
- Bez Decision Power (waga D = 0, redystrybucja)
- Attention-only (A + M, reszta = 0)
- Power-heavy (D = 50%, reszta proporcjonalnie)
- Media-heavy (M = 40%, reszta proporcjonalnie)
Osoby, których pozycja pozostaje stabilna w większości wariantów, dostają confidence A lub B. Osoby, których pozycja zależy silnie od jednej wagi, dostają C lub D i są wyraźnie oznaczone na wykresie.
10. Selekcja osób
v2.0 rozdziela dwie rzeczy:
Uniwersum kalibracyjne (~600 osób)
Szeroki benchmark globalnych osób publicznych używany do normalizacji każdego komponentu. Pochodzi z przecięcia: top 1000 Wikipedia pageviews 2015-2025 (10 języków), top 200 GDELT GKG persons per rok, oraz osoby z list Time 100 / Forbes Powerful People / Bloomberg Billionaires 2010-2026. Uniwersum kalibracyjne nie jest pokazywane w animacji, służy wyłącznie do stabilizacji skali.
Lista narracyjna (19 osób)
Osoby pokazywane w animacji i rankingu. Kryteria doboru: (1) globalna rozpoznawalność, (2) co najmniej jeden rok w czołówce Time/Forbes/Atlantic 2010-2026, (3) równowaga geograficzna (USA, Chiny, Europa, Indie, Ameryka Południowa, Bliski Wschód), (4) różnorodność profesji (polityka, biznes, religia, sport, kultura, aktywizm, technologia).
Pełna lista: Barack Obama, Donald Trump, Xi Jinping, Władimir Putin, Narendra Modi, Angela Merkel, Papież Franciszek, Papież Leon XIV, Dalajlama, Elon Musk, Bill Gates, Mark Zuckerberg, Jeff Bezos, Sam Altman, Taylor Swift, Cristiano Ronaldo, Lionel Messi, Greta Thunberg, Beyoncé.
11. Zakres i ograniczenia
Zakres wskaźnika
IGW mierzy globalny wpływ publiczny osób żyjących i publicznie mierzalnych. Nie obejmuje: osób anonimowych, funkcjonariuszy służb, niejawnych decydentów ani osób, których wpływ jest realny, ale niewidoczny w otwartych danych (np. szefowie funduszy hedgingowych operujący poza mediami, oligarchowie unikający publiczności, anonimowi szefowie wywiadów).
Znane biasy
- Bias językowy. Wikipedia, GDELT i Trends są mocniej zasiedlone w językach zachodnich, osoby aktywne głównie w chińskim Internecie (Weibo, Baidu, Toutiao) są niedoszacowane mimo trzech języków azjatyckich w koszyku Wikipedii.
- Bias recencji. M, A i Trends premiują bieżące wydarzenia. T (Temporal Persistence) częściowo to łagodzi, ale nie eliminuje.
- Bias social media. Komponent O premiuje osoby publicznie aktywne, dlatego waga wynosi tylko 15% i jest balansowana wysokim D.
- Rekonstrukcja danych 2010-2014. Większość API z tego okresu nie istnieje. Lata te mają klasę wiarygodności B-C, oznaczone osobno na wykresie (niższa opacity bar).
- Komponent D jest oceną ekspercką. Mimo matrycy scoringowej pozostaje subiektywny. Dlatego publikujemy wariant „bez D" w teście wrażliwości.
- Anchor terms w Trends. Skalowanie do wspólnej ramy poprzez koszyk kotwic redukuje, ale nie eliminuje problemu względności Google Trends.
12. Changelog
| Wersja | Data | Zmiany |
|---|---|---|
| v1.0 | 2026-01 | Pierwsza wersja publiczna. Pięć komponentów (W/S/N/G/P), wagi 30/25/20/15/10, normalizacja względem 18 osób, jakościowy P. |
| v1.1 | 2026-03 | Doprecyzowanie interpretacji, dodanie disclaimera „nie ranking moralny", oznaczenie lat 2010-2014 jako niższej klasy wiarygodności. Wagi bez zmian. |
| v2.0 | 2026-05 | Nowa formuła sześciokomponentowa (A/M/O/D/N/T). Wprowadzenie uniwersum kalibracyjnego ~600 osób. Matryca scoringowa dla D. Subindeksy, confidence score, test wrażliwości wag. Anchor terms dla Google Trends. Normalizacja GDELT do rocznego wolumenu. |
13. Cytowanie
Jeśli używasz IGW w artykule, prezentacji lub na wykresie, prosimy o link do tej strony oraz wskazanie wersji, np.:
IGW v2.0, WyścigPKB, https://wyscigpkb.pl/metodologia
14. Źródła i punkty weryfikacji
- Wikimedia Analytics / Pageviews API · dane od 1 lipca 2015.
- Wikimedia Pageviews FAQ · brak danych starszych niż lipiec 2015.
- GDELT Project · wiele zbiorów danych; w v2.0 używamy GKG 2.0.
- GDELT Data · Global Knowledge Graph 1.0 dostępny od 1 kwietnia 2013.
- Google Trends Understanding the data · wartości 0-100 są normalizowane, nie absolutne.
- Google Trends FAQ · dane dla popularnych terminów, własna normalizacja i filtrowanie.
- OECD/JRC Handbook on Constructing Composite Indicators · standard dla wskaźników kompozytowych: normalizacja, wagi, agregacja, imputacja, analiza wrażliwości i transparentność.
- Social Blade · historyczne liczniki social media.
Global Public Influence Index (IGW)
An open indicator combining global attention, media presence, owned-channel reach and an estimate of decision power for public figures. IGW does not judge whether someone's influence is good, it shows how large a person's ability to be seen, heard and consequential is on a global scale. Scale 0-1000.
v2.02010-202619 narrative figures~600 in benchmark
1. What IGW is
After Klout shut down in 2018 and Forbes ended its "World's Most Powerful People" ranking the same year, there is no single open cross-domain indicator of influence in public circulation. Lists like Time 100 are qualitative; billionaire rankings only measure wealth; social-media follower counts reward celebrities over politicians. IGW is an attempt to combine six complementary signals into one indicator that is comparable across a president, a billionaire, a pope, an athlete and an artist.
Version 2.0 (2026) is a deliberate philosophical shift from v1.0. IGW v1.0 mixed three phenomena: public visibility, information interest and real decision power. v2.0 separates these dimensions, each has its own component and its own sub-index, and the combined score is presented as one of several possible cross-sections, not "the final truth".
2. How to interpret the score
We present IGW not as a "final ranking of influence" but as an open radar of global public influence. No single indicator will ever answer whether Cristiano Ronaldo, Xi Jinping, Taylor Swift and Elon Musk are "really" comparable, which is why alongside the combined score we publish four sub-indices and a weight-sensitivity test.
3. v2.0 formula
IGW v2.0 is the weighted sum of six normalized components (each 0-100), multiplied by 10, giving a final 0-1000 scale:
IGW v2.0 = 10 × (
0.20·A Attention Demand
+ 0.20·M Media Agenda
+ 0.15·O Owned Audience
+ 0.25·D Decision Power
+ 0.10·N Network Centrality
+ 0.10·T Temporal Persistence
)
Weights and what they measure
| Component | Weight | What it measures |
|---|---|---|
| (A) Attention Demand | 20% | Wikipedia pageviews + Google Trends momentum. Real demand for information about the person, plus the dynamics of interest. |
| (M) Media Agenda | 20% | GDELT: mentions normalized to the year's total media volume, source diversity and language diversity. |
| (O) Owned Audience | 15% | Social media: log of followers, number of active platforms, optionally an engagement proxy. |
| (D) Decision Power | 25% | Formal, capital, institutional or organizational power per the scoring matrix. |
| (N) Network Centrality | 10% | The person's centrality in the network of other people, organizations and topics (GDELT GKG graph). |
| (T) Temporal Persistence | 10% | Stability of influence over time, a 3-year discounted weighted average. |
Why v2.0 differs from v1.0: in v1.0 the combined weight of attention components (W+S+G) was 70% and decision power only 10%. In practice IGW v1.0 measured attention with a power correction. v2.0 raises D to 25% and introduces two new dimensions (Network, Temporal) that dampen the premium for a one-off scandal or viral moment.
4. Components
(A) Attention Demand
A composite combining information demand and its dynamics:
A = 0.60·Wikipedia + 0.40·Google Trends Momentum
Wikipedia (60% of A)
Sum of daily biographical pageviews in the ten most-popular languages (en, es, zh, hi, ru, ar, pt, ja, de, fr), aggregated to an annual average with a log10 transform. Source: Wikimedia Pageviews API.
Limitation: the Pageviews API only goes back to 1 July 2015. Years 2010-2014 have a lower data-quality class (C/D) and are reconstructed from Wikipedia stats.grok.se and interpolation around known milestones.
Google Trends Momentum (40% of A)
Google Trends measures the relative dynamics of interest in a person over time; values 0-100 are normalized within the query. It is not an absolute measure of popularity across people. So in v2.0 we treat Trends as momentum, not volume, and use fixed anchor terms (a few globally known names, e.g. "Barack Obama", "football", "COVID") to scale queries into a common comparison frame. Method details: Google Trends Understanding the data.
(M) Media Agenda
The person's presence in the media agenda, normalized to the internet's growing volume:
M = log(person_mentions / total_GDELT_mentions_in_year)
× source_diversity
× language_diversity
Source: GDELT Project, specifically Global Knowledge Graph 2.0 (available from 1 April 2013). For 2010-2012 we use GDELT Event Database 1.0 with a class-C confidence flag.
Why normalize by yearly volume: without it, 2024 automatically looks "bigger" than 2012 because the internet and media monitoring are larger, not because a given person has more influence. source_diversity and language_diversity guard against over-rewarding people popular in one country or one source type.
(O) Owned Audience
The person's own communication channel:
O = 0.70·log(total_followers)
+ 0.15·multi-platform breadth
+ 0.15·engagement proxy
Followers summed across X/Twitter, Instagram, TikTok, YouTube, Weibo, Facebook (public profile), measured at January each year. multi-platform breadth = count of platforms with active presence. engagement proxy (where available) = median like-rate of the last 30 posts. Where engagement cannot be retrieved historically we use the simplified variant:
O = 0.80·log(followers) + 0.20·number of active platforms
Sources: Social Blade, archives of public counters, Wayback Machine for 2010-2014.
Deliberate limitation: component O rewards publicly active people. Closed leaders (Xi Jinping, Ali Khamenei) score near zero on O despite real power, which is why the weight is only 15% (not 40-50% as Klout had) and is balanced by a high D weight.
(D) Decision Power
The most important component philosophically in v2.0 and the one most strongly reworked from v1.0. Influence can be formal, capital-based, cultural, infrastructural, epistemic or mobilizational; D tries to capture all these dimensions through an explicit scoring matrix instead of a single expert number.
Every person receives a 0-100 score per the matrix assigned to their type:
Politicians
| Base | country population × country GDP × scope of office competencies |
| Adjustment | real concentration of power, parliamentary/judicial constraints, term length, formal vs. de-facto control |
CEOs / Founders
| Base | market cap / organizational value × ownership / control share × sector centrality |
| Adjustment | does the person still decide operationally, or are they a figurehead without control |
Religious leaders
| Base | number of faithful × institutional centralization |
| Adjustment | actual organizational discipline, global recognition, influence on political or social institutions |
Artists / Athletes
| Base | audience × mobilization capacity |
| Adjustment | documented political, cultural, economic influence, social campaigns, effect on group behavior |
Activists
| Base | cause visibility × institutional effect |
| Adjustment | influence on regulation, institutions, debate, protests, international agenda |
The full D table with per-person justifications is published together with the data in influence.json. We welcome disagreement; D is the component most exposed to criticism, which is why it has an explicit structure rather than a black box.
(N) Network Centrality
The person's centrality in the network of other people, organizations and topics, computed from the GDELT GKG co-occurrence graph. The more often a person is co-mentioned with diverse institutions and other people, the higher N. The component penalizes isolated celebrities and rewards people who operate inside networks, which is part of why supreme-court justices, central-bank governors and diplomats are better surfaced in v2.0 than in v1.0.
(T) Temporal Persistence
A 3-year discounted weighted average (0.5/0.3/0.2 for current/previous/two-years-back) applied to the A+M+O+D+N total. The component penalizes one-year spikes (scandal, viral) and rewards sustained presence. Without T the ranking would be highly vulnerable to seasonal swings, e.g. Greta Thunberg 2019 or Putin 2022 would dominate the entire period.
5. Normalization
Each component is brought to a 0-100 scale by percentile-rescaling against a broad reference universe of ~600 public figures, not only the 19 narrative figures. This is the key change from v1.0.
Normalization procedure per component per year:
- Collect raw values for all ~600 people in the benchmark universe.
- Apply a log10 transform for heavy-tailed components (Wikipedia, GDELT, followers).
- Winsorize outliers at the 1st and 99th percentiles.
- Rescale percentile to 0-100 with fixed anchors: 0 = 5th percentile, 50 = median, 100 = 99th percentile.
- Display the 19 narrative figures in the animation.
Anchors are stable across editions; a score of 70 in component A in 2024 and 2026 means the same position relative to the reference population, not relative to the current top 19.
6. Data-quality classes
Every (component × person × year) combination has an assigned data-quality class:
| Class | Meaning | Typical years |
|---|---|---|
| A | Direct data, complete (API returns full history) | 2015-2026 for Wikipedia/GDELT; 2018-2026 for TikTok |
| B | Direct data, partially incomplete | 2013-2014 for GDELT GKG; 2010-2014 for Wikipedia stats.grok.se |
| C | Reconstruction from proxies or interpolation around milestones | 2010-2012 for most components |
| D | Expert estimate / no complete data | component D for all years (by definition) |
7. Sub-indices
Alongside the combined score we publish four influence profiles. Same set of components, different weights, showing which type of influence dominates for a person:
| Sub-index | What it shows | Dominant components |
|---|---|---|
| Attention Rank | Who attracts the most attention? | A (60%) + M (40%) |
| Power Rank | Who has the most formal/institutional agency? | D (70%) + N (30%) |
| Media Agenda Rank | Who dominates the media? | M (70%) + N (30%) |
| Audience Rank | Who has the largest owned communication channel? | O (100%) |
Sub-indices make it visible that Taylor Swift dominates in Audience and Attention while Xi Jinping dominates in Power and Network, and there is no need to pretend they are comparable on a single flat type of influence.
8. Confidence score
Every IGW result has an A/B/C/D confidence level based on data completeness, number of sources, quality of historical data, agreement across weight variants and result stability across methods:
| Confidence | Meaning |
|---|---|
| A | Strong data, result stable across weight variants |
| B | Good data, moderate uncertainty |
| C | Data partially reconstructed or strongly weight-dependent |
| D | Indicative result, not fit for sharp comparison |
Example: Donald Trump 2024: IGW 880 / confidence A · Xi Jinping 2024: IGW 780 / confidence B · Dalai Lama 2024: IGW 400 / confidence C+ · Pope Leo XIV 2025: IGW 780 / confidence C (short tenure, sparse post-election data).
9. Weight-sensitivity test
Because IGW is a composite indicator, the result depends on decisions about weights, normalization and source selection. So with every major edition we publish seven alternative variants and compare position stability:
- Baseline v2.0 weights (reference)
- Equal weights (each component 1/6)
- No Owned Audience (O = 0, redistributed)
- No Decision Power (D = 0, redistributed)
- Attention-only (A + M, rest = 0)
- Power-heavy (D = 50%, rest proportional)
- Media-heavy (M = 40%, rest proportional)
People whose position stays stable across most variants get confidence A or B. People whose position depends heavily on a single weight get C or D and are clearly marked on the chart.
10. Person selection
v2.0 separates two things:
Calibration universe (~600 people)
A broad benchmark of global public figures used to normalize every component. It comes from the intersection of: top 1000 Wikipedia pageviews 2015-2025 (10 languages), top 200 GDELT GKG persons per year, and people from Time 100 / Forbes Powerful People / Bloomberg Billionaires 2010-2026 lists. The calibration universe is not shown in the animation; it exists only to stabilize the scale.
Narrative list (19 people)
The people shown in the animation and ranking. Selection criteria: (1) global recognition, (2) at least one year in the top of Time/Forbes/Atlantic 2010-2026, (3) geographic balance (USA, China, Europe, India, South America, Middle East), (4) profession diversity (politics, business, religion, sport, culture, activism, technology).
Full list: Barack Obama, Donald Trump, Xi Jinping, Vladimir Putin, Narendra Modi, Angela Merkel, Pope Francis, Pope Leo XIV, Dalai Lama, Elon Musk, Bill Gates, Mark Zuckerberg, Jeff Bezos, Sam Altman, Taylor Swift, Cristiano Ronaldo, Lionel Messi, Greta Thunberg, Beyoncé.
11. Scope & limitations
Indicator scope
IGW measures the global public influence of living and publicly measurable people. It does not cover: anonymous individuals, intelligence officers, undisclosed decision-makers, or people whose influence is real but invisible in open data (e.g. hedge-fund heads operating outside the media, oligarchs avoiding publicity, anonymous intelligence chiefs).
Known biases
- Language bias. Wikipedia, GDELT and Trends are more heavily populated in Western languages; people active primarily on the Chinese internet (Weibo, Baidu, Toutiao) are underestimated despite three Asian languages in the Wikipedia basket.
- Recency bias. M, A and Trends reward current events. T (Temporal Persistence) softens this but does not eliminate it.
- Social-media bias. Component O rewards publicly active people, which is why its weight is only 15% and is balanced by a high D.
- 2010-2014 reconstruction. Most APIs from that period don't exist. Those years have data-quality class B-C, marked separately on the chart (lower bar opacity).
- Component D is an expert assessment. Despite the scoring matrix, it remains subjective. That is why we publish a "no-D" variant in the sensitivity test.
- Trends anchor terms. Scaling to a common frame through an anchor basket reduces but does not eliminate the relativity problem of Google Trends.
12. Changelog
| Version | Date | Changes |
|---|---|---|
| v1.0 | 2026-01 | First public version. Five components (W/S/N/G/P), weights 30/25/20/15/10, normalization against 18 people, qualitative P. |
| v1.1 | 2026-03 | Clarified interpretation, added "not a moral ranking" disclaimer, flagged 2010-2014 as lower data-quality class. Weights unchanged. |
| v2.0 | 2026-05 | New six-component formula (A/M/O/D/N/T). Introduction of a ~600-person calibration universe. Scoring matrix for D. Sub-indices, confidence score, weight-sensitivity test. Anchor terms for Google Trends. GDELT normalization to yearly volume. |
13. Citation
If you use IGW in an article, presentation or chart, please link back to this page and cite the version, e.g.:
IGW v2.0, WyścigPKB, https://wyscigpkb.pl/metodologia
14. Sources & verification points
- Wikimedia Analytics / Pageviews API · data from 1 July 2015.
- Wikimedia Pageviews FAQ · no data older than July 2015.
- GDELT Project · many datasets; v2.0 uses GKG 2.0.
- GDELT Data · Global Knowledge Graph 1.0 available from 1 April 2013.
- Google Trends Understanding the data · 0-100 values are normalized, not absolute.
- Google Trends FAQ · data for popular terms, with its own normalization and filtering.
- OECD/JRC Handbook on Constructing Composite Indicators · the standard for composite indicators: normalization, weighting, aggregation, imputation, sensitivity analysis and transparency.
- Social Blade · historical social-media counters.
Polska Lista Bestsellerów
Skumulowana sprzedaż książek w Polsce dla 20 najczęściej kupowanych autorów, narastająco od stycznia 2010 do maja 2026. Skala w milionach egzemplarzy. Lista obejmuje autorów polskich oraz tłumaczonych autorów zagranicznych dystrybuowanych na polskim rynku.
v1.02010-202620 autorówmln egz.
Co mierzymy
Polska Lista Bestsellerów to prosta miara: łączna liczba egzemplarzy sprzedanych w Polsce przez autora od 1 stycznia 2010 do dnia publikacji. Liczone razem są wszystkie tytuły danego autora, we wszystkich kanałach dystrybucji: księgarnie sieciowe (Empik), księgarnie internetowe (Bonito, Książki Hand-Made), aplikacje czytelnicze (Bookmate, Storytel, Legimi), kioski prasowe, a także sprzedaż lektur szkolnych. Książki audio i e-booki są wliczane jako pełne egzemplarze.
Co nie jest liczone
- Sprzedaż przed 1 stycznia 2010 (klasycy mają więc niskie wartości startowe).
- Sprzedaż za granicą, nawet jeśli książkę wydaje polski autor.
- Sprzedaż na rynku wtórnym (Allegro, OLX, antykwariaty).
- Egzemplarze rozdane w ramach akcji promocyjnych, kongresów, bibliotek darowiznowych.
Klasy wiarygodności
| Klasa | Znaczenie |
|---|---|
| A | Dane bezpośrednie z raportu wydawcy lub publicznego oświadczenia (np. raport roczny Empik) |
| B | Listy bestsellerów Empik / Bonito / Bookmate, agregacja tygodniowa do roku |
| C | Szacunek na podstawie liczby wydań i tygodni na listach, wyrównany do dostępnych potwierdzeń |
Źródła danych
- Polska Izba Książki, raporty roczne o polskim rynku książki, wolumen ogólny rynku.
- Biblioteka Narodowa, statystyki czytelnictwa Polaków, raport „Stan czytelnictwa".
- Empik bestsellery, tygodniowe listy sprzedaży, najbardziej kompletny publiczny zbiór dla polskiego rynku.
- Lubimyczytać.pl, popularność tytułów i autorów wg ocen czytelników.
- Bookmate, Legimi, Storytel, dane subskrypcyjne (e-booki, audiobooki).
- MEN, Lektury szkolne, lista lektur obowiązkowych (klasycy mają stałą sprzedaż szkolną).
Znane biasy
- Bias szkolny. Sienkiewicz, Mickiewicz, Prus, Lem, Tokarczuk (Bieguni jako lektura uzupełniająca), Gombrowicz korzystają z corocznych zakupów szkolnych. Modyfikacja listy lektur w 2024 zmieniła trend.
- Bias gier i Netflixa. Sapkowski rośnie skokowo po Wiedźminie 3 (2015) i Netflixie (2019).
- Bias autora wielokrotnego. Mróz wydaje 4-8 powieści rocznie. Sumaryczna sprzedaż rośnie szybciej niż u autorów wydających rzadziej.
- Bias tłumaczeń. Hity zagraniczne (50 Twarzy Greya, Harry Potter) wchodzą skokowo i po kilku latach saturują się.
Poland's Top Book Sales
Cumulative book sales in Poland for the 20 most-bought authors, counted from 1 January 2010 to the publication date. Scale in millions of copies. Includes Polish authors and translated foreign authors distributed on the Polish market.
v1.02010-202620 authorsmillions of copies
What we measure
Poland's Top Book Sales is a simple metric: the total number of copies an author has sold in Poland from 1 January 2010 to the publication date. All of an author's titles are counted together, across every distribution channel: chain bookstores (Empik), online bookstores (Bonito, Książki Hand-Made), reading apps (Bookmate, Storytel, Legimi), newsstands, and school-reading sales. Audiobooks and e-books count as full copies.
What is not counted
- Sales before 1 January 2010 (so classics start with low base values).
- Sales abroad, even if the book is by a Polish author.
- Second-hand sales (Allegro, OLX, antique bookshops).
- Copies given away in promo campaigns, congresses, library donations.
Data-quality classes
| Class | Meaning |
|---|---|
| A | Direct data from a publisher report or public statement (e.g. Empik annual report) |
| B | Empik / Bonito / Bookmate bestseller lists, weekly data aggregated to the year |
| C | Estimate based on number of editions and weeks on the lists, calibrated to available confirmations |
Data sources
- Polska Izba Książki (Polish Book Chamber) · annual reports on the Polish book market, overall market volume.
- Biblioteka Narodowa (National Library) · Polish reading statistics, the "Stan czytelnictwa" report.
- Empik bestsellers · weekly sales lists, the most complete public dataset for the Polish market.
- Lubimyczytać.pl · title and author popularity by reader ratings.
- Bookmate, Legimi, Storytel · subscription data (e-books, audiobooks).
- MEN, required school readings · classics get steady school sales from this list.
Known biases
- School bias. Sienkiewicz, Mickiewicz, Prus, Lem, Tokarczuk (Flights as supplementary reading), Gombrowicz benefit from annual school purchases. The 2024 reading-list reform changed the trend.
- Games and Netflix bias. Sapkowski jumps sharply after The Witcher 3 (2015) and Netflix (2019).
- Prolific-author bias. Mróz publishes 4-8 novels a year. Cumulative sales rise faster than for authors who publish rarely.
- Translation bias. Foreign hits (50 Shades of Grey, Harry Potter) spike on release and saturate within a few years.