Tillbaka till metodikregistret

Källfil

Datakällor för städer

Hur vi samlar in och bearbetar geografiska och demografiska data för över 190 000 städer världen över.

Metodiksammanfattning

Vad denna fil förklarar

Denna källfil visar hur data från Datakällor för städer rör sig från offentliggörande till publicerade WorldStats-sidor: insamling, validering, transformation, täckningsbegränsningar och kända förbehåll.

  1. 01 Källa
  2. 02 Inläsning
  3. 03 Validera
  4. 04 Publicera
01

Översikt

Stadsdata på WorldStats kommer i första hand från den geografiska databasen GeoNames, som tillhandahåller standardiserad stadsinformation inklusive koordinater, befolkning, höjd över havet, tidszon och administrativ region för miljontals platser världen över.

02

Datakällor

Den primära källan är GeoNames dataset cities500, som inkluderar befolkade platser med en befolkning över 500. Detta kompletteras med data från REST Countries för metadata på landsnivå (huvudstadsstatus, valuta, språk) och Open-Meteo för klimatdata på stadsnivå med samma aggregeringsmetodik som klimatdata för länder.

03

Befolkningströsklar

WorldStats indexerar städer med en befolkning över 100 000 för fullständiga profiler med klimatdata, och befolkade platser över 500 för den bredare stadsdatabasen och sökindexet. Profiltröskeln säkerställer att rikare stadssidor har tillräckligt med stödjande data, medan den lägre GeoNames-tröskeln håller mindre platser upptäckbara.

04

Kända begränsningar

Städers befolkningssiffror baseras på de senaste GeoNames-data, vars aktualitet varierar beroende på land. Vissa städer kan ha befolkningar baserade på folkräkningsdata som är 5–10 år gamla. Administrativa gränser och stadsdefinitioner varierar mellan länder, vilket gör direkta befolkningsjämförelser oprecisa för storstads- kontra kommunala befolkningar.