Методологично бюро

Регистър на източниците на WorldStats

Как WorldStats събира, проверява, трансформира, превежда и обяснява данните зад страниците за държави, градове, време, времеви зони и индикатори.

Всеки набор от данни в WorldStats преминава през стандартизиран процес: извличане от API на източника, валидиране спрямо очакваните диапазони, нормализиране до последователни мерни единици и съхранение в нашата база данни. По-долу са описани подробни методологии за всяка област на данни.

Методологично бюро

Методологични файлове

Отворете област на източник, за да видите методите за събиране, правилата за валидиране, ограниченията на покритието и известните предупреждения.
01

Методология на брояча на живо

Как WorldStats превръща годишните статистически данни в броячи на живо, как работят нулиранията по UTC и как се присвояват етикети за актуалност и надеждност.

02

Обработка на данни от World Bank

Как извличаме и обработваме показателите за световно развитие, обхващащи БВП, население, търговия, образование и над 50 показателя за 217 икономики.

03

Процес за здравни данни на WHO

Как обработваме данните от Глобалната здравна обсерватория, обхващащи продължителност на живота, разпространение на болести, имунизация и разходи за здравеопазване.

04

Агрегиране на климатични данни

Как агрегираме 10 години ежедневни данни от реанализ на ERA5 в месечни климатични средни стойности за държави и градове.

05

Източници на данни за градове

Как събираме и обработваме географски и демографски данни за 190 000+ града по света.

Редакционна политика

Как се обработват изборът на източници, автоматизацията, преводите и корекциите в WorldStats.

01

Избор на източник

WorldStats дава приоритет на първични публични източници, официални статистически агенции и широко използвани референтни набори от данни. Когато множество източници покриват една и съща тема, ние предпочитаме документирана методология, широко покритие, стабилни идентификатори и ясна история на актуализациите пред еднократни цифри.

02

Валидиране и преглед

Данните се проверяват за очаквани диапазони, липсващи стойности, последователност на единиците, години на източника и очевидни аномалии, преди да бъдат показани. Изведените изчисления са документирани в страниците с методология, а страниците показват имена на източници или години, когато дадено число зависи от конкретно издание.

03

Преводи

Английският е изходният език за по-голямата част от редакционното съдържание. Локализираните страници се генерират чрез конвейера за превод и се проверяват за запазени контейнери, защитени имена, скриптове и непроменена английска проза. Читателите могат да докладват за неудобни или неточни преводи чрез страницата за контакти.

04

Използване на ИИ и автоматизация

Автоматизацията помага за генерирането, превода, валидирането и актуализирането на големи части от сайта, но системата е изградена около изрични изходни данни, схеми, проверки за валидиране и ръчни корекции. Текстът, подпомогнат от ИИ, не се третира като първичен източник; изходните набори от данни и документираните формули са авторитетът.

05

Корекции

Докладите за корекции се преглеждат ръчно. Полезните доклади включват URL адреса на страницата, показаната стойност, очакваната стойност и източника или изчислението зад корекцията. Поправките могат да актуализират една страница, ключ за превод или основния конвейер за приемане на данни.

06

Известни ограничения

Някои публични набори от данни се публикуват със закъснения, ревизии или неравномерно покритие по държави. Данните за времето и климата могат да пропуснат местните микроклимати. Границите на градовете и определенията за населението варират според източника. WorldStats обозначава и обяснява тези ограничения, вместо да ги прикрива.