Megosztás a következőn keresztül:


Európai Betegségmegelőzési és Járványvédelmi Központ (ECDC) COVID-19-esetek

A COVID-19-esetek földrajzi eloszlásáról világszerte elérhető legfrissebb nyilvános adatok az Európai Betegségmegelőzési és Járványvédelmi Központból (ECDC). Minden sor/bejegyzés az új jelentett esetek számát tartalmazza naponként és országonként/régiónként.

Feljegyzés

A Microsoft az Azure Open Datasets szolgáltatást "adott módon" biztosítja. A Microsoft nem vállal kifejezett vagy vélelmezett garanciát vagy feltételeket az adathalmazok Ön általi használatára vonatkozóan. A microsoft a helyi jogszabályok által megengedett mértékben kizár minden felelősséget az adathalmazok használatából eredő károkért vagy veszteségekért, beleértve a közvetlen, következményi, különleges, közvetett, incidenses vagy büntető jellegű károkat is.

Az adatkészletet a Microsoft forrásadataihoz tartozó eredeti feltételek szerint szolgáltatjuk. A készlet tartalmazhat Microsofttól származó adatokat.

Adathalmazok

Az adathalmaz módosított verziói naponta frissített CSV-, JSON-, JSON-Lines és Parquet-fájlokként is elérhetők:

Minden módosított verzióban fel van tüntetve az iso_country_region kód és a betöltési idő, és kisbetűs oszlopneveket használnak, elválasztóként pedig aláhúzás karaktert.

Nyers adatok: https://pandemicdatalake.blob.core.windows.net/public/raw/covid-19/ecdc_cases/latest/ECDCCases.csv

A módosított és nyers adatok előző verziói: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/https://pandemicdatalake.blob.core.windows.net/public/raw/covid-19/ecdc_cases/

Adatmennyiség

2020. május 28-án 19 876 sort tartalmaztak (CSV 1,5 MB, JSON 4,9 MB, JSONL 4,9 MB, Parquet 54,1 kB).

Adatforrás

A rendszer naponta betölti a nyers adatokat az ECDC csv-fájlból. Erről az adatkészletről, beleértve azok eredetét is, az ECDC adatgyűjtési oldalán talál további információt.

Adatminőség

Az ECDC nem garantálja az adatok helyességét és időbeli pontosságát. Olvassa el a jogi nyilatkozatot.

Licenc és használati jogosultságok hozzárendelése

Az adatok forrása az ECDC, és az ECDC itt elérhető szerzői jogi szabályzatával összhangban lettek elérhetővé és felhasználhatóvá téve. Minden olyan dokumentum esetén, melynek a szerzői joga harmadik fél tulajdonában van, a felhasználásra és a másolásra vonatkozó engedélyt a jogtulajdonostól kell beszerezni.

Az ECDC-t mindig fel kell tüntetni az adatok eredeti forrásaként. Az ilyen visszaigazolást az anyag minden példányában fel kell tüntetni.

Kapcsolat

A COVID-19-adattóval kapcsolatos kérdéseit és visszajelzéseit az askcovid19dl@microsoft.com címre küldheti.

Oszlopok

Név Adattípus Egyedi Values (sample) Leírás
elemzése smallint 5,515 1 2 A jelentett esetek száma
continent_exp húr 6 Európa Afrika Kontinens neve
countries_and_territories húr 214 Kanada Belgium Ország vagy terület neve
country_territory_code húr 213 KOR ISL Ország vagy terület hárombetűs kódja
date_rep dátum: 350 2020-12-11 2020-11-22 A jelentés kelte
nap smallint 31 14 13 Hónap napja
Halálesetek smallint 1049 1 2 A jelentett halálesetek száma
geo_id húr 214 CA SE Földrajzi hely azonosítója
iso_country húr 214 SE US ISO 3166 ország vagy régió kódja
load_date időbélyeg 0 2021-04-26 00:06:22.123000 Az adatok Azure-ba történő betöltésének dátuma
hónap smallint 12 10 8 Hónap száma
év smallint 2 2020 2019 Year

Előnézet

date_rep nap hónap év elemzése Halálesetek countries_and_territories geo_id country_territory_code continent_exp load_date iso_country
2020-12-14 14 12 2020 746 6 Afganisztán AF AFG Ázsia 2021.04.26. 12:06:22 AF
2020-12-13 13 12 2020 298 9 Afganisztán AF AFG Ázsia 2021.04.26. 12:06:22 AF
2020-12-12 12 12 2020 113 11 Afganisztán AF AFG Ázsia 2021.04.26. 12:06:22 AF
2020-12-11 11 12 2020 63 10 Afganisztán AF AFG Ázsia 2021.04.26. 12:06:22 AF
2020-12-10 10 12 2020 202 16 Afganisztán AF AFG Ázsia 2021.04.26. 12:06:22 AF
2020-12-09 9 12 2020 135 13 Afganisztán AF AFG Ázsia 2021.04.26. 12:06:22 AF
2020-12-08 8 12 2020 200 6 Afganisztán AF AFG Ázsia 2021.04.26. 12:06:22 AF
2020-12-07 7 12 2020 210 26 Afganisztán AF AFG Ázsia 2021.04.26. 12:06:22 AF
2020-12-06 6 12 2020 234 10 Afganisztán AF AFG Ázsia 2021.04.26. 12:06:22 AF
2020-12-05 5 12 2020 235 18 Afganisztán AF AFG Ázsia 2021.04.26. 12:06:22 AF

Az adatok elérése

Azure Notebooks

Ez a jegyzetfüzet az Európai Betegségmegelőzési és Járványvédelmi Központ (ECDC) Covid-19-esetek adatkészletének URL-címéhez való hozzáféréshez szükséges URL-címeket és mintakódot dokumentálja az Azure Blob Storage-ban üzemeltetett különböző adathalmazfájl-formátumok URL-címeihez:¶ CSV: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.csv

JSON: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.json

JSONL: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.jsonl

Parquet: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.parquet

Töltse le az adathalmazfájlt a pandas-i HTTP URL-címről letölthető beépített funkcióval. A Pandas különböző fájlformátumok olvasóival rendelkezik:

https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_parquet.html

https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_csv.html

import pandas as pd
import numpy as np
%matplotlib inline
import matplotlib.pyplot as plt

df = pd.read_parquet("https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.parquet")
df.head(10)

df.dtypes

df.groupby('countries_and_territories').first().filter(['continent_exp','cases', 'deaths','date_rep'])

df.groupby('continent_exp').agg({'countries_and_territories': 'count','cases': 'count','deaths': 'count'})

import plotly.graph_objects as go
import plotly.express as px
import matplotlib.pyplot as plt

df.loc[: , ['countries_and_territories', 'cases', 'deaths']].groupby(['countries_and_territories'
         ]).max().sort_values(by='cases',ascending=False).reset_index()[:15].style.background_gradient(cmap='rainbow')

df_Worldwide=df[df['countries_and_territories']=='United_States_of_America']

df.plot(kind='line',x='date_rep',y="cases",grid=True)
df.plot(kind='line',x='date_rep',y="deaths",grid=True)
#df_Worldwide.plot(kind='line',x='date_rep',y="confirmed_change",grid=True)
#df_Worldwide.plot(kind='line',x='date_rep',y="deaths_change",grid=True)

Azure Databricks

A minta nem érhető el ehhez a platform-/csomagkombinációhoz.

Azure Synapse

A minta nem érhető el ehhez a platform-/csomagkombinációhoz.

Példák

Példák az adathalmaz használatára:

Következő lépések

Tekintse meg a többi adathalmazt az Open Datasets katalógusban.