Európai Betegségmegelőzési és Járványvédelmi Központ (ECDC) COVID-19-esetek
A COVID-19-esetek földrajzi eloszlásáról világszerte elérhető legfrissebb nyilvános adatok az Európai Betegségmegelőzési és Járványvédelmi Központból (ECDC). Minden sor/bejegyzés az új jelentett esetek számát tartalmazza naponként és országonként/régiónként.
Feljegyzés
A Microsoft az Azure Open Datasets szolgáltatást "adott módon" biztosítja. A Microsoft nem vállal kifejezett vagy vélelmezett garanciát vagy feltételeket az adathalmazok Ön általi használatára vonatkozóan. A microsoft a helyi jogszabályok által megengedett mértékben kizár minden felelősséget az adathalmazok használatából eredő károkért vagy veszteségekért, beleértve a közvetlen, következményi, különleges, közvetett, incidenses vagy büntető jellegű károkat is.
Az adatkészletet a Microsoft forrásadataihoz tartozó eredeti feltételek szerint szolgáltatjuk. A készlet tartalmazhat Microsofttól származó adatokat.
Adathalmazok
Az adathalmaz módosított verziói naponta frissített CSV-, JSON-, JSON-Lines és Parquet-fájlokként is elérhetők:
- https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.csv
- https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.json
- https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.jsonl
- https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.parquet
Minden módosított verzióban fel van tüntetve az iso_country_region kód és a betöltési idő, és kisbetűs oszlopneveket használnak, elválasztóként pedig aláhúzás karaktert.
Nyers adatok: https://pandemicdatalake.blob.core.windows.net/public/raw/covid-19/ecdc_cases/latest/ECDCCases.csv
A módosított és nyers adatok előző verziói: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/https://pandemicdatalake.blob.core.windows.net/public/raw/covid-19/ecdc_cases/
Adatmennyiség
2020. május 28-án 19 876 sort tartalmaztak (CSV 1,5 MB, JSON 4,9 MB, JSONL 4,9 MB, Parquet 54,1 kB).
Adatforrás
A rendszer naponta betölti a nyers adatokat az ECDC csv-fájlból. Erről az adatkészletről, beleértve azok eredetét is, az ECDC adatgyűjtési oldalán talál további információt.
Adatminőség
Az ECDC nem garantálja az adatok helyességét és időbeli pontosságát. Olvassa el a jogi nyilatkozatot.
Licenc és használati jogosultságok hozzárendelése
Az adatok forrása az ECDC, és az ECDC itt elérhető szerzői jogi szabályzatával összhangban lettek elérhetővé és felhasználhatóvá téve. Minden olyan dokumentum esetén, melynek a szerzői joga harmadik fél tulajdonában van, a felhasználásra és a másolásra vonatkozó engedélyt a jogtulajdonostól kell beszerezni.
Az ECDC-t mindig fel kell tüntetni az adatok eredeti forrásaként. Az ilyen visszaigazolást az anyag minden példányában fel kell tüntetni.
Kapcsolat
A COVID-19-adattóval kapcsolatos kérdéseit és visszajelzéseit az askcovid19dl@microsoft.com címre küldheti.
Oszlopok
Név | Adattípus | Egyedi | Values (sample) | Leírás |
---|---|---|---|---|
elemzése | smallint | 5,515 | 1 2 | A jelentett esetek száma |
continent_exp | húr | 6 | Európa Afrika | Kontinens neve |
countries_and_territories | húr | 214 | Kanada Belgium | Ország vagy terület neve |
country_territory_code | húr | 213 | KOR ISL | Ország vagy terület hárombetűs kódja |
date_rep | dátum: | 350 | 2020-12-11 2020-11-22 | A jelentés kelte |
nap | smallint | 31 | 14 13 | Hónap napja |
Halálesetek | smallint | 1049 | 1 2 | A jelentett halálesetek száma |
geo_id | húr | 214 | CA SE | Földrajzi hely azonosítója |
iso_country | húr | 214 | SE US | ISO 3166 ország vagy régió kódja |
load_date | időbélyeg | 0 | 2021-04-26 00:06:22.123000 | Az adatok Azure-ba történő betöltésének dátuma |
hónap | smallint | 12 | 10 8 | Hónap száma |
év | smallint | 2 | 2020 2019 | Year |
Előnézet
date_rep | nap | hónap | év | elemzése | Halálesetek | countries_and_territories | geo_id | country_territory_code | continent_exp | load_date | iso_country |
---|---|---|---|---|---|---|---|---|---|---|---|
2020-12-14 | 14 | 12 | 2020 | 746 | 6 | Afganisztán | AF | AFG | Ázsia | 2021.04.26. 12:06:22 | AF |
2020-12-13 | 13 | 12 | 2020 | 298 | 9 | Afganisztán | AF | AFG | Ázsia | 2021.04.26. 12:06:22 | AF |
2020-12-12 | 12 | 12 | 2020 | 113 | 11 | Afganisztán | AF | AFG | Ázsia | 2021.04.26. 12:06:22 | AF |
2020-12-11 | 11 | 12 | 2020 | 63 | 10 | Afganisztán | AF | AFG | Ázsia | 2021.04.26. 12:06:22 | AF |
2020-12-10 | 10 | 12 | 2020 | 202 | 16 | Afganisztán | AF | AFG | Ázsia | 2021.04.26. 12:06:22 | AF |
2020-12-09 | 9 | 12 | 2020 | 135 | 13 | Afganisztán | AF | AFG | Ázsia | 2021.04.26. 12:06:22 | AF |
2020-12-08 | 8 | 12 | 2020 | 200 | 6 | Afganisztán | AF | AFG | Ázsia | 2021.04.26. 12:06:22 | AF |
2020-12-07 | 7 | 12 | 2020 | 210 | 26 | Afganisztán | AF | AFG | Ázsia | 2021.04.26. 12:06:22 | AF |
2020-12-06 | 6 | 12 | 2020 | 234 | 10 | Afganisztán | AF | AFG | Ázsia | 2021.04.26. 12:06:22 | AF |
2020-12-05 | 5 | 12 | 2020 | 235 | 18 | Afganisztán | AF | AFG | Ázsia | 2021.04.26. 12:06:22 | AF |
Az adatok elérése
Azure Notebooks
Ez a jegyzetfüzet az Európai Betegségmegelőzési és Járványvédelmi Központ (ECDC) Covid-19-esetek adatkészletének URL-címéhez való hozzáféréshez szükséges URL-címeket és mintakódot dokumentálja az Azure Blob Storage-ban üzemeltetett különböző adathalmazfájl-formátumok URL-címeihez:¶ CSV: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.csv
Töltse le az adathalmazfájlt a pandas-i HTTP URL-címről letölthető beépített funkcióval. A Pandas különböző fájlformátumok olvasóival rendelkezik:
https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_parquet.html
https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_csv.html
import pandas as pd
import numpy as np
%matplotlib inline
import matplotlib.pyplot as plt
df = pd.read_parquet("https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/ecdc_cases/latest/ecdc_cases.parquet")
df.head(10)
df.dtypes
df.groupby('countries_and_territories').first().filter(['continent_exp','cases', 'deaths','date_rep'])
df.groupby('continent_exp').agg({'countries_and_territories': 'count','cases': 'count','deaths': 'count'})
import plotly.graph_objects as go
import plotly.express as px
import matplotlib.pyplot as plt
df.loc[: , ['countries_and_territories', 'cases', 'deaths']].groupby(['countries_and_territories'
]).max().sort_values(by='cases',ascending=False).reset_index()[:15].style.background_gradient(cmap='rainbow')
df_Worldwide=df[df['countries_and_territories']=='United_States_of_America']
df.plot(kind='line',x='date_rep',y="cases",grid=True)
df.plot(kind='line',x='date_rep',y="deaths",grid=True)
#df_Worldwide.plot(kind='line',x='date_rep',y="confirmed_change",grid=True)
#df_Worldwide.plot(kind='line',x='date_rep',y="deaths_change",grid=True)
Azure Databricks
A minta nem érhető el ehhez a platform-/csomagkombinációhoz.
Azure Synapse
A minta nem érhető el ehhez a platform-/csomagkombinációhoz.
Példák
Példák az adathalmaz használatára:
- COVID-adatok elemzése kiszolgáló nélküli Synapse SQL-végponttal
- Lineáris regresszióelemzés COVID-adatokon SQL-végpont használatával az Azure Synapse Analyticsben
Következő lépések
Tekintse meg a többi adathalmazt az Open Datasets katalógusban.