Megosztás a következőn keresztül:


COVID Tracking-projekt

A COVID-követési projekt adatkészlete a tesztek, a megerősített esetek, a kórházi kezelések és a páciensek eredményeinek legutóbbi adatait tartalmazza az Egyesült Államok minden államára és tartományára vonatkozóan.

Az adatkészlettel kapcsolatos további információkért lásd a GitHub projekt adattárát.

Feljegyzés

A Microsoft az Azure Open Datasets szolgáltatást "adott módon" biztosítja. A Microsoft nem vállal kifejezett vagy vélelmezett garanciát vagy feltételeket az adathalmazok Ön általi használatára vonatkozóan. A microsoft a helyi jogszabályok által megengedett mértékben kizár minden felelősséget az adathalmazok használatából eredő károkért vagy veszteségekért, beleértve a közvetlen, következményi, különleges, közvetett, incidenses vagy büntető jellegű károkat is.

Az adatkészletet a Microsoft forrásadataihoz tartozó eredeti feltételek szerint szolgáltatjuk. A készlet tartalmazhat Microsofttól származó adatokat.

Adathalmazok

Az adathalmaz módosított verziói CSV-, JSON-, JSON-Lines és Parquet-fájlokként is elérhetők.

Minden módosított verzióban fel van tüntetve az ISO 3166-os alcsoportkód és a betöltési idő, és kisbetűs oszlopneveket használnak, elválasztóként pedig aláhúzás karaktert.

Nyers adatok: 'https://pandemicdatalake.blob.core.windows.net/public/raw/covid-19/covid_tracking/latest/daily.json'

A módosított és nyers adatok előző verziói: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/covid_tracking/

https://pandemicdatalake.blob.core.windows.net/public/raw/covid-19/covid_tracking/

Adatmennyiség

Minden adatkészlet naponta frissül. 2020. május 13-án 4100 sort tartalmaztak (CSV 574 MB, JSON 1,8 MB, JSONL 1,8 MB, Parquet 334 kB).

Adatforrás

Ezeket az adatokat eredetileg az Atlantic COVID Tracking projektje részeként tették közzé. A nyers adatok a COVID Tracking GitHub-adattárból vannak betöltve a states_daily_4p_et.csv fájl használatával. Erről az adatkészletről, beleértve a COVID Tracking Project API-ból származó eredetét is, tekintse meg a GitHub-adattárat.

Adatminőség

A COVID Tracking Project osztályozza az egyes állapotok adatminőségét, és további információkat nyújt az adatok minőségének értékeléséről. További információkért tekintse meg a COVID Tracking Project adatoldalát. A GitHub-adattárban található adatok az API-hoz képest egy órás késéssel jelenhetnek meg, ezért a legfrissebb adatokhoz az API-t szükséges használni.

Licenc és használati jogosultságok hozzárendelése

Ezek az adatok az Apache License 2.0 feltételei szerint licencelve lesznek.

Az adatok bármilyen felhasználásának meg kell őriznie az összes szerzői jogi, szabadalmi, védjegy- és hozzárendelési közleményt.

Kapcsolat

A COVID-19 Data Lake-ben ezzel vagy más adatkészletekkel kapcsolatos kérdéseivel vagy visszajelzéseivel kapcsolatban lépjen kapcsolatba a következővel askcovid19dl@microsoft.com: .

Oszlopok

Név Adattípus Egyedi Values (sample) Leírás
dátum: dátum: 420 2020-11-10 2021-01-30 Az a dátum, amelyre a napi összegek össze lettek gyűjtve.
date_checked húr 9,487 2020-12-01T00:00:00Z 2020-09-01T00:00:00Z Elavult
halál smallint 7,327 2 5 A COVID-19 következtében eddig elhunyt személyek teljes száma.
death_increase smallint 429 1 2 Elavult
Fips smallint 56 26 55 Az állam népszámlálási FIPS kódja.
fips_code húr 60 53 25 Az állam népszámlálási FIPS kódja.
fasíroz húr 20,780 63df8cccd23a5476bab2d8111b138e4c9becd35e c606cd6990f16086b5382e12d84f6206172d493d Ennek a rekordnak a kivonata
Kórházba egész 7,641 89995 4 Elavult
hospitalized_cumulative egész 7,641 89995 4 A COVID-19 következtében eddig kórházba került személyek teljes száma, beleértve az azóta felgyógyultakat és elhunytakat is.
hospitalized_currently smallint 3,886 8 13 Az ezen a napon COVID-19 miatt kórházban lévő személyek száma.
hospitalized_increase smallint 615 1 2 Elavult
in_icu_cumulative smallint 2,295 990 220 A COVID-19 következtében eddig intenzív osztályra került személyek teljes száma, beleértve az azóta felgyógyultakat és elhunytakat is.
in_icu_currently smallint 1,643 2 8 Az ezen a napon COVID-19 miatt intenzív osztályon ápolt személyek teljes száma.
iso_country húr 0 US ISO 3166 ország vagy régió kódja
iso_subdivision húr 57 US-UM US-WA ISO 3166-alosztály kódja
last_update_et időbélyeg 9,487 2020-12-01 00:00:00 2020-09-01 00:00:00 A napi adatok legutóbbi frissítésének időpontja
load_time időbélyeg 0 2021-04-26 00:06:49.883000 A dátum és idő, amikor az adatok be lettek töltve az Azure-ba a forrásból
negatív egész 10,864 305972 2140 Azoknak a személyeknek a teljes száma, akiken eddig negatív COVID-19-tesztet végeztek.
negative_increase egész 7,328 6 17 Elavult
on_ventilator_cumulative smallint 677 411 412 A COVID-19 következtében eddig lélegeztetőgépre került személyek teljes száma, beleértve az azóta felgyógyultakat és elhunytakat is.
on_ventilator_currently smallint 837 4 10 A COVID-19 következtében a mai napon lélegeztetőgépen lévő személyek száma.
függőben smallint 944 2 17 A még meghatározandó eredményű tesztek száma.
pos_neg egész 18,282 2140 2 Elavult
pozitív egész 16,837 2 1 Azoknak a személyeknek a teljes száma, akiken eddig pozitív COVID-19-tesztet végeztek.
positive_increase smallint 4,754 1 2 Elavult
Vissza egész 8,286 29 19 A COVID-19-ből eddig felépült személyek teljes száma.
állapot húr 56 MI PA Az állam kétbetűs kódja.
teljes egész 18,283 2140 2 Elavult
total_test_results egész 18,648 2140 3 Az állam által megadott összes teszteredmény
total_test_results_increase egész 13,463 1 2 Elavult

Előnézet

dátum: állapot pozitív hospitalized_currently hospitalized_cumulative on_ventilator_currently data_quality_grade last_update_et fasíroz date_checked halál Kórházba teljes total_test_results pos_neg Fips death_increase hospitalized_increase negative_increase positive_increase total_test_results_increase fips_code iso_subdivision load_time iso_country negatív in_icu_cumulative on_ventilator_cumulative Vissza in_icu_currently
2021-03-07 AK 56886 33 1293 2 null 2021.03.05. 03:59:00 dc4bccd4bb885349d7e94d6fed058e285d4be164 2021.03.05. 03:59:00 305 1293 56886 1731628 56886 2 0 0 0 0 0 2 US-AK 2021.04.26. 12:06:49 US
2021-03-07 AL 499819 494 45976 null 2021.03.07. 11:00:00 997207b430824ea40b8eb8506c19a93e07bc972e 2021.03.07. 11:00:00 10148 45976 2431530 2323788 2431530 0 1- 0 2087 408 2347 0 US-AL 2021.04.26. 12:06:49 US 1931711 2676 1515 295690
2021-03-07 AR 324818 335 14926 65 null 2021.03.07. 12:00:00 50921aeefba3e30d31623aaa495b47fb2ecc72fae 2021.03.07. 12:00:00 5319 14926 2805534 2736442 2805534 5 22 11 3267 165 3380 5 US-AR 2021.04.26. 12:06:49 US 2480716 1533 315517 141
2021-03-07 AS 0 null 2020.01.12. 12:00:00 96d23f888c995b9a7f3b4b864de6414f45c728ff 2020.01.12. 12:00:00 0 2140 2140 2140 60 0 0 0 0 0 60 US-AS 2021.04.26. 12:06:49 US 2140
2021-03-07 AZ 826454 963 57907 143 null 2021.03.07. 12:00:00 0437a7a96f4471666f775e63e86923eb5cbd8cdf 2021.03.07. 12:00:00 16328 57907 3899464 7908105 3899464 4 5 44 13678 1335 45110 4 US-AZ 2021.04.26. 12:06:49 US 3073010 273
2021-03-07 CA 3501394 4291 null 2021.03.07. 2:59:00 63c5c0fd2daef2fb65150e9db486de98ed3f7b72 2021.03.07. 2:59:00 3501394 49646014 3501394 6 258 0 0 3816 133186 6 US-CA 2021.04.26. 12:06:49 US 1159
2021-03-07 CO 436602 326 23904 null 2021.03.07. 1:59:00 444746cda3a596f183f3fa3269c8cab68704e819 2021.03.07. 1:59:00 5989 23904 2636060 6415123 2636060 8 3 18 0 840 38163 8 US-CO 2021.04.26. 12:06:49 US 2199458
2021-03-07 CT 285330 428 12257 null 2021.03.04. 11:59:00 bcc0f7bc8c2bf77eec31b25f8b59d510f679d3e7 2021.03.04. 11:59:00 7704 12257 285330 6520366 285330 9 0 0 0 0 0 9 USA-CT 2021.04.26. 12:06:49 US
2021-03-07 DC 41419 150 16 null 2021.03.06. 12:00:00 a3aa0d623d538807fb9577ad64354f48cf728cc8 2021.03.06. 12:00:00 1030 41419 1261363 41419 11 0 0 0 146 5726 11 USA-DC 2021.04.26. 12:06:49 US 29570 38
2021-03-07 DE 88354 104 null 2021.03.06. 18:00:00 059d870e689d5cc19c35f5eb398214d7d9856373 2021.03.06. 18:00:00 1473 633424 1431942 633424 10 9 0 917 215 5867 10 US-DE 2021.04.26. 12:06:49 US 545070 13

Az adatok elérése

Azure Notebooks

Az Azure Blob Storage-ban üzemeltetett különböző adathalmaz-fájlformátumok URL-címei:

CSV: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/covid_tracking/latest/covid_tracking.csv

JSON: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/covid_tracking/latest/covid_tracking.json

JSONL: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/covid_tracking/latest/covid_tracking.jsonl

Parquet: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/covid_tracking/latest/covid_tracking.parquet

Töltse le az adathalmazfájlt a pandas-i HTTP URL-címről letölthető beépített funkcióval. A Pandas különböző fájlformátumok olvasóival rendelkezik:

https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_parquet.html

https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_csv.html

import pandas as pd
import numpy as np
%matplotlib inline
import matplotlib.pyplot as plt

df = pd.read_parquet("https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/covid_tracking/latest/covid_tracking.parquet ")
df.head(10)

df.dtypes

df.groupby('state').first().filter(['date','positive', 'death'])

df.groupby(df.state).agg({'state': 'count','positive_increase': 'sum','death_increase': 'sum'})

df_NY=df[df['state'] == 'NY']
df_NY.plot(kind='line',x='date',y="positive",grid=True)
df_NY.plot(kind='line',x='date',y="positive_increase",grid=True)
df_NY.plot(kind='line',x='date',y="death",grid=True)
df_NY.plot(kind='line',x='date',y="death_increase",grid=True)

df_US=df.groupby(df.date).agg({'positive': 'sum','positive_increase': 'sum','death':'sum','death_increase': 'sum'}).reset_index()

df_US.plot(kind='line',x='date',y="positive",grid=True)
df_US.plot(kind='line',x='date',y="positive_increase",grid=True)
df_US.plot(kind='line',x='date',y="death",grid=True)
df_US.plot(kind='line',x='date',y="death_increase",grid=True)



Azure Databricks

A minta nem érhető el ehhez a platform-/csomagkombinációhoz.

Azure Synapse

A minta nem érhető el ehhez a platform-/csomagkombinációhoz.

Következő lépések

Tekintse meg a többi adathalmazt az Open Datasets katalógusban.