COVID Tracking-projekt
A COVID-követési projekt adatkészlete a tesztek, a megerősített esetek, a kórházi kezelések és a páciensek eredményeinek legutóbbi adatait tartalmazza az Egyesült Államok minden államára és tartományára vonatkozóan.
Az adatkészlettel kapcsolatos további információkért lásd a GitHub projekt adattárát.
Feljegyzés
A Microsoft az Azure Open Datasets szolgáltatást "adott módon" biztosítja. A Microsoft nem vállal kifejezett vagy vélelmezett garanciát vagy feltételeket az adathalmazok Ön általi használatára vonatkozóan. A microsoft a helyi jogszabályok által megengedett mértékben kizár minden felelősséget az adathalmazok használatából eredő károkért vagy veszteségekért, beleértve a közvetlen, következményi, különleges, közvetett, incidenses vagy büntető jellegű károkat is.
Az adatkészletet a Microsoft forrásadataihoz tartozó eredeti feltételek szerint szolgáltatjuk. A készlet tartalmazhat Microsofttól származó adatokat.
Adathalmazok
Az adathalmaz módosított verziói CSV-, JSON-, JSON-Lines és Parquet-fájlokként is elérhetők.
- https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/covid_tracking/latest/covid_tracking.csv
- https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/covid_tracking/latest/covid_tracking.json
- https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/covid_tracking/latest/covid_tracking.jsonl
- https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/covid_tracking/latest/covid_tracking.parquet
Minden módosított verzióban fel van tüntetve az ISO 3166-os alcsoportkód és a betöltési idő, és kisbetűs oszlopneveket használnak, elválasztóként pedig aláhúzás karaktert.
Nyers adatok: 'https://pandemicdatalake.blob.core.windows.net/public/raw/covid-19/covid_tracking/latest/daily.json'
A módosított és nyers adatok előző verziói: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/covid_tracking/
https://pandemicdatalake.blob.core.windows.net/public/raw/covid-19/covid_tracking/
Adatmennyiség
Minden adatkészlet naponta frissül. 2020. május 13-án 4100 sort tartalmaztak (CSV 574 MB, JSON 1,8 MB, JSONL 1,8 MB, Parquet 334 kB).
Adatforrás
Ezeket az adatokat eredetileg az Atlantic COVID Tracking projektje részeként tették közzé. A nyers adatok a COVID Tracking GitHub-adattárból vannak betöltve a states_daily_4p_et.csv fájl használatával. Erről az adatkészletről, beleértve a COVID Tracking Project API-ból származó eredetét is, tekintse meg a GitHub-adattárat.
Adatminőség
A COVID Tracking Project osztályozza az egyes állapotok adatminőségét, és további információkat nyújt az adatok minőségének értékeléséről. További információkért tekintse meg a COVID Tracking Project adatoldalát. A GitHub-adattárban található adatok az API-hoz képest egy órás késéssel jelenhetnek meg, ezért a legfrissebb adatokhoz az API-t szükséges használni.
Licenc és használati jogosultságok hozzárendelése
Ezek az adatok az Apache License 2.0 feltételei szerint licencelve lesznek.
Az adatok bármilyen felhasználásának meg kell őriznie az összes szerzői jogi, szabadalmi, védjegy- és hozzárendelési közleményt.
Kapcsolat
A COVID-19 Data Lake-ben ezzel vagy más adatkészletekkel kapcsolatos kérdéseivel vagy visszajelzéseivel kapcsolatban lépjen kapcsolatba a következővel askcovid19dl@microsoft.com: .
Oszlopok
Név | Adattípus | Egyedi | Values (sample) | Leírás |
---|---|---|---|---|
dátum: | dátum: | 420 | 2020-11-10 2021-01-30 | Az a dátum, amelyre a napi összegek össze lettek gyűjtve. |
date_checked | húr | 9,487 | 2020-12-01T00:00:00Z 2020-09-01T00:00:00Z | Elavult |
halál | smallint | 7,327 | 2 5 | A COVID-19 következtében eddig elhunyt személyek teljes száma. |
death_increase | smallint | 429 | 1 2 | Elavult |
Fips | smallint | 56 | 26 55 | Az állam népszámlálási FIPS kódja. |
fips_code | húr | 60 | 53 25 | Az állam népszámlálási FIPS kódja. |
fasíroz | húr | 20,780 | 63df8cccd23a5476bab2d8111b138e4c9becd35e c606cd6990f16086b5382e12d84f6206172d493d | Ennek a rekordnak a kivonata |
Kórházba | egész | 7,641 | 89995 4 | Elavult |
hospitalized_cumulative | egész | 7,641 | 89995 4 | A COVID-19 következtében eddig kórházba került személyek teljes száma, beleértve az azóta felgyógyultakat és elhunytakat is. |
hospitalized_currently | smallint | 3,886 | 8 13 | Az ezen a napon COVID-19 miatt kórházban lévő személyek száma. |
hospitalized_increase | smallint | 615 | 1 2 | Elavult |
in_icu_cumulative | smallint | 2,295 | 990 220 | A COVID-19 következtében eddig intenzív osztályra került személyek teljes száma, beleértve az azóta felgyógyultakat és elhunytakat is. |
in_icu_currently | smallint | 1,643 | 2 8 | Az ezen a napon COVID-19 miatt intenzív osztályon ápolt személyek teljes száma. |
iso_country | húr | 0 | US | ISO 3166 ország vagy régió kódja |
iso_subdivision | húr | 57 | US-UM US-WA | ISO 3166-alosztály kódja |
last_update_et | időbélyeg | 9,487 | 2020-12-01 00:00:00 2020-09-01 00:00:00 | A napi adatok legutóbbi frissítésének időpontja |
load_time | időbélyeg | 0 | 2021-04-26 00:06:49.883000 | A dátum és idő, amikor az adatok be lettek töltve az Azure-ba a forrásból |
negatív | egész | 10,864 | 305972 2140 | Azoknak a személyeknek a teljes száma, akiken eddig negatív COVID-19-tesztet végeztek. |
negative_increase | egész | 7,328 | 6 17 | Elavult |
on_ventilator_cumulative | smallint | 677 | 411 412 | A COVID-19 következtében eddig lélegeztetőgépre került személyek teljes száma, beleértve az azóta felgyógyultakat és elhunytakat is. |
on_ventilator_currently | smallint | 837 | 4 10 | A COVID-19 következtében a mai napon lélegeztetőgépen lévő személyek száma. |
függőben | smallint | 944 | 2 17 | A még meghatározandó eredményű tesztek száma. |
pos_neg | egész | 18,282 | 2140 2 | Elavult |
pozitív | egész | 16,837 | 2 1 | Azoknak a személyeknek a teljes száma, akiken eddig pozitív COVID-19-tesztet végeztek. |
positive_increase | smallint | 4,754 | 1 2 | Elavult |
Vissza | egész | 8,286 | 29 19 | A COVID-19-ből eddig felépült személyek teljes száma. |
állapot | húr | 56 | MI PA | Az állam kétbetűs kódja. |
teljes | egész | 18,283 | 2140 2 | Elavult |
total_test_results | egész | 18,648 | 2140 3 | Az állam által megadott összes teszteredmény |
total_test_results_increase | egész | 13,463 | 1 2 | Elavult |
Előnézet
dátum: | állapot | pozitív | hospitalized_currently | hospitalized_cumulative | on_ventilator_currently | data_quality_grade | last_update_et | fasíroz | date_checked | halál | Kórházba | teljes | total_test_results | pos_neg | Fips | death_increase | hospitalized_increase | negative_increase | positive_increase | total_test_results_increase | fips_code | iso_subdivision | load_time | iso_country | negatív | in_icu_cumulative | on_ventilator_cumulative | Vissza | in_icu_currently |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
2021-03-07 | AK | 56886 | 33 | 1293 | 2 | null | 2021.03.05. 03:59:00 | dc4bccd4bb885349d7e94d6fed058e285d4be164 | 2021.03.05. 03:59:00 | 305 | 1293 | 56886 | 1731628 | 56886 | 2 | 0 | 0 | 0 | 0 | 0 | 2 | US-AK | 2021.04.26. 12:06:49 | US | |||||
2021-03-07 | AL | 499819 | 494 | 45976 | null | 2021.03.07. 11:00:00 | 997207b430824ea40b8eb8506c19a93e07bc972e | 2021.03.07. 11:00:00 | 10148 | 45976 | 2431530 | 2323788 | 2431530 | 0 | 1- | 0 | 2087 | 408 | 2347 | 0 | US-AL | 2021.04.26. 12:06:49 | US | 1931711 | 2676 | 1515 | 295690 | ||
2021-03-07 | AR | 324818 | 335 | 14926 | 65 | null | 2021.03.07. 12:00:00 | 50921aeefba3e30d31623aaa495b47fb2ecc72fae | 2021.03.07. 12:00:00 | 5319 | 14926 | 2805534 | 2736442 | 2805534 | 5 | 22 | 11 | 3267 | 165 | 3380 | 5 | US-AR | 2021.04.26. 12:06:49 | US | 2480716 | 1533 | 315517 | 141 | |
2021-03-07 | AS | 0 | null | 2020.01.12. 12:00:00 | 96d23f888c995b9a7f3b4b864de6414f45c728ff | 2020.01.12. 12:00:00 | 0 | 2140 | 2140 | 2140 | 60 | 0 | 0 | 0 | 0 | 0 | 60 | US-AS | 2021.04.26. 12:06:49 | US | 2140 | ||||||||
2021-03-07 | AZ | 826454 | 963 | 57907 | 143 | null | 2021.03.07. 12:00:00 | 0437a7a96f4471666f775e63e86923eb5cbd8cdf | 2021.03.07. 12:00:00 | 16328 | 57907 | 3899464 | 7908105 | 3899464 | 4 | 5 | 44 | 13678 | 1335 | 45110 | 4 | US-AZ | 2021.04.26. 12:06:49 | US | 3073010 | 273 | |||
2021-03-07 | CA | 3501394 | 4291 | null | 2021.03.07. 2:59:00 | 63c5c0fd2daef2fb65150e9db486de98ed3f7b72 | 2021.03.07. 2:59:00 | 3501394 | 49646014 | 3501394 | 6 | 258 | 0 | 0 | 3816 | 133186 | 6 | US-CA | 2021.04.26. 12:06:49 | US | 1159 | ||||||||
2021-03-07 | CO | 436602 | 326 | 23904 | null | 2021.03.07. 1:59:00 | 444746cda3a596f183f3fa3269c8cab68704e819 | 2021.03.07. 1:59:00 | 5989 | 23904 | 2636060 | 6415123 | 2636060 | 8 | 3 | 18 | 0 | 840 | 38163 | 8 | US-CO | 2021.04.26. 12:06:49 | US | 2199458 | |||||
2021-03-07 | CT | 285330 | 428 | 12257 | null | 2021.03.04. 11:59:00 | bcc0f7bc8c2bf77eec31b25f8b59d510f679d3e7 | 2021.03.04. 11:59:00 | 7704 | 12257 | 285330 | 6520366 | 285330 | 9 | 0 | 0 | 0 | 0 | 0 | 9 | USA-CT | 2021.04.26. 12:06:49 | US | ||||||
2021-03-07 | DC | 41419 | 150 | 16 | null | 2021.03.06. 12:00:00 | a3aa0d623d538807fb9577ad64354f48cf728cc8 | 2021.03.06. 12:00:00 | 1030 | 41419 | 1261363 | 41419 | 11 | 0 | 0 | 0 | 146 | 5726 | 11 | USA-DC | 2021.04.26. 12:06:49 | US | 29570 | 38 | |||||
2021-03-07 | DE | 88354 | 104 | null | 2021.03.06. 18:00:00 | 059d870e689d5cc19c35f5eb398214d7d9856373 | 2021.03.06. 18:00:00 | 1473 | 633424 | 1431942 | 633424 | 10 | 9 | 0 | 917 | 215 | 5867 | 10 | US-DE | 2021.04.26. 12:06:49 | US | 545070 | 13 |
Az adatok elérése
Azure Notebooks
Az Azure Blob Storage-ban üzemeltetett különböző adathalmaz-fájlformátumok URL-címei:
Töltse le az adathalmazfájlt a pandas-i HTTP URL-címről letölthető beépített funkcióval. A Pandas különböző fájlformátumok olvasóival rendelkezik:
https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_parquet.html
https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_csv.html
import pandas as pd
import numpy as np
%matplotlib inline
import matplotlib.pyplot as plt
df = pd.read_parquet("https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/covid_tracking/latest/covid_tracking.parquet ")
df.head(10)
df.dtypes
df.groupby('state').first().filter(['date','positive', 'death'])
df.groupby(df.state).agg({'state': 'count','positive_increase': 'sum','death_increase': 'sum'})
df_NY=df[df['state'] == 'NY']
df_NY.plot(kind='line',x='date',y="positive",grid=True)
df_NY.plot(kind='line',x='date',y="positive_increase",grid=True)
df_NY.plot(kind='line',x='date',y="death",grid=True)
df_NY.plot(kind='line',x='date',y="death_increase",grid=True)
df_US=df.groupby(df.date).agg({'positive': 'sum','positive_increase': 'sum','death':'sum','death_increase': 'sum'}).reset_index()
df_US.plot(kind='line',x='date',y="positive",grid=True)
df_US.plot(kind='line',x='date',y="positive_increase",grid=True)
df_US.plot(kind='line',x='date',y="death",grid=True)
df_US.plot(kind='line',x='date',y="death_increase",grid=True)
Azure Databricks
A minta nem érhető el ehhez a platform-/csomagkombinációhoz.
Azure Synapse
A minta nem érhető el ehhez a platform-/csomagkombinációhoz.
Következő lépések
Tekintse meg a többi adathalmazt az Open Datasets katalógusban.