Proyek Pelacakan COVID
Kumpulan data COVID Tracking Project menyediakan angka terbaru tentang tes, kasus terkonfirmasi, rawat inap, dan hasil pasien dari setiap negara bagian dan wilayah AS.
Untuk informasi selengkapnya tentang kumpulan data ini, lihat repositori GitHub proyek.
Catatan
Microsoft menyediakan Azure Open Datasets berdasarkan "apa adanya". Microsoft tidak memberikan jaminan, tersurat maupun tersirat, jaminan atau ketentuan sehubungan dengan penggunaan Anda atas himpunan data. Sejauh diizinkan menurut undang-undang setempat Anda, Microsoft melepaskan semua tanggung jawab atas segala kerusakan atau kerugian, termasuk langsung, konsekuensial, khusus, tidak langsung, insidental, atau hukuman, yang diakibatkan oleh penggunaan Anda atas kumpulan data.
Kumpulan data ini disediakan di bawah ketentuan asli yang diterima Microsoft data sumbernya. Himpunan data mungkin menyertakan data yang bersumber dari Microsoft.
Himpunan data
Versi himpunan data yang dimodifikasi tersedia dalam CSV, JSON, JSON-Lines, dan Parquet.
- https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/covid_tracking/latest/covid_tracking.csv
- https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/covid_tracking/latest/covid_tracking.json
- https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/covid_tracking/latest/covid_tracking.jsonl
- https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/covid_tracking/latest/covid_tracking.parquet
Semua versi yang dimodifikasi memiliki kode subdivisi ISO 3166 dan waktu muat ditambahkan, dan menggunakan nama kolom huruf kecil dengan pemisah garis bawah.
Data mentah: 'https://pandemicdatalake.blob.core.windows.net/public/raw/covid-19/covid_tracking/latest/daily.json'
Versi sebelumnya dari data yang dimodifikasi dan data mentah: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/covid_tracking/
https://pandemicdatalake.blob.core.windows.net/public/raw/covid-19/covid_tracking/
Volume data
Semua himpunan data diperbarui setiap hari. Pada 13 Mei 2020 himpunan data berisi 4.100 baris (CSV 574 KB, JSON 1,8 MB, JSONL 1,8 MB, Parquet 334 KB).
Sumber data
Data ini awalnya diterbitkan oleh Covid Tracking Project di Atlantik. Data mentah diserap dari repo GitHub Pelacakan COVID menggunakan file states_daily_4p_et.csv. Untuk informasi selengkapnya tentang himpunan data ini termasuk asalnya dari COVID Tracking Project API, lihat repositori GitHub proyek.
Kualitas data
Covid Tracking Project menilai kualitas data untuk setiap negara bagian dan memberikan informasi lebih lanjut tentang penilaian mereka terhadap kualitas data. Untuk informasi selengkapnya, lihat halaman data COVID Tracking Project. Data di repositori GitHub mungkin satu jam di belakang API; penggunaan API diperlukan untuk mengakses data terbaru.
Atribusi lisensi dan hak penggunaan
Data ini dilisensikan berdasarkan persyaratan dan ketentuan Lisensi Apache 2.0.
Setiap penggunaan data harus menampilkan semua hak cipta, paten, merek dagang, dan pemberitahuan atribusi.
Kontak
Untuk pertanyaan atau umpan balik tentang himpunan data ini atau yang lainnya di Data Lake COVID-19, hubungi askcovid19dl@microsoft.com.
Kolom
Nama | Jenis data | Unik | Nilai (sampel) | Deskripsi |
---|---|---|---|---|
date | date | 420 | 2020-11-10 2021-01-30 | Tanggal di mana total harian dikumpulkan. |
date_checked | string | 9,487 | 2020-12-01T00:00:00Z 2020-09-01T00:00:00Z | Tidak digunakan lagi |
kematian | smallint | 7,327 | 2 5 | Total orang yang meninggal akibat COVID-19 sejauh ini. |
death_increase | smallint | 429 | 1 2 | Tidak digunakan lagi |
fips | smallint | 56 | 26 55 | Kode FIPS sensus untuk negara. |
fips_code | string | 60 | 53 25 | Kode FIPS sensus untuk negara. |
Hash | string | 20,780 | 63df8cccd23a5476bab2d8111b138e4c9becd35e c606cd6990f16086b5382e12d84f6206172d493d | Hash untuk catatan ini |
Dirawat | int | 7,641 | 89995 4 | Tidak digunakan lagi |
hospitalized_cumulative | int | 7,641 | 89995 4 | Jumlah total orang yang telah pergi ke rumah sakit karena COVID-19 sejauh ini, termasuk mereka yang telah pulih atau meninggal. |
hospitalized_currently | smallint | 3,886 | 8 13 | Jumlah orang di rumah sakit karena COVID-19 pada hari ini. |
hospitalized_increase | smallint | 615 | 1 2 | Tidak digunakan lagi |
in_icu_cumulative | smallint | 2,295 | 990 220 | Jumlah total orang yang telah dirawat di ICU karena COVID-19 sejauh ini, termasuk mereka yang telah pulih atau meninggal. |
in_icu_currently | smallint | 1,643 | 2 8 | Total orang di ICU karena COVID-19 pada hari ini. |
iso_country | string | 1 | US | Kode negara atau kawasan ISO 3166 |
iso_subdivision | string | 57 | US-UM US-WA | Kode subdivisi ISO 3166 |
last_update_et | rentang waktu | 9,487 | 2020-12-01 00:00:00 2020-09-01 00:00:00 | Terakhir kali data hari diperbarui |
waktu_pemuatan | rentang waktu | 1 | 2021-04-26 00:06:49.883000 | Tanggal dan waktu data dimuat ke Azure dari sumber |
negatif | int | 10,864 | 305972 2140 | Total orang yang telah dites negatif COVID-19 sejauh ini. |
negative_increase | int | 7,328 | 6 17 | Tidak digunakan lagi |
on_ventilator_cumulative | smallint | 677 | 411 412 | Jumlah total orang yang telah menggunakan ventilator karena COVID-19 sejauh ini, termasuk mereka yang telah pulih atau meninggal. |
on_ventilator_currently | smallint | 837 | 4 10 | Jumlah orang yang menggunakan ventilator karena COVID-19 pada hari ini. |
Tertunda | smallint | 944 | 2 17 | Jumlah tes yang hasilnya belum ditentukan. |
pos_neg | int | 18,282 | 2140 2 | Tidak digunakan lagi |
positif | int | 16,837 | 2 1 | Total orang yang telah dites positif COVID-19 sejauh ini. |
positive_increase | smallint | 4,754 | 1 2 | Tidak digunakan lagi |
pulih | int | 8,286 | 29 19 | Total orang yang telah sembuh dari COVID-19 sejauh ini. |
state | string | 56 | MI PA | Kode dua huruf untuk negara. |
total | int | 18,283 | 2140 2 | Tidak digunakan lagi |
total_test_results | int | 18,648 | 2140 3 | Total hasil tes yang disediakan oleh Negara |
total_test_results_increase | int | 13,463 | 1 2 | Tidak digunakan lagi |
Pratinjau
date | state | positif | hospitalized_currently | hospitalized_cumulative | on_ventilator_currently | data_quality_grade | last_update_et | Hash | date_checked | kematian | Dirawat | total | total_test_results | pos_neg | fips | death_increase | hospitalized_increase | negative_increase | positive_increase | total_test_results_increase | fips_code | iso_subdivision | waktu_pemuatan | iso_country | negatif | in_icu_cumulative | on_ventilator_cumulative | pulih | in_icu_currently |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
2021-03-07 | AK | 56886 | 33 | 1293 | 2 | nihil | 3/5/2021 3:59:00 AM | dc4bccd4bb885349d7e94d6fed058e285d4be164 | 3/5/2021 3:59:00 AM | 305 | 1293 | 56886 | 1731628 | 56886 | 2 | 0 | 0 | 0 | 0 | 0 | 2 | US-AK | 4/26/2021 12:06:49 AM | US | |||||
2021-03-07 | AL | 499819 | 494 | 45976 | nihil | 3/7/2021 11:00:00 AM | 997207b430824ea40b8eb8506c19a93e07bc972e | 3/7/2021 11:00:00 AM | 10148 | 45976 | 2431530 | 2323788 | 2431530 | 1 | -1 | 0 | 2087 | 408 | 2347 | 1 | US-AL | 4/26/2021 12:06:49 AM | US | 1931711 | 2676 | 1515 | 295690 | ||
2021-03-07 | AR | 324818 | 335 | 14926 | 65 | nihil | 3/7/2021 12:00:00 AM | 50921aeefba3e30d31623aa495b47fb2ecc72fae | 3/7/2021 12:00:00 AM | 5319 | 14926 | 2805534 | 2736442 | 2805534 | 5 | 22 | 11 | 3267 | 165 | 3380 | 5 | US-AR | 4/26/2021 12:06:49 AM | US | 2480716 | 1533 | 315517 | 141 | |
2021-03-07 | AS | 0 | null | 12/1/2020 12:00:00 AM | 96d23f888c995b9a7f3b4b864de6414f45c728ff | 12/1/2020 12:00:00 AM | 0 | 2140 | 2140 | 2140 | 60 | 0 | 0 | 0 | 0 | 0 | 60 | US-AS | 4/26/2021 12:06:49 AM | US | 2140 | ||||||||
2021-03-07 | AZ | 826454 | 963 | 57907 | 143 | nihil | 3/7/2021 12:00:00 AM | 0437a7a96f4471666f775e63e86923eb5cbd8cdf | 3/7/2021 12:00:00 AM | 16328 | 57907 | 3899464 | 7908105 | 3899464 | 4 | 5 | 44 | 13678 | 1335 | 45110 | 4 | US-AZ | 4/26/2021 12:06:49 AM | US | 3073010 | 273 | |||
2021-03-07 | OS | 3501394 | 4291 | nihil | 3/7/2021 2:59:00 AM | 63c5c0fd2daef2fb65150e9db486de98ed3f7b72 | 3/7/2021 2:59:00 AM | 3501394 | 49646014 | 3501394 | 6 | 258 | 0 | 0 | 3816 | 133186 | 6 | US-CA | 4/26/2021 12:06:49 AM | US | 1159 | ||||||||
2021-03-07 | CO | 436602 | 326 | 23904 | nihil | 3/7/2021 1:59:00 AM | 444746cda3a596f183f3fa3269c8cab68704e819 | 3/7/2021 1:59:00 AM | 5989 | 23904 | 2636060 | 6415123 | 2636060 | 8 | 3 | 18 | 0 | 840 | 38163 | 8 | US-CO | 4/26/2021 12:06:49 AM | US | 2199458 | |||||
2021-03-07 | CT | 285330 | 428 | 12257 | nihil | 3/4/2021 11:59:00 PM | bcc0f7bc8c2bf77eec31b25f8b59d510f679d3e7 | 3/4/2021 11:59:00 PM | 7704 | 12257 | 285330 | 6520366 | 285330 | 9 | 0 | 0 | 0 | 0 | 0 | 9 | US-CT | 4/26/2021 12:06:49 AM | US | ||||||
2021-03-07 | DC | 41419 | 150 | 16 | nihil | 3/6/2021 12:00:00 AM | a3aa0d623d538807fb9577ad64354f48cf728cc8 | 3/6/2021 12:00:00 AM | 1030 | 41419 | 1261363 | 41419 | 11 | 0 | 0 | 0 | 146 | 5726 | 11 | US-DC | 4/26/2021 12:06:49 AM | US | 29570 | 38 | |||||
2021-03-07 | DE | 88354 | 104 | nihil | 3/6/2021 6:00:00 PM | 059d870e689d5cc19c35f5eb398214d7d9856373 | 3/6/2021 6:00:00 PM | 1473 | 633424 | 1431942 | 633424 | 10 | 9 | 0 | 917 | 215 | 5867 | 10 | US-DE | 4/26/2021 12:06:49 AM | US | 545070 | 13 |
Akses data
Azure Notebooks
URL dari berbagai format file himpunan data yang dihosting di Azure Blob Storage:
Mengunduh file himpunan data menggunakan kemampuan pengunduhan bawaan dari URL http di Pandas. Pandas memiliki pembaca untuk berbagai format file:
https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_parquet.html
https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_csv.html
import pandas as pd
import numpy as np
%matplotlib inline
import matplotlib.pyplot as plt
df = pd.read_parquet("https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/covid_tracking/latest/covid_tracking.parquet ")
df.head(10)
df.dtypes
df.groupby('state').first().filter(['date','positive', 'death'])
df.groupby(df.state).agg({'state': 'count','positive_increase': 'sum','death_increase': 'sum'})
df_NY=df[df['state'] == 'NY']
df_NY.plot(kind='line',x='date',y="positive",grid=True)
df_NY.plot(kind='line',x='date',y="positive_increase",grid=True)
df_NY.plot(kind='line',x='date',y="death",grid=True)
df_NY.plot(kind='line',x='date',y="death_increase",grid=True)
df_US=df.groupby(df.date).agg({'positive': 'sum','positive_increase': 'sum','death':'sum','death_increase': 'sum'}).reset_index()
df_US.plot(kind='line',x='date',y="positive",grid=True)
df_US.plot(kind='line',x='date',y="positive_increase",grid=True)
df_US.plot(kind='line',x='date',y="death",grid=True)
df_US.plot(kind='line',x='date',y="death_increase",grid=True)
Azure Databricks
Sampel tidak tersedia untuk kombinasi platform/paket ini.
Azure Synapse
Sampel tidak tersedia untuk kombinasi platform/paket ini.
Langkah berikutnya
Lihat himpunan data lainnya di katalog Open Datasets.