Bagikan melalui


Proyek Pelacakan COVID

Kumpulan data COVID Tracking Project menyediakan angka terbaru tentang tes, kasus terkonfirmasi, rawat inap, dan hasil pasien dari setiap negara bagian dan wilayah AS.

Untuk informasi selengkapnya tentang kumpulan data ini, lihat repositori GitHub proyek.

Catatan

Microsoft menyediakan Azure Open Datasets berdasarkan "apa adanya". Microsoft tidak memberikan jaminan, tersurat maupun tersirat, jaminan atau ketentuan sehubungan dengan penggunaan Anda atas himpunan data. Sejauh diizinkan menurut undang-undang setempat Anda, Microsoft melepaskan semua tanggung jawab atas segala kerusakan atau kerugian, termasuk langsung, konsekuensial, khusus, tidak langsung, insidental, atau hukuman, yang diakibatkan oleh penggunaan Anda atas kumpulan data.

Kumpulan data ini disediakan di bawah ketentuan asli yang diterima Microsoft data sumbernya. Himpunan data mungkin menyertakan data yang bersumber dari Microsoft.

Himpunan data

Versi himpunan data yang dimodifikasi tersedia dalam CSV, JSON, JSON-Lines, dan Parquet.

Semua versi yang dimodifikasi memiliki kode subdivisi ISO 3166 dan waktu muat ditambahkan, dan menggunakan nama kolom huruf kecil dengan pemisah garis bawah.

Data mentah: 'https://pandemicdatalake.blob.core.windows.net/public/raw/covid-19/covid_tracking/latest/daily.json'

Versi sebelumnya dari data yang dimodifikasi dan data mentah: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/covid_tracking/

https://pandemicdatalake.blob.core.windows.net/public/raw/covid-19/covid_tracking/

Volume data

Semua himpunan data diperbarui setiap hari. Pada 13 Mei 2020 himpunan data berisi 4.100 baris (CSV 574 KB, JSON 1,8 MB, JSONL 1,8 MB, Parquet 334 KB).

Sumber data

Data ini awalnya diterbitkan oleh Covid Tracking Project di Atlantik. Data mentah diserap dari repo GitHub Pelacakan COVID menggunakan file states_daily_4p_et.csv. Untuk informasi selengkapnya tentang himpunan data ini termasuk asalnya dari COVID Tracking Project API, lihat repositori GitHub proyek.

Kualitas data

Covid Tracking Project menilai kualitas data untuk setiap negara bagian dan memberikan informasi lebih lanjut tentang penilaian mereka terhadap kualitas data. Untuk informasi selengkapnya, lihat halaman data COVID Tracking Project. Data di repositori GitHub mungkin satu jam di belakang API; penggunaan API diperlukan untuk mengakses data terbaru.

Atribusi lisensi dan hak penggunaan

Data ini dilisensikan berdasarkan persyaratan dan ketentuan Lisensi Apache 2.0.

Setiap penggunaan data harus menampilkan semua hak cipta, paten, merek dagang, dan pemberitahuan atribusi.

Kontak

Untuk pertanyaan atau umpan balik tentang himpunan data ini atau yang lainnya di Data Lake COVID-19, hubungi askcovid19dl@microsoft.com.

Kolom

Nama Jenis data Unik Nilai (sampel) Deskripsi
date date 420 2020-11-10 2021-01-30 Tanggal di mana total harian dikumpulkan.
date_checked string 9,487 2020-12-01T00:00:00Z 2020-09-01T00:00:00Z Tidak digunakan lagi
kematian smallint 7,327 2 5 Total orang yang meninggal akibat COVID-19 sejauh ini.
death_increase smallint 429 1 2 Tidak digunakan lagi
fips smallint 56 26 55 Kode FIPS sensus untuk negara.
fips_code string 60 53 25 Kode FIPS sensus untuk negara.
Hash string 20,780 63df8cccd23a5476bab2d8111b138e4c9becd35e c606cd6990f16086b5382e12d84f6206172d493d Hash untuk catatan ini
Dirawat int 7,641 89995 4 Tidak digunakan lagi
hospitalized_cumulative int 7,641 89995 4 Jumlah total orang yang telah pergi ke rumah sakit karena COVID-19 sejauh ini, termasuk mereka yang telah pulih atau meninggal.
hospitalized_currently smallint 3,886 8 13 Jumlah orang di rumah sakit karena COVID-19 pada hari ini.
hospitalized_increase smallint 615 1 2 Tidak digunakan lagi
in_icu_cumulative smallint 2,295 990 220 Jumlah total orang yang telah dirawat di ICU karena COVID-19 sejauh ini, termasuk mereka yang telah pulih atau meninggal.
in_icu_currently smallint 1,643 2 8 Total orang di ICU karena COVID-19 pada hari ini.
iso_country string 1 US Kode negara atau kawasan ISO 3166
iso_subdivision string 57 US-UM US-WA Kode subdivisi ISO 3166
last_update_et rentang waktu 9,487 2020-12-01 00:00:00 2020-09-01 00:00:00 Terakhir kali data hari diperbarui
waktu_pemuatan rentang waktu 1 2021-04-26 00:06:49.883000 Tanggal dan waktu data dimuat ke Azure dari sumber
negatif int 10,864 305972 2140 Total orang yang telah dites negatif COVID-19 sejauh ini.
negative_increase int 7,328 6 17 Tidak digunakan lagi
on_ventilator_cumulative smallint 677 411 412 Jumlah total orang yang telah menggunakan ventilator karena COVID-19 sejauh ini, termasuk mereka yang telah pulih atau meninggal.
on_ventilator_currently smallint 837 4 10 Jumlah orang yang menggunakan ventilator karena COVID-19 pada hari ini.
Tertunda smallint 944 2 17 Jumlah tes yang hasilnya belum ditentukan.
pos_neg int 18,282 2140 2 Tidak digunakan lagi
positif int 16,837 2 1 Total orang yang telah dites positif COVID-19 sejauh ini.
positive_increase smallint 4,754 1 2 Tidak digunakan lagi
pulih int 8,286 29 19 Total orang yang telah sembuh dari COVID-19 sejauh ini.
state string 56 MI PA Kode dua huruf untuk negara.
total int 18,283 2140 2 Tidak digunakan lagi
total_test_results int 18,648 2140 3 Total hasil tes yang disediakan oleh Negara
total_test_results_increase int 13,463 1 2 Tidak digunakan lagi

Pratinjau

date state positif hospitalized_currently hospitalized_cumulative on_ventilator_currently data_quality_grade last_update_et Hash date_checked kematian Dirawat total total_test_results pos_neg fips death_increase hospitalized_increase negative_increase positive_increase total_test_results_increase fips_code iso_subdivision waktu_pemuatan iso_country negatif in_icu_cumulative on_ventilator_cumulative pulih in_icu_currently
2021-03-07 AK 56886 33 1293 2 nihil 3/5/2021 3:59:00 AM dc4bccd4bb885349d7e94d6fed058e285d4be164 3/5/2021 3:59:00 AM 305 1293 56886 1731628 56886 2 0 0 0 0 0 2 US-AK 4/26/2021 12:06:49 AM US
2021-03-07 AL 499819 494 45976 nihil 3/7/2021 11:00:00 AM 997207b430824ea40b8eb8506c19a93e07bc972e 3/7/2021 11:00:00 AM 10148 45976 2431530 2323788 2431530 1 -1 0 2087 408 2347 1 US-AL 4/26/2021 12:06:49 AM US 1931711 2676 1515 295690
2021-03-07 AR 324818 335 14926 65 nihil 3/7/2021 12:00:00 AM 50921aeefba3e30d31623aa495b47fb2ecc72fae 3/7/2021 12:00:00 AM 5319 14926 2805534 2736442 2805534 5 22 11 3267 165 3380 5 US-AR 4/26/2021 12:06:49 AM US 2480716 1533 315517 141
2021-03-07 AS 0 null 12/1/2020 12:00:00 AM 96d23f888c995b9a7f3b4b864de6414f45c728ff 12/1/2020 12:00:00 AM 0 2140 2140 2140 60 0 0 0 0 0 60 US-AS 4/26/2021 12:06:49 AM US 2140
2021-03-07 AZ 826454 963 57907 143 nihil 3/7/2021 12:00:00 AM 0437a7a96f4471666f775e63e86923eb5cbd8cdf 3/7/2021 12:00:00 AM 16328 57907 3899464 7908105 3899464 4 5 44 13678 1335 45110 4 US-AZ 4/26/2021 12:06:49 AM US 3073010 273
2021-03-07 OS 3501394 4291 nihil 3/7/2021 2:59:00 AM 63c5c0fd2daef2fb65150e9db486de98ed3f7b72 3/7/2021 2:59:00 AM 3501394 49646014 3501394 6 258 0 0 3816 133186 6 US-CA 4/26/2021 12:06:49 AM US 1159
2021-03-07 CO 436602 326 23904 nihil 3/7/2021 1:59:00 AM 444746cda3a596f183f3fa3269c8cab68704e819 3/7/2021 1:59:00 AM 5989 23904 2636060 6415123 2636060 8 3 18 0 840 38163 8 US-CO 4/26/2021 12:06:49 AM US 2199458
2021-03-07 CT 285330 428 12257 nihil 3/4/2021 11:59:00 PM bcc0f7bc8c2bf77eec31b25f8b59d510f679d3e7 3/4/2021 11:59:00 PM 7704 12257 285330 6520366 285330 9 0 0 0 0 0 9 US-CT 4/26/2021 12:06:49 AM US
2021-03-07 DC 41419 150 16 nihil 3/6/2021 12:00:00 AM a3aa0d623d538807fb9577ad64354f48cf728cc8 3/6/2021 12:00:00 AM 1030 41419 1261363 41419 11 0 0 0 146 5726 11 US-DC 4/26/2021 12:06:49 AM US 29570 38
2021-03-07 DE 88354 104 nihil 3/6/2021 6:00:00 PM 059d870e689d5cc19c35f5eb398214d7d9856373 3/6/2021 6:00:00 PM 1473 633424 1431942 633424 10 9 0 917 215 5867 10 US-DE 4/26/2021 12:06:49 AM US 545070 13

Akses data

Azure Notebooks

URL dari berbagai format file himpunan data yang dihosting di Azure Blob Storage:

CSV: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/covid_tracking/latest/covid_tracking.csv

JSON: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/covid_tracking/latest/covid_tracking.json

JSONL: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/covid_tracking/latest/covid_tracking.jsonl

Parquet: https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/covid_tracking/latest/covid_tracking.parquet

Mengunduh file himpunan data menggunakan kemampuan pengunduhan bawaan dari URL http di Pandas. Pandas memiliki pembaca untuk berbagai format file:

https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_parquet.html

https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_csv.html

import pandas as pd
import numpy as np
%matplotlib inline
import matplotlib.pyplot as plt

df = pd.read_parquet("https://pandemicdatalake.blob.core.windows.net/public/curated/covid-19/covid_tracking/latest/covid_tracking.parquet ")
df.head(10)

df.dtypes

df.groupby('state').first().filter(['date','positive', 'death'])

df.groupby(df.state).agg({'state': 'count','positive_increase': 'sum','death_increase': 'sum'})

df_NY=df[df['state'] == 'NY']
df_NY.plot(kind='line',x='date',y="positive",grid=True)
df_NY.plot(kind='line',x='date',y="positive_increase",grid=True)
df_NY.plot(kind='line',x='date',y="death",grid=True)
df_NY.plot(kind='line',x='date',y="death_increase",grid=True)

df_US=df.groupby(df.date).agg({'positive': 'sum','positive_increase': 'sum','death':'sum','death_increase': 'sum'}).reset_index()

df_US.plot(kind='line',x='date',y="positive",grid=True)
df_US.plot(kind='line',x='date',y="positive_increase",grid=True)
df_US.plot(kind='line',x='date',y="death",grid=True)
df_US.plot(kind='line',x='date',y="death_increase",grid=True)



Azure Databricks

Sampel tidak tersedia untuk kombinasi platform/paket ini.

Azure Synapse

Sampel tidak tersedia untuk kombinasi platform/paket ini.

Langkah berikutnya

Lihat himpunan data lainnya di katalog Open Datasets.