Bagikan melalui


Himpunan data diabetes

Kumpulan data Diabetes memiliki 442 sampel dengan 10 fitur, menjadikannya ideal untuk memulai dengan algoritme pembelajaran mesin. Ini adalah salah satu Himpunan data Scikit Learn Toy yang paling populer.

Deskripsi himpunan data asli | File data asli

Catatan

Microsoft menyediakan Azure Open Datasets berdasarkan "apa adanya". Microsoft tidak memberikan jaminan, tersurat maupun tersirat, jaminan atau ketentuan sehubungan dengan penggunaan Anda atas himpunan data. Sejauh diizinkan menurut undang-undang setempat Anda, Microsoft melepaskan semua tanggung jawab atas segala kerusakan atau kerugian, termasuk langsung, konsekuensial, khusus, tidak langsung, insidental, atau hukuman, yang diakibatkan oleh penggunaan Anda atas kumpulan data.

Kumpulan data ini disediakan di bawah ketentuan asli yang diterima Microsoft data sumbernya. Himpunan data mungkin menyertakan data yang bersumber dari Microsoft.

Kolom

Nama Jenis data Unik Nilai (sampel)
USIA bigint 58 53 60
BMI ganda 163 24.1 23.5
BP ganda 100 93.0 83.0
S1 bigint 141 162 184
S2 ganda 302 125.8 114.8
S3 ganda 63 46.0 38.0
S4 ganda 66 3.0 4.0
S5 ganda 184 4.4427 4.3041
S6 bigint 56 92 96
Jenis Kelamin bigint 2 1 2
Y bigint 214 72 200

Pratinjau

USIA Jenis Kelamin BMI BP S1 S2 S3 S4 S5 S6 Y
59 2 32.1 101 157 93.2 38 4 4.8598 87 151
48 1 21.6 87 183 103.2 70 3 3.8918 69 75
72 2 30.5 93 156 93.6 41 4 4.6728 85 141
24 1 25.3 84 198 131.4 40 5 4.8903 89 206
50 1 23 101 192 125,4 52 4 4.2905 80 135
23 1 22.6 89 139 64.8 61 2 4.1897 68 97
36 2 22 90 160 99.6 50 3 3.9512 82 138
66 2 26.2 114 255 185 56 4.55 4.2485 92 63
60 2 32.1 83 179 119.4 42 4 4.4773 94 110
29 1 30 85 180 93,4 43 4 5.3845 88 310

Akses data

Gunakan contoh kode berikut untuk mengakses himpunan data ini di Azure Notebooks, Azure Databricks, atau Azure Synapse.

Azure Notebooks

# This is a package in preview.
from azureml.opendatasets import Diabetes

diabetes = Diabetes.get_tabular_dataset()
diabetes_df = diabetes.to_pandas_dataframe()

diabetes_df.info()

Azure Databricks

# This is a package in preview.
from azureml.opendatasets import Diabetes

diabetes = Diabetes.get_tabular_dataset()
diabetes_df = diabetes.to_spark_dataframe()

display(diabetes_df.limit(5))

Azure Synapse

Sampel tidak tersedia untuk kombinasi platform/paket ini.

Langkah berikutnya

Lihat himpunan data lainnya di katalog Open Datasets.