Bagikan melalui


Komisi Taksi & Limusin NYC - catatan perjalanan Kendaraan yang Disewakan (FHV)

Catatan perjalanan Kendaraan yang Disewakan (“FHV”) meliputi bidang yang menanangkap nomor lisensi dasar pengiriman dan tanggal penjemputan, waktu, dan ID lokasi zona taksi (file bentuk di bawah ini). Catatan ini dihasilkan dari pengiriman FHV Trip Record yang dibuat oleh pangkalan.

Catatan

Microsoft menyediakan Azure Open Datasets berdasarkan "apa adanya". Microsoft tidak memberikan jaminan, tersurat maupun tersirat, jaminan atau ketentuan sehubungan dengan penggunaan Anda atas himpunan data. Sejauh diizinkan menurut undang-undang setempat Anda, Microsoft melepaskan semua tanggung jawab atas segala kerusakan atau kerugian, termasuk langsung, konsekuensial, khusus, tidak langsung, insidental, atau hukuman, yang diakibatkan oleh penggunaan Anda atas kumpulan data.

Kumpulan data ini disediakan di bawah ketentuan asli yang diterima Microsoft data sumbernya. Himpunan data mungkin menyertakan data yang bersumber dari Microsoft.

Volume dan retensi

Himpunan data ini disimpan dalam format Parquet. Terdapat sekitar 500 Juta baris (5 GB) pada tahun 2018.

Himpunan data ini berisi catatan historis yang diakumulasi dari 2009 hingga 2018. Anda dapat menggunakan pengaturan parameter di SDK kami untuk mengambil data dalam rentang waktu tertentu.

Lokasi penyimpanan

Himpunan data ini disimpan di wilayah Azure US Timur. Disarankan untuk mengalokasikan sumber daya komputasi di US Timur untuk afinitas.

Informasi Tambahan

Komisi Taksi dan Limousine NYC (TLC):

Data dikumpulkan dan diberikan kepada Komisi Taksi dan Limousine NYC (TLC) oleh penyedia teknologi yang berwenang di bawah Program Peningkatan Penumpang Taksi dan Seragam (TPEP/LPEP). Data perjalanan tidak dibuat oleh TLC, dan TLC tidak membuat representasi tentang keakuratan data ini.

Lihat lokasi set data asli dan ketentuan penggunaan asli.

Kolom

Nama Jenis data Unik Nilai (sampel) Deskripsi
dispatchBaseNum string 1,144 B02510 B02764 Nomor Lisensi Pangkalan TLC dari pangkalan memberangkatkan perjalanan
doLocationId string 267 265 132 Zona Taksi TLC tempat perjalanan berakhir.
dropOffDateTime rentang waktu 57,110,352 2017-07-31 23:59:00 2017-10-15 00:44:34 Tanggal dan waktu pengantaran perjalanan.
pickupDateTime rentang waktu 111,270,396 2016-08-16 00:00:00 2016-08-17 00:00:00 Tanggal dan waktu penjemputan perjalanan.
puLocationId string 266 79 161 Zona Taksi TLC tempat perjalanan berakhir.
puMonth int 12 1 12
puYear int 5 2018 2017
srFlag string 44 1 2 Menunjukkan apakah perjalanan itu adalah bagian dari rantai perjalanan bersama yang ditawarkan oleh perusahaan FHV Volume Tinggi (misalnya, Uber Pool, Lyft Line). Untuk perjalanan bersama, nilainya adalah 1. Untuk perjalanan non-bersama, bidang ini null. CATATAN: Untuk sebagian besar perusahaan FHV Volume Tinggi, hanya perjalanan bersama yang diminta DAN dicocokkan dengan permintaan perjalanan bersama lainnya selama perjalanan ditandai. Namun, Lyft (nomor lisensi dasar B02510 + B02844) juga menandai perjalanan yang diminta oleh tumpangan bersama tetapi penumpang lain tidak berhasil dicocokkan untuk berbagi perjalanan —oleh karena itu, catatan perjalanan dengan SR_Flag = 1 dari dua pangkalan tersebut dapat menunjukkan perjalanan pertama dalam rantai perjalanan bersama ATAU perjalanan bersama yang diminta tetapi tidak pernah cocok. Pengguna harus mengantisipasi kelebihan perhitungan perjalanan bersama yang berhasil diselesaikan oleh Lyft.

Pratinjau

dispatchBaseNum pickupDateTime dropOffDateTime puLocationId doLocationId srFlag puYear puMonth
B03157 6/30/2019 23:59:57 7/1/2019 Pukul 12.07.21 264 null null 2019 6
B01667 6/30/2019 23:59:56 7/1/2019 12:28:06 264 null null 2019 6
B02849 6/30/2019 23:59:55 7/1/2019 12:14:10 264 null null 2019 6
B02249 6/30/2019 23:59:53 7/1/2019 12:15:53 264 null null 2019 6
B00887 6/30/2019 23:59:48 7/1/2019 12:29:29 264 null null 2019 6
B01626 6/30/2019 23:59:45 7/1/2019 12:18:20 264 null null 2019 6
B01259 6/30/2019 23:59:44 7/1/2019 12:03:15 264 null null 2019 6
B01145 6/30/2019 23:59:43 7/1/2019 12:11:15 264 null null 2019 6
B00887 6/30/2019 23:59:42 7/1/2019 12.34.21 264 null null 2019 6
B00821 6/30/2019 23:59:40 7/1/2019 12:02:57 264 null null 2019 6

Akses data

Azure Notebooks

# This is a package in preview.
from azureml.opendatasets import NycTlcFhv

from datetime import datetime
from dateutil import parser


end_date = parser.parse('2018-06-06')
start_date = parser.parse('2018-05-01')
nyc_tlc = NycTlcFhv(start_date=start_date, end_date=end_date)
nyc_tlc_df = nyc_tlc.to_pandas_dataframe()

nyc_tlc_df.info()

Azure Databricks

# This is a package in preview.
# You need to pip install azureml-opendatasets in Databricks cluster. https://learn.microsoft.com/azure/data-explorer/connect-from-databricks#install-the-python-library-on-your-azure-databricks-cluster
from azureml.opendatasets import NycTlcFhv

from datetime import datetime
from dateutil import parser


end_date = parser.parse('2018-06-06')
start_date = parser.parse('2018-05-01')
nyc_tlc = NycTlcFhv(start_date=start_date, end_date=end_date)
nyc_tlc_df = nyc_tlc.to_spark_dataframe()

display(nyc_tlc_df.limit(5))

Azure Synapse

# This is a package in preview.
from azureml.opendatasets import NycTlcFhv

from datetime import datetime
from dateutil import parser


end_date = parser.parse('2018-06-06')
start_date = parser.parse('2018-05-01')
nyc_tlc = NycTlcFhv(start_date=start_date, end_date=end_date)
nyc_tlc_df = nyc_tlc.to_spark_dataframe()

# Display top 5 rows
display(nyc_tlc_df.limit(5))

Langkah berikutnya

Lihat himpunan data lainnya di katalog Open Datasets.