NYC Taxi &Limuzin Bizottság - sárga taxi utazás rekordok
A sárga taxis utazások rekordjai az utasfelvétel és -kiadás dátumát és idejét, a felvétel és -kiadás helyét, az út hosszát, a tételes viteldíjakat, a díjszabás típusát, a fizetési módot, valamint a sofőr által bejelentett utasszámot tartalmazzák.
Feljegyzés
A Microsoft az Azure Open Datasets szolgáltatást "adott módon" biztosítja. A Microsoft nem vállal kifejezett vagy vélelmezett garanciát vagy feltételeket az adathalmazok Ön általi használatára vonatkozóan. A microsoft a helyi jogszabályok által megengedett mértékben kizár minden felelősséget az adathalmazok használatából eredő károkért vagy veszteségekért, beleértve a közvetlen, következményi, különleges, közvetett, incidenses vagy büntető jellegű károkat is.
Az adatkészletet a Microsoft forrásadataihoz tartozó eredeti feltételek szerint szolgáltatjuk. A készlet tartalmazhat Microsofttól származó adatokat.
Kötet és megőrzés
Az adatkészlet Parketta formátumban van tárolva. 2018-ban összesen körülbelül 1,5B sor (50 GB) található.
Az adatkészlet 2009. és 2018. között összegyűjtött adatokat tartalmaz. Adott időtartomány adatainak beolvasásához az általunk biztosított SDK paraméterbeállításait használhatja.
Tárolási hely
Az adatkészlet tárolási helye a Kelet-USA Azure-régió. Az affinitás érdekében Kelet-USA régión belüli számítási erőforrások lefoglalását javasoljuk.
További információk
NYC Taxi and Limousine Commission (TLC):
Az adatokat a Taxicab & Livery Passenger Enhancement Programs (TPEP/LPEP) keretében technológiai szolgáltatók szolgáltatták az NYC Taxi and Limousine Commission (TLC) számára. Az utazások adatait nem a TLC hozta létre, amely így nem is vállal felelősséget ezek pontosságáért.
Tekintse meg az eredeti adatkészlet helyét és az eredeti használati feltételeket.
Oszlopok
Név | Adattípus | Egyedi | Values (sample) | Leírás |
---|---|---|---|---|
doLocationId | húr | 265 | 161 236 | A taxióra kikapcsolásának TLC taxizónája. |
endLat | double | 961,994 | 41.366138 40.75 | |
endLon | double | 1,144,935 | -73.137393 -73.9824 | |
többlet | double | 877 | 0.5 1.0 | Egyéb pótdíjak. Ez jelenleg csak a 0,50, illetve 1 USD-s csúcsidős és éjszakai díjakat tartalmazza. |
viteldíjAmount | double | 18,935 | 6.5 4.5 | Az óra által mért díj az idő és a megtett út függvényében. |
improvementSurcharge | húr | 60 | 0.3 0 | 0,30 USD-s pótdíj az utasfelvételnél. A pótdíjat 2015-ben vezették be. |
mtaTax | double | 360 | 0.5 -0.5 | Az ár 0,50 USD MTA- (városi közlekedési hatósági) adót tartalmaz, amely a mért díjnak megfelelően automatikusan hozzáadódik az összeghez. |
passengerCount | egész | 64 | 1 2 | A járműben tartózkodó utasok száma. Az értéket a sofőr adja meg. |
paymentType | húr | 6,282 | CSH CRD | Numerikus kód, amely azt jelzi, hogy az utas hogyan fizetett az útért. 1 = Hitelkártya; 2 = Készpénz; 3 = Díjmentes; 4 = Vita; 5 = Ismeretlen; 6 = Érvénytelenített utazás. |
puLocationId | húr | 266 | 237 161 | A taxióra indításának TLC-taxizónája. |
puMonth | egész | 12 | 3 5 | |
puYear | egész | 29 | 2012 2011 | |
rateCodeId | egész | 56 | 1 2 | A végösszeg az utazás végén. 1 = Standard ráta; 2 = JFK; 3 = Newark; 4 = Nassau vagy Westchester; 5 = Tárgyalásos viteldíj; 6 = Csoportos utazás. |
startLat | double | 833,016 | 41.366138 40.7741 | |
startLon | double | 957,428 | -73.137393 -73.9821 | |
storeAndFwdFlag | húr | 8 | N 0 | Ez a jelző azt jelzi, hogy az utazási rekord a jármű memóriájában volt-e tárolva, mielőtt elküldené a szállítónak, más néven "tároló és továbbítás" néven, mivel a járműnek nem volt kapcsolata a kiszolgálóval. Y = tárolás és továbbítás; N = nem egy üzlet és egy előre utazás. |
tipAmount | double | 12,121 | 1.0 2.0 | Ez a mező automatikusan kitöltésre kerül hitelkártyás borravaló-fizetésnél. A készpénzben fizetett borravalókat nem tartalmazza. |
tollsAmount | double | 6,634 | 5.33 4.8 | Az utazás során fizetett összes úthasználati díj összege. |
totalAmount | double | 39,707 | 7.0 7.8 | Az utasok által térítendő teljes összeg. Nem tartalmazza a készpénzben fizetett borravalók összegét. |
tpepDropoffDateTime | időbélyeg | 290,185,010 | 2010-11-07 01:29:00 2013-11-03 01:22:00 | Az óra leállításának dátuma és ideje. |
tpepPickupDateTime | időbélyeg | 289,948,585 | 2010-11-07 01:00:00 2009-11-01 01:05:00 | Az óra indításának dátuma és ideje. |
tripDistance | double | 14,003 | 1.0 0.9 | A utazás során megtett távolság mérföldben a taxióra adatai alapján. |
vendorID | húr | 7 | VTS CMT | A rekordot szolgáltató TPEP-szolgáltató kódja. 1 = Creative Mobile Technologies, LLC; 2= VeriFone Inc. |
vendorID | egész | 2 | 2 1 | A rekordot szolgáltató LPEP-szolgáltató kódja. 1 = Creative Mobile Technologies, LLC; 2= VeriFone Inc. |
Előnézet
vendorID | tpepPickupDateTime | tpepDropoffDateTime | passengerCount | tripDistance | puLocationId | doLocationId | rateCodeId | storeAndFwdFlag | paymentType | viteldíjAmount | többlet | mtaTax | improvementSurcharge | tipAmount | tollsAmount | totalAmount | puYear | puMonth |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
2 | 2088.01.24. 12:25:39 | 2088. 01. 24. 07:28:25 | 0 | 4.05 | 24 | 162 | 0 | N | 2 | 14,5 | 0 | 0,5 | 0.3 | 0 | 0 | 15,3 | 2088 | 0 |
2 | 2088.01.24. 12:15:42 | 2088. 01. 24. 12:19:46 | 0 | 0.63 | 41 | 166 | 0 | N | 2 | 4,5 | 0 | 0,5 | 0.3 | 0 | 0 | 5.3 | 2088 | 0 |
2 | 2084.04.11. 12:32:24 | 2084.04.11. 12:47:41 | 0 | 1.34 | 238 | 236 | 0 | N | 2 | 10 | 0 | 0,5 | 0.3 | 0 | 0 | 10.8 | 2084 | 11 |
2 | 2084.04.11. 12:25:53 | 2084.04.11. 12:29:00 | 0 | 0.32 | 238 | 238 | 0 | N | 2 | 4 | 0 | 0,5 | 0.3 | 0 | 0 | 4.8 | 2084 | 11 |
2 | 2084.04.11. 12:08:33 | 2084.04.11. 12:22:24 | 0 | 1.85 | 236 | 238 | 0 | N | 2 | 10 | 0 | 0,5 | 0.3 | 0 | 0 | 10.8 | 2084 | 11 |
2 | 2084.04.11. 11:41:35 | 2084.04.11. 11:59:41 | 0 | 1.65 | 68 | 237 | 0 | N | 2 | 12.5 | 0 | 0,5 | 0.3 | 0 | 0 | 13.3 | 2084 | 11 |
2 | 2084.04.11. 11:27:28 | 2084.04.11. 11:39:52 | 0 | 1.07 | 170 | 68 | 0 | N | 2 | 9 | 0 | 0,5 | 0.3 | 0 | 0 | 9.8 | 2084 | 11 |
2 | 2084.04.11. 11:19:06 | 2084.04.11. 11:26:44 | 0 | 1.3 | 107 | 170 | 0 | N | 2 | 7,5 | 0 | 0,5 | 0.3 | 0 | 0 | 8.3 | 2084 | 11 |
2 | 2084.04.11. 11:02:59 | 2084.04.11. 11:15:51 | 0 | 1.85 | 113 | 137 | 0 | N | 2 | 10 | 0 | 0,5 | 0.3 | 0 | 0 | 10.8 | 2084 | 11 |
2 | 2084.04.11. 10:46:05 | 2084.04.11. 10:50:09 | 0 | 0,62 | 231 | 231 | 0 | N | 2 | 4,5 | 0 | 0,5 | 0.3 | 0 | 0 | 5.3 | 2084 | 11 |
Az adatok elérése
Azure Notebooks
# This is a package in preview.
from azureml.opendatasets import NycTlcYellow
from datetime import datetime
from dateutil import parser
end_date = parser.parse('2018-06-06')
start_date = parser.parse('2018-05-01')
nyc_tlc = NycTlcYellow(start_date=start_date, end_date=end_date)
nyc_tlc_df = nyc_tlc.to_pandas_dataframe()
nyc_tlc_df.info()
Azure Databricks
# This is a package in preview.
# You need to pip install azureml-opendatasets in Databricks cluster. https://learn.microsoft.com/azure/data-explorer/connect-from-databricks#install-the-python-library-on-your-azure-databricks-cluster
from azureml.opendatasets import NycTlcYellow
from datetime import datetime
from dateutil import parser
end_date = parser.parse('2018-06-06')
start_date = parser.parse('2018-05-01')
nyc_tlc = NycTlcYellow(start_date=start_date, end_date=end_date)
nyc_tlc_df = nyc_tlc.to_spark_dataframe()
display(nyc_tlc_df.limit(5))
Azure Synapse
# This is a package in preview.
from azureml.opendatasets import NycTlcYellow
from datetime import datetime
from dateutil import parser
end_date = parser.parse('2018-06-06')
start_date = parser.parse('2018-05-01')
nyc_tlc = NycTlcYellow(start_date=start_date, end_date=end_date)
nyc_tlc_df = nyc_tlc.to_spark_dataframe()
# Display top 5 rows
display(nyc_tlc_df.limit(5))
Következő lépések
Tekintse meg a többi adathalmazt az Open Datasets katalógusban.