Munkaszüneti
A PyPI szabadnapos csomagja és a Wikipedia alapján készült nyilvános szabadnapi adatok, 38 országra vagy régióra vonatkozóan, 1970. és 2099 között.
Minden sor egy adott dátum és ország vagy régió szabadnapjaira vonatkozó adatait tartalmazza, illetve azt, hogy a legtöbb ember kap-e fizetett szabadságot.
Feljegyzés
A Microsoft az Azure Open Datasets szolgáltatást "adott módon" biztosítja. A Microsoft nem vállal kifejezett vagy vélelmezett garanciát vagy feltételeket az adathalmazok Ön általi használatára vonatkozóan. A microsoft a helyi jogszabályok által megengedett mértékben kizár minden felelősséget az adathalmazok használatából eredő károkért vagy veszteségekért, beleértve a közvetlen, következményi, különleges, közvetett, incidenses vagy büntető jellegű károkat is.
Az adatkészletet a Microsoft forrásadataihoz tartozó eredeti feltételek szerint szolgáltatjuk. A készlet tartalmazhat Microsofttól származó adatokat.
Kötet és megőrzés
Az adatkészlet Parketta formátumban van tárolva. Ez egy pillanatkép, amely 1970. január 1-től 2099. január 1-ig ünnepnapi információkat tartalmaz. Az adatok mérete körülbelül 500 KB.
Tárolási hely
Az adatkészlet tárolási helye a Kelet-USA Azure-régió. Javasoljuk, hogy az USA keleti régiójában keresse meg a számítási erőforrásokat az affinitás érdekében.
További információk
Az adatkészlet a Wikipediáról (WikiMedia Foundation Inc) és a PyPI szabadnapos csomagjából származó adatokat tartalmaz.
- Wikipedia: eredeti forrás, eredeti licenc
- PyPI szabadnapok: eredeti forrás, eredeti licenc
Az egyesített adatkészlet a Creative Commons Attribution-ShareAlike 3.0 nem adaptált licenc alapján terjeszthető.
Az adatforrással kapcsolatos kérdéseket e-mailben teheti fel ezen a címen: aod@microsoft.com.
Oszlopok
Név | Adattípus | Egyedi | Values (sample) | Leírás |
---|---|---|---|---|
countryOrRegion | húr | 38 | Svédország Norvégia | Ország vagy régió teljes neve. |
countryRegionCode | húr | 35 | SE NEM | Ország vagy régiókód ebben a formátumban. |
dátum: | időbélyeg | 20,665 | 2074-01-01 00:00:00 2025-12-25 00:00:00 | Az ünnep dátuma. |
holidayName | húr | 483 | Søndag Söndag | Az ünnep teljes neve. |
isPaidTimeOff | Logikai | 3 | Igaz | Jelezze, hogy a legtöbben fizetett időt töltöttek-e ezen a napon (jelenleg csak az EGYESÜLT Államok, GB és India számára érhető el). Ha az értéke NULL, akkor az adat ismeretlen. |
normalizeHolidayName | húr | 438 | Søndag Söndag | Az ünnep normalizált neve. |
Előnézet
countryOrRegion | holidayName | normalizeHolidayName | countryRegionCode | dátum: |
---|---|---|---|---|
Norvégia | Søndag | Søndag | NEM | 2098. 12. 28. 12:00:00 |
Svédország | Söndag | Söndag | SE | 2098. 12. 28. 12:00:00 |
Ausztrália | Boxing Day | Boxing Day | AU | 2098. 12. 26. 12:00:00 |
Magyarország | Karácsony | Karácsony | HU | 2098. 12. 26. 12:00:00 |
Ausztria | Stefanitag | Stefanitag | AT | 2098. 12. 26. 12:00:00 |
Kanada | Boxing Day | Boxing Day | CA | 2098. 12. 26. 12:00:00 |
Horvátország | Sveti Stjepan | Sveti Stjepan | HR | 2098. 12. 26. 12:00:00 |
Cseh | 2. svátek vánoční | 2. svátek vánoční | CZ | 2098. 12. 26. 12:00:00 |
Az adatok elérése
Azure Notebooks
# This is a package in preview.
from azureml.opendatasets import PublicHolidays
from datetime import datetime
from dateutil import parser
from dateutil.relativedelta import relativedelta
end_date = datetime.today()
start_date = datetime.today() - relativedelta(months=1)
hol = PublicHolidays(start_date=start_date, end_date=end_date)
hol_df = hol.to_pandas_dataframe()
hol_df.info()
Azure Databricks
# This is a package in preview.
# You need to pip install azureml-opendatasets in Databricks cluster. https://learn.microsoft.com/azure/data-explorer/connect-from-databricks#install-the-python-library-on-your-azure-databricks-cluster
from azureml.opendatasets import PublicHolidays
from datetime import datetime
from dateutil import parser
from dateutil.relativedelta import relativedelta
end_date = datetime.today()
start_date = datetime.today() - relativedelta(months=1)
hol = PublicHolidays(start_date=start_date, end_date=end_date)
hol_df = hol.to_spark_dataframe()
display(hol_df.limit(5))
Azure Synapse
# This is a package in preview.
from azureml.opendatasets import PublicHolidays
from datetime import datetime
from dateutil import parser
from dateutil.relativedelta import relativedelta
end_date = datetime.today()
start_date = datetime.today() - relativedelta(months=1)
hol = PublicHolidays(start_date=start_date, end_date=end_date)
hol_df = hol.to_spark_dataframe()
# Display top 5 rows
display(hol_df.limit(5))
Következő lépések
Tekintse meg a többi adathalmazt az Open Datasets katalógusban.