Table.AddFuzzyClusterColumn
Syntax
Table.AddFuzzyClusterColumn(table as table, columnName as text, newColumnName as text, optional options as nullable record) as table
Om
Lägger till en ny kolumn newColumnName
till table
med representativa värden för columnName
. Representanterna erhålls genom att ungefärligt matcha värden i columnName
för varje rad.
En valfri uppsättning options
kan inkluderas för att ange hur du jämför nyckelkolumnerna. Alternativen är:
-
Culture
: Tillåter gruppering av poster baserat på kulturspecifika regler. Det kan vara valfritt giltigt kulturnamn. Till exempel grupperar kulturalternativet "ja-JP" poster baserat på den japanska kulturen. Standardvärdet är "", som grupperar baserat på den invarianta engelska kulturen. -
IgnoreCase
: Ett logiskt värde (sant/falskt) som tillåter skiftlägesokänslig nyckelgruppering. När det till exempel är sant grupperas "Vindruvor" med "vindruvor". Standardvärdet är sant. -
IgnoreSpace
: Ett logiskt värde (sant/falskt) som gör det möjligt att kombinera textdelar för att hitta grupper. När det till exempel är sant grupperas "Gra pes" med "Vindruvor". Standardvärdet är sant. -
SimilarityColumnName
: Ett namn på kolumnen som visar likheten mellan ett indatavärde och det representativa värdet för indata. Standardvärdet är null, i vilket fall en ny kolumn för likheter inte läggs till. -
Threshold
: Ett tal mellan 0,00 och 1,00 som anger likhetspoängen där två värden ska grupperas. Till exempel grupperas "Vindruvor" och "Graes" (som saknar "p") endast tillsammans om det här alternativet är inställt på mindre än 0,90. Ett tröskelvärde på 1,00 tillåter bara exakta matchningar. (Observera att en fuzzy "exakt matchning" kan ignorera skillnader som hölje, ordordning och skiljetecken.) Standardvärdet är 0,80. -
TransformationTable
: En tabell som tillåter gruppering av poster baserat på anpassade värdemappningar. Den bör innehålla kolumnerna "Från" och "Till". Till exempel grupperas "Vindruvor" med "Russin" om en transformeringstabell finns med kolumnen "Från" som har "Vindruvor" och kolumnen "Till" som har "Russin". Observera att omvandlingen tillämpas på alla förekomster av texten i transformeringstabellen. Med ovanstående transformeringstabell kommer "Druvor är söta" också att grupperas med "Russin är söta".
Exempel 1
Hitta representativa värden för de anställdas plats.
Användning
Table.AddFuzzyClusterColumn(
Table.FromRecords(
{
[EmployeeID = 1, Location = "Seattle"],
[EmployeeID = 2, Location = "seattl"],
[EmployeeID = 3, Location = "Vancouver"],
[EmployeeID = 4, Location = "Seatle"],
[EmployeeID = 5, Location = "vancover"],
[EmployeeID = 6, Location = "Seattle"],
[EmployeeID = 7, Location = "Vancouver"]
},
type table [EmployeeID = nullable number, Location = nullable text]
),
"Location",
"Location_Cleaned",
[IgnoreCase = true, IgnoreSpace = true]
)
utdata
Table.FromRecords(
{
[EmployeeID = 1, Location = "Seattle", Location_Cleaned = "Seattle"],
[EmployeeID = 2, Location = "seattl", Location_Cleaned = "Seattle"],
[EmployeeID = 3, Location = "Vancouver", Location_Cleaned = "Vancouver"],
[EmployeeID = 4, Location = "Seatle", Location_Cleaned = "Seattle"],
[EmployeeID = 5, Location = "vancover", Location_Cleaned = "Vancouver"],
[EmployeeID = 6, Location = "Seattle", Location_Cleaned = "Seattle"],
[EmployeeID = 7, Location = "Vancouver", Location_Cleaned = "Vancouver"]
},
type table [EmployeeID = nullable number, Location = nullable text, Location_Cleaned = nullable text]
)