Megosztás a következőn keresztül:


Fuzzy merge

A fuzzy merge egy intelligens adat-előkészítési funkció, a segítségével intelligens egyező algoritmusokat alkalmazhat az oszlopok összehasonlítása során. Ezek az algoritmusok megpróbálnak egyezéseket találni az egyesítendő táblák között.

Az Egyesítés párbeszédpanel alján lévő homályos egyezés engedélyezéséhez válassza a "Fuzzy egyeztetés használata" gombot az egyesítési beállítás gombra kattintva. További információ: Egyesítési műveletek áttekintése

Feljegyzés

A homályos egyeztetés csak szövegoszlopokon végzett egyesítési műveletek esetén támogatott. A Power Query a Jaccard-hasonlósági algoritmust használja a példánypárok közötti hasonlóság mérésére.

Mintaforgatókönyv

A homályos egyezés gyakori használati esete a szabadkérelmű szövegmezők, például egy felmérés. Ebben a cikkben a mintatáblát közvetlenül egy, egy csoportnak küldött online felmérésből vettünk, amely csak egy kérdést tartalmaz: Mi a kedvenc gyümölcse?

A felmérés eredményei az alábbi képen láthatók.

Minta felmérés nyers bejegyzésekkel.

Képernyőkép az oszlopeloszlási gráfot tartalmazó minta felmérési kimeneti tábláról, amelyen kilenc különböző válasz látható, az összes válasz egyedi, a felmérésre adott válaszok pedig az összes elírással, többes számmal vagy szingularissal és esetproblémákkal.

A kilenc rekord a felmérési beküldéseket tükrözi. A felmérés beküldésével az a probléma, hogy vannak elírások, néhány többes szám, néhány egyedi, néhány nagybetűs, néhány pedig kisbetűs.

Ezeknek az értékeknek a szabványosításához ebben a példában egy Fruit-referenciatáblázatot láthat.

Gyümölcs referenciatábla.

Képernyőkép a Gyümölcs referenciatábláról, amely oszlopeloszlási grafikont tartalmaz, amelyen négy különböző gyümölcs látható, amelyek mindegyike egyedi, és a gyümölcsök listája: alma, ananász, görögdinnye és banán.

Feljegyzés

Az egyszerűség kedvéért ez a Gyümölcs referenciatábla csak az ehhez a forgatókönyvhöz szükséges gyümölcsök nevét tartalmazza. A referenciatáblának annyi sora lehet, amennyit csak szeretne.

A cél egy olyan táblázat létrehozása, mint a következő, ahol szabványosította ezeket az értékeket, hogy több elemzést végezhessenek.

Minta felmérés kimeneti táblája.

Képernyőkép a minta felmérés kimeneti tábláról az oszlopeloszlási gráfot tartalmazó Kérdés oszlopmal. A gráf kilenc különböző választ jelenít meg, amelyek mindegyike egyedi választ ad. A felmérésre adott válaszok tartalmazzák az összes elírást, többes vagy egyes számokat, valamint a kis- és nagybetűk problémáit. A kimeneti tábla a Fruit oszlopot is tartalmazza. Ez az oszlop az oszlopeloszlási gráfot tartalmazza, amely négy különböző választ és egy egyedi választ tartalmaz. Azt is felsorolja az összes gyümölcsöt megfelelően írt, egyedi, és a megfelelő esetben.

Fuzzy merge művelet

A homályos egyesítéshez először egyesítést kell végrehajtania. Ebben az esetben egy bal oldali külső illesztést használ, ahol a bal oldali tábla a felmérésből származó, a jobb oldali táblázat pedig a Fruit referenciatábla. A párbeszédpanel alján jelölje be az Összefésülés használata jelölőnégyzetet az egyesítés végrehajtásához.

Képernyőkép az Egyesítés párbeszédpanelről, amely bemutatja, hogyan használható a homályos egyeztetés az egyesítési beállítás végrehajtásához.

Az OK gomb kiválasztása után egy új oszlop jelenik meg a táblában az egyesítési művelet miatt. Ha kibontja, van egy sor, amely nem tartalmaz értékeket. Pontosan ezt mondta az előző képen látható párbeszédpanel-üzenet, amikor a következőt mondta: "A kijelölés az első táblázat 9 sorából 8-nak felel meg".

Homályos találatok a Fruit oszlopban.

Képernyőkép a Felmérés táblához hozzáadott gyümölcsoszlopról. A Kérdés oszlop összes sora ki van bontva, kivéve a 9. sort, amely nem bontható ki, és a Fruit oszlop null értéket tartalmaz.

Fuzzy keresés beállításai

Módosíthatja a Fuzzy egyeztetési beállításait , hogy módosítsa a hozzávetőleges egyezést. Először válassza a Lekérdezések egyesítése parancsot, majd az Egyesítés párbeszédpanelen bontsa ki az Fuzzy matching options (Fuzzy matching) lehetőségeket.

Képernyőkép az Egyesítés párbeszédpanelről, amelyen megjelennek a homályos egyeztetési lehetőségek.

Az elérhető lehetőségek:

  • Hasonlósági küszöbérték (nem kötelező):0,00 és 1,00 közötti érték, amely lehetővé teszi egy adott hasonlósági pontszám feletti rekordok egyeztetését. Az 1,00-as küszöbérték megegyezik a pontos egyezés feltételeinek megadásával. A Szőlő például csak akkor egyezik a Graes-lel (hiányzik a p betű), ha a küszöbérték 0,90-nél kisebb. Alapértelmezés szerint ez az érték 0,80.
  • Kis- és nagybetűk figyelmen kívül hagyása: Lehetővé teszi az egyező rekordok használatát a szövegtől függetlenül.
  • Egyezés szövegrészek kombinálásával: Lehetővé teszi a szövegrészek egyezések keresését. Ha ez a beállítás engedélyezve van, a Micro soft például megfelel a Microsoftnak .
  • Hasonlósági pontszámok megjelenítése: A bemenet és a megfeleltetett értékek közötti hasonlósági pontszámokat jeleníti meg a homályos egyeztetés után.
  • Egyezések száma (nem kötelező):: Az egyes bemeneti sorokhoz visszaadható egyező sorok maximális számát adja meg.
  • Transzformációs tábla (nem kötelező):Lehetővé teszi a rekordok egyéni értékleképezéseken alapuló egyeztetését. Például a Szőlő és a Mazsola megfeleltethető, ha egy transzformációs táblázat van megadva, ahol a Feladó oszlop szőlőt, a To oszlop pedig Mazsolát tartalmaz.

Transzformációs táblázat

A cikkben szereplő példában egy transzformációs táblával leképezheti a hiányzó párokat tartalmazó értéket. Ez az érték apls, amelyet le kell képezni az Apple-re. Az átalakítási táblázat két oszlopból áll:

  • A Forrás a megkeresendő értékeket tartalmazza.
  • Azokat az értékeket tartalmazza, amelyek a Forrás oszlop használatával a talált értékek helyére kerülnek.

Ebben a cikkben az átalakítási táblázat a következőképpen néz ki:

Forrás Művelet
apls Apple

Visszaléphet az Egyesítés párbeszédpanelre, és az Egyezések száma területen az Fuzzy matching options (Egyezések száma) mezőben adja meg az 1 értéket. Engedélyezze a Hasonlósági pontszámok megjelenítése lehetőséget, majd az Átalakítás tábla alatt válassza a Táblázat átalakítása lehetőséget a legördülő menüben.

Képernyőkép az Egyesítés párbeszédpanelről, amelyen az egyezések száma 1, az Átalakítás tábla pedig Az átalakítás tábla van beállítva.

Az OK gombot választva továbbléphet az egyesítési lépésre. Ha táblaértékekkel bontja ki az oszlopot, a Gyümölcs mező mellett a Hasonlóság pontszám mező is megjelenik. Jelölje ki mindkettőt, és bontsa ki őket előtag hozzáadása nélkül.

Képernyőkép a kijelölt Gyümölcs és hasonlóság pontszámmezőket tartalmazó Gyümölcs oszlop kibontó párbeszédpaneléről.

A két mező kibontása után a rendszer hozzáadja őket a táblához. Figyelje meg az egyes értékek hasonlósági pontszámaihoz kapott értékeket. Ezek a pontszámok segíthetnek a további átalakításokban, ha szükséges, annak meghatározásához, hogy csökkentenie kell-e a hasonlósági küszöbértéket, vagy növelnie kell-e a hasonlósági küszöbértéket.

Képernyőkép a tábla kimenetéről, miután a homályos egyesítési folyamat megtörtént, és megjeleníti az egyes értékek új Gyümölcs és Hasonlóság pontszámmezőit.

Ebben a példában a Hasonlóság pontszám csak további információként szolgál, és nem szükséges a lekérdezés kimenetében, így eltávolíthatja. Figyelje meg, hogy a példa kilenc különböző értékkel indult, de a homályos egyesítés után csak négy különböző érték van.

Fuzzy merge survey output table.

Képernyőkép a felmérés eredménytáblájának homályos egyesítéséről, az oszlopeloszlási gráfot tartalmazó Kérdés oszlopgal, amelyen kilenc különböző válasz látható egyedi válaszokkal, valamint a felmérésre adott válaszok az összes elírással, többes számmal vagy egyesével, valamint esetproblémákkal. Emellett tartalmazza a Fruit oszlopot az oszlopeloszlási gráfpal, amely négy különböző választ jelenít meg egyetlen egyedi válaszsal, és felsorolja az összes gyümölcsöt megfelelően megírva, egyesével és megfelelő esettel.

Az átalakítási táblák működéséről az Átalakítás tábla parancsai című témakörben talál további információt.