Поділитися через


Перетворення й зіставлення даних

Після того, як ви виберете потрібний джерело даних, ви перейдете до редактора Power Query . Редактор запитів є потужним інструментом для перетворення даних. Щоб дізнатися більше, перейдіть до розділу Інтерфейс Power Query користувача.

Нижче наведено кілька причин, чому може знадобитися трансформувати дані.

  • Можливо, вас не цікавлять усі назви активностей, які реєструються, тому ви хочете відфільтрувати конкретні назви активностей, важливі для процесу, який ви намагаєтеся майнити.

  • Можливо, ви захочете перейменувати деякі назви вправ, щоб вони були більш описовими та зрозумілими. Це часто не стосується імен у базі даних.

  • Вас може зацікавити лише певний діапазон дат, а не вся історія даних.

  • Можливо, ви захочете об’єднати кілька стовпців ідентифікатора з ідентифікатором звернення. Це часто робиться, коли ідентифікатора, який ви хочете використовувати для майнінгу процесів, не існує або є комбінацією кількох ідентифікаторів у програмі. Наприклад, коли клієнт подає заявку в службу підтримки, запит на підтримку може бути призначено кільком агентам служба підтримки клієнтів. Якщо ви хочете проаналізувати, як кожен агент обробляє кожну заявку, вам слід об’єднати ідентифікатор агента та ідентифікатор квитка в ідентифікатор звернення.

Фільтрування назв дій

  1. Виберіть каретку поруч зі стовпцем назви вправи, щоб відкрити меню сортування та фільтрування.

  2. Якщо з’явилося повідомлення Список може бути неповним, виберіть Завантажити більше.

  3. Виберіть лише ті назви дій, які потрібно проаналізувати. Зніміть прапорці з будь-якого імені, яке потрібно виключити.

    Скріншот фільтрації назв активностей.

  4. Крім того, ви можете скористатися меню Текстовий фільтр для більш розширеної фільтрації. Щоб дізнатися більше про фільтрування за значенням, перейдіть до розділу Фільтрування за значеннями у стовпці.

Перейменування вправ

  1. Переконайтеся, що вибрано стовпець «Назва діяльності».
  2. Над панеллю інструментів виберіть вкладку Трансформувати .
  3. На панелі інструментів виберіть Замінити значення.
  4. У розділі Значення, які потрібно знайти, введіть назву вправи, яка відображається в джерело даних, який потрібно замінити.
  5. У полі Замінити на введіть назву діяльності, яку потрібно відобразити на карті процесу.
  6. Повторіть цей процес для всіх значень, які потрібно замінити.

Зменшення загальної кількості записів

Однією зі стратегій зменшення загальної кількості записів є використання лише останніх записів. Для цього потрібно попередньо відсортувати дані за часом.

  1. Відкрийте меню сортування та фільтрування, вибравши каретку поруч зі стовпцем startTimestamp .

    Скріншот зменшення загальної кількості записів.

  2. Щоб найновіші записи відображалися першими, виберіть пункт Сортувати за спаданням.

  3. Натисніть кнопку OK, а потім виберіть пункт Зберігати рядки на панелі інструментів.

  4. Введіть 150000 у полі Кількість рядків.

  5. Натисніть кнопку OK , щоб відфільтрувати перші 150 000 рядків.

Об’єднання кількох ідентифікаторів

За допомогою клацання + клавішею Ctrl можна вибрати кілька стовпчиків, які потрібно об’єднати.

  1. На панелі інструментів вкладки Трансформування виберіть пункт Об’єднати стовпці.
  2. (Необов’язково.) Виберіть роздільник зі спадного списку. Крім того, ви можете вибрати жодного.
  3. Змініть ім’я (або запишіть згенероване ім’я за замовчуванням), щоб його можна було вибрати під час зіставлення з ідентифікатором інциденту.

Зіставлення даних

Зіставлення повідомляє можливості майнінгу процесу, який стовпець зіставлено з яким типом атрибута (наприклад, ідентифікатором інциденту, назвою діяльності або позначкою часу).

  1. Щоб перейти на екран «Карта», натисніть кнопку Далі.
  2. Скористайтеся спадними меню поруч із відповідними стовпцями, щоб вибрати тип атрибута. Щоб дізнатися більше, перейдіть до опису типів атрибутів.
  3. Якщо дані передаються з Azure Data Lake Gen2 у форматі файлу CSV, ви можете скористатися розкривними меню в стовпці Тип даних, щоб змінити типи даних для імпорту. Для стовпців, які мають числові значення, розгляньте їх аналітичне використання атрибута щодо того, чи є атрибут безперервним значенням (наприклад, сума рахунка-фактури, установлена в число) або категоріальним значенням (наприклад, кодом матеріалу, встановленим у значення Текст).
  4. Ідентифікатор інциденту, Активність і Позначка часу початку є обов’язковими атрибутами для продовження аналізу.
  5. Щоб розпочати аналіз процесу, виберіть Зберегти та проаналізувати.