Инструмент, используемый для обработки и преобразования данных в проектах бизнес-аналитики
Что такое Power Query?
Power Query – это инструмент для обработки данных, который обычно используется для анализа данных и бизнес-аналитики. Power Query доступен как в Microsoft Excel, так и в Microsoft Power BI.
Высококачественный анализ основан на хорошо организованных данных, в которых нет ошибок и которые получены из единого достоверного источника. В то время как многие аналитики тратят часы на манипулирование данными, их объединение и поиск, Power Query позволяет автоматизировать все эти этапы с помощью простых, повторяемых действий.
Power Query – один из самых эффективных инструментов, доступных любому аналитику, работающему с данными в Excel. Он не только сэкономит часы работы аналитиков, но и сократит количество ошибок вручную и улучшит возможность получения данных из единого достоверного источника.
Основные моменты
- Power Query – это инструмент преобразования данных, доступный как в Microsoft Excel, так и в Power BI.
- Power Query – это бесценный инструмент для любого аналитика, работающего в Excel, который экономит часы работы пользователей, сокращает количество ошибок вручную и позволяет получать данные из центрального источника достоверности.
- Power Query запоминает шаги пользователя по преобразованию данных, эффективно автоматизируя длительные и выполняемые вручную процессы.
- Наиболее распространенными вариантами использования являются изменение структуры данных, подключение к центральным источникам данных, объединение связанных таблиц или нескольких файлов.
Основные области применения и преимущества Power Query
1. Преобразование данных
Основная цель Power Query – преобразовать данные. Это означает изменение структуры, устранение ошибок и, как правило, повышение удобства анализа данных.
Обычно в Power Query выполняются такие преобразования данных, как:
- Сводка / отмена сводки
- Разделение / слияние столбцов
- Фильтрация данных
- Создание пользовательских столбцов
- Удаление заголовков / пустых строк / строк с ошибками
- Изменение типов данных
- Заполнение значений
Пример: В этом примере пользователь хочет рассчитать ежемесячную производительность каждого магазина. Проблема в том, что данные в его текстовом файле выглядят следующим образом (ниже).
Этот тип данных будет хорошо знаком пользователям Excel, которые знают, как много работы требуется для переформатирования данных в соответствии с их потребностями в анализе.
В верхней части файла есть ненужные строки, столбцы с пустыми значениями, значения, которые нужно заполнить, и даты, которые нужно отменить.
С помощью нескольких простых шагов Power Query позволяет пользователю преобразовать данные в приведенный ниже формат. И что немаловажно, процесс, вероятно, занял около минуты.
2. Повторяемые шаги
Если приведенного выше примера недостаточно, Power Query также запоминает все шаги, которые были предприняты для преобразования данных. Это означает, что при обновлении отчетов или внесении изменений входные данные модели могут быть обновлены за считанные секунды без необходимости повторять весь процесс с нуля.
Пример: На этом изображении мы можем видеть список шагов, которые были применены к набору данных. Каждый раз, когда мы обновляем источник данных, применяются шаги и обновляются выходные данные.
3. Объединение нескольких таблиц
Power Query позволяет нам объединять несколько таблиц связанных данных. Пользователи Excel справились бы с той же задачей, используя формулы поиска. Они были бы ограничены 1 миллионом строк и обнаружили бы, что их модели становятся все более медленными из-за добавления такого количества формул.
Вместо этого Power Query эффективно объединяет таблицы, используя соответствующие столбцы, не требует каких-либо формул и выполняется для всего набора данных за считанные секунды.
Пример: В этом примере у нас есть таблица транзакций в верхней части. Во второй таблице ниже мы приводим некоторую вспомогательную информацию о доставке каждой транзакции.
Всего за пару кликов в Power Query мы можем использовать совпадающие столбцы для объединения двух таблиц и добавления информации о доставке в исходную таблицу.
4. Объединение нескольких файлов.
Power Query включает в себя функциональность, позволяющую легко объединять данные из нескольких похожих файлов.
Пример: Предположим, у нас есть три похожих файла, каждый из которых содержит данные о продажах в наших магазинах за определенный месяц. Для нашей модели требуется один файл со сводным списком транзакций.
С помощью Power Query мы можем легко объединить вышеуказанные файлы в единую таблицу, как показано ниже. Это позволяет аналитикам сэкономить огромное количество времени и снизить риск ошибок вручную.
5. Подключение к центральным источникам данных
Power Query включает в себя множество соединителей, которые позволяют извлекать данные из баз данных SQL, веб-страниц, облачных хранилищ и локальных файлов. Всегда обращаясь к центральным источникам данных, аналитики могут быть уверены, что все они работают на основе единой версии правды.
Используя меню “Получить данные”, можно легко настроить запросы для получения данных из каждого типа источника данных.
Полный список доступных подключателей Power Query Connectors приведен в документации Microsoft Power Query Connectors.
Кому следует использовать Power Query?
1. Аналитикам, работающим в Excel
Любой, кто работает в Excel, значительно улучшит свои навыки работы с данными и манипулирования ими, работая с Power Query. Вместо того, чтобы обновлять модели вручную каждую неделю или месяц, аналитики теперь могут автоматизировать ввод данных и сосредоточиться на своей работе.
2. Аналитики, заинтересованные в бизнес-аналитике
Преобразование данных для проектов является важным этапом в процессе бизнес-аналитики (см. ниже). По этой причине Power Query – отличное место для начала работы для любого аналитика на основе Excel, интересующегося бизнес-аналитикой. Он использует привычную среду Excel, обеспечивает перенос навыков в Power BI и невероятно прост в использовании.
3. Любой, кто работает с данными
Даже если Excel или Power BI не являются вашими основными инструментами BI, Power Query идеально подходит для работы с данными или быстрого объединения файлов для других проектов. Загрузите выходные данные в рабочий лист и используйте его для быстрого создания прототипа BI-проекта с чистыми данными.
Где я могу найти Power Query?
Power Query доступен как в Microsoft Excel, так и в Microsoft Power BI.
Power Query в Excel
Начиная с Excel 2016, Power Query доступен изначально. Если у вас более ранняя версия Excel, возможно, вам придется загрузить ее в качестве надстройки.
В последних версиях Power Query доступен через вкладку “Данные” в Excel и состоит из нескольких кнопок в разделе “Получение и преобразование данных”.
Power Query в Power BI
Power BI – это лидирующий на рынке инструмент Microsoft для создания информационных панелей, который позволяет пользователям импортировать и преобразовывать данные, создавать модель данных и интерактивные информационные панели.
Power BI использует ту же технологию Power Query для выполнения всех необходимых преобразований данных. Доступ к нему можно получить через разделы “Данные” и “Запросы” на вкладке “Главная”.