КУРС

DATA SCIENCE ACADEMY

Научитесь использовать инструменты анализа данных, включая языки программирования и средства визуализации.

Функция “query” (запрос) относится к программированию и БД. Чаще всего она подходит для отправки запросов к БД с целью извлечения, обновления, удаления или вставки информации. При этом возможно применение опции в Google-таблицах, Python и даже Excel. Ниже подробно рассмотрим, в чем особенности применения для каждого из вариантов, и о каких особенностях важно знать.

Функция query в Гугл-таблицах

Последнее время набирает популярности функция query в Гугл Таблицах. Здесь она представляет собой полезного помощника для извлечения табличных сведений с применением структурированного языка запросов, подобного SQL. Опция позволяет фильтровать, сортировать, объединять и агрегировать сведения в таблице для получения интересующих сведений.

Синтаксис опции имеет такой вид — «=QUERY(диапазон_данных, “запрос”, [число_заголовков])», где

  • диапазон_данных — ячейки «от и до», из которых требуется извлечь информацию;
  • “запрос” — строчка, содержащая команду на языке запросов, определяющим список данных для обработки;
  • [число_заголовков] — альтернативная составляющая, показывающая, сколько строчек в начале диапазона относится к категории заголовков.

Примеров применения query в Гугл Таблицах много, благодаря большой функциональности инструмента:

  1. Фильтрация информации. Использование условий WHERE для отбора строк, удовлетворяющих определенному правилу. Пример: “SELECT * WHERE B > 20” выберет строчки, где параметр в B-столбце больше 20.
  2. Сортировка данных. Оператор ORDER BY сортирует сведения по одному или нескольким столбцам. К примеру, “SELECT * ORDER BY B DESC” выполняет работу в отношении B-столбца.
  3. Выбор определенных методов. Применение “SELECT D, E, F” обеспечивает поиск только упомянутых в перечне строк.
  4. Соединение таблиц. Применение JOIN для объединения табличных данных на базе идентичных значений столбцов. Пример: “SELECT * FROM таблица2 JOIN таблица3 ON таблица2.столбец = таблица3.столбец” объединяет таблицу2 и таблицу3 по одинаковым параметрам.
  5. Агрегация информации. Предусматривает применение COUNT, SUM, AVG, MAX, MIN и иных инструментов для расчета суммы, среднего параметра, числа или иных агрегированных показателей для конкретных строчек.

Функция query в excel

Одним из мощных инструментов считается функция Power Query в Excel. Применяется для импорта, преобразования и комбинирования информации из разных источников. Позволяет выполнять широкий спектр операций для подготовки информации перед анализом и отчетностью.

С помощью Power Query в Excel доступны следующие опции в отношении данных:

  1. Импорт из разных источников из файлов Excel, БД, txt-файлов, CSV-файлов, интернет-сервисов, папок с документами и иных.
  2. Преобразование типов данных, объединение таблиц, фильтрация и сортировка, разделение или объединение столбцов, удаление дубликатов, внесение пропущенных сведений и т. д.
  3. Очистка информации от нежелательных параметров, удаление строк или столбцов с неправильными данными или пустыми значениями, обработка текстовых сведений и исправление иных проблем.
  4. Комбинация. Объединение данных из разных источников или таблиц в одну. Благодаря созданию функции Power query, поддерживаются операции соединения, слияния и объединения с помощью различных вариантов: по столбцу, ключу и других.
  5. Трансформации и расчеты для создания новых столбцов, расчета значений, применения условных операций и иных вычислений на основе информации.
  6. Обновление. Сохранение и настройка операции преобразования, которые можно повторно применять к информации при обновлении. Это дает возможность автоматизировать процесс.

КУРС

DATA SCIENCE ACADEMY

Научитесь использовать инструменты анализа данных, включая языки программирования и средства визуализации.

Функция query в Python

Опция query в Python не является встроенной. Но есть ряд библиотек и модулей, которые позволяют выполнять запросы и манипулировать с информацией:

  • SQLAlchemy. Мощная ORM-библиотека, представляющая абстракцию над БД и разрешающая исполнять запросы с использованием SQL-подобного выражения. Поддерживает различные БД, включая SQLite, MySQL и иных.
  • Psycopg2. Модуль для взаимодействия с БД PostgreSQL. Позволяет устанавливать соединение с БД, выполнять запросы на языке SQL, получать результаты и манипулировать сведениями.
  • Sqlite3. Встроенный инструмент Питон, предлагающий доступный метод взаимодействия с БД SQLite. Ориентирован на исполнение SQL-запросов, умеет делать, изменять и удалять таблицы, а также работать с информацией.
  • MySQL Connector. Инструмент для работы с БД MySQL. Предоставляет API для установки соединения с БД MySQL, исполнения SQL-запросов и манипуляции информацией.
  • Pandas. Библиотека для анализа сведений в Python. Предоставляет функциональность для исполнения запросов к сведениям в виде таблицы, включая фильтрацию, сортировку, группировку, объединение и т. д.

Аналог функции query в Excel

Специалисты по работе с приложением знают, что аналогом функции “QUERY” в Excel считается “Сводная таблица” (PivotTable). Она позволяет анализировать и сводить сведения из исходного диапазона в удобной и структурированной форме.

Доступные возможности:

  1. Выполнение различных агрегирующих операций: сумма, среднее, MAX, MIN, подсчет числа и другие для цифровых значений в исходном диапазоне данных.
  2. Группировка по определенным столбцам, чтобы создать иерархическую структуру и анализировать сведения на разных уровнях агрегации.
  3. Фильтрация, чтобы анализировать интересующие значения или исключить нежелательные параметры.
  4. Разработка сводных таблиц, которые позволяют объединять данные по нескольким измерениям и агрегировать параметры на пересечении измерений.
  5. Добавление итогов для строк, столбцов и иных измерений, чтобы увидеть общие параметры и суммы.
  6. Применение условного форматирования для видимого отображения сведений с учетом конкретных условий и критериев.

“Сводная таблица” — мощный инструмент для анализа данных в Excel. Позволяет быстро суммировать, фильтровать и организовывать информацию, чтобы увидеть связи и тренды.

Как создать настраиваемые функции в power query

В интернете активно ведутся дискуссии, как создать настраиваемые функции в Power Query. Для этого рекомендуется применять следующие инструменты:

  1. Параметризированные запросы. Сделайте новый запрос, который становится базой для настраиваемой функции. Далее внедрите параметры, указав их в формате “@имя_параметра”. Внесите данные в раздел “Параметры” в редакторе Power Query и укажите значения. На завершающем шаге применяйте параметр к запросу с помощью Expression.Evaluate. Такой запрос легко сохранить в виде функции и повторно применять с разными данными.
  2. Функции-обработчики. При использовании опции создайте новую функцию-обработчик с применением let и определите его внутри запроса. Введите аргументы функции в скобках и определите логику обработки данных в опции. Верните результаты с применением ключевого слова in. Далее вызовите функцию, передав ей требуемые аргументы и получив результаты.

Как видно, опция Query может использоваться в разных сферах, не только для создания кода. Главное — разобраться в технологии применения, особенностях взаимодействия и возможностях программного инструмента.

КУРС

DATA SCIENCE ACADEMY

Научитесь использовать инструменты анализа данных, включая языки программирования и средства визуализации.