Процесс сбора данных из различных источников и управления ими для получения ценной бизнес-информации
Хранилище данных можно определить как процесс сбора и хранения данных из различных источников и управления ими для получения ценной бизнес-информации. Его также можно назвать электронным хранилищем, в котором предприятия хранят большое количество данных и информации. Это важнейший компонент системы бизнес-аналитики, который включает в себя методы анализа данных.
Хранилище данных – это совокупность технологий и компонентов, которые позволяют стратегически использовать данные. Это электронный сбор организацией значительного объема информации, предназначенный скорее для запросов и анализа, чем для обработки транзакций. Хранение данных – это метод преобразования данных в информацию и своевременного предоставления их потребителям, позволяющий изменить ситуацию к лучшему.
Анализ данных используется для получения более подробной информации о деятельности организации путем сравнения комбинированных данных из различных разнородных источников данных. Хранилище данных выполняет запросы и анализ исторических данных, полученных из транзакционных ресурсов.
Идея создания хранилищ данных была разработана в 1980-х годах, чтобы помочь оценить данные, хранящиеся в нереляционных системах баз данных. Это было разработано для того, чтобы дать компаниям возможность использовать свои архивные данные для достижения корпоративных преимуществ. Огромный объем данных в центрах обработки данных поступает из различных областей, таких как коммуникации, продажи и финансы, клиентские приложения и внешние партнерские сети.
Любые данные, которые помещаются в хранилище, не изменяются и не могут быть изменены, поскольку хранилище данных анализирует инциденты, которые произошли ранее, концентрируясь на изменениях данных с течением времени. Хранение данных должно быть организовано таким образом, чтобы хранящиеся данные оставались безопасными, надежными, их можно было легко извлекать и управлять ими.
В процессе создания хранилища данных задействованы следующие этапы:
Успешное внедрение хранилища данных может принести организации следующие преимущества:
Высокая окупаемость инвестиций для компаний, успешно внедривших хранилище данных, свидетельствует об огромном конкурентном преимуществе, которое дает эта технология. Конкурентное преимущество достигается за счет предоставления лицам, принимающим решения, доступа к данным, которые могут содержать ранее недоступную и неиспользованную информацию о клиентах, спросах и тенденциях.
Хранилище данных повышает эффективность принятия бизнес-решений, предоставляя взаимосвязанный архив последовательных, объективных и исторических данных. Хранилище данных помогает объединить данные из различных конфликтующих структур в форму, которая дает более четкое представление о предприятии. Преобразуя данные в полезную информацию, хранилища данных помогают менеджерам рынка проводить более практичный, точный и надежный анализ.
Хранилища данных хранят все данные в одном месте и не требуют большой ИТ-поддержки. Потребность в информации за пределами отрасли, которая является дорогостоящей и сложной для интеграции, снижается.
С хранилищами данных могут быть связаны следующие проблемы:
Часто мы не можем оценить время, необходимое для извлечения, очистки и загрузки данных в хранилище. На это может уйти значительная часть общего производственного времени, хотя существуют определенные ресурсы, позволяющие свести к минимуму время и усилия, затрачиваемые на этот процесс.
Скрытые проблемы, связанные с сетями-источниками, которые обеспечивают хранилище данных, могут быть обнаружены после нескольких лет отсутствия информации. Например, при вводе новой информации о собственности в некоторые поля могут быть введены пустые значения, что может привести к тому, что персонал введет неполные данные о собственности, даже если они были доступны и актуальны.
При создании хранилищ данных также используются аналогичные форматы данных в разных источниках данных. Это может привести к потере некоторых ценных частей данных.