19-21 сентября 2017 года в Южной Африке прошла очередная Международная конференция по вопросам качества данных IMDQ 2017. Она является традиционным местом встреч для проведения дискуссий по наиболее актуальным темам, связанным с осознанием текущего уровня развития бизнес-сообщества в направлении управления данными и наиболее эффективного их использования, а также с перспективами, которые открываются с новыми подходами и технологиями.
PiLog, являясь одним из лидеров рынка решений для управления данными, высоко ценит возможность встретиться с коллегами из разных стран и обменяться опытом и мнениями, поэтому всегда с удовольствием поддерживает эту конференцию и активно участвует в обсуждениях, представляя также свои доклады.
Данные постепенно превращаются в самостоятельный информационный продукт и требуют такого же продуктового подхода в управлении для того, чтобы стать одним из ключевых активов компании. В рамках рабочих сессий были представлены как мнения научного сообщества по построению и оценке системы управления, так и опыт компаний по практическому применению принципов повышения качества данных в различных отраслях бизнеса.
По оценкам, приведенным компанией Aberdeen Group в исследовании 2015 года, 47% данных рассматриваются компаниями как ненадежные, а 54% аналитических выводов строится на недостаточных данных. Низкое качество данных съедает 20% производительности труда и является причиной провала 40% бизнес-инициатив. Тем не менее, нельзя абстрактно оценивать качество конкретного набора данных - само понятие качества данных не существует в отрыве от тех бизнес-требований, которые должны быть удовлетворены. Профессор John R Talbort из Университета Арканзаса, Little Rock (США) посвятил свое выступление на конференции способам оценки качества данных, принципам, которые должны быть положены в основу системы управления данными, а также обсуждению новой роли, появившейся недавно в компаниях – Chief Data Officer.
«Что посеешь – то и пожнешь» - говорим мы, определяя зависимость конечного результата от исходных данных. В ИТ аналогом этого изречения является принцип GIGO (Garbage in – Garbage out), декларирующий низкое качество результата обработки некачественных данных. Об этом принципе следует помнить, реализуя на практике модную концепцию Data Lake, предполагающую сбор и хранение в едином месте больших массивов данных из различных внешних и внутренних источников для последующего анализа и использования. Профессор John Talbort акцентировал внимание на том, что компаниям необходимо предпринимать специальные усилия для того, чтобы озеро (англ. Lake) данных не превратилось в болото данных. Профессор Ismael Caballero, представляющий Университет Castilla-La Mancha (Испания), продолжил эту тему в своем выступлении, сфокусировавшись на моделях оценки организационной зрелости и качества данных. Такие модели являются необходимым ключом к пониманию способов избежать бессмысленных «болот» данных.
Учитывая, что данные все чаще расцениваются как отдельный ценный актив компании, расходы на создание и поддержание системы управления этим активом закономерно квалифицируются как инвестиции. Большая дискуссия была посвящена тем параметрам, на основании которых можно рассчитать ROI для проектов управления данными.
Внимание к данным растет не только на уровне компаний, но и на государственном уровне. Обсуждались вызовы и возможности, появляющиеся в процессе построения инфраструктуры пространственных данных (SDI) в разных странах мира, а также влияние ограничений, накладываемых законодательством в части защиты личной информации, и последствия ошибок в макроэкономических данных.
Мы считаем, что многие идеи, обсуждавшиеся на конференции, заслуживают широкого внимания специалистов, поэтому собираемся поделиться ими в следующих публикациях, предоставив слово экспертам. Надеемся, что вы сможете почерпнуть для себя новые идеи и применить их на практике.
Если понадобится наша помощь в разработке и качественной реализации проекта, решающего задачи, актуальные именно для вашего бизнеса – приходите в офис PiLog.