Заранее приношу извинения за опечатки, пунктуацию и некоторые грамматически ошибки – мне было не до этого по ходу мероприятия (во время конспектирования)..
Я снова тут, вчера, кстати, Максом Цепков выложил обзор первго дня (вечером).
Идет теория про хранилища данных (я заслушался, даже сюда не записывал). Хранилие надо чтоб быстро строить отчеты и не джоинить данные до сумасшествия. Позволяют быстрее реагироватьи гибче отвечать на изменения (короче консолидация данных).
Вутренние причины для внедрения – системы содержат часть инфы, и не могут содержать всё и вся.
Копятся данные – можно строить прогнозы и проч (то есть копим историю).
Дефекты хранилищ – плохое качество данные.
Витрины даных – хранят уже подготовленные данные.
Решения – по команде, кто имеет доступ (консультантов могут нанять). Лучше всего – запустить пилотный проект. Администраторов лучше определить в начале.
Разрабатывам – сверху вниз (от требовани) и снизу вверх (от данных).
Тестовая стратегия – из стратеги тестирования кадого компонента. Отсюда идут требования к тестированию и ресурсы (вкл железки и тп).
Этапы – анализ требований, проектирование, загрузка ифы и тд. Главное – что по итогам надо тестировать.
Тестировать уже можно н а этапе проектирования.
Источнки гетерогенны и нужно учесть, как мы из будем собирать. Это ETL.
Этап первоначальной загрузки – заполняем хранилищ данных. Процесс итеративный и может занимать несколько лет.
Вообще если посмотреть его слайды, то мою писанину можно не читать. Доклад отличный, буду только слушать.