10 лучших вопросов и ответов для интервью ETL на 2022 год

Демонстрация ваших технических знаний процессов ETL (извлечение, преобразование и загрузка) важна для того, чтобы произвести сильное впечатление во время собеседования на должность в области технологий. Потенциальные работодатели хотят знать, что у вас есть необходимый опыт для разработки схем, процедур и функций базы данных. Перед собеседованием просмотрите описание вакансии, чтобы понять, какие именно навыки работодатель ищет в кандидате. В этой статье мы поделимся некоторыми общими вопросами и ответами на собеседования по ETL, которые помогут вам добиться успеха на следующем собеседовании.

Вопросы для собеседования по тестированию ETL

Чтобы помочь вам подготовиться к следующему собеседованию, мы составили список часто задаваемых вопросов и ответов на собеседовании ETL:

  1. Что такое ЭТЛ?

  2. Какие шаги включает в себя процесс ETL?

  3. Что такое начальная нагрузка и полная нагрузка?

  4. Какие три уровня в ETL?

  5. Что такое снимки и каковы их характеристики?

  6. Какие мнения? Что подразумевается под журналом материализованного представления?

  7. Объясните разницу между неподключенным и подключенным поиском.

  8. Объясните секционирование, хэш-секционирование и циклическое секционирование.

  9. Как анализируются таблицы в ETL?

  10. Как можно настроить сопоставление в ETL?

1. Что такое ETL?

ETL — это тип интеграции данных, который относится к трем этапам, используемым для смешивания данных из нескольких источников. Извлечение, преобразование и загрузка — это три функции базы данных, которые объединены в один инструмент для извлечения данных из одной базы данных и помещения их в другую. На этапе извлечения данные собираются из разных, часто из нескольких источников. На этапе преобразования извлеченные данные преобразуются в форму, в которой они должны быть, чтобы их можно было поместить в другую базу данных. На этапе загрузки данные записываются в новую базу данных.

ETL — это проверенный метод, на который сегодня полагаются многие предприятия и организации, поскольку он может объединять данные транзакций из хранилища, чтобы люди могли просматривать их в формате, который они могут понять и использовать. Он часто используется для консолидации данных о слияниях компаний, а также для сбора и объединения данных от внешних партнеров.

2. Какие этапы включает процесс ETL?

Шаги процесса ETL включают определение источника и цели, создание сопоставления и сеанса, а затем создание рабочего процесса.

3. Что такое начальная загрузка и полная загрузка?

Начальная загрузка относится к процессу заполнения данных в первый раз. При полной загрузке записи загружаются с натяжкой. Все содержимое таблицы удаляется, и таблица перезагружается со свежими данными.

4. Какие три уровня существуют в ETL?

Большинство хранилищ данных представляют собой трехуровневые структуры. Данные попадают на первый уровень, где компилируются данные из внешних источников. Второй уровень — это уровень интеграции, где данные преобразуются в соответствии с потребностями компании. Третий уровень — это уровень измерений, где информация хранится для внутреннего использования.

5. Что такое снимки и каковы их характеристики?

Снимки — это копии данных главной таблицы, доступные только для чтения. Их можно использовать для отслеживания действий, таких как время возникновения события, ключ для идентификации моментального снимка и данные, относящиеся к ключу. Они расположены на удаленных узлах и периодически обновляются, поэтому любые изменения в таблице могут быть записаны.

6. Какие мнения? Что подразумевается под журналом материализованного представления?

Представление — это объект базы данных, являющийся логическим представлением таблицы. Журнал материализованного представления — это предварительно вычисленная таблица с агрегированными данными из таблиц фактов и таблиц измерений.

7. Объясните разницу между неподключенным и подключенным поиском.

При поиске с подключением несколько столбцов могут быть возвращены из одной строки или вставлены в кэш динамического поиска, тогда как поиск без подключения назначает один порт возврата и возвращает один столбец из каждой строки. Подключенный поиск участвует в сопоставлении, тогда как несвязанный поиск используется только тогда, когда функция поиска используется вместо преобразования выражения во время сопоставления.

При подключенном поиске может быть возвращено несколько значений, а при неподключенном поиске возвращается только один выходной порт. Подключенный поиск поддерживает определяемые пользователем значения по умолчанию, а неподключенный поиск — нет. Статический или динамический кеш может использоваться для поиска с подключением, в то время как поиск без подключения может использовать только статический кеш.

8. Объясните секционирование, хэш-секционирование и циклическое секционирование.

Секционирование — это разделение области хранения данных для повышения производительности. Типы разделов: циклический и хэш. При круговом разделении адаптивный сервер назначает строки циклическим способом, поэтому каждый раздел содержит примерно одинаковое количество строк и достигается балансировка нагрузки. При секционировании по хешу для распределения строк по секциям используется хеш-ключ.

9. Как анализируются таблицы в ETL?

Оператор ANALYZE позволяет проверять структуры объектов в системе. Статистические данные, сгенерированные этим оператором, повторно используются оптимизатором на основе затрат, что позволяет вам рассчитать наиболее эффективный план извлечения данных. Другие операции включают COMPUTER, ESTIMATE и DELETE.

10. Как можно точно настроить сопоставление в ETL?

Тонкая настройка отображения включает в себя использование условия для фильтрации в источнике, квалификацию данных без фильтра, использование кэш-памяти и постоянства при поиске t/r, использование агрегации t/r в отсортированной группе i/p по разным портам и увеличение размера кеша и интервала фиксации. Вы также можете использовать операторы в выражениях вместо функций.

Похожие записи

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *