Всех поздравляю с наступившим последним месяцем в году
🙂Самое время, чтобы окончательно добить наш файл с 50 вопросами аналитикам с собеседований
🔥 Сегодня нас ждут вопросы 42 - 50.
4️⃣2️⃣ -
5️⃣0️⃣42. С помощью какой функции можно менять типы данных столбцов?В SQL есть весьма популярная функция CAST
A FIREBALL. С помощью нее можно превращать типы данных друг в друга, если такое физически возможно. Как ни старайся,
из букв А.О,П,Ж не сложить слово "вечность" из строки "ABC" не получится сделать integer.
Также в некоторых БД/диалектах работает двойное двоеточие. Например: my_column::date - это приведение столбца my_column к типу данных date.
43. У вас есть колонка с показателем возраста. Как можно создать новый столбец, в котором возраст был бы разбит на интервалы по 20 лет?Вопрос, конечно же, про конструкцию CASE WHEN, с помощью которой любой столбец можно привести к желаемому количеству уникальных значений. В более широком смысле данная операция называется
интервалированием или
бинированием или (реже)
бендированием. Происходят термины, соответственно, от слов
interval,
bin и
band, которые имеют примерно одинаковое значение в этом контексте :)
44. Пусть у нас есть две таблицы — t1 и t2. В обеих есть колонка id. В t1 есть записи с id in (1, 2, 3, 4). В t2 есть записи с id in (1, 1, 2, 5). Сколько строк дадут inner, left, right и full join'ы?И вновь закрепим джойны))
INNER JOIN даст нам три строки
LEFT JOIN даст пять строк
RIGHT JOIN даст четыре строки
FULL JOIN даст шесть строк
CROSS JOIN даст 16 строк
45. Встречались ли вы когда-нибудь с CROSS JOIN? Что он делает?CROSS JOIN - это SQL-аналог Декартова произведения. То есть при cross join двух таблиц по 10 строк в каждой мы получим 100 строк, так как к каждой строке таблицы-1 "приделаем" всю таблицу-2.
Любой джойн в своей основе имеет именно cross join, и уже после операции декартова произведения происходит проверка и сопоставление ключей.
46. В чём разница между UNION и UNION ALL?Оба оператора отвечают за вертикальное соединение таблиц.
UNION (в отличие от UNION ALL) удаляет все дубликаты в таблицах. Притом удаляются как дубликаты родом из разных таблиц, так и родом из одной таблицы.
47. Что такое квантиль?Квантиль - это пороговое значение, которое не превышается с некоторой вероятностью.
Более простыми словами, квантиль (или
персентиль) - это то значение выборки, которое делит отранжированную выборку в определённом соотношении.
Например,
медиана - это квантиль уровня 0.5. Половина значений выборки меньше, чем медиана. а половина - выше.
Квартили ("четвертинки") бывают:
- первым (квантиль уровня 0.25, такой что четверть наблюдений меньше него, а три четверти - выше).
- вторым, он же медиана
- третьим (квантиль уровня 0.75, такой что три четверти наблюдений меньше него, а четверть - выше).
Бывают также децили, т.е. десятые части, которые режут выборку в соотношениях 10 на 90, 20 на 80, 30 на 70 и тд
48. Что такое стандартное отклонение?
Стандартное отклонение - это "мера разброса" распределения, которая представляет из себя корень из дисперсии.
Стандартное отклонение часто используется в статистике и даже чаще чем дисперсия, так как, в отличие от дисперсии, стандартное отклонение
это сигма-самец измеряется в тех же единицах измерения, что и сама случайная величина.
49. Что такое мода?Тут всё очень просто)) Мода - это
стиль всего лишь самое частое значение в выборке)
50. В чём разница между LTR и LTV?Разница между ними ровно такая же, как между выручкой и прибылью.
LTR (Lifetime Revenue) - это суммарная выручка, которую мы получим с клиента за всё время его "
продуктовой жизни". Мы не учитываем в данном случае, сколько денег мы затратили на
привлечение или
содержание клиента.
LTV (Lifetime Value) эти косты учитывает и именно поэтому чаще всего является одной из
north-star метрик продуктовых команд и компаний.
А какие еще вопросы с собеседований вы бы хотели разобрать?
🤓#аналитика #тестовое #hh