Коан 8 Коан о панельных данных

8.1 R

Загрузим необходимые библиотеки.

library(plm) # Работа с панельными данными
library(lmtest) # Оценка регрессий и ковариационных матриц параметров
library(skimr) # Красивый summary
library(car) # Линейные модели
library(gplots) # Графики гетерогенности
library(rio) # Чтение данных
library(tidyverse) # Обработка данных

Загрузим данные и преобразуем нужные переменные в факторные. В данном разделе все визуализации будут построены на подмножестве данных из шести индивидов и нескольких временных точек. Это позволит не перегружать графики. Все модели будут оценены на большом массиве данных.

panel = import('../data/09_small.csv')
panel = mutate(panel, black = factor(black), id = factor(id))

Изобразим наши панельные данные на диаграмме рассеяния. Дополнительно установим параметр сглаживания, чтобы получить кривые временных рядов. Ненежным элементам графика поставим в соответствие значение “FALSE”

ggplot(data = panel, aes(y = lwage, x = year, color = id)) + geom_smooth(aes(group = id), se = FALSE)  +
        geom_point(aes(color = id)) + ylab("Log(wage)") + xlab("Year")

Можно сгруппировать данные по различным признакам. Например, в зависимости от расы индивидов.

ggplot(data = panel) + geom_point(aes(x = year, y = lwage)) + geom_smooth(aes(x = year, y = lwage), se = FALSE) + facet_wrap(~black) + ylab("Log(wage)") + xlab("Year")