Коан 10 Коан о методе главных компонент

Метод главных компонент позволяет снизить размерность данных за счет замены исходных переменных на меньшее количество новых переменных. Новые, искусственно созданные, переменные называются главными компонентами.

Реализация метода главных компонент “вручную” включает в себя следующие элементы:

  1. Центрирование исходных данных
  2. Вычисление собственных значений матрицы \(X^TX\)
  3. Расчет доли дисперсии, объясняемой найденными компонентами
  4. Выбор числа главных компонент

Однако прогресс не стоит на месте, и получение главных компонент теперь осуществляется быстрее и проще (а главное совершенно бесплатно и без регистрации). Рассмотрим, как проделать это на r, python и в stata.