Случайные заметки

Быстрый случайный лес

Вышел пакет ranger для R. Растит случайный лес. Оказывается таких пакетов куча, но ranger — самый шустрый :) Read more

Пародокс Штейна с доказательствами

Ryan Tibshirani, Larry Wasserman, Пародокс Штейна с доказательствами :) Read more

Информация в статистике

Небольшой аккуратный текст про энтропию и Кульбака-Лейблера. Текст про энтропию с кучей картинок и перевод на русский. Mutual information. Read more

Импорт экселевского файла в gretl

Есть gretl — чудесный бесплатный открытый пакет для эконометрики! Уже два человека меня спрашивали, как импортировать панельные данные в gretl из экселя :) Шаг 1. Убираем всякий мусор с экселевского листа. Никаких графиков, никаких выделений шрифтом/цветом. Только данные. Шаг 2. Размещаем названия переменных в первой строке. Каждую переменную ... Read more

Снижение размерности с tsne

Два зверя: линейный PCA и нелинейный t-SNE. Игрушечные примеры для t-SNE. Пакет Rtsne. Ещё один пример, t-SNE + word2vec. Read more