Розеттский камень
2020-01-25
Коан 1 Приветственный коан
В этом коане мы рассмотрим установку и настройку R, Python и Stata.
1.1 Язык программирования R
R — это открытая среда программирования, помогающая в работе со статистическими данными. Для программирования на R подойдет программа RStudio.
Рассмотрим установку RStudio на Mac OS и Windows.
1.1.1 Инструкция по установке RStudio для Windows / Mac OS:
- Загрузите и установите язык программирования R с официального сайта.
Версия для Windows: Выберите “Download R for Windows” ▶ “base” ▶ “Download R 3.x.x for Windows”.
Версия для Mac OS: Выберите “Download R for (Mac) OS X” ▶ “Latest Release” ▶ “R 3.x.x”.
- Загрузите программу RStudio с официального сайта разработчика (выберите подходящую версию из предложенных опций). Возможностей бесплатной версии будет вполне достаточно для работы.

Страница загрузки
1.1.2 Начало работы

Интерфейс программы
New file - Создание нового файла.
New project - Создание нового проекта.
Open file - Открытие существующего файла.
Console - Консоль, в которой набирается код.
Files - Список файлов, доступных для работы.
Packages - Список установленных пакетов, т.е. расширений. Также можно ознакомиться с ним, введя в консоль команду
installed.packages()
.Viewer - Отображение введенного кода.
1.1.3 Настройка программы1
Запустите RStudio. В разделе Tools — Global Options — Sweave — “Weave .Rnw files using” выберите knitr.
Перед началом работы рекомендуется также установить ряд пакетов, то есть расширений, которые помогут при работе с данными.
Для этого необходимо ввести в командную строку следующую команду:
install.packages(c("vcd", "ggplot2", "knitr", "xtable", "texreg", "lmtest", "sandwich", "erer", "dplyr", "readxl", "reshape2", "RCurl", "RSelenium","XML", "jsonlite", "quantmod", "lubridate", "stringr", "tidyr"))
После выполнения команды все рекомендованные для использования пакеты установятся автоматически.
При работе на Windows для установки пакетов может потребоваться запуск Rstudio от имени администратора (для этого необходимо кликнуть правой кнопкой мыши, выбрать “Запуск от имени администратора”).
Установили? Отлично. Всё готово для использования RStudio на вашем компьютере.
cat("Рабочая папка:", getwd(), "\n")
<U+0420><U+0430><U+0431><U+043E><U+0447><U+0430><U+044F> <U+043F><U+0430><U+043F><U+043A><U+0430>: C:/Users/The_sun/Desktop/Current_projects/Rosetta_demeshev/01
1.2 Язык программирования Python
Python — это открытая среда программирования, помогающая в работе со статистическими данными. Для программирования на Python подойдет программа Jupyter Notebook.
1.2.1 Установка
Загрузите и установите Anaconda с официального сайта.
После загрузки и установки откройте Anaconda Navigator, через который Вы сможете открыть программу Jupyter Notebook.

Интерфейс Anaconda Navigator
1.2.2 Начало работы
Открыв Jupyter Notebook, вы попадете на страницу, содержащую ваши сохраненные файлы. Чтобы создать новый файл, нажмите “New” ▶ “Notebook: Python 3”.

Новый файл
Затем, в открывшемся окне, появится новый файл. Теперь все готово к работе. Вы можете вводить свой код и затем, используя комбинацию клавиш <Shift>
+ <Enter>
, проверять его исполнение.

Ввод кода
1.3 Программа STATA
Stata, в отличие от R и Python, является программой, а не языком программирования. Она также помогает в работе со статистическими данными.
1.3.1 Установка:
Для установки Stata необходимо загрузить актуальную версию с сайта компании-разработчика. Подойдут как Stata SE, так и Stata MP.
1.3.2 Начало работы:

Интерфейс Stata
- Open File - открыть файл.
- Save - сохранить файл.
- Data Editor - редактирование данных.
- Data Browser - просмотр данных.
- Variables - список переменных.
- Command - командная строка, в которой вводится код.