Цукалос, М. R: приступим [Текст] : [введение в язык программирования R и применение версии R командной строки для обработки и визуализации данных мониторинга системы] : [руководство] / Михалис Цукалос [Mihalis Tsoukalos] // Linux Format. — 2015. — №2 (193), февр.. — С. 92-95. — (Академия кодинга) (Программирование на R). — Прил.: "Скорая помощь. Азбука теории вероятности: бросая шестигранную игральную кость, вы угадываете правильное число с вероятностью 1/6. При двух бросаниях вероятность отгадки сократится до (1/6)*(1/6), то есть 1/36.". — С. 92 ; "Определения статистики" : [краткое толкование определений Min, Median, 1stQu, Mean, 3rdQu, Max для понимания результатов команды summery()] ; "Скорая помощь. В развитие Азбуки теории вероятности…: при одновременном бросании двух костей вероятность угадать оба числа будет другой, поскольку не надо угадывать порядок появления значений". — С. 93 ; "Теплокарта — хороший и визуально эффективный способ представления данных. Теплокарты отлично подходят для анализа данных мониторинга по латентности и загрузке" [Изображение] : [цвет. рис.] ; "Скорая помощь. Статистика способна ввести в заблуждение. Если человека сбила машина, за последние три часа двигавшаяся со средней скоростью 5 км/ч, то какая скорость была у машины в момент столкновения? Ответ: 100 км/ч. Никогда не путайте среднее и максимальное значения.". — С. 94 ; "Попытки взлома WordPress!" [Изображение] : [гистограмма хакерских атак на сайт WordPress, созданная автоматически из лог-файла с помощью R]. — С. 95.
Аннотация
R — краткая характеристика языка, установка в системе под Debian 7, примеры вычисления, команда summery() для получения полного обзора набора данных.
Программирование на R — рассмотрен код для поиска чисел Фибоначчи и кода для поиска факториала целого числа; показано создание собственных пакетов функций R на примере пакета "Linux Format", который содержит функции myFibo() и myFactorial().
Применение R для анализа набора данных мониторинга системы — команды pairs() и ggpairs() для поиска отношений между переменными, создание столбчатой диаграммы с целью наглядного показа распределения, разброса и медианы набора данных, теплокарта — способ визуализации таблицы с числами путём замены значений цветными клетками — и её использование для визуализации данных мониторинга нескольких компьютеров.
Автоматизация извлечения данных мониторинга в текстовый файл и его обработки скриптами R при помощи интерфейса Rscript.
Реализация в R алгоритма сортировки Bubble (приводится код).
Обработка в R лог-файлов с данными веб-сервера на примере отслеживания запросов, которые могут иметь отношение к взлому.
Из имеющихся для R GUI рекомендуется RStudio (www.rstudio.com).