R

R es un lenguaje y un entorno orientado a la computación estadística, que proporciona una gran variedad de técnicas estadísticas y gráficas, y es muy extensible. Se trata de uno de los lenguajes más utilizados en investigación por la comunidad estadística, siendo además muy popular en el campo de la minería de datos, la investigación biomédica, la bioinformática y las matemáticas financieras.

 

Versión instalada

Las versiones instaladas de R se pueden visualizar mediante el comando module, una vez hemos accedido a un nodo de cómputo mediante una sesión interactiva.

$ module avail R

———————- /opt/modulefiles ——————

R/3.5.1

En caso de existir más de una versión de R instalada, la versión por defecto se identifica mediante “(D)”, de forma que si queremos cargar una versión específica de R, la especificamos mediante

$ module load R/<version>

 

Paquetes de R

Los usuarios pueden instalar en su carpeta personal los distintos módulos y paquetes de R que necesiten, si no estan disponibles en la versión de R instalada. Dichos paquetes se instalan en la ruta “R/x86_64-redhat-linux-gnu-library/” de la carpeta personal de cada usuario.

Para llevar a cabo la instalación de paquetes R, en primer lugar solicitamos una sesión interactiva en uno de los nodos de cómputo

$ sinteractive

Una vez hemos accedido al nodo de cómputo, ejecutamos R

$ module load R

$ R

A continuación podemos instalar paquetes mediante

> install.packages(«package_name»);

 

Envío de trabajos mediante script

Para ejecutar un trabajo de R, hemos de preparar un script para indicar al gestor de colas las carácterísticas del trabajo así como los comandos a ejecutar. A continuación se muestra un ejemplo de un trabajo que solicita 16Gb de RAM, 2 horas de duración maxima y que ejecuta en R el script llamado script.R

#!/bin/bash

#SBATCH –job-name=test_R

#SBATCH –mem-per-cpu=16384

#SBATCH –output=%j.log

#SBATCH –error=%j.err

#SBATCH –mail-user=

#SBATCH –mail-type=BEGIN,END,FAIL

#SBATCH –time=02:00:00

module load R

cd /home/usuario/test_R

R CMD BATCH script.R

 

Y a continuación enviar el trabajo a la cola mediante

$ sbatch trabajo.sbatch

Recordar que hay que modificar los distintos parámetros del script de ejemplo para adecuarlos a nuestro trabajo real