R para la programación en Bioestadística y Ciencia de Datos: Introducción a R

R medicine 2024

Authors

Catalina Cañizares

Francisco Cardozo

Published

October 6, 2024

Objetos y Variables en R

Introducción

En este taller, aprenderemos sobre los tipos de datos que existen en R. Aprender a identificar los diferentes tipos de datos es escencial para poder sacar más provecho de este programa. Primero, vamos a definir cuáles tipos de variables que existen en R.

Tipos de variables en R

1. Números

Enteros

Los números enteros son números sin decimales. En R, los enteros se definen utilizando la función as.integer() o agregando una L al final del número.

un_numero <- 10
mi_entero <- as.integer(10)
mi_entero2 <- 10L

class(un_numero)
[1] "numeric"
class(mi_entero)
[1] "integer"
class(mi_entero2)
[1] "integer"

Números Decimales (Double)

Los números decimales en R se denominan “double” o “numeric”. Se definen simplemente escribiendo el número con decimales.

# Definiendo un número decimal
mi_decimal <- 10.5

# Mostrando el tipo de dato
class(mi_decimal)
[1] "numeric"

2. Caracteres/palabras (Strings)

Los caracteres son letras o número que se definen entre comillas simples o dobles.

mi_caracter <- "Hola, mundo!"

class(mi_caracter)
[1] "character"

3. Lógicos (Booleanos)

Los valores lógicos son TRUE o FALSE.

mi_logico <- TRUE
mi_logico
[1] TRUE
class(mi_logico)
[1] "logical"

4. Factores

Los factores se utilizan para datos categóricos y pueden tener niveles ordenados o no ordenados.

mi_factor <- factor(c("bajo", "medio", "alto"))

class(mi_factor)
[1] "factor"
mi_factor
[1] bajo  medio alto 
Levels: alto bajo medio
mi_factor_ordenado <- factor(c("bajo", "medio", "alto"), ordered = TRUE)

class(mi_factor_ordenado)
[1] "ordered" "factor" 
mi_factor_ordenado
[1] bajo  medio alto 
Levels: alto < bajo < medio

En resumen

Tipos de objetos en R

1. Vectores

Un vector es una colección de elementos del mismo tipo. Los vectores se pueden crear utilizando la función c().

mi_vector <- c(1, 2, 3, 4, 5)

class(mi_vector)
[1] "numeric"
length(mi_vector)
[1] 5

2. Matrices

Una matriz es una colección de elementos del mismo tipo organizados en dos dimensiones. Se puede crear utilizando la función matrix().

mi_matriz <- matrix(1:9, nrow = 3, ncol = 3)

print(mi_matriz)
     [,1] [,2] [,3]
[1,]    1    4    7
[2,]    2    5    8
[3,]    3    6    9
class(mi_matriz)
[1] "matrix" "array" 

3. Data Frames

Un data frame es una colecciónde elementos donde las columnas pueden ser de diferentes tipos, pero los elementos al interior de las columnas deben ser del mismo tipo. Se puede crear utilizando la función data.frame(). Más adelante vamos a llamar a los “data.frame” como “tibble”, cuando agreguemos algunas características adicionales que hacen más fácil el entendimiento de la estructura de los datos.

mi_data_frame <- data.frame(
  nombre = c("Ana", "Luis", "Carlos"),
  edad = c(23, 25, 30),
  altura = c(160, 175, 168)
)

print(mi_data_frame)
  nombre edad altura
1    Ana   23    160
2   Luis   25    175
3 Carlos   30    168
class(mi_data_frame)
[1] "data.frame"

4. Listas

Una lista es una colección de elementos que pueden ser de diferentes tipos. Se puede crear utilizando la función list().

mi_lista <- list(
  nombre = "Ana",
  edad = 23,
  alturas = c(160, 175, 168)
)

# Mostrando la lista y su tipo de dato
print(mi_lista)
$nombre
[1] "Ana"

$edad
[1] 23

$alturas
[1] 160 175 168
class(mi_lista)
[1] "list"

Ejercicio

Ejercicio 1: Crear un vector

Crea un vector con los números del 1 al 10 y muestra su longitud y tipo de dato.

# codigo aquí

Ejercicio 2: Crear un data frame

Crea un data frame con los nombres y edades de 3 personas. Muestra el data frame que has creado.

# Código aquí

Resumen

Aprendimos a identificar y trabajar con diferentes tipos de datos. Cubrimos los números enteros, que se definen usando as.integer() o agregando una L al final del número, y los números decimales (double), que se escriben simplemente con decimales. También exploramos los caracteres (strings), que son letras o números definidos entre comillas, y los valores lógicos (booleanos), que pueden ser TRUE o FALSE. Además, vimos cómo manejar factores para datos categóricos, que pueden ser ordenados o no. Posteriormente, vimos los vectores (colecciones de elementos del mismo tipo), matrices (estructuras bidimensionales de elementos del mismo tipo), data frames (colecciones de elementos donde las columnas pueden ser de diferentes tipos), y listas (colecciones de elementos que pueden ser de diferentes tipos).

Ahora vamos a profundizar en los data.frame que son estructuras de datos bastante comunes.

Back to top