Scrap de Memes en R

web scraping

memes

twitter

Autor/a

Jorge Juvenal Campos Ferreira

Fecha de publicación

10 de marzo de 2022

Introducción

En este post vamos a aprender a hacer web scraping de memes de Twitter usando R. Utilizaremos las librerías rvest para el scraping y rtweet para interactuar con la API de Twitter.

Librerías necesarias

library(rvest)
library(rtweet)
library(dplyr)
library(stringr)
library(ggplot2)

Proceso de scraping

El proceso incluye:

Configuración de la API de Twitter
Búsqueda de tweets con memes
Extracción de imágenes
Análisis de patrones

Configuración inicial

# Configurar credenciales de Twitter API
auth_setup_default()

# Términos de búsqueda para memes
meme_terms <- c("meme", "momo", "funny", "humor")

Búsqueda y extracción

# Buscar tweets con memes
tweets_memes <- search_tweets(
  q = paste(meme_terms, collapse = " OR "),
  n = 1000,
  include_rts = FALSE,
  type = "popular"
)

# Filtrar tweets con imágenes
tweets_with_images <- tweets_memes %>%
  filter(!is.na(media_url))

Análisis de resultados

Los memes más populares suelen tener:

Mayor engagement (likes + retweets)
Timing específico (fines de semana, noches)
Temas trending del momento

Consideraciones éticas

Recuerda respetar los términos de servicio de Twitter y los derechos de autor de las imágenes al hacer scraping.

Visualización

# Gráfica de engagement por hora
tweets_memes %>%
  mutate(hour = hour(created_at)) %>%
  group_by(hour) %>%
  summarise(
    avg_likes = mean(favorite_count, na.rm = TRUE),
    avg_rts = mean(retweet_count, na.rm = TRUE)
  ) %>%
  ggplot(aes(x = hour)) +
  geom_line(aes(y = avg_likes, color = "Likes")) +
  geom_line(aes(y = avg_rts, color = "Retweets")) +
  labs(
    title = "Engagement de memes por hora del día",
    x = "Hora",
    y = "Promedio",
    color = "Métrica"
  ) +
  theme_minimal()

Conclusiones

El scraping de memes nos permite entender:

Patrones de humor en redes sociales
Momentos de mayor actividad
Temas que generan más engagement

Código completo

El código completo está disponible en mi repositorio de GitHub.

¿Te gustó este tutorial? ¡Sígueme en Twitter @JuvenalCamposF para más contenido de R!