library(rvest)
library(rtweet)
library(dplyr)
library(stringr)
library(ggplot2)
Scrap de Memes en R
R
web scraping
memes
twitter
Introducción
En este post vamos a aprender a hacer web scraping de memes de Twitter usando R. Utilizaremos las librerías rvest
para el scraping y rtweet
para interactuar con la API de Twitter.
Librerías necesarias
Proceso de scraping
El proceso incluye:
- Configuración de la API de Twitter
- Búsqueda de tweets con memes
- Extracción de imágenes
- Análisis de patrones
Configuración inicial
# Configurar credenciales de Twitter API
auth_setup_default()
# Términos de búsqueda para memes
<- c("meme", "momo", "funny", "humor") meme_terms
Búsqueda y extracción
# Buscar tweets con memes
<- search_tweets(
tweets_memes q = paste(meme_terms, collapse = " OR "),
n = 1000,
include_rts = FALSE,
type = "popular"
)
# Filtrar tweets con imágenes
<- tweets_memes %>%
tweets_with_images filter(!is.na(media_url))
Análisis de resultados
Los memes más populares suelen tener:
- Mayor engagement (likes + retweets)
- Timing específico (fines de semana, noches)
- Temas trending del momento
Consideraciones éticas
Recuerda respetar los términos de servicio de Twitter y los derechos de autor de las imágenes al hacer scraping.
Visualización
# Gráfica de engagement por hora
%>%
tweets_memes mutate(hour = hour(created_at)) %>%
group_by(hour) %>%
summarise(
avg_likes = mean(favorite_count, na.rm = TRUE),
avg_rts = mean(retweet_count, na.rm = TRUE)
%>%
) ggplot(aes(x = hour)) +
geom_line(aes(y = avg_likes, color = "Likes")) +
geom_line(aes(y = avg_rts, color = "Retweets")) +
labs(
title = "Engagement de memes por hora del día",
x = "Hora",
y = "Promedio",
color = "Métrica"
+
) theme_minimal()
Conclusiones
El scraping de memes nos permite entender:
- Patrones de humor en redes sociales
- Momentos de mayor actividad
- Temas que generan más engagement
Código completo
El código completo está disponible en mi repositorio de GitHub.
¿Te gustó este tutorial? ¡Sígueme en Twitter @JuvenalCamposF para más contenido de R!