Descripción:
En la actualidad, las redes sociales son espacios donde las personas comparten pensamientos,
emociones, experiencias y opiniones. El texto generado constituye una fuente valiosa
de conocimiento para estudiar el comportamiento y la salud mental de las personas. Particularmente,
en este trabajo se analizan publicaciones de usuarios en distintas plataformas,
principalmente X (antes Twitter) y Reddit, con el objetivo de identificar patrones lingüísticos
asociados con rasgos de depresión y comparar su manifestación en redes sociales.
Para realizar esta investigación, se utilizaron tres conjuntos de datos de referencia, los cuales
contienen publicaciones provenientes de tales plataformas. Utilizando tales colecciones,
se crearon modelos computacionales para detectar usuarios con depresión mediante el uso
de técnicas de procesamiento de lenguaje natural y aprendizaje automático. Se entrenaron
varios modelos de clasificación para distinguir entre textos etiquetados como casos de
depresión y aquellos que no lo son, priorizando la puntuación F1 en la clase positiva.
Los resultados indican que, a pesar de las diferentes características de las publicaciones
cada plataforma social (e.g., longitud máxima de las publicaciones), existen similaridades
en el uso del lenguaje asociado a depresión. Además, se observó que el desempeño de los
modelos de clasificación depende en cierta medida de la colección de datos utilizada en el
entrenamiento.