Predecir violencia infantil con machine learning
La violencia infantil es un fenómeno generalizado en el mundo. En Argentina, el 59,4% de los menores de 15 años ha sufrido algún tipo de violencia física o psicológica en el hogar. La exposición a situaciones de violencia durante los primeros años de la vida de un niño puede afectar negativamente su desarrollo cognitivo y emocional, comprometiendo su aprendizaje, su salud física y mental, e incluso sus ingresos futuros. A pesar de su gravedad, las denuncias por violencia contra los niños son escasas. Según estimaciones internacionales, el maltrato físico infantil es 75 veces mayor que los casos registrados. Con el objetivo de mejorar la detección temprana de los niños en riesgo, y siguiendo el trabajo de Mercedes Sidders, graduada destacada 2021 de la Universidad de San Andrés (UdeSA), María Edo y Victoria Oubiña, investigadoras del Departamento de Economía de UdeSA, junto a Marcela Svarc, investigadora del Departamento de Matemática de UdeSA, desarrollaron modelos predictivos mediante técnicas de aprendizaje automático para identificar casos de violencia física en hogares argentinos.
En un artículo recientemente publicado por Children and Youth Services Review, las investigadoras de UdeSA entrenaron un algoritmo con datos de 7.358 hogares argentinos con niños de 1 a 14 años, recolectados por la Encuesta de Indicadores Múltiples por Conglomerados realizada por UNICEF durante 2019 y 2020. A partir de los “métodos de disciplina” reportados por los adultos de los hogares, el algoritmo se entrenó para identificar patrones asociados a la violencia. Los resultados indican que los modelos predictivos pueden detectar el 43% de los hogares donde ocurren episodios de violencia física contra los niños, dentro del 30% de los hogares con mayor riesgo. “Al desarrollar estos modelos, nuestro objetivo es modesto: no buscamos explicar ni resolver el problema de fondo, sino ofrecer herramientas que permitan optimizar la orientación de recursos públicos”, señala Edo. Esta herramienta permite realizar un paneo inicial que amplía significativamente la identificación de niños en situación de riesgo de una manera eficiente. Además, la investigación reveló que el 41,8% de los hogares utiliza al menos un método físicamente violento para disciplinar a los niños. Los factores clave en el modelo incluyen la infraestructura del hogar, la salud integral y la educación de sus miembros, y la composición demográfica de la familia.
Las investigadoras de UdeSA advierten que el uso de modelos predictivos presenta riesgos significativos, ya que al entrenarse con bases de datos específicas, estas metodologías pueden reproducir sesgos existentes. Por ejemplo, si un grupo determinado presenta tasas más altas de subreporte de casos de violencia, los algoritmos detectan una tasa mayor de violencia en hogares de niveles socioeconómicos bajos. Para mitigar posibles estigmas, proponen establecer umbrales diferenciados y reconocen que es fundamental asegurar que los casos identificados automáticamente sean evaluados por profesionales capacitados, garantizando una intervención adecuada.