Un Enfoque a los Tokens Iniciales de las Capas de Atención para Detectar Cambios de Autor en Textos Multi-autor.

César Espin-Riofrio; Jenniffer Tenempaguay-Borja; Jhonn Montenegro-Arellano; Verónica Mendoza Morán; Lilia Santos Díaz; Arturo Montejo-Ráez

doi:10.18687/LACCEI2024.1.1.109

Un Enfoque a los Tokens Iniciales de las Capas de Atención para Detectar Cambios de Autor en Textos Multi-autor.

Autores/as

César Espin-Riofrio Universidad de Guayaquil - (EC), Ecuador
Jenniffer Tenempaguay-Borja Universidad de Guayaquil - (EC), Ecuador
Jhonn Montenegro-Arellano Universidad de Guayaquil - (EC), Ecuador
Verónica Mendoza Morán Universidad de Guayaquil - (EC), Ecuador
Lilia Santos Díaz Universidad de Guayaquil - (EC), Ecuador
Arturo Montejo-Ráez Universidad de Jaén - (ES)

DOI:

https://doi.org/10.18687/LACCEI2024.1.1.109

Palabras clave:

Author changes, Natural Language Processing, Transformers, Embeddings of initial tokens.

Resumen

La detección de cambios de autor es crucial en un entorno donde múltiples personas han aportado al mismo contenido, siendo esencial para garantizar la transparencia y originalidad de un documento, beneficiando a múltiples áreas como la académica y científica. El objetivo de esta investigación es detectar dónde se produce el cambio de autor en documentos multi-autor, donde se propone un modelo basado en la arquitectura Transformers utilizando los modelos pre-entrenados DeBERTa y mDeBERTa. En el proceso experimental, extraemos los embeddings de los tokens iniciales de las capas del modelo y aplicamos aprendizaje por transferencia para ajustarlos. Validamos nuestro enfoque utilizando un dataset de textos en inglés tomado de PAN CLEF 2023, evaluando su eficacia y rendimiento. Los resultados muestran F1-scores de 0.9721 y 0.9647 para DeBERTa y mDeBERTa, respectivamente, validando que ambos tienen una alta precisión en la detección de cambios de autor en textos multi-autor. DeBERTa se destaca ligeramente por encima de mDeBERTa. La propuesta demuestra que la extracción de embeddings y el posterior fine-tuning en ambos modelos, son altamente efectivos para la detección precisa de cambios de autor en documentos multi-autor.

Descargas

PDF (Inglés)

Publicado

2024-07-27

Número

Vol. 1 Núm. 10 (2024): LACCEI 2024

Sección

Articles

Derechos de autor

Derechos de autor 2024 LACCEI

Ver política oficial de derechos de autor de LACCEI

Licencia

Esta obra está bajo una Licencia Creative Commons Atribución-NoComercial-CompartirIgual 4.0 Internacional.

LACCEI conserva el copyright de todos los artículos publicados bajo los términos de su acuerdo de transferencia de copyright. Como titular del copyright, LACCEI distribuye los artículos al público bajo la Licencia Internacional Creative Commons Atribución-NoComercial-CompartirIgual 4.0 (CC BY-NC-SA 4.0).

Cómo citar

Espin-Riofrio, C., Tenempaguay-Borja, J., Montenegro-Arellano, J., Mendoza Morán, V., Santos Díaz, L., & Montejo-Ráez, A. (2024). Un Enfoque a los Tokens Iniciales de las Capas de Atención para Detectar Cambios de Autor en Textos Multi-autor. LACCEI, 1(10). https://doi.org/10.18687/LACCEI2024.1.1.109

Descargar cita

Un Enfoque a los Tokens Iniciales de las Capas de Atención para Detectar Cambios de Autor en Textos Multi-autor.

Autores/as

DOI:

Palabras clave:

Resumen

Descargas

Publicado

Número

Sección

Derechos de autor

Licencia

Cómo citar

Artículos más leídos del mismo autor/a

Derechos de autor

Licencia

Información

Idioma

ISSN