Análisis Léxico sobre los Tweets de Twitter
- Astrid Paola Bográn 1
- José Luis Alonso Berrocal 2
- Luis Carlos García de Figuerola Paniagua 2
- 1 Departamento de Informática y Automática - Facultad de Traducción y Documentación, Universidad de Salamanca
- 2 1Departamento de Informática y Automática - Facultad de Traducción y Documentación, Universidad de Salamanca
- Juan Cruz Benito (coord.)
- Alicia García Holgado (coord.)
- Sergio García Sánchez (coord.)
- Daniel Hernández Alfageme (coord.)
- María Navarro Cáceres (coord.)
- Roberto Vega Ruiz (coord.)
Verlag: Departamento de Informática y Automática ; Universidad de Salamanca
ISBN: 84-695-8670-X
Datum der Publikation: 2013
Seiten: 21-36
Art: Buch-Kapitel
Zusammenfassung
Este documento ofrece un acercamiento sobre el Análisis léxico enfocado en los tweets de Twitter, presentando el desarrollo de unaaplicación web que se podrá conectar con Twitter involucrando el manejode un clasificador de texto sobre la web, y de esta manera poder descubrir las características esenciales de los tweets seleccionados ya sea deforma individual o masiva, todo esto ejecutándose en tiempo real o bienagregando el contenido a la base de datos que ofrece la aplicación paraposteriormente tratar los tweets al gusto del usuario. Durante el procesode investigación se han utilizado técnicas de stemming y tokenizaciónque ayudan a procesar el tweet de forma más limpia y sin ruido; igualmente, para la clasificación se han creado varios diccionarios en formatoXML basados en las áreas de ciencia y tecnología, también diccionariosque ayuden a identificar palabras vacías; para realizar la clasificación sepropuso el algoritmo Naïve Bayes.