Título: Búsqueda de modelos para el reconocimiento de patrones de uso de un sitio web a través de la minería de datos
Autores: Fortoul Yegues, Hedry Camanes
Fecha: 2011-05-31
2011-05-31
2011-05-31
Publicador: Universidad de los Andes Venezuela
Fuente:
Tipo: Texto
Tema: Patrones de comportamiento
Minería de Datos
Knowledge Discovery in Databases
Cadenas de Markov
Alineamiento Global de Secuencias
Bayes Ingenuo
Tesis PGCOMP
Postgrado en Computación
Universidad de Los Andes
Facultad de Ingeniería
Departamento de Computación
Tesis
Descripción: La presente investigación tuvo como objetivo la búsqueda de modelos que facilitaran el reconocimiento de patrones de comportamiento de usuarios en un sitio web. El caso de estudio se enmarcó en el Módulo de Departamentos de la página de Control de Estudios y Evaluación de la Universidad del Táchira. Fue aplicada la metodología KDD (Knowledge Discovery in Databases) utilizando diversas técnicas de minería, entre las que se pueden destacar: el enfoque tradicional estadístico de regresión lineal, el análisis de secuencias utilizando Cadenas de Markov, la implementación del algoritmo de alineamiento global de secuencias de Needleman-Wunsch, Bayes Ingenuo y Clustering. Para realizar las pruebas, se utilizaron registros de navegación almacenados en una Base de Datos MySql, los cuales proporcionaron el identificador del usuario conectado, la página visitada, la dirección IP de origen de la conexión, entre otros. La aplicación de las técnicas mencionadas, se llevó a cabo de dos maneras; en primer lugar, a través de programas desarrollados en el lenguaje de programación Java y en segundo lugar, haciendo uso de herramientas automáticas de estadística y minería como SPSS (Statistical Package for the Social Sciences) y Weka (Waikato Environment for Knowledge Analysis). Los resultados permitieron obtener modelos que se ajustaron (en diferente grado) al objetivo planteado y fue la técnica de Bayes Ingenuo la que proporcionó, a partir de la muestra seleccionada de usuarios, un alto porcentaje de precisión para tratar de determinar a través de los registros de navegación en el sitio, si un usuario es quien dice ser.
Universidad de Los Andes
Maestría en Computación
Idioma: Español