Análisis comparativo de técnicas de Machine Learning para la detección y clasificación de sitios web maliciosos
| dc.contributor.advisor | Cantoni Rabolini, Nélida Mónica | |
| dc.creator | Hainze, Luciano Martín | |
| dc.date | 2024-09-00 | |
| dc.date.accessioned | 2026-04-23T20:12:37Z | |
| dc.description | Fil: Hainze, Luciano Martín. Universidad de Buenos Aires. Facultad de Ciencias Económicas. Buenos Aires, Argentina. | |
| dc.description | Fil: Cantoni Rabolini, Nélida Mónica. Universidad de Buenos Aires. Facultad de Ciencias Económicas. Buenos Aires, Argentina. | |
| dc.description.abstract | El presente trabajo consiste en el planteo y desarrollo de un proyecto de Ciencia de Datos para la clasificación binaria y multiclase de sitios web benignos y maliciosos. La investigación consiste en la comparación de la performance de los modelos de aprendizaje automático supervisado Random Forest, Adaptive Boosting Decision Trees, Logistic Regression, Neural Net y Naive Bayes evaluando las métricas ROC-AUC, Precision, Recall y F1-Score. La clasificación es realizada primeramente entre sitios benignos y maliciosos, y en segundo lugar distinguiendo entre las clases de sitios maliciosos malware, spam, phishing y defacement. Se utilizan características del léxico empleado y datos provenientes de la base WHOIS para el entrenamiento de los modelos. El modelo Random Forest alcanzó una mejor performance que los modelos restantes para la clasificación binaria y multiclase, alcanzando un ROC AUC de 0,998 y 0,999 respectivamente. El trabajo presenta una optimización del modelo seleccionado y una descripción de su funcionamiento. El trabajo finaliza con la postulación de una propuesta de arquitectura de datos para el despliegue del proyecto. | |
| dc.format | application/pdf | |
| dc.identifier | 1502-2911_HainzeL | |
| dc.identifier.other | Especialización en Métodos Cuantitativos para la Gestión y Análisis de Datos en Organizaciones | |
| dc.identifier.uri | https://bibliotecadigital.economicas.uba.ar/handle/123456789/7414 | |
| dc.language | spa | |
| dc.publisher | Universidad de Buenos Aires. Facultad de Ciencias Económicas. Escuela de Negocios y Administración Pública | |
| dc.rights | info:eu-repo/semantics/openAccess | |
| dc.rights | http://creativecommons.org/licenses/by/2.5/ar/ | |
| dc.subject | Ciberseguridad | |
| dc.subject | Ciencia de datos | |
| dc.subject | Machine learning | |
| dc.subject.other | 10 | |
| dc.subject.other | Sobresaliente | |
| dc.title | Análisis comparativo de técnicas de Machine Learning para la detección y clasificación de sitios web maliciosos | |
| dc.type | info:eu-repo/semantics/masterThesis | |
| dc.type | info:ar-repo/semantics/tesis de maestría | |
| dc.type | info:eu-repo/semantics/publishedVersion |
Archivos
Bloque original
1 - 1 de 1
