untitled

Métodos de clustering robustos


Robust clustering methods

González, Juan Domingo

Director(a):
Yohai, Víctor J.
 
Institución otorgante:
Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales
Fecha:
2019-03-15
Tipo de documento: 
info:eu-repo/semantics/doctoralThesis
 
Formato:
application/pdf
Idioma:
spa
Descripción:
Se tienen p variables medidas sobre n objetos. El problema de clustering, que se presenta en varias áreas del conocimiento, consiste en dividir el conjunto de n objetos en K grupos homogéneos, es decir de modo que en cada grupo las p variables tomen valores parecidos. Hay varios enfoques para este problema, uno de los más populares es "K-means", que consiste en minimizar la media de las distancias de los objetos a los centros de los grupos a los que pertenecen. Este procedimiento tiene la ventaja de ser conceptualmente y computacionalmente simple. Sin embargo, es muy sensible a la presencia de puntos atípicos. Se propone una alternativa robusta basada en minimizar una escala robusta de tipo tau de las distancias entre los puntos y los centros de los grupos a los que pertenecen. Simulaciones por el método de Monte Carlo muestran que este procedimiento no es mayormente afectado por puntos atípicos. Se muestra además que los centros de los grupos están bien definidos, y que son fuertemente consistentes. Otro enfoque para clustering es utilizar un modelo de mezcla de K distribuciones, donde cada distribución depende de varios parámetros. En este caso, el método usuales estimar los parámetros por máxima verosimilitud. En el caso de que las distribuciones son normales multivariadas, este estimador se calcula utilizando un algoritmo EM. Sin embargo, este procedimiento tampoco es robusto. En esta tesis se modifica el algoritmo EM de modo que la estimación de los parámetros sea robusta y consistente. Asímismo, se implementa el algoritmo y se realizan simulaciones de Monte Carlo, en donde se muestran las ventajas de la presente propuesta frente a otros estimadores clásicos y robustos de la literatura.
Identificador:
http://hdl.handle.net/20.500.12110/tesis_n6652_Gonzalez
Derechos:
info:eu-repo/semantics/openAccess
http://creativecommons.org/licenses/by-nc-nd/2.5/ar/
Licencia de uso:
Licencia Creative Commons


Cita bibliográfica:

González, Juan Domingo  (2019-03-15).     Métodos de clustering robustos.  (info:eu-repo/semantics/doctoralThesis).    Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales.    [consultado:  ] Disponible en el Repositorio Digital Institucional de la Universidad de Buenos Aires:  <http://hdl.handle.net/20.500.12110/tesis_n6652_Gonzalez>