Una revisión del método Distance Weighted Discrimination: ¿Una mejora de SVM en dimensiones altas?

Author
José Antonio garcia
View Count
2123
License
Creative Commons CC BY 4.0
Abstract

El análisis estadístico de alta dimensión y tamaño de muestra pequeño (HDLSS) se está aplicando cada vez más en una amplia gama de contextos. En tales situaciones, se ve que el popular método de la Máquina de Vectores Soporte (SVM) sufre de ''Acumulación de datos'' en el margen, lo que puede disminuir la capacidad de generalización del modelo. Esto conduce al desarrollo de la Distance Weighted Discrimination para encontrar un hiperplano separador . En el presente trabajo se revisa y reproduce, con detalle en la derivación y solución de la función de pérdida que se resuelve usando SOCP, del método desarrollado en e implementado en el entorno R\cite{R}. Basado en el trabajo e implementación de se aplica y comparan resultados a conjuntos de datos reales y simulados (en medida de lo posible los mismos conjuntos de datos utilizados que en) Palabras clave: SVM, kernel, R (el ambiente de cómputo estadístico) y datos de alta dimensión con tamaño de muestra pequeño (data High Dimension Low Sample Size).

Una revisión del método Distance Weighted Discrimination: ¿Una mejora de SVM en dimensiones altas?