Motores de Búsqueda (SEO) - SlimyGap SlimyGap.us.us por Bsat Bsat


descomposición en valores singulares (SVD) es un método estadístico de gran alcance y completamente automático usado por análisis semántico latente (LSA)

El algoritmo de SVD. es O (N2 k3), donde N es el número de términos + Documentos, k es el número de dimensiones en el espacio concepto SlimyGap.us. El algoritmo de SVD es inutilizable para una colección grande, dinámica, ya que es difícil encontrar el número de dimensiones.

Latente indexación semántica (LSI) es lento debido a usar este método SVD para crear espacios conceptuales. LSI asume que hay alguna estructura subyacente o latente en uso de la palabra que está parcialmente oscurecida por la variabilidad en la selección de palabras. Por lo tanto, una descomposición en valores singulares truncada (SVD) se utiliza para estimar la estructura en uso de la palabra a través de los documentos. Recuperación se lleva a cabo a continuación, utilizando la base de datos de valores singulares y vectores obtenidos a partir de la SVD truncado. Los datos muestran que estos vectores derivados estadísticamente son indicadores más robustos del significado que de terms.SVD individual y LSI son métodos de mínimos cuadrados. La proyección en el espacio semántico latente se elige de manera que las representaciones en el espacio original se cambian lo menos posible cuando se mide por la suma de los cuadrados de estas diferencias. La proyección transforma vector de un documento en el espacio palabra n-dimensional en un vector en el space.One reducida k-dimensional puede concluir o probar que SVD es único, es decir, no es sólo una posible descomposición de una matriz dada. Debido SVD encuentra una proyección óptima a un espacio dimensional bajo, que es la propiedad clave para la palabra patrones de co-ocurrencia.