lunes, 8 de diciembre de 2008

algoritmo LSI solo para SEO

¿LSI simplemente una matriz?

En posicionamiento ilegal mostramos el contenido del estudio del LSI, para comprender las ventajas y limitaciones del algoritmo,de lo que es y lo que se puede hacer con el LSI o lo que esto puede o no puede hacer por las empresas de marketing online y sus clientes.

El resultado es la difusión de información inexacta. Por ejemplo, los Empresas han asignado un significado a los términos "latente" y "semántico" que no están en el LSI literatural. Otros se han convertido en "expertos" en cada cita. En un esfuerzo para vender sus servicios, incluso otros han llegado con LSI basado en software, videos, herramientas, etc, que son en el mejor de una caricatura de cómo un motor de búsqueda implementa sistema LSI. Independientemente de estas herramientas puntuación probablemente no es lo que un motor de búsqueda como Google o Yahoo podría ser de puntuación.

LSI es uno de los actuales algoritmos que ignorar el orden de las palabras (secuencias de plazo), aunque un modelo sintagmático paradigmáticos,

El Doctor Tom Landauer y su grupo en la Universidad de Colorado indica que más del 99% de la palabra pares cuya similitud es inducida, nunca aparecerán juntas en un párrafo. Los lectores deben recordar que los términos sinónimos no tienden a repetirse, pero suele ocurrir en el mismo contexto.

Considere la posibilidad de dos documentos y X y Y tres términos A, B y C y en donde:

A y B no se co-producen.
X menciona términos A y C
Y menciona los términos B y C.

A---C---B

El denominador común es C, por lo que definirimos una coincidencia, ya que ambos A y B, mientras que se producen en tránsito con C. Esto se llama de segundo orden co-ocurrencia y es un caso especial de alta co fin -ocurrencia.
Sin embargo, sólo porque lo que A y B están en tránsito con C esto no conceder contextuality, puesto que los términos pueden ser mencionado en diferentes contextos en los documentos X e Y. Por ejemplo, este sería el caso de X e Y discutir diferentes temas . Documentos largos son más propensos a ello.

Incluso si X e Y son estos monotopic podría discutir diferentes temas. Por lo tanto, sería engañoso suponer que la orden de alto co-ocurrencia entre A y B, mientras que en tránsito con C equivale a una contextuality relación entre ambos términos. Añadir a esta polisemia y empeora el escenario, como no puede LSI para hacer frente a la polisemia.

Hay otras cosas en qué pensar. LSI es computacionalmente costosa y sus generales se amplifica en gran escala colecciones. LSI Ciertamente no es la indexación asociativa o root (raíz) de indexación como algunos han sugerido. No se trata de indización de documentos, pero se utiliza con colecciones que ya han sido indexados cuyo documento de términos han sido prescored de acuerdo a un plazo de peso régimen. Por otra parte, la comprensión de una consulta, es decir, la hipótesis de que la consulta debe ser el lenguaje natural de tipo, no es un requisito para la aplicación de LSI.

Además, la afirmación de que lo que debe provenir de una porción específica de un documento como título de las etiquetas, ancla de texto, enlaces o una URL específica del dominio no juega ningún papel y no es un requisit de la aplicación de LSI. Estos falsos conceptos se han extendido por un tiempo, en su mayoría por aquellos que venden vínculo basado en servicios, que convenientemente no proporcionan pruebas de matemáticas sobre la forma en LSI obras, ya que no pueden hacer las matemáticas.

Es cierto que algunos documentos sobre distribuidos a gran escala LSI menciona la palabra "dominio" en relación con LSI, pero el término se utiliza en referencia a la información los dominios, no URL dominios o lo que se conoce como sitios web. LSI cierto que se puede aplicar a las colecciones que se han precategorized por el sitio web de dominios, pero esto no es más que el filtrado y preclassification y no es parte de la SVD algoritmo usado en LSI.