Definicion de LSI – Latent Semantic Indexing (Video)

Solo con ver el nombre que le he puesto al blog os podeis imaginar que ademas de lo mas buscado en Google también me intriga el mundo de como funcionan los buscadores en internet. En esta ocasión me gustaría hablaros sobre LSI, un metodo que sirve para ofrecer resultados de busquedas relevantes distintas al metodo inicialmente usado por Google.

LSI ( Indexacion Semantica Lantente) es una metodología que incluye probabilidad estadística y de correlación que ayuda a deducir la distancia semántica entre las palabras. Es evidentemente, una metodología compleja, pero se puede aplicar fácilmente a comprender la relación entre ciertas palabras en un párrafo o en un documento. Esta metodología se está utilizando al indexar una página en el motor de búsqueda de la base de datos.

Profundizando, LSI se ocupa no sólo de un documento para el estudio de las palabras clave y listarlas en la base de datos, sino también del estudio de una colección de documentos y el reconocimiento y la identificación de las palabras que son comunes entre estos documentos. De esta manera se puede llegar a la conclusión sobre la relación semántica entre las palabras que se utilizan en estos documentos. El proceso entonces descubre que incluyen otros documentos o que hacen uso de estas palabras semánticamente cerca. Los documentos resultantes se indexan al estar estrechamente relacionadas con un contexto, de acuerdo a la indexación semántica latente.

Este video de Edel Garcia sobre LSI explica en lo que consiste esta idea para ofrecer resultados de busquedas:

2 comments

  1. Pingback: TEORIA FRACTAL IR – Las increíbles aportaciones de EDEL GARCIA. | I THINK SEARCH

Post a comment

You may use the following HTML:
<a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>