24 jun. 2010

Indexación Y Recuperación de la Información

En las bibliotecas este es un tema muy importante porque de acuerdo a la forma en que es utilizado así mismo dará el resultado deseado por ende para aumentar la eficiencia de acceso e indexación se diseñan estructuras adicionales asociadas a los archivos que mantienen la información de las bases de datos.Existen distintas formas generales para la indexación y búsqueda. Cada una de las técnicas tiene ventajas y desventajas comparativas y deben evaluarse de a cuerdo a:
  • tiempo de acceso a datos.
  • tiempo de inserción de datos.
  • tiempo de eliminación de datos.
  • espacio extra necesario para la indexación de más terminología.

La idea de crear índices y realizar su posterior indexación es la misma que en el caso de un índice de un libro, en este existe un índice alfabético y permite ir directamente a la página asociada con cada entrada del índice, al igual existen varias bibliotecas que mantienen fichas en las cuales la indexación es realizada por tema, título y autor, que entregan la información relacionada acerca de en donde se encuentra, el número del libro para así encontrarlo fácilmente. El índice define los atributos que tiene cada uno de los términos para asociarla a una relación de contenidos y da valor a todos los bloques de información que contienen dicho término. Los valores en la indexación se mantienen con cierto orden de modo que se pueda realizar la búsqueda rápidamente. Existen entonces distintas técnicas de indexación con distintas características.

  • Indexación por árboles de términos
  • Indexación por archivos de términos secuenciales

INDEXACIÓN POR ACCESO SECUENCIAL

Es uno de los esquemas de indexación más antiguos que existen para realizar una búsqueda ordenada. Este tipo de indexación expone el ordenamiento secuencial y que por lo tanto tendrán una llave de búsqueda primaria. Es por lo tanto que en este aparte cabe destacar dos tipos de índices:

  • ÍNDICE DENSO
  • ÍNDICE ESCASO

Resulta entonces que entre más pequeño sea el índice la indexación y búsqueda resultara más rápida, dado que la terminología utilizada será la misma porque se realizan asociaciones dentro del motor de búsqueda. Sin importar cuál sea la forma de indexación siempre debemos actualizar todos los índices cada vez que se inserta o elimina una palabra (término). Cabe destacar que entre más datos tengan los contenidos más cuesta acceder, manipular y no facilita la búsqueda de la información. La indexación será ineficiente si se realizan muchas inserciones o eliminaciones. Se pueden indexar atributos a aquellos términos que no se encuentran secuencialmente ordenados, como palabras compuestas utilizando etiquetas que direccionen la búsqueda y recuperación de información. Existen programas como Index Your File, una aplicación que permite indizar los archivos que tenemos en nuestro computador para poder realizar búsquedas muy rápidas, este software fue desarrollado por J. Rafael Castro Imbernon. Permite buscar archivos por nombre, fecha e incorpora la utilización de operadores booleanos. Una de las grandes características de éste es que no necesita de instalación por esta razón se hace portable, adicional a esto me permite organizar como yo quiera la indexación de los archivos; esto se debe a que me permite crear muchas bases de datos y en estas puedo escoger que carpetas quiero indizar y cuáles no. Por otra parte es importante conocer el significado de los siguientes términos los cuales no ayudarán en su comprensión.

INDEXACIÓN: Que se accede mediante un índice. El concepto de indexación se relaciona al de dirección de memoria, dirección que se obtiene sumando a un valor relativo el contenido de un registro índice, para obtener una dirección absoluta.

INDEXAR: Acción de crear un índice, consiste en que a partir de los datos que figuran en un campo de una base de datos, crear un índice de direcciones a toda la base de datos. Con este sistema se acelera el acceso a los datos de una base de datos. Así, cuando se desea encontrar un registro determinado dentro de la base, lo primero es acudir al índice y buscar en él, y una vez encontrado se accede al registro completo.

INDICE: Lista o enumeración breve y por orden, catálogo contenido en uno o muchos volúmenes, en el cual, por orden alfabético o cronológico, están escritos los autores o materias de las obras que se conservan en una biblioteca, sirve para hallar términos y franquearlos, sabiendo que la indexación por medio de estos índices permite la recuperación y búsqueda de los contenidos.

La indexación es la manera más eficiente de organizar y recuperar contenido en una base de datos. Para cada uno de los artículos, se deben asociar etiquetas diferentes, (palabras representativas) o las particularidades que permiten al contenido para ser identificado entre un número grande de artículos disponibles. La indexación es uno de los pasos más importantes para la búsqueda de información por medio de índices, un contenido bien indexado derivara en la recuperación y fácil búsqueda de la información. Las palabras clave son ciertamente los campos más importantes de la indexación. Este es el método primario de búsqueda. También, es importante utilizar sólo palabras clave que puedan ayudar a encontrar un cierto contenido y no otro. Así se debe utilizar palabras clave realmente ligadas al sujeto representado o que se quiere encontrar. También, según el tipo de búsqueda, las palabras claves pueden obedecer a descripciones del elemento por encontrar Las categorías son importantes también, ya que ayudan a crear filtros en la búsqueda exhaustiva de información, existen dos tipos de categorías conceptuales y representativas que se requieren para validar la indexación de uno o varios términos son útiles para mejorar la visibilidad de un contenido. Es importante encontrar la categoría más exacta para indexar un archivo. Realmente, es mejor no tener ninguna categoría que una categoría que no corresponda a su tema. Una buena indexación es una indexación que sigue las pautas siguientes. De hecho, es importante que su indexación sea entendida bien por un motor de búsqueda para ofrecer los mejores resultados.

Existen reglas para la indexación la principal es utilizar un número limitado de palabras clave (ni demasiadas, ni demasiado pocas). Según el tipo de información que se quiera describir, se pueden necesitar varias palabras clave, pero no muchas. Cuantas menos palabras clave se usen, más relevantes son. Este es el modo en que los motores de búsqueda tienen en cuenta a la hora de la relevancia en los términos y por ende la importancia que toma cada uno a la hora de la búsqueda. También es importante el orden de las palabras clave y ordenarlas correctamente. La palabra clave más relevante debe ir primero. Determinará el lugar en la página de resultados. Si la primera palabra clave no es la más pertinente, el contenido puede no aparecer cuando es necesitado. Se deben indexar los términos en un solo idioma, ya que el motor de búsqueda traduce automáticamente todas las palabras clave en todos los idiomas disponibles en el sitio web. Si se utilizan idiomas diferentes en la indexación, el archivo no puede ser tenido en cuenta para búsquedas específicas. La precisión es también un punto importante de la indexación, y se deben utilizar sólo palabras clave que describan el contenido. No se deben encontrar todos los sinónimos posibles para un solo concepto, y está absolutamente prohibido utilizar palabras clave que no están ligadas directamente al concepto por representar. Las reglas específicas también se aplican a la indexación. Para tener una buena indexación también se deben respetar algunas pautas semánticas que ayudarán a que el contenido aparezca en el lugar correcto en el momento oportuno. Las palabras compuestas serán escritas de una vez (en la misma línea), especialmente cuando el significado de las palabras tomadas separadamente sea muy diferente de la palabra compuesta. El uso del plural será limitado a los términos que representan efectivamente varias veces el sujeto. Es lo mismo para singular; no se debe poner la palabra clave en singular si el sujeto es representado varias veces. Cada una de estas especificaciones son importantes porque determinarán la visibilidad del contenido y su potencial o relevancia. Si no se respetan ciertas indicaciones la relevancia de las palabras clave disminuirá y no se adecuarán a los hábitos de búsqueda de los usuarios. Cuando un usuario busca un término o concepto, él ya sabe lo que quiere hacer. Generalmente escribe una palabra clave representativa, por eso es importante ser muy preciso durante la indexación. Es muy importante siempre imaginarse qué clase de usuarios estarán interesados por el contenido del sitio web.

Compilado Por. Javier Mejía T.

Publicar un comentario en la entrada