26 ago. 2010

La estructura conceptual de los tesauros en el entorno digital: ¿nuevas esperanzas para viejos problemas? Parte I

Introducción

En la actualidad, existe una amplia producción técnica y científica donde se discuten las pautas de elaboración y diseño de las herramientas documentales (taxonomías, tesauros, sistemas de clasificación, listas de encabezamiento de materia, etc.) adaptadas a los nuevos desafíos del medio digital (De la Cueva 1999, López Alonso et al 2000, Shiri y Revie 2000, García Jiménez 2004, entre otros). El entorno digital ha abierto nuevas perspectivas al uso y a la construcción de herramientas documentales de control terminológico para la representación y la recuperación de información, dado que posibilita la reutilización e interoperabilidad entre recursos y aplicaciones. No obstante, la consideración de casos reales de tesauros en soporte digital nos hace cuestionar si es real la evolución en la concepción del rol de los tesauros para la gestión documental, teniendo presente un entorno digital. Del análisis de algunos tesauros en soporte digital surge la persistencia de problemas que ya estaban presentes en las ediciones impresas, por ejemplo, en la estructuración conceptual. Es a partir de elementos como esta constatación, que planteamos como objetivos de la presente comunicación, el análisis de las bases de la estructuración conceptual de los tesauros, el establecimiento de los elementos problemáticos, a los que denominaremos “patologías”[1] (Barité 1995: 41), y la proposición de soluciones alternativas. La presente comunicación se desarrolla en tres apartados en consecuencia con los objetivos anteriormente mencionados. En el primer apartado, se presentan las bases de la estructuración conceptual general de los tesauros de acuerdo con las últimas revisiones teórico/prácticas de los mismos. En el segundo, se analizan los problemas (patologías) de la estructura conceptual de tesauros en soporte digital (Tesauro ISOC de Psicología, UNESCO Thesaurus y EUROVOC Thesaurus). En el tercer apartado, se plantean las posibles alternativas de solución de los problemas analizados a partir del uso de los conceptos propios de las ontologías como recurso lingüístico de primer orden para el diseño y la generación de tesauros. Finalmente se presentan las conclusiones y perspectivas de investigación futuras.

2. Los tesauros en la documentación

La conceptualización de tesauro que apoyamos considera al tesauro como un tipo de lenguaje documental que representa la estructuración conceptual de un determinado campo del conocimiento, y proporciona una organización semántica a través de la explicitación tanto de las relaciones establecidas entre dichos conceptos como del significado de los términos que los representan. Los tesauros para la Documentación son una herramienta de control terminológico, puesto que la estructuración del tesauro es en base a conceptos, pero los conceptos son representados por lexicalizaciones seleccionadas o sea por términos. Con el control terminológico se busca neutralizar la sinonimia y la polisemia, ambas características naturales de la lengua, que dificultan la precisión de la indización y recuperación de la información, ambas funciones básicas de los tesauros.

2.1 La estructura conceptual de los tesauros

La estructura conceptual de los tesauros no es arbitraria en ningún sentido, puesto que existen tanto manuales de elaboración de tesauros de larga trayectoria internacional como normativa internacional que recomiendan los elementos estructurales a tener en cuenta. La relación de manuales de difusión internacional es amplia, sin embargo no es posible dejar de mencionar a autores tales como Soergel (1974), Currás (1991), Slype (1991), Aitchinson (1992), Lancaster, (1992) y Maniez (1993), cuyos manuales fueron y son pautas de trabajo para numerosos documentalistas y especialistas que se enfrentan con la construcción y el uso de los tesauros como herramientas de control terminológico. Las normas sobre tesauros más difundidas son las elaboradas en el entorno de la ISO (International Organization for Standarization), y son la norma ISO 5964:1985 “Documentation -- Guidelines for the establishment and development of multilingual thesauri” y la norma ISO 2788:1986 “Documentation -- Guidelines for the establishment and development of monolingual thesauri”. La traducción de ambas normas al español ha sido realizada por la AENOR (Asociación Española de Normalización y Certificación) y se corresponden con la norma UNE 50125:1997 “Directrices para el establecimiento y desarrollo de tesauros multilingües” y la norma UNE 50106:1990 “Directrices para el establecimiento y desarrollo de tesauros monolingües”. Otras normas que son de necesaria consulta puesto que desarrollan más elementos que las normas ISO, son las elaboradas por la NISO (National Information Standars Organization), institución que desarrolla, mantiene y publica normas técnicas en el ámbito de la gestión de información a nivel de los Estados Unidos de América. Actualmente dicha institución está en proceso de actualización y revisión de la norma técnica sobre tesauros ANSI/NISO Z39.19–2003 (Revision of Z39.19-1980) “Guidelines for the Construction, Format, and Management of Monolingual Thesauri”. La consulta tanto de manuales como de normas en relación a la construcción de tesauros, nos conduce a una estructura conceptual (que implica relaciones semánticas), en donde también se tienen en cuenta los términos como representaciones léxicas de los conceptos. Las relaciones semánticas establecidas en los tesauros son de tres tipos: de equivalencia, de jerarquía y de asociación. Brevemente, daremos una descripción de cada una de ellas y recomendamos recurrir a los manuales y a las normas citadas en la bibliografía para una definición y ejemplificación más detallada. Las relaciones de equivalencia, implican la existencia de términos preferentes y no preferentes, por lo tanto son las que denotan el control terminológico en los tesauros. De las variadas denominaciones con que puede ser representado un concepto, se debe seleccionar una que será el término con valor de descriptor, y las otras formas posibles, consideradas sinónimos o cuasi sinónimos, son descartadas como puntos de acceso en la indización y la recuperación. Las relaciones jerárquicas, son las establecidas entre conceptos que presentan distintos niveles de súper ordinación y subordinación, y donde cada término subordinado debe tratar la misma clase básica de conceptos que su término general, por ejemplo representar un objeto, una acción o una propiedad. Existen cuatro subtipos de relaciones jerárquicas: género-especie (clase o categoría / miembros o especies), todo-parte, enumerativas (categoría general / caso individual), y poli jerárquicas (conceptos que se insertan en más de una cadena jerárquica). Las relaciones asociativas, son las más difíciles de definir y establecer, y en realidad se reconocen como las relaciones que son determinadas por no ser ni de equivalencia ni jerárquicas, sino que son asociaciones mentales con tanto peso que muchas veces un concepto no puede definirse sin la presencia del otro. Tienen una variada subtipología y requieren de un estricto control para evitar decisiones de carácter subjetivo. La red semántica establecida por los tesauros no se agota en la explicitación de las relaciones conceptuales anteriormente mencionadas, sino que incluye las denominadas notas de alcance donde se acota el significado o alcance conceptual que es representado por un término en particular. Según la normativa y los manuales antes citados, la estructuración conceptual de los tesauros se limita a los tipos de relaciones que se encuentran en los mismos. Luego, se presentan aparte, la elección de los descriptores (o sea los términos que representan a los conceptos), entendiendo que es una elección de forma del descriptor que sean compuestos (formados por varios conceptos) o simples (formados por un único concepto). Sin embargo, a nuestro criterio, la elección de la forma de los descriptores, involucra algo más, pues implica la pos coordinación o pre coordinación en el momento de estructurar el campo conceptual sobre el que trata el tesauro, y por ende esto se traduce en la representación léxica de los conceptos, o sea en los términos. En último lugar, cabe destacar que en las fuentes anteriormente mencionadas se sugiere una estructuración conceptual de los tesauros con una fuerte orientación al soporte papel. Solamente las normas NISO hacen referencia a la posibilidad de un soporte electrónico, considerando al tesauro como parte de un sistema de almacenamiento y recuperación de información (NISO 2003: 31).

2.2 Los tesauros en el medio digital

Actualmente la gestión documental está influenciada por el desarrollo de Internet y una de sus tecnologías más flexibles, el World Wide Web (WWW). A las tecnologías asociadas a este contexto se les reconoce varios factores de impacto. El primer factor de impacto, es el incremento del número de recursos de información que requieren descripción, identificación y elementos de localización. Un segundo factor de impacto, es potenciar la necesidad de análisis temáticos más consistentes, con el consecuente rediseño de herramientas de gestión y organización de información entre las cuales se encuentran los vocabularios controlados. El tercer y último factor de impacto, es la necesidad de dotar a los usuarios con estructuras de conocimiento que le permitan un acceso rápido y amigable a la información, donde los tesauros son una de las posibilidades estudiadas. Los usuarios requieren de herramientas conceptuales y semánticas destinadas a una efectiva organización de la información digital, y los tesauros son una de las estructuras que pueden tener una participación activa en este sentido. Desde esta perspectiva, ya en 1997 López-Huertas y autores más actuales como De la Cueva Martín (2000), consideran que los aportes del entorno digital a los tesauros son:

§ El desarrollo de una estructura hipertextual donde se establezcan hipervínculos, entre todos los elementos estructurales (descriptores, no descriptores, notas de alcance, etc.), y también entre las distintas partes del tesauro.

§ La simplificación de la estructura a través de la hipertextualidad, por lo cual también se facilita su manejo a partir de interfaces adecuadas.

  • La reducción de los costos de actualización.

§ La ayuda al desarrollo de tesauros multilingües y multidisciplinares fomentando la cooperación internacional, y, por lo tanto, impulsando la reutilización e interoperabilidad de recursos.

§ El acceso universal a herramientas terminológicas de auxilio a la recuperación de información y que a su vez actúan como recursos para establecer bases de conocimiento.

§ La integración del usuario al proceso de creación, gestión y optimización de las herramientas conceptuales documentales.

Shiri y Revie en su artículo del 2000, son quienes ponen de manifiesto elementos fundamentales, a nuestro parecer, para aproximarnos al contexto digital de los tesauros. En este sentido, plantean las pautas de revisión de la norma ANSI/NISO Z39.19–2003 (Revision of Z39.19-1980) “Guidelines for the Construction, Format, and Management of Monolingual Thesauri” de construcción de tesauros, surgidas del Workshop organizado por la NISO en 1999, “Electronic thesauri: planning for a standard”. Esta visión tiene como ejes centrales a la interoperabilidad, la gestión de la construcción y la descripción del vocabulario a utilizar, e implica como parámetros de acción:

§ Contar con una visión amplia en la elaboración de herramientas conceptuales, no limitándose a la construcción de tesauros sino considerando otros tipos de estructuraciones conceptuales (taxonomías, ontologías, etc.).

§ Involucrar al usuario en el proceso de construcción y evaluación de los vocabularios controlados.

§ Considerar funciones alternativas de los tesauros, donde se superen las tradicionales indización y recuperación, dando paso a nuevas (navegación).

§ Desvincular los lineamientos de construcción del soporte físico del tesauro en cuestión .

§ Guiar no solamente la construcción sino tambièn el uso de estas herramientas

§ Posibilitar la interoperabilidad y reutilización de información conceptual y lingüística ya generada para otros recursos, y que dicha información sea enriquecida o se le busquen nuevas aplicaciones.

Nuevamente son Shiri y Revie (2000) quienes apuntan un elemento clave a tener en cuenta en la nueva generación de tesauros digitales, que priorizan la interoperabilidad y reutilización de otros recursos. Los autores, enfatizan esta perspectiva tomando a los propios tesauros como fuentes para generar nuevos tesauros u optimizar los ya existentes. No obstante, es posible avanzar más en la interoperabilidad y reutilización de recursos, y beneficiarnos de diversas tecnologías lingüísticas (como las ontologías) que aporten mayor información semántica a la construcción de tesauros y otras herramientas conceptuales. Si en un futuro se adopta a la ontología como fuente para la generación o el enriquecimiento de un tesauro, se podrían evitar ciertos inconvenientes estructurales, que existían en las versiones impresas de los tesauros y persisten aún hoy en sus versiones digitales.

3. Los tesauros en soporte digital: análisis de casos

En el apartado anterior, hemos planteado nuestra interpretación de tesauro, lo que implica su estructuración conceptual y que cambios se espera que ocurran al trasladarse a un medio digital Nuestra propuesta es realizar un análisis crítico de tres casos de tesauros en soporte digital (Tesauro ISOC de Psicología, UNESCO Thesaurus y EUROVOC Thesaurus) y estudiar si la adopción de dicho soporte ha provocado cambios significativos en los tesauros como herramientas documentales.

[1] El término patología, es utilizado en los trabajos críticos sobre la estructuración conceptual de los sistemas de clasificación del Prof. Mario Barité de la Universidad de la República del Uruguay, pero nuestra postura es que la problemática de la estructuración conceptual es común a los distintos tipos de herramientas documentales.

Tomado de: Silvia Arano, Lluís Codina

Compilado Por. Javier Mejía T.

Publicar un comentario en la entrada