Actualidad

actualidad

Procesado de la información y Documentación

Disminuir Aumentar

El poder de los datos y el reto por gestionarlos

El clic se ha tragado al CD y, por supuesto, a la libreta. Y los exabytes han hecho lo propio con los gigas. La recopilación y almacenamiento de datos mutan sin parar para adaptarse a un auténtico alud que no se había previsto. El sinfín de informaciones que el mundo genera cada día requiere nuevos contendores, que los países anglosajones encarrilaron hace un par de años. Ahora se suma el resto de Europa y la emergente Asia. El Centre de Supercomputació de Catalunya (CESCA) ha organizado una jornada para debatir la cuestión.

Ànnia Monreal | 14 de diciembre de 2009

“Cada vez hay más datos, porque se han perfeccionado los instrumentos para generarlos”. “La avalancha actual de información ha cambiado el panorama de la investigación”. “Se precisan nuevos modelos de almacenamiento y tratamiento de los datos”. Afirmaciones como éstas resonaron recientemente en el rectorado de la Universitat Autònoma de Barcelona. El primer ponente de la sesión, recién aterrizado desde Londres, advirtió que “hay que impulsar un cambio cultural a todos los niveles: para los científicos, para las administraciones y para los inversores”.

Luis Martínez Uribe, coordinador de proyectos y analista del e-Research Centre de la Universidad de Oxford, está más que familiarizado con los repositorios de datos. “Se trata de un conjunto de servicios para el almacenamiento, la preservación, el acceso, el tratamiento y la gestión de datos”, define. Son necesarios porque facilitan el acceso a la información, un bien muy preciado para la sociedad actual, basada en el conocimiento.

“Los investigadores deben ser conscientes de la importancia de los datos desde el inicio de sus proyectos. Hay que ayudarles a gestionarlos, porque para ellos se trata de una cuestión técnica”, sostiene el investigador. Xavier Luri, astrónomo de la Universitat de Barcelona, le da la razón: “La informática debe estar al alcance de los investigadores. Se tiene que profesionalizar. Hay que realizar previsiones de lo que será necesario y planificar para poder optimizar los datos que se van obteniendo”.

Una buena gestión de los datos es importante porque “generarlos no resulta económico, porque algunos sólo se pueden crear una única vez, porque así pueden reutilizarse y combinarse para ofrecer nuevas perspectivas, porque pueden someterse a escrutinio y porque entonces son accesibles y atractivos para los inversores”, sostiene Martínez Uribe.

Discriminar entre tanto dato

Hoy se fomenta la e-ciencia o posibilidad de compartir y comparar bases de datos entre investigadoresEl ritmo de crecimiento de todo tipo de informaciones es exponencial. Ha desbordado las previsiones, por lo que también resulta necesario saber discernir correctamente para evitar a Diógenes (acumulación innecesaria de datos). “Hay datos que se producen que no es preciso guardar para siempre”, asegura Martínez Uribe. “Bibliotecas y archivos deberían discriminar, pero para ello hay que tener un profundo conocimiento de cada disciplina. ¿Son los profesionales de la documentación los más indicados para llevar a cabo esta elección?”. La primera pregunta salta al ring.

A Xavier Luri, la oleada de datos ya le ha modificado su grupo de trabajo. “Ahora somos la mitad investigadores y la mitad ingenieros, que diseñan el software necesario para investigar”. Y añade: “Ya no funciona lo de ‘yo me lo guiso, yo me lo como’. Hemos pasado de utilizar nuestros centros de procesamiento a recurrir a centros más grandes con más posibilidades y que permiten compartir las informaciones”.

Uno de estos grandes centros ubicados en Cataluña es el Port d’Informació Científica (PIC). Es una de las 11 instituciones de primer nivel encargadas de recopilar la segunda copia de los 10-15 petabytes en bruto anuales que generará el gran colisionador de hadrones (LHC, de Large Hadron Collider) de Ginebra. “Los petabytes cada vez serán más habituales”, pronostica Gonzalo Merino, investigador del PIC. Esta institución también trabaja con otros centros más pequeños, en los que fomenta una nueva fórmula entre la práctica científica, la e-ciencia, o posibilidad de compartir y comparar bases de datos entre investigadores, siempre en línea.

La acumulación de información acarrea dos incertidumbres: confidencialidad y seguridad. La primera parece que depende del criterio de cada científico. Y para la segunda, que también introduce el interrogante sobre la libertad de acceso a los datos, Luis Martínez Uribe considera que sólo es una cuestión de tecnología.

Las dudas se suceden, porque la tecnología también puede ser un obstáculo. Varios ponentes reconocen que es preciso establecer mecanismos estándar para evitar incompatibilidades. Y sobre su capacidad para soportar el paso del tiempo, tanto Luri como Martínez Uribe apelan a la renovación y reutilización de la tecnología a medida que sea necesario.

BUSCADORES-REPOSITORIOSEl desarrollo de servicios cartográficos a cargo de los grandes publicadores virtuales (Google, Yahoo, Bing) se ha convertido en un magnífico almacén de datos con el que ha topado el Institut Cartogràfic de Catalunya (ICC). Son fáciles, atractivos y proporcionan todo tipo de recursos útiles para viajeros o despistados.

Pero todos ellos han introducido un cambio de paradigma, previene Josep Lluís Colomer, responsable técnico del ICC: “Dan más crédito a la actualidad que a la calidad, algo impensable para las instituciones científicas. Si la información es suficiente, no tiene por qué ser perfecta”.

Sin embargo, el intrusismo imperfecto se ha traducido en colaboración. El ICC y Google han firmado un convenio por el que intercambian datos por tecnología. Otra forma de ejercer e-Ciencia, que satisface a ambas partes.

Comentarios

   
0 comentarios
 
Global Global

www.antibloc.com

RSS

Global Talent - Pg.Lluís Companys,23 - 08010 Barcelona - Tel: 932687700 - info@globaltalentfcri.com

Sitio Web optimizado para: ie7, ie8, firefox, chrome, safari. Próximamente ie6