Inteligencia colectiva para innovar

Inés Skotnicka: "Mi Toolkit básico para reducir la infoxicación (2da parte)"

multitool

La 1ra parte del artículo trató sobre las herramientas para la búsqueda de información. Esta 2da entrega continúa la serie para reducir la sobrecarga informativa, con aplicaciones para el análisis, almacenamiento y visualización de datos.

Tags: análisis de informaciónbúsqueda de informacióndesinfoxicarherramientasinés skotnickainteligencia competitivarecomendacionessobrecarga informacionalvigilancia 2.0visualización de contenidoswiki-vigilancia  View Comments

Puedes descargar el artículo en pdf

En la 1ra parte del artículo, me centré en las herramientas y aplicaciones comúnmente usadas para la búsqueda de información. Y algunos habrán dado por concluido el proceso de “informarse” pero los verdaderos infonomistas (desde los profesionales de vigilancia hasta los content curators y periodistas) saben que ENCONTRAR buenos contenidos es sólo una parte del proceso de generar conocimiento útil.

Continuando la serie de mi Toolkit básico para reducir la sobre carga informativa, vamos a ver  algunas aplicaciones para el Análisis de información, el Almacenamiento y visualización, y la Difusión de información.

Aplicaciones para el Análisis de Información

A la hora de analizar la información encontrada en la Web, el sentido común sugiere el camino más directo: hacerlo “a pedal” echando mano de nuestra experiencia. Pero esto no siempre es posible, y menos con los grandes volúmenes de información que se capturan por la red. Así que hay ciertas técnicas y herramientas que nos pueden facilitar el proceso.

Por ejemplo, la minería de datos (en inglés, Data Mining) se define como la extracción no trivial de información implícita, previamente desconocida y potencialmente útil, a partir de datos.

Con la emergencia del Big Data, la primera se va convirtiendo en una herramienta fundamental para analizar y explotar de forma eficaz los datos, sobre todo después de la aparición de herramientas menos complejas y más asequibles para un usuario común, y que describiré a continuación.

Recientemente he hecho un test, con la familia Rapid, en un proyecto real. RapidMiner se usa habitualmente en investigación científica,  educación, creación rápida de prototipos y aplicaciones empresariales. Proporciona más de 500 operadores orientados al análisis de datos, incluyendo algunos para realizar operaciones de entrada y salida, pre-procesamiento de datos y visualización. Permite un análisis de datos encadenados y procesa volúmenes significativos, lo que es una ventaja sustancial para usuarios corporativos. Esto, la presentación gráfica (muy visual) de los resultados de análisis y el hecho de que sea open source lo hacen una herramienta muy interesante. El menú disponible de aplicaciones para la minería de datos se amplía con Weka, KNIME CLUTO (software de clusterización de secuencias de datos), a las que añadiría algunas de “Web-Mining” que son de uso gratuito, como:

· Yahoo cluesMuestra visualmente tendencias de búsqueda, muy útil para segmentación de mercados digitales.

· Google keywords tool: Permite descubrir palabras clave, frases de búsqueda o queries más buscadas en torno a un concepto utilizado como semilla. El sistema contabiliza millones de expresiones y datos históricos. Nosotros sólo recibimos la pequeña parte relacionada con lo que pedimos, pero podemos pedir mucho.

· Microsoft academic searchBuscador y visualizador de relaciones. Con sus limitaciones y sesgos está obligando a otros a mejorar las herramientas de análisis (y visualización) bibliométricas.

· Google correlate: Permite encontrar términos de búsqueda con similares patrones a los que uno introduzca, o introducir nuestros propios datos para que los analice.

· Y finalmente su primo, Google Refine (o como he oído recientemente un Excel con esteroides”), una herramienta de filtrado de datos potente con algoritmos eficaces donde, además de procesar los datos, se pueden desarrollar librerías a medida.

También en el sector del Social Analytics, han surgido multitud de herramientas que usan las APIs de distintas fuentes (GoogleFacebookTwitter, etc.) para extraer datos con los que realizar comparaciones de todo tipo y extraer tendencias en tiempo real incluyendo lo que se denomina Sentiment analysis para evaluar la opinión que los usuarios tienen de una marca.

Son herramientas útiles, pero como las aplicaciones de búsqueda de información, también necesitan un trabajo previo para superar los típicos inconvenientes que se encuentran en el proceso del análisis. En cualquier caso, hay que prestar atención a las técnicas de adquisición de los datos.

No vale cargar con datos a un software, por muy potente que sea, si no tenemos claro que respuestas buscamos

A veces simples técnicas, casi manuales, pueden dar mejor resultado que análisis demasiado sofisticados, más aún si no tenemos experiencia en la interpretación de lo que “escupe” la herramienta.

Aplicaciones de Almacenamiento y Visualización

Otro gran bloque de herramientas usadas en el proceso de Inteligencia Competitiva (tanto a nivel organizativo como individual) son las aplicaciones de almacenamiento y visualización. Ambos subgrupos adquieren una creciente importancia con las Redes Sociales y el auge del multimedia.

Entre los dispositivos de almacenamiento, evidentemente en la nube, personalmente me decanto por Dropbox. Las soluciones sencillas ofrecen a menudo los mejores resultados.

Dropbox, de modo similar a GoogleDrive o SkyDrive, es una solución muy buena para compartir una carpeta entre diferentes usuarios, o para hacer público un contenido. Dispone de una aplicación inteligente para subir archivos, y permite gestionar las versiones de trabajo de estos.Los desarrolladores están aún perfeccionando la opción del trabajo sincronizado en el mismo archivo, para evitar que se vayan creando dos copias del mismo. En este aspecto SugarSync le toma ventaja.

Y finalmente un truco para desconfiados: Passdrop puede ayudarte a proteger más los enlaces a archivos o carpetas que desde tu Dropbox compartes por la red. Es un extra que resulta tremendamente sencillo de usar (basta con pegar enlace de Dropbox y establecer una contraseña) y que lo convierten en un servicio imprescindible para muchos usuarios.

Los profesionales de la información buscan presentar la información de una manera más gráfica

Esa tendencia está ayudando a que ya veamos menos las clásicas e infinitas tablas de datos en los informes de vigilancia. Hoy vivimos en la era de imagen, así que la visualización de la información ya forma parte del instrumental de un buen infonomista.

De ahí que las herramientas que permiten crear visualizaciones y contar historias a partir de los datos están teniendo cada vez más usuarios. He testado algunas como Tableau y Tableau Public, y la inclusión de posibilidades de gráficos dentro de Google Docs, un desarrollo que ha ayudado a que mucha gente empiece a probar sin tener mucho conocimiento de programación. Cabe destacar el diseño del interfaz, un acabado elegante y sencillo, pero sobre todo, que no introduce “ruido” entre la información que se busca comprender y el sistema de percepción visual.

Tableau es una de las mejores herramientas que hay actualmente para la visualización de datos, tanto por la facilidad de uso como por sus funcionalidades.

Permite el filtrado de datos de acuerdo a las necesidades del usuario, un análisis en detalle (drilldown) y la construcción sencilla de reportes y dashboards con sólo arrastrar campos (drag & drop). La versión de pago es bastante cara pero con la versión gratuita se pueden hacer visualizaciones muy profesionales, aunque con volúmenes de datos reducidos.

Otra aplicación online muy útil, sobre todo para los economistas, es Google Fusion Tables: herramienta con la que puedes combinar y visualizar distintos conjuntos de datosalojados en la nube. Para empezar con Fusion Tables solo hace falta una cuenta de Google y tiempo para jugar con los datos!! Esta herramienta permite compartir los datos de forma abierta y construir gráficos personalizados de visualización. 

Para ámbitos más especializados, como el del periodismo, existen herramientas específicas que presentan la información textual de un modo muy visual. Un buen ejemplo es Newsmap que utiliza el método de "treemappingpara visualizar datos en tiempo real de noticias agregadas por Google Noticias. Tiene apariencia de un portal pero su ventaja principal es la de poder personalizar la presentación y el tema de noticias. Es realmente rápido a la hora de cargar las últimas noticias publicadas en medios de comunicación de todo el mundo. Escribiendo palabras clave en la barra de búsqueda, los resultados se muestran al instante y se renuevan de acuerdo a los cambios que se realicen.

Se observa, por otra parte, una fuerte tendencia hacia la visualización de datos en tiempo real, o sea, un feed de datos que está cambiando constantemente como una fuente para visualizaciones de datos, al estilo de un feed de Twitter. Otra práctica en alza es la de permitir a los usuarios crear visualizaciones y compartir su visión personalizada de un conjunto de datos con colegas, compañeros y amigos.

La práctica de compartir visualizaciones de datos y generar conversación alrededor de ellas gana cada vez más adeptos

Dentro de este grupo mencionaré una herramienta, entre varias que existen actualmente, para realizar las infografías (esos tebeos de la visualización de datos).  Visual.ly destaca por su interfaz  tanintuitivo y sencillo para usuarios sin experiencia, donde con un solo clic se pueden generar infografías a partir de plantillas. Los tipos de “informes gráficos” vienen predeterminados, lo que para unos será una evidente ventaja por el ahorro de tiempo que supone, pero para otros puede que sea un obstáculo si quieren realizar personalizaciones más ingeniosas.

Antes de terminar, te invito a que veas este video de TED titulado “The Beauty of Data Visualización, que aunque ya tiene sus añitos, sigue teniendo total vigencia para el tema tratado en este artículo:

Bueno, sólo nos queda la 3ra y última entrega del Toolkit, que dedicaré íntegramente a analizar el grupo de herramientas para la difusión de la información, y que nos llevarán a un escenario más ambicioso que el simple Content Curation :-D

 Puedes descargar "Mi toolkit básico para reducir la infoxicación" aquí.

Este documento está en la microsite de Vigilancia 2.0 y Content Curators, donde puedes consultar más contenidos sobre el tema. También te recomendamos visitar el Boletín [Nº23] con una selección de los mejores artículos del mes escritos por el equipo de emotools.

Comentarios