Random Monkey

Random Monkey es una empresa de consultoría en ciencia de datos con fuertes raíces de trabajo multidisciplinar, creativo y responsable que ofrece diferentes servicios alrededor de los datos para que nuestros clientes y sus usuarios puedan comunicar y entender la información de manera más fácil. Nuestro equipo integral experto en ciencias de datos y tecnologías de Big Data combina el diseño para asegurar que se maximice el impacto positivo de los datos en nuestros clientes. Somos el aliado ideal comunicar y entender mejor la información de manera que apoye la toma de decisiones a todo nivel. Nuestras áreas de especialización incluyen:

Como empresa social, Random Monkey SAS cuenta con toda una línea de Tecnologías Cívicas en su portal de periodismo de datos Datasketch. Más información aquí.

Nuestros servicios

Captura de datos y limpieza
Capturas de datos de la web y otras fuentesCaptura, transformación y depuración de datos. Extracción masiva de información, limpieza de duplicados y estructuración de bases de datos para análisis.
Enriquecimiento de información Georreferenciación a nivel sub municipal. Identificación automática de género de personas de acuerdo al nombre.
Cruces aproximadosHerramientas de cruces aproximados para limpiar bases de datos y mezclarlas con diversas fuentes.
Análisis
Implementación de algoritmos y crucesImplementación y análisis usando los últimos algoritmos de aprendizaje maquinal y estadística computacional:
  • - Segmentación/Clustering
  • - Predicción
  • - Matching
  • - Simulación de escenarios
  • - Sentimiento en textos
  • - Contexto en textos
  • - Análisis multivariado
Visualizaciones e interactivos con múltiples componentes
Más de 100 tipos de visualizaciones

Generación de visualizaciones de todo tipo para múltiples tipos de datos de entrada.

Realizamos visualizaciones estáticas listas para publicación en impresos y visualizaciones interactivas listas para publicación web.

Trabajamos las representaciones más usuales de líneas, barras o burbujas, hasta las más avanzadas de redes o mapas interactivos.

Aplicaciones de datos para la web
ReportesGeneración automatizada de reportes para fuentes de datos definidas y con la implementación del flujo de visualización y algoritmos implementados. Reportes automatizados en PDF, Word o HTML
Aplicaciones de visualizaciónPreparamos la herramienta de visualización para que ser usada por nuestros clientes como software web desde el cual investigadores y usuarios en general pueden cargar datos y visualizarlo de múltiples formas.
Aplicaciones personalizadasHerramienta web con los análisis recurrentes o por demanda para las fuentes particulares del cliente. Se puede incluir cualquier combinación de visualizaciones o algoritmos para que los usuarios del clientes puedan explorar la información.

Quiénes usan nuestras herramientas

CAFConsolidación de información para análisis de política pública y exploración de datos abiertos en temas de movilidad para América Latina. Herramienta de visualización de datos alrededor de temas de violencia y conflicto en los últimos 40 años en Colombia.
MacrowiseHerramienta de análisis cuantitativo y soporte de visualizaciones sobre activos financieros para portafolios de inversión macro
Centro MemoriaHerramienta de visualización de datos alrededor de temas de violencia y conflicto en los últimos 40 años de Colombia
Fundación CoronaConsolidación de bases de datos y plataforma web de visualización de datos públicos en ciudatos
La Silla VacíaMúltiples interactivos y visualizaciones de datos sobre temas de elecciones y análisis de redes de poder
GEMAplicación web de análisis de textos y generación de gráficas sobre temas de emprendimiento a partir de encuestas y textos
UniandesInfraestructura Visible. Portal de datos, análisis, visualización y recursos con todos los datos sobre infraestructura del país.
Transparencia por ColombiaPortal de visualización y recursos sobre casos y actores de corrupción en Colombia con datos y reportes descargable

Detalle Proyectos Seleccionados

Infraestructura Visible

Portal en desarrollo con un primer prototipo funcional en vivo creado en conjunto con la Universidad de Los Andes que compila todos los datos sobre infraestructura del país. Un reto importante del proyecto es la agregación de diferentes bases de datos de múltiples fuentes, muchas veces dispares. El proyecto consolida la información sobre la infraestructura de transporte (aeropuertos, vías, vías férreas, puertos, etc), infraestructura productiva y energética (centrales, líneas de transmisión, oleoductos, etc) e infraestructura social (colegios, universidades, hospitales, centros de reclusión, etc).

Todos los datos son libres, se pueden visualizar directamente dentro de la plataforma y tienen el objetivo de brindar mejores herramientas para que ciudadanos o investigadores puedan analizar la situación del país ciudadanos con datos factuales.

Monitor Ciudadano

El Monitor es una plataforma de datos abiertos y públicos que visibiliza, cualifica y analiza la corrupción en el país. En su lanzamiento en agosto de este se analizó la "Corrupción en territorios de paz". Cuenta con acceso a las fichas con la información descargable de los casos más emblemáticos de corrupción en el país. El Monitor Ciudadano dentro de su propósito de análisis histórico y estructural de la corrupción cuantifica la corrupción contabilizando los escándalos de corrupción y cualificar la corrupción respondiendo a varias preguntas: ¿Cómo se genera la corrupción?¿Qué sector está afectado por la corrupción?¿Quiénes son los corruptos?¿Dónde actúa la corrupción?. Todo esto tras un proceso de recopilación, estructuración de información y análisis de datos.

Periodismo de datos: La Silla Vacía

Con La Silla Vacía hemos realizado diferentes aplicaciones de datos que facilitan la comunicación de información para una audiencia general, con un enfoque que facilita la toma de decisiones para los ciudadanos a múltiples niveles. Entre los trabajos realizados se encuentran las visualizaciones de redes de poder de políticos y sus conexiones, o de la composición de las juntas directivas del país. Hemos creado diferentes aplicaciones para la toma de decisiones en época electoral, como el Tan Cerca Tan Lejos que permite a los ciudadanos saber con cuáles posturas de candidatos se tiene más afinidad a partir del análisis de datos con unas preguntas clave. El mismo ejercicio se realizó para el plebiscito con un termómetro que permitía a los ciudadanos conocer si se inclinaban más por el Sí o por el No, a partir de las respuestas a ciertas preguntas clave.

Datasketch

Datasketch es un portal de periodismo de investigación y de datos, donde periodistas, científicos de datos, científicos sociales y la ciudadanía en general puede aprender y consultar sobre visualizaciones de datos, herramientas, software e investigaciones profundas sobre diversos temas coyunturales, o no coyunturales. Lideramos diferentes proyectos sociales, políticos, económicos, ambientales y culturales y nos esforzamos en trabajar por la transparencia y el acceso a la información y en velar que las instituciones públicas nos entreguen la información que por derecho pedimos.

Proyectos de datos + periodismo

Nuestro portal permite que periodistas, científicos de datos, científicos sociales y la ciudadanía en general puede aprender y consultar sobre visualizaciones de datos, herramientas, software e investigaciones profundas sobre diversos temas coyunturales. Contamos con herramientas gratuitas de datos y diferentes proyectos para tender un puente entre los datos y la ciudadanía que facilite la democratización del conocimiento y una revisión crítica de las realidades sociales a partir de contrastes de información.

Queremos datos

Plataforma que ayuda a la ciudadanía a hacer efectivo su derecho a la información por medio de derechos de petición. Te ayuda a formular tus derechos de petición y pública en línea las respuestas y los datos.

Investigaciones

Árboles de Bogotá: Reportaje a profundidad que analiza la realidad arbórea en la ciudad, las características que determinan la estrategia de siembra en la ciudad, y hasta qué punto los árboles existentes permiten mitigar la huella ambiental en Bogotá.

Derechos humanos y líderes asesinados: Investigación a profundidad que quiere visibilizar en qué anda Colombia en tema de Derechos Humanos y por qué los líderes sociales están siendo asesinados en un ambiente de posacuerdo.

Cocina colombiana: Proyecto que quiere extraer a datos todas las recetas del famoso libro de Cocina Colombiana y poder desglosar desde recetas, hasta platos por región, vegetarianos o no vegetarianos, animales silvestres en peligro de extinción entre muchas otras cosas. Esta es una apuesta para que la gente se apropie y conozca la cocina típica de las diferentes regiones del país.

Whois

Es una base de datos abierta que contienen todas las relaciones de poder que hay en Colombia, mapeando las familias con tradición política, los diferentes cargos que ha tenido cada político, así como los escándalos de corrupción en los que se han visto involucrados.

Apps de visualización

Desde la plataforma de Datasketch se pueden encontrar herramientas de análisis de datos, limpieza y más de 200 gráficos para visualizar los datos que los usuarios carguen. Se pueden realizar visualizaciones desde las más simples como diagramas de tortas o barras, hasta nubes de palabras, redes o mapas de calor.

Ejercicios de apropiación ciudadana

Urbano: Proyecto de visualizaciones callejeras que consiste en entregarle a grupos de ciudadanos o individuos materiales como lana, tizas, vinilos adhesivos, tijeras y cintas de colores entre muchas cosas, para que puedan intervenir los espacios públicos como parques, aceras, postes de luz y canecas de basura con datos.

Datos & Guaros: Es un espacio para compartir y difundir experiencias con datos, desde proyectos, investigaciones o inquietudes personales, hasta herramientas y software especializado. Estos eventos quieren nutrir la comunidad que trabaja con datos en Colombia y Latam.

Equipo

Juan Pablo Marín Díaz: Científico de datos. Ingeniero electrónico con máster en estadística computacional. Experto en ciencia de datos con aplicaciones en múltiples áreas como la economía, hidrología y periodismo.

María Isabel Magaña: Periodista con máster en periodismo de investigación, Datos y Visualización. Ha liderado el derecho al acceso a la información por medio de la plataforma queremos datos

Camila Achuri: Estadística y experta en lenguaje de programación R. Ha desarrollado diversas aplicaciones de visualización de datos en temas de movilidad y datos abiertos.

Juliana Galvis: Politóloga y conocedora de la historia política colombiana. Actualmente lidera el desarrollo de la base de datos de las conexiones de poder.

Ana Hernández: Matemática y experta en lenguaje de programación R. Ha colaborado para diversos proyectos comoinfraestructura visible y en el desarrollo de herramientas de visualización.

David Daza:Licenciado en Electrónica. Experto en desarrollo de aplicaciones y desarrollo web con aplicaciones en periodismo de datos y gestión de contenidos de múltiples bases de datos.

Verónica Toro: Antropóloga e investigadora. Encargada de la gestión y organización de la comunidad datera en Colombia y Latinoamérica, además de apoyar las investigaciones periodísticas y la creación de bases de datos.

Andrea Cervera: Periodista y Comunicadora Social, reportera de contenido basado en datos e investigadora aplicada en temas de datos abiertos.

Otros Colaboradores

Lorena Cala: Diseñadora con experiencia en diseño de producto y en metodologías de Design Thinking para creación de productos y soluciones.

Eliana Vaca: Diseñador gráfica con experiencia en usabilidad y en creación de contenido periodístico y visualización de datos.

Wim van der Ham:Científico de datos. Físico con máster en Inteligencia Artificial. Experiencia en implementación de soluciones de Machine Learning para múltiples industrias.