por Sangwon Yoon
05 Abril 2016
del Sitio Web 
Bloomberg 

traducción de Adela Kaufmann
Versión original en ingles

 

 

 

Este es un proyecto nacido de la comunidad de inteligencia y va en serio sobre el tema de "predecir el futuro.'

 

Esperan que esta tecnología trabaje junto con la inteligencia geoespacial, donde la ubicación de las personas y los grupos son factores a tener en cuenta.

 

Este es el sueño de un tecnócrata como herramienta de seguimiento para perfeccionar los proyectos de ingeniería social.

Fuente

 

 




 

 

Cuando James Shinn estaba trabajando para la CIA como especialista calificado de Asia oriental hace más de una década, él anhelaba las herramientas de un hombre del clima.

 

El quería ser capaz de predecir la posibilidad de que Corea del Norte probara un lanzamiento de un misil, por decir, en el lapso de un mes, fuera, por ejemplo, de un 60 por ciento. Se mantuvo una fantasía, dice, hasta ahora.

 

Shinn y su equipo de 14 personas en Predata han desarrollado un software que describe numéricamente la volatilidad y el riesgo político.

 

Aspira vastas cantidades de datos de conversaciones y comentarios en línea, los compara con patrones del pasado, y escupe una probabilidad. (Una versión del servicio de Predata es accesible en el servicio Bloomberg Professional .)

 

Shinn compara su producto con sabermetrics, la estrategia de impulso por estadísticas del béisbol popularizado en el Moneyball - La Bola de la Fortuna de Michael Lewis.

"Al reunir cuidadosamente montones y montones de estadísticas sobre su desempeño pasado de todos los rincones de Internet, estamos prediciendo cómo van a batear en el terreno de juego en el futuro, un gran número de jugadores en un equipo", dice Shinn, a modo de analogía.

 

 

James Shinn

 

 

Predata no reemplaza a los analistas humanos tanto como les ofrece una nueva herramienta. Sin que la gente elija qué seguir, raspar en metadata tiene un uso limitado.

 

Por otra parte, argumenta Shinn, mientras las empresas de análisis de riesgos están ofreciendo a sus clientes cada vez más porcentajes numéricos, los datos a menudo se extraen del aire.

"Este es un índice de riesgo calculado cuidadosamente e impulsado por una máquina," dice Shinn, el fundador y CEO de la empresa. "No hay una puntuación arbitraria por un analista humano."

Cada día, Predata supervisa alrededor de 1,000 entradas en Twitter, 10,000, 50,000 páginas de Wikipedia, vídeos de YouTube, y varias docenas de periódicos y revistas en unos 200 países.

 

Cubre 300 temas, incluyendo noticias sobre empresas en particular, el debate sobre el Reino Unido saliendo de la Unión Europea, y las decisiones de tipos de interés de los bancos centrales.

 

 

 

El panorama Digital desde el 01 de octubre de 2015-15 de marzo de 2016:

analizando el período previo a los ataques de Bélgica

 

Un conjunto de tres señales –comprendiendo colectivamente la cobertura de los sitios de ataque y el ataque anterior de ISIL en Bélgica - todo sustancialmente elevado antes del ataque del 22 de marzo.

 

Picos en volatilidad de conversaciones alrededor de Metro de Bruselas en francés el 08 de febrero de 2016 y

el 27 de febrero de 2016

 

Picos en volatilidad de conversaciones en el

aeropuerto de Bruselas en árabe en 08 de

marzo de 2016

 

Volatilidad consistentemente elevada en conversaciones en francés acerca del ataque de ISIL de mayo 2014 en el Museo Judío de Bélgica desde finales de diciembre de 2015 a través del 15 de marzo de 2016

30 días antes del

ataque del 22 de marzo

 

 

 

Los datos históricos son de suma importancia.

 

Por ejemplo, Predata no hizo una predicción estadísticamente útil para los ataques en Bruselas, Bélgica del 22 de marzo, en parte porque había experimentado pocos incidentes de este tipo.

 

El software necesita al menos cinco eventos anteriores para encontrar una correlación entre las conversaciones digitales y un acto de terrorismo, según Shinn.

 

Francia, por el contrario, había sido testigo de 13 incidentes previos a los ataques de París el 13 de noviembre; la compañía dice que su modelo indicó la probabilidad de un evento por lo menos en un 61 por ciento con un mes de antelación.

 

Del mismo modo, el 27 de diciembre, Predata dice que calcula una probabilidad del 68 por ciento que Corea del Norte podría participar en alguna actividad respecto a las armas de destrucción masiva en el lapso de 45 días. Casi dos semanas después, el 6 de enero, el régimen de Kim Jong Un llevó a cabo cuarta prueba nuclear de la nación.

 

Shinn, quien se desempeñó como secretario adjunto para Asia Oriental en el Departamento de Defensa de Estados Unidos tras su paso por la CIA, comenzó a desarrollar la tecnología en 2014 mientras enseñaba en su alma mater, Princeton y era miembro de la junta consultiva de Kensho Technologies, un desarrollador de software de análisis para el manejo de la inversión.

 

El CEO de Kensho, Daniel Nadler, y Shinn experimentaron en su tiempo libre con un prototipo crudo que supervisaba las conversaciones en línea entre los sindicatos de Sudáfrica, pensando en que los datos ofrecían una manija sobre la volatilidad del país.

 

Encontraron que la argumentación de ida y vuelta en Inglés y Afrikaans en sitios tan públicos como las páginas de la Wikipedia de los sindicatos se dispararon antes de que ocurrieran las huelgas en minería, después de lo cual los precios del oro y de platino subieron.

 

Shinn contrató a uno de sus estudiantes, Andrew Choi, para construir un algoritmo más sofisticado, una parte del cual utiliza una especificación ideada por la Inteligencia Avanzada de Proyectos de Investigación Actividad (IARPA), una organización que conduce la investigación en tecnología innovadora en la Oficina del Director de Inteligencia Nacional.

"Predata está muestreando un patrón más amplio, más complejo antes y después de los acontecimientos", dice Choi.

 

"Estamos caracterizando patrones de comportamiento más grandes por muchas personas a través de Internet y luego buscamos recurrencia de estos patrones como "alerta temprana", de que un evento de este tipo está a punto de repetirse."

 

Los dolientes fuera del restaurante Le Carillon,

Después de los ataques en París, el 16 de noviembre de 2015.

Fotógrafo: Simon Dawson / Bloomberg

 

 

Choi, ahora director de tecnología de Predata, dice que la compañía puede atraer enlaces directos de las conversaciones digitales a la volatilidad geopolítica, y de allí a las acciones colectivas tales como huelgas, protestas y movimientos de tropas.

 

Hubo una oleada de comentarios a noticias acerca de Rusia y Ucrania antes de la invasión de Crimea de Rusia, por ejemplo, y un fuerte aumento de los participantes conversando en la página de Wikipedia en lengua francesa sobre el Estado Islámico antes de los ataques de París .

"Hay una forma característica de que la narrativa de un determinado evento se construya antes y después de ese evento ha tenido lugar", dice Choi.

 

El paisaje digital hasta los ataques en los alrededores de París

El 13 de noviembre de 2015.

Fuente: Predata

 

 

A medida que la actividad se intensifica, Predata reúne los metadatos - por ejemplo, cómo muchas personas editan una página de Wikipedia sobre un ataque terrorista y la rapidez con que esos cambios son disputados - y con efectos retroactivos que coinciden con las señales estadísticas contra conjuntos de eventos históricos, para predecir la probabilidad de eventos similares, dice Shinn.

"Los rusos gastan mucho tiempo y dinero moldeando la narrativa sobre las intenciones y las acciones rusas, y los chicos en Beijing hacen lo mismo sobre el Mar del Sur de China."

El resultado, dice, es que los actores dejan huellas.

 

Sus intereses de propaganda prevalecen sobre su deseo de seguridad operacional.

 

Los gobiernos comenzaron a utilizar los primeros modelos computacionales en la Segunda Guerra Mundial para descifrar mensajes alemanes y automatizar la focalización de las armas antiaéreas. 

 

En la década de 1960, las empresas e instituciones de investigación comenzaron a comercializar modelos para una variedad de usos, desde decidir el riesgo de crédito hasta predecir el tiempo.

 

El negocio ha evolucionado hasta convertirse en cientos de empresas que persiguen tres enfoques generales para la gestión del riesgo y la volatilidad:

  • priorización de nuevas y mejores fuentes de datos

  • centrándose en mejores formas de condensar los datos

  • combinando los dos para predecir la probabilidad

El cofundador de Microsoft Paul Allen invirtió en BlackSky Global con sede en Seattle, que tiene previsto poner en marcha una flota de 60 satélites el próximo año para escanear la mayor parte del planeta hasta 70 veces al día.

 

Spaceknow con sede en San Francisco combina las imágenes de más de 6,000 instalaciones industriales con algoritmos para crear un índice de producción de las fábricas de China.

 

Las compañías tales como BanjoCytora, y Dataminr monitorean las redes sociales e Internet para realizar un seguimiento de eventos lo más cerca al tiempo real como sea posible. Se especializan en la detección de disturbios o protestas tan pronto como son reportadas en la Web, alertando a los clientes a la evolución y haciendo la información de fácil digestión.

 

Predata es el único hasta ahora produciendo una métrica de predicción generada por algoritmo.

 

La compañía ya está ampliando sus conclusiones, aplicándolas a los índices de acciones, renta variable, los tipos de cambio de divisas, materias primas, y los diferenciales de crédito-swap-por-defecto, y dice que ha encontrado una correlación entre las señales medidas y los precios de los distintos activos.

 

Predata también realiza un seguimiento de los chats sobre vídeos de YouTube de ruedas de prensa de gobernadores de bancos centrales para predecir las decisiones de las tasas.

 

KalevLeetaru, investigador principal de la Universidad George Washington, inició el Proyecto GDELT en 2013, una base de datos gratuita, a disposición del público de todos los medios del mundo en formatos impresos, audiovisuales y web en más de 100 idiomas, que se remonta a partir del 1 de enero, 1979 hasta la actualidad.

 

GDELT utiliza más de 40 algoritmos para traducir al Inglés y procesa metadatos de los medios de comunicación en tablas, permitiendo a los individuos y a las organizaciones manejar los análisis de riesgo a la medida.

 

También proporciona una línea de tiempo en tiempo real midiendo la inestabilidad en los países, dijo Leetaru, añadiendo que GDELT planea lanzar una serie de plantillas de prototipo a finales de este año, pronosticando riesgo según la ubicación y el tipo de eventos volátiles.

 

Un riesgo del enfoque de Predata es el potencial de ser alcanzado por un inteligente partido hostil.

 

Shinn y Choi sostienen, sin embargo, que las 'comprobaciones y balances democráticos' de la Internet y la abundancia de puntos de datos mantendrán la tecnología de Predata relativamente a salvo de los intentos de engañarla.

 

Dice Choi,

"Ni siquiera es que usted esté tratando de hablar sobre un tema de forma favorable. Es el hecho de que usted esté hablando de ese tema en absoluto - esa es una señal."