All Posts

Data Management
David Loshin 0
Big data quality with continuations

I've been doing some investigation into Apache Spark, and I'm particularly intrigued by the concept of the resilient distributed dataset, or RDD. According to the Apache Spark website, an RDD is “a fault-tolerant collection of elements that can be operated on in parallel.” Two aspects of the RDD are particularly

Analytics | Fraud & Security Intelligence
Gustavo Gutman 0
Data Streaming

Si se ha preguntado cómo manejar los datos “al vuelo”, tiene que leer esto. Primero, planteemos un par de preguntas: ¿Qué hago si necesito los datos de inmediato? ¿Cómo puedo conseguirlos más rápido? La respuesta se sintetiza en Data Streaming. La primera pregunta que siempre me hacen al respecto es: Qué apuro puede

1 534 535 536 537 538 737