[informatiquenews] BigDataFr recommande: Initiative Open Data Platform : MapR décline #hadoop #apache #machinelearning

BigDataFr recommande : Initiative Open Data Platform : MapR « MapR a été invité à participer à l’initiative Open Data Platform (ODP), une offre que la société a refusée après avoir attentivement étudié la valeur qu’elle apporte au marché. Telle qu’elle a été annoncée, l’initiative Open Data Platform est une opération marketing réussie pour Hortonworks et […]

[JDN] Avec Cloud Bigtable, Google se renforce encore dans le Big Data

BigDataFr recommande : Avec Cloud Bigtable, Google se renforce encore dans le Big Data « Google livre un nouveau service cloud centré sur le traitement de données en masse (Big Data). Baptisé Cloud Bigtable, il s’agit d’un serveur NoSQL taillé pour les besoins de haute performance. Permettant d’ajuster les ressources en fonction de la volumétrie à […]

[arXiv] BigDataFr recommends: On the Feasibility of Distributed Kernel Regression for Big Data #datascientist #machinelearning

BigDataFr recommends: On the Feasibility of Distributed Kernel Regression for Big Data « In modern scientific research, massive datasets with huge numbers of observations are frequently encountered. To facilitate the computational process, a divide-and-conquer scheme is often used for the analysis of big data. In such a strategy, a full dataset is first split into several […]

[O’R] BigDataFr recommends: Why VMs aren’t the solution for next-gen applications #machinelearning

BigDataFr recommends: The unwelcome guest: Why VMs aren’t the solution for next-gen applications Scale-out applications need scaled-in virtualization. « Data center operating systems are emerging as a first-class category of distributed system software. Hadoop, for example, is evolving from a MapReduce framework into YARN, a generic platform for scale-out applications. To enable a rich ecosystem of […]

[Decideo] Décider, agir et piloter autrement avec la Data visualisation

Décider, agir et piloter autrement avec la Data visualisation « La Data visualisation (Data Viz) établit une nouvelle approche dans le rapport au traitement de l’information à travers la restitution de données sous forme de représentations graphiques. Cette approche vise à optimiser les prises de décision en offrant la possibilité de détecter des phénomènes ou des […]

[databricks] Project Tungsten: Bringing Spark Closer to Bare Metal #spark #machinelearning

BigDataFr recommends: Project Tungsten: Bringing Spark Closer to Bare Metal « In a previous blog post, we looked back and surveyed performance improvements made to Spark in the past year. In this post, we look forward and share with you the next chapter, which we are calling Project Tungsten. 2014 witnessed Spark setting the world record […]

[arXiv] BigDataFr highly recommends: Leading Undergraduate Students to Big Data Generation #datascientist #machinelearning #conceptlearning

BigDataFr highly recommends: Leading Undergraduate Students to Big Data Generation Introduction « People are facing a flood of data today. Data are being collected at unprecedented scale in many areas, such as networking[14][2][4], image processing[15 ][5], visualization[12], scientific computation, data base[17][18], and algorithms. The huge data nowadays are called Big Data. Big data is an all-encompassing […]

[SNCF Open Data] BigDataFr recommande : Des capteurs à la Data, un challenge digital SNCF #datascientist #machinelearning

Open Data   BigDataFr recommande : Des capteurs à la Data, un challenge digital SNCF SNCF lance le Challenge Digital avec une bonne dose de capteurs, de data, d’open source et de 3D appliqués aux trains, aux gares et aux infrastructures Au programme -12 challenges répartis en quatre thématiques -12 entreprises présélectionnées et réunies durant […]

[Forbes] BigDataFr recommends: The Challenge of Figuring Out The Right Big Data questions #datascientist #machinelearning

BigDataFr recommends: The Challenge of Figuring Out The Right Big Data questions « You know the great thing about databases? You ask them a question – or, to be more technical, you generate a query – and the answer comes back. That’s highly simplified, of course, because for your query to be successful, it has to […]