BigDataFr recommande : Spark contre MapReduce – quelle solution pour les entreprises « Out MapReduce. La percée fut belle, mais les développeurs Big Data actuels ont faim de simplicité et de rapidité. Et quand il s’agit de choisir un framework pour exécuter des tâches dans un environnement Hadoop, ils sont de plus en plus nombreux à […]
Hadoop
[O’R] BigDataFr recommends: The O’Reilly Data Show Podcast-Alice Zheng Strata + Hadoop #machine learning
BigDataFr recommends: The O’Reilly Data Show Podcast-Alice Zheng Strata + Hadoop Bridging the divide – Business users and machine learning experts […] ‘As tools for advanced analytics become more accessible, data scientist’s roles will evolve. Most media stories emphasize a need for expertise in algorithms and quantitative techniques (machine learning, statistics, probability), and yet the […]
[O’R] BigDataFr recommends: Hadoop for business – Analytics across industries
BigDataFr recommends: Hadoop for business – Analytics across industries Ben Sharma on the business impact of Hadoop and the evolution of tools ‘In this episode of the O’Reilly Podcast, O’Reilly’s Ben Lorica chats with Ben Sharma, CEO and co-founder of Zaloni, a company that provides enterprise data management solutions for Hadoop. Sharma was one of […]
[CIO] BigDataFr recommends: 5 things CIOs need to know about data lakes #datascientist
BigDataFr recommends: 5 things CIOs need to know about data lakes ‘1.The concept is still quite new. The term data lake, credited to Pentaho CTO James Dixon, has been bandied about for several years. But the idea of data lakes as corporate resources is still in its infancy, according to IDC analyst Ashish Nadkarni. A […]
[Decideo] BigDataFr recommande : Le Big Data, c’est bien. Avec Hadoop et NoSQL, c’est mieux
« BigDataFr recommande : Le Big Data, c’est bien. Avec Hadoop et NoSQL, c’est mieux ! Hadoop et NoSQL – une rivalité complémentaire Outre le framework Hadoop, de nombreuses entreprises utilisent actuellement la technologie de gestion de base de données NoSQL pour traiter le Big Data. L’un et l’autre peuvent gérer des volumes de données importants […]
[HAL] BigDataFr recommends: FP-Hadoop: Efficient Execution of Parallel Jobs Over Skewed Data #datascientist
BigDataFr recommends: FP-Hadoop: Efficient Execution of Parallel Jobs Over Skewed Data Abstract ‘Big data parallel frameworks, such as MapReduce or Spark have been praised for their high scalability and performance, but show poor performance in the case of data skew. There are important cases where a high percentage of processing in the reduce side ends […]
[ZDnet] BigDataFr recommande : Pourquoi Hadoop est compliqué, comment l’aborder plus simplement
BigDataFr recommande : Pourquoi Hadoop est compliqué, comment l’aborder plus simplement « Comme l’a écrit précédemment Toby Wolpe, Gartner a sorti une étude de ses membres du Research Circle, qui montre que l’adoption de Hadoop par les entreprises n’est pas à la hauteur du buzz médiatique. Pour quasiment toute nouvelle technologie, il y a généralement un […]
[JDN] BigDataFr recommande : Quatre pistes pour optimiser vos investissements dans le Big Data
BigDataFr recommande : Quatre pistes pour optimiser vos investissements dans le Big Data « Le Big Data est bien là et il gagne en maturité. Par conséquent, un nombre croissant de décideurs IT ne réfléchissent plus à l’éventualité d’investir dans les plateformes Big Data mais se demandent plutôt comment valoriser les investissements qu’ils ont déjà engagés […]
[Forbes] BighDataFr recommends: Spark Or Hadoop – Which Is The Best Big Data Framework? #datascientist #hadoop #apache spark #machine-learning
BigDataFr recommends: Spark Or Hadoop – Which Is The Best Big Data Framework? One question I get asked a lot by my clients is: Should we go for Hadoop or Spark as our big data framework? Spark has overtaken Hadoop as the most active open source Big Data project. While they are not directly comparable […]
[JDN] BigDataFr recommande : Big Data, la 3eme phase #hadoop
BigDataFr recommande : Big Data, la 3eme phase « Avant Internet, c’est-à-dire pendant les années 70 et 80, les passionnés d’informatique et les chercheurs qui devaient déplacer des fichiers utilisaient le sneaker-net ou « réseau-basket »[1] Avec l’avènement du Big Data, ce réseau fait son grand retour. un nombre croissant d’entreprises parmi les plus importantes et […]