Modélisation prédictive et apprentissage statistique avec R / Stéphane Tufféry,...

Livre

Tufféry, Stéphane (1965-....). Auteur

Edited by Éditions Technip - 2017

Issu de formations devant des publics variés, cet ouvrage présente les principales méthodes de modélisation de statistique et de machine learning, à travers le fil conducteur d'une étude de cas. Chaque méthode fait l'objet d'un rappel de cours et est accompagnée de références bibliographiques, puis est mise en oeuvre avec des explications détaillées sur les calculs effectués, les interprétations des résultats et jusqu'aux astuces de programmation permettant d'optimiser les temps de calcul. À ce sujet, une annexe est consacrée au traitement des données massives. L'ouvrage commence par les méthodes de classement classiques les plus éprouvées, mais aborde rapidement les méthodes plus récentes et avancées : régression ridge, lasso, elastic net, boosting, forêts aléatoires, Extra-Trees, réseaux de neurones, séparateurs à vaste marge. Chaque fois, le lien est fait entre la théorie et les résultats obtenus pour montrer qu'ils illustrent bien les principes sous-jacents à ces méthodes. Mais l'aspect pratique est aussi privilégié, avec l'objectif de permettre au lecteur une mise en oeuvre rapide et efficace dans son travail concret. L'exploration et la préparation préliminaire des données sont d'ailleurs décrites, ainsi que le processus de sélection des variables. Une synthèse finale est faite de toutes les méthodes présentées. La mise en oeuvre s'appuie sur le logiciel libre R et sur un jeu public de données. Ce dernier peut être téléchargé sur internet et présente l'intérêt d'être riche, complet et de permettre des comparaisons grâce aux nombreuses publications dans lesquelles il a servi. Le logiciel statistique utilisé est R, actuellement celui qui se développe le plus : devenu la lingua franca de la statistique et l'outil le plus répandu dans le monde académique, il prend également de plus en plus de place dans le monde de l'entreprise, à tel point que tous les logiciels commerciaux proposent désormais une interface avec R. Outre qu'il est disponible pour tous, dans de multiples environnements, il est aussi le plus riche statistiquement et c'est le seul logiciel permettant de mettre en oeuvre toutes les méthodes présentées dans cet ouvrage. Enfin, son langage de programmation particulièrement élégant et adapté au calcul mathématique permet de se concentrer dans le codage sur les aspects statistiques. R permet d'arriver directement à l'essentiel et de mieux comprendre les méthodes exposées dans l'ouvrage. [Source : 4e de couv.]

Vérification des exemplaires disponibles ...

Se procurer le document

Vérification des exemplaires disponibles ...

Suggestions

Du même auteur

Data mining and statistics for decision making / Stéphane Tufféry, traduit ...

Livre | Tufféry, Stéphane (1965-....). Auteur | 2011

"This practical guide to understanding and implementing data mining techniques discusses traditional methods--cluster analysis, factor analysis, linear regression, PLS regression, and generalized linear models--and recent methods-...

Data mining et statistique décisionnelle : la science des données / Stéphan...

Livre | Tufféry, Stéphane (1965-....). Auteur | 2017 - 5ee édition actualisée et augmentée

Le data mining et la data science sont de plus en plus répandus dans les entreprises et les organisations soucieuses d'extraire l'information pertinente de leurs bases de données, qu'elles peuvent utiliser pour expliquer et prévoi...

Big data, machine learning et apprentissage profond / Stéphane Tufféry,...

Livre | Tufféry, Stéphane (1965-....). Auteur | 2019

Dans cet ouvrage, les Big Data sont abordées du point de vue des applications, des méthodes d'analyse et de modélisation, des outils informatiques, et de l'optimisation de la programmation dans R et dans d'autres logiciels, dont S...

Du même sujet

Gestion de portefeuille et marchés financiers / Pascal Alphonse,... Gérard ...

Livre | Alphonse, Pascal (1967-2023). Auteur | 2017 - 2e édition [enrichie]

La 4e de couverture précise : "Conçu par des spécialistes réputés, ce manuel traite des concepts fondamentaux de l'évaluation des actifs financiers, de la théorie financière et des techniques à maîtriser pour exercer les métiers d...

Analyse de données avec Python / Wes McKinney

Livre | McKinney, Wes (1985-....). Auteur | 2021 - [2e édition]

"Découvrez des techniques éprouvées pour manipuler, traiter, nettoyer et reformer des jeux de données en Python. À jour des dernières versions 3.x de Python, ce guide regorge d'études de cas pratiques montrant comment résoudre eff...

Data scientist et langage R : guide d'autoformation à l'exploitation intell...

Livre | Laude, Henri (1958-....). Auteur | 2018 - 2e édition

Statistiques pour l'économie et la gestion / Anderson, Sweeney, Williams......

Livre | Anderson, David Ray (1941-....). Auteur | 2015 - 5e édition

Tout le PASS & LAS en QCM et exercices : tout le tronc commun du parcours a...

Livre | Fredon, Daniel (1944-....) - enseignant-chercheur en mathématiques. Directeur de publication | 2024 - 2024-2025

Pour réussir les examens de PASS et de L.AS permettant d'accéder aux études de médecine, vous devez maîtriser un grand nombre de connaissances mais aussi savoir les restituer en temps limité le jour de l'examen. Tout le programme ...

Python pour la data science / Jake VanderPlas

Livre | VanderPlas, Jacob T. (19..-....). Auteur | 2022

Pour de nombreux chercheurs, Python constitue l'outil de prédilection en raison de ses riches librairies de fonctions de traitement et d'analyse de données. S'il existe des livres et tutoriels dédiés à ces différentes librairies, ...

Chargement des enrichissements...