Machine learning et courses hippiques

Vos méthodes, critères pour tout ce qui s'applique au monde des courses et du Turf...

Modérateur : Modos

Répondre
turf-ia.com
Poussin
Poussin
Messages : 8
Enregistré le : 24 janv. 2021, 21:13

Machine learning et courses hippiques

Message par turf-ia.com »

Bonjour à tous,

J'ai commencé à rédiger quelques articles sur le machine learning et les courses hippiques.

Dans un premier temps, les articles vous montreront comment analyser les données. Par exemple, on verra les différents types de variables. Comment traiter.

Si vous avez votre propre base de données, vous commencez probablement à rencontrer quelques difficultés : vous vous rendez compte que votre ensemble de données est sale, qu'il manque beaucoup de valeurs, que certaines variables contiennent des étiquettes au lieu de chiffres, que d'autres ne correspondent pas aux hypothèses des modèles et, par-dessus tout, vous vous demandez si c'est la bonne façon de coder les choses.

Ce blog vous aidera ! Vous apprendrez une grande variété de techniques d'ingénierie utilisées dans le monde entier dans différentes organisations et dans des concours de science des données, pour nettoyer et transformer vos données et vos variables. Vous pourrez à terme analyser plus facilement les courses hippiques et peut-être trouver plus facilement les gagnants pour le quinté ou le jeu simple.

Qu'allez-vous apprendre ?
J'ai rassemblé une grande collection de techniques d'ingénierie des données, basée sur des articles scientifiques, des livres blancs, des concours de science des données et bien sûr sur ma propre expérience en tant que spécialiste des données.

Plus précisément, vous apprendrez :

• Comment imputer vos données manquantes
• Comment encoder vos variables catégorielles
• Comment transformer vos variables numériques pour qu'elles correspondent aux hypothèses du modèle ML
• Comment convertir vos variables numériques en intervalles discrets
• Comment éliminer les valeurs aberrantes
• Comment traiter les variables de date et d'heure
• Comment traiter les variables mixtes qui contiennent des chaînes de caractères et des chiffres

Tout au long des articles de ce blog, vous allez apprendre de multiples techniques pour chacune des tâches mentionnées, et vous apprendrez à mettre en œuvre ces techniques de manière élégante, efficace et professionnelle, en utilisant Python, NumPy, Scikit-learn, pandas etc…

Vous serez en mesure de mettre en œuvre toutes vos étapes d'ingénierie des fonctionnalités dans un pipeline unique et élégant, qui vous permettra de mettre en production vos modèles prédictifs pour les courses hippiques avec une efficacité maximale.

https://turf-ia.com/presentation-du-jeu ... hippiques/

N'hésitez pas à commenter ici ou sur le blog.
turf-ia.com
Poussin
Poussin
Messages : 8
Enregistré le : 24 janv. 2021, 21:13

Re: Machine learning et courses hippiques

Message par turf-ia.com »

Cette semaine on continue notre exploration avec les variables catégorielles comme la musique ou les hippodromes

https://turf-ia.com/les-variables-categorielles/
turf-ia.com
Poussin
Poussin
Messages : 8
Enregistré le : 24 janv. 2021, 21:13

Re: Machine learning et courses hippiques

Message par turf-ia.com »

Cette semaine comment gérer les dates et surtout comment trouver les mois présentant la meilleure réussite.

https://turf-ia.com/les-variables-de-type-date-heure/
foufie
Professionnel
Professionnel
Messages : 485
Enregistré le : 24 févr. 2013, 21:14

Re: Machine learning et courses hippiques

Message par foufie »

bonjour
bienvenue

intéressant ton site et ton approche

j'aime bien ....
turf-ia.com
Poussin
Poussin
Messages : 8
Enregistré le : 24 janv. 2021, 21:13

Re: Machine learning et courses hippiques

Message par turf-ia.com »

Merci pour le commentaire.

J'essaie de partager mes qq connaissance en machine learning en l'appliquant au turf. Le sujet est sympa.


Cette semaine découvrons ce qu'est une variable mixte.

Les variables mixtes sont celles dont les valeurs contiennent à la fois des chiffres et des étiquettes.

https://turf-ia.com/variables-mixtes-en ... -learning/
turf-ia.com
Poussin
Poussin
Messages : 8
Enregistré le : 24 janv. 2021, 21:13

Re: Machine learning et courses hippiques

Message par turf-ia.com »

Les prochaines semaines, nous allons nous pencher sur les caractéristiques de nos différentes variables hippiques.

https://turf-ia.com/caracteristiques-de ... anquantes/
foufie
Professionnel
Professionnel
Messages : 485
Enregistré le : 24 févr. 2013, 21:14

Re: Machine learning et courses hippiques

Message par foufie »

variable mixte



On peut remarquer que la catégorie 1a est tjs celle qui est plus présente. Ce qui somme toute semble normale car en général le 1° de paris turf est plutot un favori.


que viens faire le 1 er de paris turf dans ce dernier commentaire ?
turf-ia.com
Poussin
Poussin
Messages : 8
Enregistré le : 24 janv. 2021, 21:13

Re: Machine learning et courses hippiques

Message par turf-ia.com »

Et bien comme indiqué dans la présentation du jeu de données, le dataframe est celui du 1° de paris turf

https://turf-ia.com/presentation-du-jeu ... hippiques/
turf-ia.com
Poussin
Poussin
Messages : 8
Enregistré le : 24 janv. 2021, 21:13

Re: Machine learning et courses hippiques

Message par turf-ia.com »

Caractéristiques des variables : La cardinalité

https://turf-ia.com/caracteristiques-de ... rdinalite/

Apprendre à quantifier la cardinalité
Voir des exemples de variables à cardinalité élevée et faible
Comprendre l’effet de la cardinalité lors de la préparation des trains et des jeux d’essai
Visualiser l’effet de la cardinalité sur les performances du modèle d’apprentissage machine
Répondre