Besoins de données pour apprendre le Machine Learning ?
par
, 06/06/2022 à 17h08 (508 Affichages)
La clé du succès dans le domaine de l'apprentissage automatique est de pratiquer avec différents types d'ensembles de données.
Mais découvrir un ensemble de données adapté à chaque type de projet d'apprentissage automatique est une tâche difficile.
Qu'est-ce qu'un jeu de données ?
Un jeu de données est une collection de données dans laquelle les données sont organisées dans un certain ordre. Un jeu de données peut contenir n'importe quelle donnée d'une série d'un tableau à une table de base de données.
Un ensemble de données tabulaire peut être compris comme une table ou une matrice de base de données, où chaque colonne correspond à une variable particulière et chaque ligne correspond aux champs de l'ensemble de données. Le type de fichier le plus pris en charge pour un jeu de données tabulaire est le fichier séparé par des virgules ou CSV. Mais pour stocker des "données arborescentes", nous pouvons utiliser le fichier JSON plus efficacement.
Les principaux sites de jeux de données libres :
- https://www.kaggle.com/datasets
- https://archive.ics.uci.edu/ml/index.php
- https://registry.opendata.aws/
- https://toolbox.google.com/datasetsearch
- https://msropendata.com/
- https://github.com/awesomedata/awesome-public-datasets
- https://data.europa.eu/en
- https://www.visualdata.io/
- https://scikit-learn.org/stable/datasets/index.html
Rhona Helena
https://www.urbanisation-si.com/
@rhona_helena
"Pour mettre un terme définitif aux guerres, la seule issue est de développer l’art de la rencontre" Albert Jacquard