HOME
Bienvenue !
Python, SAS, R, NodeJS, PHP ... Gorenja.com vous propose des ressources en libre accès !
Nos datasets
Heptathlon Londres 2017 vs Qatar 2019
Performances des 5 premières athlètes féminines aux championnats du monde d'heptathlon de Londres 2017 et du Qatar 2019.
L'intérêt de ce dataset réside dans le fait qu'il présente plusieurs types de variables et, par ailleurs, que chaque individu statistique est associé a suffisamment de variables quantitatives pour illustrer une relation de c...
Publié le 2022-11-01
Salariés par division
Ce dataset comporte une liste de 186 salariés repartis selon leur service (comptabilité, informatique, etc ...). Le sexe (H ou F) du salarié est également indiqué.
Par ailleurs figure dans ce dataset les réponses de chacun de ces salariés à deux sondages dont la seule et unique question était : Etes-vous fumeur ou non-fumeur ?
Les deux so...
Publié le 2022-11-02
Age des adhérents d'un club de pétanque
Retrouvez dans ce dataset l'âge des adhérents d'un club de pétanque repartis selon leur affiliation à une structure de province ou de région parisienne.
Ce dataset sera particulièrement intéressant pour illustrer une analyse descriptive univariée.
Publié le 2022-11-03
Salaires des cadres par secteur d'activité
Ce dataset liste les salaires d'un échantillon de cadres affiliés à une mutuelle. Les cadres sont répartis selon leur secteur d'activité.
Ce dataset pourra être exploité notamment pour illustrer une analyse descriptive univariée.
Publié le 2022-11-04
Echantillonnage d'une ensacheuse de riz
Vous trouverez dans ce dataset le poids de paquets de riz produits par une ensacheuse, programmée pour sortir des paquets de 500gr. Deux échantillons indépendants (A et B), de 30 paquets chacun, ont été prélevés respectivement avant et après maintenance de la machine.
Ce dataset peut être intéressant pour illustrer sur chacun des 2 échantillon...
Publié le 2022-12-26
Atelier fitness
Ce dataset regroupe les adhérents d'un club de gym inscrits à un atelier fitness sur le point d'être lancé. 150 membres sont repartis en 4 groupes. Chaque groupe compte respectivement 35, 22, 41 et 52 membres. Pour chaque membre nous trouvons son âge, son sexe et son poids.
L'intérêt de ce dataset réside, entre autres, dans la répartition en p...
Publié le 2023-01-04
Transactions immobilières
Vous trouverez dans ce dataset une liste de 135 appartements vendus dans un arrondissement d'une grande ville de province.
Ce dataset pourra notamment servir à illustrer des relations de corrélations entre variables ou encore des modèles de régression.
Publié le 2023-01-05
Notes des élèves I
Ce petit dataset regroupe les notes de 10 élèves d'une même classe dans 2 matières différentes (Mathématiques et sciences).
Ce dataset sera principalement utilisé pour illustrer le lien de corrélation entre 2 variables quantitatives.
Publié le 2023-01-05
Notes des élèves II
Dans ce dataset figure une liste de 40 élèves de deux classes distinctes (20 élèves par classe). Pour une même évaluation, chacun de ces élèves a été noté par deux professeurs. Vous trouverez donc, pour chaque élève, sa classe, la note attribuée par le professeur 1 et la note attribuée par le professeur 2.
Ce dataset pourra notamment servir a ...
Publié le 2023-01-06
Rendement des variétés de blé d'hiver
Ce dataset est issu de tests menés par un institut d’agronomie. Celui-ci procède à des sélections entre quatre variétés de blé d’hiver en vue d’effectuer des croisements. Deux variétés présentent une phase d’épiaison précoce, les deux autres une phase d’épiaison tardive.
Les semences sont réparties dans 3 serres distinctes. Chaque serre est so...
Publié le 2023-01-12
Base clients à nettoyer
Ce dataset constitue la base clients d'une société de commerce en ligne. Il comporte des informations textuelles et numériques.
Ce dataset comporte plusieurs problèmes ou incohérences. Il est par conséquent intéressant pour étudier le nettoyage de données et le retraitement de valeurs manquantes.
Ci-dessous les problèmes constatés :
...
Publié le 2023-01-28
En-têtes de commandes
Ce dataset regroupe les données d'en-tête de 168 commandes. Les identifiants clients correspondent à des individus issus de la base client présente sur Gorenja.com et disponible
ici
.
Ce dataset est intéressant pour travailler notamment sur les dates, les délais, etc ... ...
Publié le 2023-03-22
Base de données articles
Cette base de données mySQL compte 4 tables : une base d'articles, les catégories hiérarchisées associées, les matières dont ils sont faits ainsi que leurs prix dans le temps.
Cette base est au format sql. Elle est intéressante pour travailler sur les modèles relationnels ou le langage SQL.
Le fichier téléchargeable est un fichier ...
Publié le 2023-08-13
Time Serie I - Nombre moyen de visiteurs
Ce fichier recense le nombre moyen de visiteur par jour d'un site internet. L'unité est le mois et les données couvrent la période de janvier 2008 a décembre 2022, soit 15 ans.
Les données font apparaitre deux périodes distinctes qui résultent de la mise en place fin 2016 d'une stratégie SEO sur le site. Aussi la période pré-SEO suit un...
Publié le 2023-10-23