EDA · Analyse de plateforme

Hacker News —
Exploration de données

Analyse exploratoire d'un dataset Hacker News : distribution des scores, patterns de publication, types de contenus et comportements d'engagement de la communauté tech.

Python Pandas Seaborn Matplotlib Jupyter
↗ Voir le code sur GitHub
300k+
Posts
analysés
EDA
Exploration
complète
2023
Année
du dataset

Contexte & objectif

Hacker News est l'une des plateformes tech les plus influentes du monde. Ce projet explore la structure du dataset : distribution des scores, types de posts (Ask HN, Show HN, liens), et patterns généraux d'engagement.

Ce projet a servi d'exercice de prise en main des outils EDA (Pandas, Seaborn) avant d'aborder des analyses plus complexes sur des données médias.

Ce que le notebook explore

Distribution des scores : forte asymétrie, la majorité des posts obtiennent peu de points tandis qu'une minorité concentre l'attention.
Comparaison des types de posts : Ask HN, Show HN, et liens externes ont des comportements d'engagement différents.
Analyse de la distribution temporelle des publications selon les heures et les jours de la semaine.
Nettoyage des données et traitement des valeurs manquantes dans les champs textuels.

Méthode technique

Données : Dataset Hacker News public (Kaggle / archive HN).

Analyse : Nettoyage Pandas, statistiques descriptives, visualisations Seaborn et Matplotlib.

← Projet précédent
Social Media vs Traditional Media
Projet suivant →
Rhétorique conspirationniste