EEG Brain-Computer Interface (BCI) - Total Perspective Vortex

📑 Table des matières

🌌 Total Perspective Vortex — EEG Brain-Computer Interface (BCI)
📌 Overview
📥 Télécharger le dépôt
🧠 Objectifs pédagogiques (42 / IA / ML)
🧩 Architecture du projet
🔬 1. Préprocessing & parsing EEG (MNE)
📊 Visualiser raw vs filtré
🧭 Justification scientifique : canaux & fenêtres temporelles
🎛️ 2. Extraction de features
🧮 3. Réduction de dimension (PCA, CSP, ICA…)
🧠 4. Pipeline scikit-learn
🔍 5. Entraînement
⚡ 6. Prédiction en pseudo temps réel
🧪 Tests & qualité logicielle
✅ Contraintes officielles du sujet
📚 Stack technique
- Traitement du signal / maths
- Machine Learning
- Qualité & Murphy Map
🧭 Vue d’ensemble documentation
🔎 Pourquoi cette stack ? © Licence
📖 Ressources utilisées
👤 Auteur

📌 Overview

Total Perspective Vortex est un projet de Brain-Computer Interface (BCI) utilisant des données EEG pour déterminer, en quasi temps réel, l’intention motrice d’un individu (mouvement A ou B).

Il implémente un pipeline complet :

🧠 Parsing & preprocessing EEG (MNE, filtres 8–40 Hz)
🎚️ Extraction de features (spectre, puissance, canaux × temps)
🔻 Réduction de dimension implémentée manuellement (CSP, PCA, ICA…)
🔗 Pipeline scikit-learn (baseEstimator + transformerMixin)
🤖 lassification supervisée
⏱️ Prediction < 2 secondes (lecture pseudo temps réel)
📈 Validation croisée (cross_val_score)
🧪 Accuracy ≥ 75 % sur sujets non vus – métrique obligatoire

Le travail final ne contient que le code Python ; le dataset EEG Physionet n’est pas versionné.

📥 Télécharger le dépôt

Cloner le projet depuis GitHub :

git clone https://github.com/raveriss/Total_Perspective_Vortex.git
cd Total_Perspective_Vortex

🧠 Objectifs pédagogiques (42 / IA / ML)

Concevoir un pipeline ML complet sur données EEG
Implémenter un algorithme mathématique de réduction de dimension
Intégrer ce module dans un pipeline scikit-learn
Traiter un flux temps réel
Travailler sur un dataset bruité (EEG réel)
Manipuler MNE, NumPy, Pandas, SciPy, scikit-learn
Construire des métriques reproductibles et un score fiable
Préparer une défense solide (norme 42 + compréhension algorithmique)

🧩 Architecture du projet

Total_Perspective_Vortex/
.
├── AGENTS.md
├── author
├── codecov.yml
├── create_tpv_fields.sh
├── data
├── docs
│   ├── assets
│   │   ├── image01.png
│   │   └── image02.png
│   ├── index.md
│   ├── metrics
│   │   ├── eval_payload.json
│   │   └── eval_payload.npz
│   ├── project
│   │   ├── benchmark_results.json
│   │   ├── benchmark_results.md
│   │   ├── checklist_wbs_matrix.md
│   │   ├── gantt_tpv.png
│   │   ├── physionet_dataset.md
│   │   ├── roadmap.md
│   │   ├── splits_metrics.md
│   │   ├── split_strategy.md
│   │   └── wbs_tpv.md
│   ├── risk
│   │   └── tpv_murphy_map.csv
│   ├── total_perspective_vortex.en.checklist.pdf
│   └── Total_Perspective_Vortex.en.subject.pdf
├── LICENSE
├── Makefile
├── mybci.py
├── poetry.lock
├── poetry.toml
├── pyproject.toml
├── README.md
├── scripts
│   ├── aggregate_accuracy.py
│   ├── aggregate_experience_scores.py
│   ├── aggregate_scores.py
│   ├── benchmark.py
│   ├── fetch_physionet.py
│   ├── __init__.py
│   ├── predict.py
│   ├── prepare_physionet.py
│   ├── sync_dataset.py
│   ├── train.py
│   └── visualize_raw_filtered.py
├── src
│   └── tpv
│       ├── classifier.py
│       ├── dimensionality.py
│       ├── features.py
│       ├── __init__.py
│       ├── pipeline.py
│       ├── predict.py
│       ├── preprocessing.py
│       ├── __pycache__
│       │   ├── classifier.cpython-310.pyc
│       │   ├── dimensionality.cpython-310.pyc
│       │   ├── features.cpython-310.pyc
│       │   ├── __init__.cpython-310.pyc
│       │   ├── pipeline.cpython-310.pyc
│       │   ├── preprocessing.cpython-310.pyc
│       │   └── utils.cpython-310.pyc
│       ├── realtime.py
│       ├── train.py
│       └── utils.py
└── tests
    ├── test_aggregate_scores_cli.py
    ├── test_benchmark.py
    ├── test_classifier.py
    ├── test_dimensionality.py
    ├── test_docs.py
    ├── test_experience_scores.py
    ├── test_features.py
    ├── test_fetch_physionet.py
    ├── test_mybci.py
    ├── test_pipeline.py
    ├── test_predict_cli.py
    ├── test_predict_evaluate_run.py
    ├── test_predict_load_data.py
    ├── test_predict_reports.py
    ├── test_prepare_physionet.py
    ├── test_preprocessing.py
    ├── test_realtime.py
    ├── test_scripts_roundtrip.py
    ├── test_sync_dataset.py
    ├── test_tpv_entrypoints.py
    ├── test_train_cli.py
    ├── test_train.py
    ├── test_utils.py
    └── test_visualize_raw_filtered.py

🚀 Mise en route : données, installation, entraînement, prédiction (Poetry + Makefile)

Le projet utilise Poetry exclusivement (aucun requirements.txt). Le Makefile expose des raccourcis vers les commandes poetry run ....

Objectif	Commande recommandée	Commande équivalente
Installer le projet + dataset	`make install`	`make install-deps && make download_dataset`
Installer les dépendances	`make install-deps`	`poetry install --with dev`
Télécharger / valider le dataset	`make download_dataset`	validation locale puis `scripts/download_dataset.py` (sources officielles PhysioNet)
Linter	`make lint`	`poetry run ruff check .`
Formatter	`make format`	`poetry run ruff format . && poetry run ruff check --fix .`
Type-check	`make type`	`poetry run mypy src scripts tests`
Tests	`make test`	`PYTEST_DISABLE_PLUGIN_AUTOLOAD=1 poetry run pytest -vv`
Coverage	`make cov`	`PYTEST_DISABLE_PLUGIN_AUTOLOAD=1 poetry run coverage run -m pytest ...`
Mutation	`make mut`	`MUTMUT_USE_COVERAGE=1 ... poetry run mutmut run`
Entraîner	`make train`	`poetry run python mybci.py 109 3 train` (par défaut)
Prédire	`make predict`	`poetry run python mybci.py 109 3 predict` (par défaut)
Temps réel	`make realtime <subject> <run>`	`poetry run python src/tpv/realtime.py <subject> <run>`
Visualiser brut/filtré	`make visualizer <subject> <run>`	`poetry run python scripts/visualize_raw_filtered.py <subject> <run>`
Moyenne des moyennes	`make compute-mean-of-means`	`poetry run python scripts/aggregate_experience_scores.py`
Benchmark global	`make mybci`	`poetry run python mybci.py`
Sanitize benchmark / profiling	`make sanitizer`	`poetry run python scripts/sanitizer.py -- make -j1 mybci wavelet`
Nettoyer	`make clean`	supprime `./artifacts` + les `*.npy` (hors `.venv`, `.git`, `artifacts`)

📦 Générer les artefacts manquants avant l'évaluation globale

L'exécution de make mybci sans arguments déclenche l'évaluation des 6 expériences (3 → 14) sur 109 sujets. Pour éviter les avertissements "aucun modèle disponible", assurez-vous que artifacts/<subject>/<run>/model.joblib existe pour chaque run visé. L'appel make mybci wavelet relaie la stratégie --feature-strategy wavelet à la CLI globale tout en journalisant la sortie dans artifacts/benchmarks/bench_YYYYmmdd_HHMMSS.log.

🧪 Diagnostiquer une commande avec `sanitizer`

make sanitizer lance scripts/sanitizer.py sur la commande make -j1 mybci wavelet par défaut et produit un dossier artifacts/sanitizer/<timestamp>/ contenant :

summary.json et summary.md
un sous-dossier par sonde (A1.make, A2, F1, P1.make, etc.)
les commandes rejouables, stdout.log, stderr.log et les artefacts associés (time.csv, time.jsonl, perf.csv, mprof.dat, pyspy.svg...)

Exemples :

make sanitizer
make sanitizer SANITIZER_ARGS='--probe A2 --time-csv-runs 20'
make sanitizer SANITIZER_COMMAND='make -j1 compute-mean-of-means'
make sanitizer SANITIZER_ARGS="--probe F1 --python-command 'python mybci.py --feature-strategy wavelet'"
make sanitizer SANITIZER_ALLOW_PRIVILEGED_TOOLS=1 SANITIZER_ARGS='--probe P1.make --probe P1.poetry --probe P2 --probe P3'
make sanitizer-privileged SANITIZER_ARGS='--probe P1.make --probe P1.poetry --probe P2 --probe P3'

Quand une sonde affiche SKIPPED ou WARN, summary.md et la sortie console incluent désormais des command: structurés :

commandes d'installation Poetry (poetry install --with dev) pour les outils Python
commandes système Ubuntu (sudo apt-get install ...) pour les binaires hors venv
commandes de fallback ou de re-run ciblé
commandes privilégiées explicites (sudo -v, puis SANITIZER_ALLOW_PRIVILEGED_TOOLS=1)

Le mode privilégié reste opt-in. Il est utile sur un poste perso pour perf, mais n'est pas activé par défaut afin de préserver le comportement canonique Ubuntu/no-sudo de la CI et des machines 42.

🖥️ Exemples d'exécution (sorties tronquées)

`make install`

raveriss@raveriss-NLx0MU:~/Desktop/Total_Perspective_Vortex$ make install
poetry install --with dev
Installing dependencies from lock file
No dependencies to install or update
Installing the current project: total-perspective-vortex (0.1.0)
Dataset incomplet: dossier racine manquant (data).
Téléchargement EEGMMIDB PhysioNet (~3.4GB), cela peut prendre du temps...
Source: https://physionet.org/files/eegmmidb/1.0.0/
...
Dataset EEGMMIDB complet et validé dans data.

`make install-deps`

raveriss@raveriss-NLx0MU:~/Desktop/Total_Perspective_Vortex$ make install-deps
poetry install --with dev
Installing dependencies from lock file
No dependencies to install or update
Installing the current project: total-perspective-vortex (0.1.0)

`make download_dataset`

raveriss@raveriss-NLx0MU:~/Desktop/Total_Perspective_Vortex$ make download_dataset
Dataset incomplet: dossier racine manquant (data).
Téléchargement EEGMMIDB PhysioNet (~3.4GB), cela peut prendre du temps...
Source: https://physionet.org/files/eegmmidb/1.0.0/
...
Dataset EEGMMIDB complet et validé dans data.

Si le dataset est déjà présent et complet, la commande sort immédiatement :

raveriss@raveriss-NLx0MU:~/Desktop/Total_Perspective_Vortex$ make download_dataset
Dataset EEGMMIDB déjà complet dans data (aucun téléchargement).

Si la connexion internet est indisponible (DNS/route), la commande échoue avec un diagnostic actionnable :

raveriss@raveriss-NLx0MU:~/Desktop/Total_Perspective_Vortex$ make download_dataset
Dataset incomplet: dossier sujet manquant (data/S001).
❌ Connexion internet indisponible ou instable: impossible de joindre PhysioNet.
- https://physionet.org/files/eegmmidb/1.0.0/ -> Temporary failure in name resolution
- https://physionet.org/static/published-projects/eegmmidb/1.0.0/ -> Temporary failure in name resolution
Diagnostic local automatique:
- ping -c 1 1.1.1.1 -> code retour 2
  stderr: ping: connect: Network is unreachable
- getent hosts physionet.org -> code retour 2
  sortie: aucune réponse
Cause probable: la machine n'a plus d'accès réseau sortant.
Action: rétablissez la connexion réseau (Wi-Fi, câble, VPN ou routage), puis relancez make download_dataset.

make download_dataset n'utilise plus d'URL configurable dans le Makefile : le script choisit dynamiquement une source officielle PhysioNet parmi les endpoints supportés.

raveriss@raveriss-NLx0MU:~/Desktop/Total_Perspective_Vortex$ make download_dataset
Dataset incomplet: dossier sujet manquant (data/S001).
Téléchargement EEGMMIDB PhysioNet (~3.4GB), cela peut prendre du temps...
Source: https://physionet.org/files/eegmmidb/1.0.0/

`make show-activate`

raveriss@raveriss-NLx0MU:~/Desktop/Total_Perspective_Vortex$ make show-activate
Commande d'activation (a executer dans le shell courant) :
source /home/raveriss/Desktop/Total_Perspective_Vortex/.venv/bin/activate
raveriss@raveriss-NLx0MU:~/Desktop/Total_Perspective_Vortex$

`Activer l'environnement`

raveriss@raveriss-NLx0MU:~/Desktop/Total_Perspective_Vortex$ source /home/raveriss/Desktop/Total_Perspective_Vortex/.venv/bin/activate
(total-perspective-vortex-py3.10) raveriss@raveriss-NLx0MU:~/Desktop/Total_Perspective_Vortex$

`make train <subject> <run>`

(total-perspective-vortex-py3.10) raveriss@raveriss-NLx0MU:~/Desktop/Total_Perspective_Vortex$ make train 1 4
CV_SPLITS: 10 (scores: 10)
[0.6667 0.6667 0.6667 0.6667 0.3333 0.3333 0.6667 1.0000 0.6667 0.3333]
cross_val_score: 0.6000

Entraîner via Makefile avec une stratégie de features :

`make train <subject> <run> <method>`

(total-perspective-vortex-py3.10) raveriss@raveriss-NLx0MU:~/Desktop/Total_Perspective_Vortex$ make train 1 3 wavelet
INFO: dim_method='csp/cssp' appliqué avant l'extraction des features.
[⚡ TPV] Extracting wavelet features...
CV_SPLITS: 10 (scores: 10)
[0.6667 0.3333 0.3333 0.6667 1.0000 0.6667 0.6667 0.6667 0.3333 1.0000]
cross_val_score: 0.6333
(total-perspective-vortex-py3.10) raveriss@raveriss-NLx0MU:~/Desktop/Total_Perspective_Vortex$

`make predict <subject> <run>`

(total-perspective-vortex-py3.10) raveriss@raveriss-NLx0MU:~/Desktop/Total_Perspective_Vortex$ make predict 1 3
epoch nb: [prediction] [truth] equal?
epoch 00: [1] [1] True
epoch 01: [0] [0] True
epoch 02: [0] [0] True
...
epoch 14: [0] [0] True
Accuracy: 1.0000

`make realtime <subject> <run>`

(total-perspective-vortex-py3.10) raveriss@raveriss-NLx0MU:~/Desktop/Total_Perspective_Vortex$ make realtime 1 3
realtime prediction window=0 offset=0.000s raw=1 (T2) smoothed=1 (T2) latency=0.000s
realtime prediction window=1 offset=0.500s raw=1 (T2) smoothed=1 (T2) latency=0.000s
realtime prediction window=2 offset=1.000s raw=1 (T2) smoothed=1 (T2) latency=0.000s
...
realtime prediction window=188 offset=94.000s raw=0 (T1) smoothed=0 (T1) latency=0.000s
realtime prediction window=189 offset=94.500s raw=0 (T1) smoothed=0 (T1) latency=0.000s
realtime prediction window=190 offset=95.000s raw=0 (T1) smoothed=0 (T1) latency=0.000s

`make mybci`

(total-perspective-vortex-py3.10) raveriss@raveriss-NLx0MU:~/Desktop/Total_Perspective_Vortex$ make mybci
experiment 0: subject 001: accuracy = 1.0000
INFO: modèle absent pour S002 R03, entraînement automatique en cours...
experiment 0: subject 002: accuracy = 0.6923
...
experiment 5: subject 109: accuracy = 1.0000

Mean accuracy of the six different experiments for all 109 subjects:
experiment 0:		accuracy = 0.8894
experiment 1:		accuracy = 0.8799
experiment 2:		accuracy = 0.9056
experiment 3:		accuracy = 0.9013
experiment 4:		accuracy = 0.8935
experiment 5:		accuracy = 0.8972

Mean accuracy of 6 experiments: 0.8945

`make mybci wavelet`

(total-perspective-vortex-py3.10) raveriss@raveriss-NLx0MU:~/Desktop/Total_Perspective_Vortex$ make mybci wavelet
experiment 0: subject 001: accuracy = 1.0000
INFO: modèle absent pour S002 R03, entraînement automatique en cours...
[⚡ TPV] Extracting wavelet features...
experiment 0: subject 002: accuracy = 0.6923
...
experiment 5: subject 109: accuracy = 1.0000

Mean accuracy of the six different experiments for all 109 subjects:
experiment 0:		accuracy = 0.8894
experiment 1:		accuracy = 0.8799
experiment 2:		accuracy = 0.9056
experiment 3:		accuracy = 0.9013
experiment 4:		accuracy = 0.8935
experiment 5:		accuracy = 0.8972

Mean accuracy of 6 experiments: 0.8945

`make compute-mean-of-means`

(total-perspective-vortex-py3.10) raveriss@raveriss-NLx0MU:~/Desktop/Total_Perspective_Vortex$ make compute-mean-of-means
Subject	T1	T2	T3	T4	Mean	Eligible(4/4)	MeetsThreshold_0p75
S001	0.962	0.895	1.000	0.933	0.947	yes	yes
S002	0.846	0.900	1.000	0.857	0.901	yes	yes
...
S108	0.833	1.000	0.900	0.917	0.912	yes	yes
S109	0.900	0.933	1.000	0.867	0.925	yes	yes
Global	0.891	0.889	0.906	0.901	0.897	109 subjects, bonus 5	yes
Worst subjects by Mean (mean_of_means):
- S092: 0.765
- S066: 0.780
- S059: 0.795
- S089: 0.799
- S045: 0.815

🔬 1. Préprocessing & parsing EEG (MNE)

Lecture des fichiers Physionet
Visualisation du signal brut
Filtrage bande-passante 8–40 Hz
Découpage des epochs (t0–tn)
Extraction des événements motrices (Left Hand / Right Hand / Feet)

Structure locale attendue (non versionnée) : data/<subject>/<run>.edf. Vérifiez l’intégrité et le nombre de runs avant tout parsing :

📊 Visualiser raw vs filtré

Ce script génère une figure comparative signal brut vs signal filtré (bande-passante 8–40 Hz), afin de valider visuellement le préprocessing sur un couple (subject, run) avant d’enchaîner sur l’extraction de features.

Commande

Recommandé : exécuter via Poetry pour garantir l’environnement.

make visualizer 1 9

🧭 Justification scientifique : canaux & fenêtres temporelles

Les canaux EEG retenus se concentrent sur la région sensorimotrice (10-20) car l’imagerie motrice induit des variations d’ERD/ERS surtout sur les sites C3/Cz/C4 et leurs voisins fronto-centraux et centro-pariétaux. Cela aligne la sélection DEFAULT_MOTOR_ROI (ex: FC3/FC1/FCz/FC2/FC4, C3/C1/Cz/C2/C4, CP3/CP1/CPz/CP2/CP4) du script scripts/visualize_raw_filtered.py et les recommandations classiques en BCI (Pfurtscheller & Neuper, 2001; Wolpaw et al., 2002). Références :

Pfurtscheller, G. & Neuper, C. (2001). Motor imagery and direct brain-computer communication. https://doi.org/10.1109/5.939829
Wolpaw, J. R. et al. (2002). Brain-computer interfaces for communication. https://doi.org/10.1016/S1388-2457(02)00057-3

Les fenêtres temporelles d’epoching 0.5–2.5 s, 1.0–3.0 s et 0.0–2.0 s correspondent aux valeurs par défaut de tpv.utils.DEFAULT_EPOCH_WINDOWS. Elles évacuent la phase de réaction immédiate à l’indice visuel tout en couvrant la réponse motrice soutenue, ce qui limite les risques de fenêtres trop courtes ou mal alignées avec l’ERD/ERS (cf. Murphy TPV-032, TPV-052).

Pour visualiser l’impact de ces choix (canaux + filtrage), utiliser le script de comparaison brut/filtré :

make visualizer 1 3 C3 Cz C4

Ce graphique permet de vérifier visuellement que les canaux sensorimoteurs présentent bien une dynamique exploitable dans la bande 8–40 Hz avant d’alimenter la pipeline de features.

🎛️ 2. Extraction de features

Puissances par fréquence
Spectrogrammes ou FFT
Projection channel × time
Agrégation temporelle

Tu décides des features que tu veux envoyer à ta matrice X ∈ R^(d × N).

🧮 3. Réduction de dimension (PCA, CSP, ICA…)

🔐 Partie obligatoire du sujet : implémenter l’algorithme soi-même

calcul des matrices de covariance
décomposition SVD / eigendecomposition
normalisation
projection WᵀX → X'
tests de cohérence dimensionnelle

🧠 4. Pipeline scikit-learn

Le sujet exige :

héritage de baseEstimator et TransformerMixin
pipeline → [Preprocessing → Dimensionality → Classifier]
utilisation de cross_val_score

🧪 Tests & qualité logicielle

pytest
ruff
black
mypy
coverage
mutation testing (mutmut)
- la configuration Mutmut couvre mybci.py, src/tpv et scripts pour évaluer la qualité sur l'ensemble du pipeline
CI GitHub Actions + Codecov

Matrice checklist → WBS → tests

Item checklist TPV	WBS / livrable	Test ou commande reproductible
Visualisation raw vs filtré	3.3.1–3.3.4	`poetry run python scripts/visualize_raw_filtered.py data/S001` ; `poetry run pytest tests/test_preprocessing.py::test_apply_bandpass_filter_preserves_shape_and_stability`
Filtre 8–30 Hz + notch 50 Hz	3.1.1–3.1.3	`poetry run pytest tests/test_preprocessing.py::test_apply_bandpass_filter_preserves_shape_and_stability`
Réduction dimension (PCA/CSP)	5.2.1–5.2.4	`poetry run pytest tests/test_dimensionality.py::test_csp_returns_log_variances_and_orthogonality`
Pipeline sklearn (BaseEstimator/TransformerMixin)	5.3.1–5.3.4	`poetry run pytest tests/test_pipeline.py::test_pipeline_pickling_roundtrip`
Train + score via CLI	6.3.x & 7.1.x	`poetry run pytest tests/test_classifier.py::test_training_cli_main_covers_parser_and_paths`
Predict renvoie l’ID de classe	1.2.x & 6.2.x	`poetry run pytest tests/test_classifier.py::test_predict_cli_main_covers_parser_and_report`
Temps réel < 2 s	8.2.x–8.3.x	`poetry run pytest tests/test_realtime.py::test_realtime_latency_threshold_enforced`
Score ≥ 75 % (agrégation)	7.2.x	`poetry run pytest tests/test_classifier.py::test_aggregate_scores_exports_files_and_thresholds`

Définition du score global (scripts/aggregate_experience_scores.py)

Eligible = sujet disposant des 4 types d’expérience (T1..T4).
Mean (par sujet) = moyenne des 4 moyennes d’expérience.
MeetsThreshold_0p75 = Mean >= 0.75.
GlobalMean = (mean(T1) + mean(T2) + mean(T3) + mean(T4)) / 4.
Le script affiche les 10 pires sujets par Mean et retourne exit code 1 si GlobalMean < 0.75.

La version complète et maintenable de cette matrice, incluant les références aux risques Murphy, est disponible dans docs/project/checklist_wbs_matrix.md.

✅ Contraintes officielles du sujet

Ces exigences doivent être présentes et respectées dans toute la documentation et le code :

Finalité : classer en temps « réel » un signal EEG (imagination de mouvement A ou B).
Source des données : utiliser exclusivement Physionet (EEG motor imagery) ; les signaux sont des matrices channels × time avec runs découpés et labellisés proprement.
Prétraitement obligatoire :
- visualiser le signal brut dans un script dédié ;
- filtrer les bandes utiles (theta, alpha, beta… au choix) ;
- visualiser après prétraitement ;
- extraire les features (spectre, PSD, etc.) ;
- 🚫 interdiction implicite : ne pas utiliser mne-realtime.
Pipeline ML :
- utilisation obligatoire de sklearn.pipeline.Pipeline ;
- transformer maison héritant de BaseEstimator et TransformerMixin ;
- implémenter soi-même la réduction PCA, ICA, CSP ou CSSP (NumPy/SciPy autorisés, pas de version prête de sklearn ou MNE).
Entraînement/validation/test :
- cross_val_score sur l’ensemble du pipeline ;
- splits Train / Validation / Test distincts pour éviter l’overfit ;
- moyenne d’accuracy ≥ 60 % sur tous les sujets du jeu de test et les 6 runs d’expériences, sur des données jamais apprises.
Temps réel : le script predict lit un flux simulé (lecture progressive d’un fichier) et produit une prédiction en < 2 secondes après chaque chunk.
Architecture : fournir un script train et un script predict ; le dépôt final contient uniquement le code Python (pas le dataset).
Bonus facultatifs : wavelets pour le spectre, classifieur maison ou autres datasets EEG.
Formalisme mathématique : pour le transformer, avec X ∈ R^{d × N}, produire une matrice W telle que W^T X = X_{CSP}/X_{PCA}/X_{ICA}.

📚 Stack technique

Traitement du signal / maths

NumPy (matrices, opérations vectorisées)
SciPy (eigenvalues, SVD)
MNE (EEG parsing)

Machine Learning

scikit-learn (pipeline, classif, cross-validation)

Qualité & Murphy Map

ruff, black, mypy
pytest, coverage, mutmut
GitHub Actions, Codecov

Les fichiers de cartographie des risques (Loi de Murphy) se trouvent dans :

docs/qa/murphy_map_tpv.csv

🧭 Vue d’ensemble documentation

Tous les jalons projet sont récapitulés dans docs/index.md, avec des liens directs vers le WBS, le diagramme de Gantt, la roadmap et la Murphy map.

📖 Ressources utilisées

Les contenus suivants ont été essentiels pour comprendre l’EEG, les filtres spatiaux (CSP) et la mise en place d’un pipeline d’analyse monotrial robuste :

🎥 Playlist YouTube — Machine Learning from Scratch Série pédagogique pour consolider les bases de l’apprentissage supervisé (modèles linéaires, descente de gradient, régularisation) utilisées pour entraîner le classifieur sur les features EEG.
📄 Wikipédia — Électroencéphalographie Notions fondamentales sur l’EEG, l’acquisition du signal et le rôle des électrodes, indispensables pour interpréter les données brutes.
📄 Wikipédia — Common spatial pattern Présentation du principe des filtres spatiaux CSP, de la maximisation de la variance entre classes et de leur utilisation en BCI.
📄 Blankertz et al., Optimizing Spatial Filters for Robust EEG Single-Trial Analysis Article de référence décrivant les stratégies d’optimisation de filtres spatiaux pour améliorer la robustesse de l’analyse EEG monotrial.
🗄️ PhysioNet — EEG Motor Movement/Imagery Dataset v1.0.0
🏷️ ICLabel — Tutoriel “EEG Independent Component Labeling”
📚 MNE-Python — Tutoriels officiels
📝 Importing EEG data — blog / guide pratique

© Licence

MIT License.

👤 Auteur

Rafael Verissimo
Étudiant IA/Data — École 42 Paris
GitHub : https://github.com/raveriss
LinkedIn : https://www.linkedin.com/in/verissimo-rafael/

Name		Name	Last commit message	Last commit date
Latest commit History 621 Commits
.github/workflows		.github/workflows
docs		docs
scripts		scripts
src/tpv		src/tpv
tests		tests
.gitignore		.gitignore
.pre-commit-config.yaml		.pre-commit-config.yaml
.python-version		.python-version
AGENTS.md		AGENTS.md
LICENSE		LICENSE
Makefile		Makefile
README.md		README.md
author		author
codecov.yml		codecov.yml
mybci.py		mybci.py
poetry.lock		poetry.lock
poetry.toml		poetry.toml
pyproject.toml		pyproject.toml

Folders and files

Latest commit

History

Repository files navigation

EEG Brain-Computer Interface (BCI) - Total Perspective Vortex

📑 Table des matières

📌 Overview

📥 Télécharger le dépôt

🧠 Objectifs pédagogiques (42 / IA / ML)

🧩 Architecture du projet

🚀 Mise en route : données, installation, entraînement, prédiction (Poetry + Makefile)

📦 Générer les artefacts manquants avant l'évaluation globale

🧪 Diagnostiquer une commande avec sanitizer

🖥️ Exemples d'exécution (sorties tronquées)

make install

make install-deps

make download_dataset

make show-activate

Activer l'environnement

make train <subject> <run>

make train <subject> <run> <method>

make predict <subject> <run>

make realtime <subject> <run>

make mybci

make mybci wavelet

make compute-mean-of-means

🔬 1. Préprocessing & parsing EEG (MNE)

📊 Visualiser raw vs filtré

Commande

🧭 Justification scientifique : canaux & fenêtres temporelles

🎛️ 2. Extraction de features

🧮 3. Réduction de dimension (PCA, CSP, ICA…)

🧠 4. Pipeline scikit-learn

🧪 Tests & qualité logicielle

Matrice checklist → WBS → tests

Définition du score global (scripts/aggregate_experience_scores.py)

✅ Contraintes officielles du sujet

📚 Stack technique

Traitement du signal / maths

Machine Learning

Qualité & Murphy Map

🧭 Vue d’ensemble documentation

📖 Ressources utilisées

© Licence

👤 Auteur

About

Topics

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

🧪 Diagnostiquer une commande avec `sanitizer`

`make install`

`make install-deps`

`make download_dataset`

`make show-activate`

`Activer l'environnement`

`make train <subject> <run>`

`make train <subject> <run> <method>`

`make predict <subject> <run>`

`make realtime <subject> <run>`

`make mybci`

`make mybci wavelet`

`make compute-mean-of-means`

Packages