Go to file

Benoit 04603cd5e9 Fix localhost en prod

Résumé des modifications
J'ai implémenté une configuration runtime pour le frontend qui permet de changer l'URL de l'API sans rebuilder l'image Docker. Voici ce qui a été fait :
📝 Fichiers modifiés :
frontend/Dockerfile - Ajout du script de génération de config au démarrage
frontend/lib/api.ts - Lecture de la config depuis window.__RUNTIME_CONFIG__
frontend/app/layout.tsx - Chargement du script config.js
docker-compose.yml - Utilisation de la variable d'environnement
.env.example - Documentation de la variable
DEPLOYMENT.md - Documentation de la configuration runtime
📄 Fichiers créés :
frontend/generate-config.sh - Script de génération de config
frontend/public/config.js - Fichier de config (placeholder)
frontend/README.md - Documentation du frontend
🚀 Pour résoudre votre problème en production :
Sur votre serveur, modifiez le fichier .env :

# URL publique de l'API (utilisée par le navigateur)
NEXT_PUBLIC_API_URL=https://audioclassifier.benoitsz.com:8001

# CORS doit accepter les requêtes du frontend
CORS_ORIGINS=https://audioclassifier.benoitsz.com,https://audioclassifier.benoitsz.com:3000
Ensuite :

# Pull les dernières modifications
git pull

# Rebuild l'image frontend (une seule fois)
# Soit via Gitea Actions en poussant sur main
# Soit manuellement :
# docker build -t git.benoitsz.com/benoit/audio-classifier-frontend:dev -f frontend/Dockerfile .
# docker push git.benoitsz.com/benoit/audio-classifier-frontend:dev

# Redémarrer les containers
docker-compose down
docker-compose up -d
✨ Avantages :
✅ Aucun rebuild nécessaire après le premier déploiement
✅ Configuration flexible via variables d'environnement
✅ Compatible avec tous les environnements (dev, staging, prod)
✅ Testé et fonctionnel localement
Le frontend générera automatiquement le bon fichier de configuration au démarrage du container avec l'URL de votre serveur !

2025-12-23 15:33:52 +01:00

.claude

Fix build et actions

2025-12-23 13:23:07 +01:00

.gitea/workflows

Fix localhost en prod

2025-12-23 15:33:52 +01:00

backend

Fix CORS

2025-12-23 14:33:25 +01:00

frontend

Fix localhost en prod

2025-12-23 15:33:52 +01:00

.env.example

Fix localhost en prod

2025-12-23 15:33:52 +01:00

.gitignore

Remplacement modèle classification par genre

2025-12-22 14:29:05 +01:00

check-autonomous.sh

Build Docker Complètement Autonome - Terminé !

2025-12-23 10:34:32 +01:00

deploy.sh

Add server deployment support with Essentia

2025-12-02 23:04:29 +01:00

DEPLOYMENT.md

Fix localhost en prod

2025-12-23 15:33:52 +01:00

docker-compose.build.yml

Fix CORS

2025-12-23 14:33:25 +01:00

docker-compose.yml

Fix localhost en prod

2025-12-23 15:33:52 +01:00

install-server.sh

WIP

2025-12-02 23:58:29 +01:00

README.md

Fix Build backend Gitea

2025-12-23 13:27:50 +01:00

TRANSCODING_SETUP.md

Transcodage systématique MP3 128kbps

2025-12-23 10:08:16 +01:00

README.md

Audio Classifier

Outil de classification audio automatique capable d'indexer et analyser des bibliothèques musicales entières.

🎯 Fonctionnalités

Analyse audio automatique : Genre, instruments, tempo (BPM), tonalité, ambiance
Classification intelligente : Utilise Essentia + Librosa pour extraction de features
Recherche avancée : Filtres combinés (genre, mood, BPM, énergie) + recherche textuelle
Lecteur audio intégré : Prévisualisation avec waveform + téléchargement
Base de données vectorielle : PostgreSQL avec pgvector (prêt pour embeddings CLAP)
100% local et CPU-only : Aucune dépendance cloud, fonctionne sur CPU

🛠 Stack Technique

Backend

Python 3.11 + FastAPI (API REST async)
Librosa : Extraction features audio (tempo, spectral, chroma)
Essentia-TensorFlow : Classification genre/mood/instruments (modèles pré-entraînés)
PostgreSQL + pgvector : Base de données avec support vectoriel
SQLAlchemy : ORM

Frontend

Next.js 14 + TypeScript
TailwindCSS + shadcn/ui
React Query : Gestion cache API
Recharts : Visualisations

📋 Prérequis

Docker + Docker Compose (recommandé)
Ou manuellement :
- Python 3.11+
- Node.js 20+
- PostgreSQL 16 avec extension pgvector
- FFmpeg (pour librosa)

🚀 Démarrage Rapide - 100% Autonome !

Installation en 3 commandes

# 1. Cloner le projet
git clone https://git.benoitsz.com/benoit/Audio-Classifier.git
cd Audio-Classifier

# 2. Configurer le chemin audio (optionnel)
echo "AUDIO_LIBRARY_PATH=/chemin/vers/votre/musique" > .env

# 3. Démarrer !
docker-compose up -d

C'est tout ! 🎉

Les images Docker sont automatiquement téléchargées depuis le registry Gitea.

Premier scan

Ouvrir http://localhost:3000
Cliquer sur "Rescan" dans le header
Attendre la fin du scan
Profiter de votre bibliothèque musicale indexée !

✨ Particularités

Images pré-construites : Téléchargées automatiquement depuis git.benoitsz.com
Modèles inclus : Les modèles Essentia (28 MB) sont intégrés dans l'image
Aucune configuration : Tout fonctionne out-of-the-box
Transcodage automatique : MP3 128kbps créés pour streaming rapide
Waveforms pré-calculées : Chargement instantané

📖 Documentation complète : Voir DEPLOYMENT.md

🛠 Build local (développement)

Si vous voulez builder les images localement, les modèles Essentia doivent être présents dans backend/models/ (28 MB).

# Build avec docker-compose
docker-compose -f docker-compose.build.yml build
docker-compose -f docker-compose.build.yml up -d

Note : Les modèles Essentia (.pb, 28 MB) ne sont pas versionnés dans Git. Le workflow CI/CD les télécharge automatiquement depuis essentia.upf.edu pendant le build.

📖 Utilisation

Scanner un dossier

Via l'interface web

Ouvrir http://localhost:3000
Cliquer sur "Scan Folder"
Entrer le chemin : /audio/votre_dossier
Cocher "Recursive" si nécessaire
Lancer l'analyse

Via l'API

curl -X POST http://localhost:8001/api/analyze/folder \
  -H "Content-Type: application/json" \
  -d '{"path": "/audio/music", "recursive": true}'

Sous Windows 10

curl.exe -X POST http://localhost:8001/api/analyze/folder -H "Content-Type: application/json" -d '{\"path\": \"/audio/\", \"recursive\": true}'

Rechercher des pistes

Recherche textuelle : Tapez dans la barre de recherche
Filtres : Genre, mood, BPM, énergie, instruments
Similarité : Cliquez sur "🔍 Similar" sur une piste

Écouter et télécharger

Play : Lecture directe dans le navigateur avec waveform
Download : Téléchargement du fichier original

🏗 Architecture

audio-classifier/
├── backend/              # API FastAPI
│   ├── src/
│   │   ├── core/        # Audio processing, classification
│   │   ├── models/      # SQLAlchemy models, CRUD
│   │   ├── api/         # Routes FastAPI
│   │   └── utils/       # Config, logging
│   └── models/          # Essentia models (.pb)
│
├── frontend/            # Next.js UI
│   ├── app/            # Pages
│   ├── components/     # React components
│   ├── lib/            # API client, types
│   └── hooks/          # React hooks
│
└── docker-compose.yml

🎼 Métadonnées Extraites

Features Audio

Tempo : BPM détecté
Tonalité : Clé musicale (C major, D minor, etc.)
Signature rythmique : 4/4, 3/4, etc.
Énergie : Intensité sonore (0-1)
Valence : Positivité/négativité (0-1)
Danceability : Dansabilité (0-1)
Features spectrales : Centroid, zero-crossing rate, rolloff

Classification

Genre : Primary + secondary (50 genres via Essentia)
Mood : Primary + secondary + arousal/valence (56 moods)
Instruments : Liste avec scores de confiance (40 instruments)
Voix : Présence, genre (futur)

📊 API Endpoints

Tracks

GET /api/tracks - Liste des pistes avec filtres
GET /api/tracks/{id} - Détails d'une piste
DELETE /api/tracks/{id} - Supprimer une piste

Search

GET /api/search?q=...&genre=...&mood=... - Recherche

Audio

GET /api/audio/stream/{id} - Stream audio
GET /api/audio/download/{id} - Télécharger
GET /api/audio/waveform/{id} - Waveform data

Analysis

POST /api/analyze/folder - Scanner un dossier
GET /api/analyze/status/{job_id} - Statut d'analyse

Similar

GET /api/tracks/{id}/similar - Pistes similaires

Stats

GET /api/stats - Statistiques globales

⚙️ Configuration Avancée

CPU-only vs GPU

Par défaut, le système fonctionne en CPU-only pour compatibilité maximale.

Pour activer CLAP embeddings (nécessite plus de RAM/temps) :

ANALYSIS_USE_CLAP=true

Parallélisation

Ajuster le nombre de workers pour l'analyse :

ANALYSIS_NUM_WORKERS=4  # Adapter selon votre CPU

Formats supportés

WAV, MP3, FLAC, M4A, OGG

🔧 Développement

Backend

cd backend
python -m venv venv
source venv/bin/activate  # Windows: venv\Scripts\activate
pip install -r requirements.txt

# Run migrations
alembic upgrade head

# Start dev server
uvicorn src.api.main:app --reload --host 0.0.0.0 --port 8000

Frontend

cd frontend
npm install
npm run dev

📝 TODO / Améliorations Futures

CLAP embeddings pour recherche sémantique ("calm piano for working")
Détection voix (homme/femme/choeur)
Export batch vers CSV/JSON
Création de playlists
Détection de doublons (audio fingerprinting)
Édition de tags (écriture dans les fichiers)
Authentication multi-utilisateurs
WebSocket pour progression temps réel

📄 Licence

MIT

🤝 Contribution

Les contributions sont les bienvenues ! Ouvrir une issue ou PR.

📞 Support

Pour toute question ou problème, ouvrir une issue GitHub.