Skip to content

pqbas/cnn-audio-clasifier

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

8 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Audio Classification

Sistema de clasificación de audio que identifica sonidos ambientales usando un modelo CNN ResNet.

Qué hace?

  • Clasifica archivos de audio en 50 categorías del dataset ESC-50 (ladridos de perro, lluvia, bocinas de auto, etc).

Cómo funciona?

  • Convierte audio a espectrogramas mel
  • Usa red neuronal ResNet para clasificación
  • Retorna predicciones principales con puntajes de confianza

Uso

  1. Instalar dependencias con uv:
uv sync
  1. Entrenar el modelo en Modal cloud:
make train
  1. Desplegar servidor de inferencia:
make deploy
  1. Probar el endpoint:
make test

Estructura

  • src/ - Código principal del modelo y entrenamiento
  • ops/ - Scripts de despliegue en Modal
  • tests/ - Archivos de pruebas
  • data/ - Dataset ESC-50

About

CNN Audio Clasifier with ResNet architecture

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors