Audiobook Simplifier est un outil qui crée des livres audio à partir de documents texte ou de livres électroniques à l'aide de la technologie TTS (Text-to-Speech).
Ce projet transforme des documents texte ou des livres électroniques en fichiers audio à l'aide de TTSv2, rendant le contenu écrit accessible au format audio. Idéal pour l'accessibilité, les personnes malvoyantes ou tout simplement pour ceux qui préfèrent écouter un livre plutôt que de le lire.
Assurez-vous d'avoir installé les éléments suivants :
-
Python 3.10
👉 Télécharger Python 3.10.11 (Windows)Pendant l'installation :
- Cochez "Installer pour tous les utilisateurs".
- Cochez "Ajouter Python au PATH".
-
Télécharger les outils de création Microsoft C++ -👉 https://visualstudio.microsoft.com/fr/visual-cpp-build-tools/
-
FFmpeg
👉 Télécharger FFmpegAjoutez FFmpeg à votre variable d'environnement
PATH.Ou avec Terminal de commande
winget install "FFmpeg (Essentials Build)"
###🔧 Uniquement pour les propriétaires de cartes Nvidia
-
CUDA Toolkit 11.8
👉 Télécharger CUDA Toolkit 11.8 -
cuDNN v8.9.7 pour CUDA 11
👉 Télécharger cuDNN v8.9.7Dézippez et copiez les fichiers dans :
C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.8 -
**eSpeak NG (64 bits) (facultatif) **
👉 Télécharger eSpeak NG
- Clonez ce dépôt sur votre machine :
git clone https://github.com/EasyAI-France/audiobook-simplifier.git cd audiobook-simplifier
- Installez les dépendances dans un environnement virtuel (optionnel mais recommandé) :
python -m venv .venv .venv\Scripts\activate pip install torch==2.5.1 torchvision==0.20.1 torchaudio==2.5.1 --index-url https://download.pytorch.org/whl/cu118 pip install -r requirements.txt
- Installez les dépendances dans un environnement virtuel (optionnel mais recommandé) :
python -m venv .venv .venv\Scripts\activate pip install torch==2.5.1 torchvision==0.20.1 torchaudio==2.5.1 --index-url https://download.pytorch.org/whl/cpu pip install -r requirements.txt
- Double-cliquez sur « install.bat ».
- Sélectionnez vos graphiques.
- Une fois le projet installé, le terminal se ferme automatiquement.
Clonez le répertoire GitHub, puis allez à la racine du répertoire Audiobook-Simplifier, là où se trouvent les fichiers Dockerfile et docker-compose.yml Pour créer votre image Docker, tapez dans le terminal :
docker build -t audiobook_simplifier .👉 Pour le lancer en français, tapez :
docker run --name EasyAI -e LANGUE=fr -p 7860:7860 audiobook_simplifier
-
Ou pour le lancer en anglais :
docker run --name EasyAI -e LANGUE=eng -p 7860:7860 audiobook_simplifier
- Double-cliquez sur
start.bat. - Sélectionnez votre langue.
- Ouvrez l’URL affichée dans votre navigateur.
.venv\Scripts\activate
python scripts\main.py- Choisissez une voix TTS au format
.wav. - Sélectionnez la langue dans le menu déroulant.
- Activez/désactivez les sous-titres.
- Téléchargez votre fichier texte ou eBook (optimisé paragraphe par paragraphe).
- Lancez le traitement pour rendre le texte plus compréhensible pour le moteur TTS.
- Générez les fichiers audio (plusieurs segments seront créés dans le dossier
cache). - Dans le terminal : Vous devez accepter les conditions de la licence non commerciale CPML : https://coqui.ai/cpml
- Compilez les segments en un seul fichier audio via le bouton « Compiler les fichiers audio ».
- Écoutez et téléchargez votre livre audio.
- Nettoyez le cache avec « Supprimer les fichiers ».
- Cliquez sur « Transformer un audio ».
- Indiquez le nom du fichier
.wav. - Réécrivez le texte à corriger.
- Cliquez sur « Recompiler le fichier audio ».
Ce projet est maintenu par EasyAI-France.
Il utilise le moteur TTS open source de Coqui TTS.
Les contributions sont les bienvenues !
N’hésitez pas à proposer des améliorations, corriger des bugs ou créer des tickets.
This project is distributed under an MPL-2.0 license.
Pour toute question, retour ou suggestion :
📧 easyaivideo@gmail.com
Made with ❤️ by EasyAI-France