Optimiser le cache des modèles IA dans Transformers.js
Transformers.js simplifie l'utilisation de modèles IA comme Whisper-tiny.en pour la reconnaissance vocale dans les apps Web. Le cache navigateur isolé par origine force des téléchargements redondants, comme 177 MB pour un modèle ou 4,7 MB pour le runtime Wasm.
« the browser instead has to download and cache all the model resources again, even if they're byte-by-byte the same as before. » — Hugging Face Blog
Que faut-il retenir ?
- Transformers.js utilise Xenova/whisper-tiny.en comme modèle par défaut pour la reconnaissance vocale.
- Le cache navigateur isolé entraîne 177 MB de téléchargement redondant pour un même modèle sur différentes origines.
- Le runtime Wasm partagé (4,733 kB) est aussi retéléchargé inutilement entre apps.
- Les ressources des modèles proviennent du Hugging Face Hub et de son CDN.
Pourquoi cette nouvelle compte-t-elle ?
Cet enjeu de cache cross-origin impacte directement les performances des apps Web IA, avec des coûts en bande passante et stockage. Les développeurs doivent anticiper ces doublons pour optimiser l'expérience utilisateur, surtout avec des modèles volumineux.
177 MB de téléchargement redondant pour un modèle
💬 Thomas Steiner, Developer Relations Engineer chez Chrome (Google)
Public concerné : développeurs
Comment éviter les téléchargements redondants de modèles IA dans les apps Web ?
L'article propose d'expérimenter avec la Cross-Origin Storage API pour partager le cache entre origines. Une solution technique à étudier pour optimiser bande passante et stockage.