Le collectif Anna’s Archive affirme avoir « sauvegardé » Spotify en récupérant des métadonnées portant sur environ 86 millions de fichiers audio, soit environ 300 To. Selon leurs propos, cela représenterait environ 37 % des morceaux de la plateforme, mais pas n’importe lesquels puisque ces 37% là correspondent à 99,6 % des écoutes. La « récupération » aurait été triée par popularité comme ils l’expliquent sur leur blog.
Spotify confirme un accès non autorisé par scraping et indique que des tactiques « illégales » ont permis d’accéder à une partie des fichiers audio en contournant des protections DRM. La plateforme dit avoir désactivé les comptes impliqués et ajouté des protections pour limiter ce type d’attaque.

Dans cette logique, le collectif annonce une mise à disposition en téléchargement via torrent, sous la forme d’une distribution uniquement en « bulk torrents » d’environ 300 To, regroupés par popularité. La publication doit se faire par étapes, via leur page Torrents, et le billet détaille le calendrier prévu.
Séquençage annoncé :
• Métadonnées d’abord (décembre 2025)
• Fichiers musicaux ensuite, classés par popularité
• Puis des métadonnées supplémentaires liées aux torrents (chemins et checksums)
• Puis les pochettes
• Puis des fichiers de patch (.zstdpatch) pour reconstruire les fichiers « originaux » avant l’injection de métadonnées
Le billet revient aussi sur leur méthode de tri : les titres auraient été priorisés à partir de la métrique « popularity » de Spotify. L’idée est donc de publier d’abord ce qui est le plus écouté, puis de descendre progressivement vers les morceaux moins populaires.

Spotify confirme un accès non autorisé par scraping et indique que des tactiques « illégales » ont permis d’accéder à une partie des fichiers audio en contournant des protections DRM. La plateforme dit avoir désactivé les comptes impliqués et ajouté des protections pour limiter ce type d’attaque.

Comment ils s’y sont pris ?
Le cœur de leur méthode, c’est le contournement du DRM : en temps normal, Spotify ne livre pas l’audio comme un simple fichier récupérable, le flux est protégé par ce qu’on appel un DRM et conçu pour n’être lisible que via un client autorisé. Quand Spotify évoque des « tactiques illicites pour contourner le DRM », cela suggère qu’Anna’s Archive auraient trouvé un moyen d’obtenir l’audio sous une forme exploitable en dehors de l’application, donc archivable et redistribuable. Une fois ce verrou franchi, ils peuvent ensuite passer à l’échelle en automatisant la récupération sur des dizaines de millions de titres, ce qu’on appelle le scraping.Ce que dit Anna’s Archive
Dans leur blog, Anna’s Archive explique vouloir constituer une « archive de préservation » afin de protéger le « patrimoine musical de l’humanité » contre « la destruction liée à des catastrophes naturelles, des guerres, des restrictions budgétaires et d’autres désastres ».Dans cette logique, le collectif annonce une mise à disposition en téléchargement via torrent, sous la forme d’une distribution uniquement en « bulk torrents » d’environ 300 To, regroupés par popularité. La publication doit se faire par étapes, via leur page Torrents, et le billet détaille le calendrier prévu.
Séquençage annoncé :
• Métadonnées d’abord (décembre 2025)
• Fichiers musicaux ensuite, classés par popularité
• Puis des métadonnées supplémentaires liées aux torrents (chemins et checksums)
• Puis les pochettes
• Puis des fichiers de patch (.zstdpatch) pour reconstruire les fichiers « originaux » avant l’injection de métadonnées
Le billet revient aussi sur leur méthode de tri : les titres auraient été priorisés à partir de la métrique « popularity » de Spotify. L’idée est donc de publier d’abord ce qui est le plus écouté, puis de descendre progressivement vers les morceaux moins populaires.

source : The Verge
Partagez :
Posté le 23 Décembre 2025 à 12:31|par




