EN DIRECT en ligne connexion / inscription
Connexion

Surnom/Pseudo
Mot de Passe :

[ Vous avez perdu votre mot de pass ? | Devenir membre ]

×

Spotify ciblé par un scraping massif : Anna’s Archive revendique 86 millions de fichiers audio

Le collectif Anna’s Archive affirme avoir « sauvegardé » Spotify en récupérant des métadonnées portant sur environ 86 millions de fichiers audio, soit environ 300 To. Selon leurs propos, cela représenterait environ 37 % des morceaux de la plateforme, mais pas n’importe lesquels puisque ces 37% là correspondent à 99,6 % des écoutes. La « récupération » aurait été triée par popularité comme ils l’expliquent sur leur blog.

Spotify confirme un accès non autorisé par scraping et indique que des tactiques « illégales » ont permis d’accéder à une partie des fichiers audio en contournant des protections DRM. La plateforme dit avoir désactivé les comptes impliqués et ajouté des protections pour limiter ce type d’attaque.



spotify scraping


Comment ils s’y sont pris ?

Le cœur de leur méthode, c’est le contournement du DRM : en temps normal, Spotify ne livre pas l’audio comme un simple fichier récupérable, le flux est protégé par ce qu’on appel un DRM et conçu pour n’être lisible que via un client autorisé. Quand Spotify évoque des « tactiques illicites pour contourner le DRM », cela suggère qu’Anna’s Archive auraient trouvé un moyen d’obtenir l’audio sous une forme exploitable en dehors de l’application, donc archivable et redistribuable. Une fois ce verrou franchi, ils peuvent ensuite passer à l’échelle en automatisant la récupération sur des dizaines de millions de titres, ce qu’on appelle le scraping.

Ce que dit Anna’s Archive

Dans leur blog, Anna’s Archive explique vouloir constituer une « archive de préservation » afin de protéger le « patrimoine musical de l’humanité » contre « la destruction liée à des catastrophes naturelles, des guerres, des restrictions budgétaires et d’autres désastres ».

Dans cette logique, le collectif annonce une mise à disposition en téléchargement via torrent, sous la forme d’une distribution uniquement en « bulk torrents » d’environ 300 To, regroupés par popularité. La publication doit se faire par étapes, via leur page Torrents, et le billet détaille le calendrier prévu.

Séquençage annoncé :

• Métadonnées d’abord (décembre 2025)
• Fichiers musicaux ensuite, classés par popularité
• Puis des métadonnées supplémentaires liées aux torrents (chemins et checksums)
• Puis les pochettes
• Puis des fichiers de patch (.zstdpatch) pour reconstruire les fichiers « originaux » avant l’injection de métadonnées

Le billet revient aussi sur leur méthode de tri : les titres auraient été priorisés à partir de la métrique « popularity » de Spotify. L’idée est donc de publier d’abord ce qui est le plus écouté, puis de descendre progressivement vers les morceaux moins populaires.

spotify scraping

source : The Verge
Partagez :
Posté le 23 Décembre 2025 à 12:31|par Sébastien Domeau


7 commentaires
Vous devez être membre pour poster des commentaires.
Identification
Surnom/Pseudo :
Mot de Passe :
Top 100 dernières actualités des fermiers