12 月 22 日消息,全球最大音樂流媒體平臺 Spotify 遭到影子圖書館組織“安娜的檔案”入侵。該組織幾乎完整抓取了 Spotify 平臺內容,下載了約 300TB 音樂文件,并通過 BT 種子進行非法分發。
Spotify 已承認此次事件,并通過外媒 Android Authority 表示:“我們在調查未經授權訪問時發現,有第三方抓取了公開元數據,并通過非法手段繞過 DRM(注:數字版權管理),從而獲取了平臺上的部分音頻文件。目前事件仍在調查中。”
流出的文件數量約為 8600 萬首歌曲,占 Spotify 全部曲庫的約 37%,但卻覆蓋了平臺 99.9% 的播放量。大多數音頻仍保持 Spotify 原始的 OGG Vorbis 160kbps 格式;只有熱度評分為 0 的歌曲被重新編碼為 75kbps,以降低存儲占用。
據外媒 Tom's Hardware 今晚報道,泄露數據還包括 2.56 億條元數據記錄,覆蓋 Spotify 上 99.6% 的收聽量,并被整理為可查詢的 SQL 數據庫。“安娜的檔案”還對 Spotify API 進行了近乎無損的 JSON 級重建,包含 1.86 億個唯一 ISRC 編號,涵蓋全部錄音標識、專輯信息、藝人資料和封面圖像。
“安娜的檔案”發布的博客對這次數據抓取進行了詳細說明,并附帶大量統計圖表。例如,Spotify 平臺約 70% 的歌曲幾乎無人收聽,而最受歡迎的 0.1% 曲目占據了絕大多數關注度。平臺上的音樂以單曲為主,120 BPM 是最常見的節奏。
“安娜的檔案”稱,此次行動的目的在于“音樂保存”。該組織認為,Spotify 的曲庫分發機制過度偏向熱門藝人和音質表現,因此需要建立一個“旨在涵蓋人類歷史上所有音樂作品”的權威 BT 種子列表。
種子文件由“安娜的檔案”自行托管,音頻數據采用其自定義的 Anna's Archive Containers 封裝格式。元數據已率先公開,其余音頻內容將按照受歡迎程度分級,以大規模分批方式陸續發布。這次抓取事件的長期影響,仍有待時間驗證。











