سازندگان آرشیو آنا (Anna’s Archive) که یکی از بزرگترین «کتابخانههای دیجیتال» جهان است و دسترسی رایگان به میلیونها کتاب و مقاله را امکانپذیر کرده، مدعی شدهاند که ۸۶ میلیون فایل صوتی را از سرورهای اسپاتیفای بیرون کشیدهاند.
آنها میگویند آرشیو جدیدشان، ۹۹.۶ درصد از تمام موسیقیهای پخششده در اسپاتیفای را در بر میگیرد و عملاً چیز زیادی باقی نمانده که از روی سرورهای اسپاتیفای بر نداشته باشند!
ابعاد گسترده ماجرا
سازندگان آرشیو آنا ادعا میکنند که دیتابیسی با حجم سرسامآور ۳۰۰ ترابایت ایجاد کردهاند که این موارد را شامل میشود:
- متادیتای ۲۵۶ میلیون قطعه موزیک: اطلاعات شناسنامهای تقریباً تمام آهنگهای موجود در اسپاتیفای.
- فایل صوتی ۸۶ میلیون آهنگ: خودِ فایلهای موسیقی که دانلود و ذخیره شدهاند.
- پوشش ۹۹.۶ درصدی: آهنگهای دانلود شده، ۹۹.۶ درصد از کل موسیقیهایی است که در اسپاتیفای آپلود و شنیده شدهاند.
روش انتشار: هوشمندانه و گزینشی
به نظر میرسد گروه آرشیو آنا فقط یک دانلود کورکورانه و شتابزده انجام نداده، بلکه با دور زدن قفلهای دیجیتال (DRM) و با استفاده از اسکریپتهای پیچیده توانسته به این آرشیو عظیم دسترسی پیدا کند. آرشیوی که:
- آهنگها را براساس میزان محبوبیت دستهبندی کرده و نشان میدهد.
- اکثر فایلهای را با کیفیت بالا (۱۶۰ کیلوبیت بر ثانیه) در اختیار کاربر میگذارد.
- و آهنگهای نهچندان محبوب را اندکی فشردهسازی کرده تا حجم نهایی کمتر شود.
یک حقیقت تلخ راجع به اسپاتیفای
دادههایی که به واسطه این آرشیو به دست آمدهاند نشان میدهند ۷۰ درصد از آهنگهای اسپاتیفای، کمتر از ۱۰۰۰ بار پخش شدهاند و عملاً کسی به آنها گوش نمیدهد. از طرف دیگر، ۳ آهنگ برتر از نظر «دفعات پخش»، به تنهایی از دهها میلیون آهنگِ انتهایِ جدول، بیشتر شنونده داشتهاند.
این تفاوت نشان میدهد چطور الگوریتم اسپاتیفای، موسیقی محبوب را محبوبتر و موسیقیهای گمنام را گمنامتر میکند.
واکنش اسپاتیفای: تایید نصفه و نیمه
غول استریم موسیقی در برابر این ادعا ساکت نبوده، اما تایید کامل هم نکرده است. اسپاتیفای اعلام کرده که مهاجمان توانستهاند با «تکنیکهای غیرمجاز» قفلهای DRM را دور بزنند و به «تعدادی» از فایلهای صوتی و متادیتا دسترسی پیدا کنند.
این را هم فراموش نکنیم که چنین دیتابیس عظیمی، خوراک آمادهای برای سرویسهای استریم غیرقانونی و همینطور شرکتهای هوش مصنوعی است که تشنهی دیتای صوتی برای تعلیم دادن مدلهای AI خود هستند!
این مطالب را هم در نوشدارو بخوانید:
