چگونه برنامه های شناسایی موسیقی مانند Shazam کار می کنند؟

برنامه‌های شناسایی موسیقی، شگفت‌انگیز به نظر می‌رسند، اما یک الگوریتم پیچیده دارند که می‌توانند آهنگ‌ها را در یک لحظه پیدا کنند. در اینجا نحوه کار آن‌ها آورده شده است.

جادوی شناسایی موسیقی


احتمالاً برای همه ما اتفاق افتاده است، وقتی در یک رستوران خوب شام می‌خورید، در کافی شاپ یا در یک فروشگاه قدم می‌زنید، ناگهان آهنگ خوبی را می‌شنوید که در بلندگو پخش می‌شود. شاید این آهنگی باشد که قبلاً گوش کرده‌اید یا آهنگی است که تاکنون نشنیده‌اید. بنابراین، گوشی موبایل را بیرون می‌آورید، Shazam را باز می‌کنید. فقط با یک فلش، برنامه می‌گوید که این آهنگ چیست، هنرمند کیست و کجا آن را پخش می‌کند.

این نرم‌افزارها حتی مبهم‌ترین آهنگ‌ها را نیز شناسایی می‌کنند. به طور خلاصه، آن‌ها با جداسازی آهنگ از ضبط و جستجوی آن در پایگاه داده گسترده آهنگ‌ها، کار می‌کنند. اما فناوری چگونگی انجام این کار کاملاً پیچیده است.

نرم‌افزار Shazam سیستمی سریع است و این به دلیل یک الگوریتم منحصر به فرد است که می‌تواند دنیای موسیقی را متحول کند.

در نگاه اول، نرم‌افزارهای شناسایی موسیقی مانند Shazam ممکن است ساده به نظر برسند. ممکن است فکر کنید آن‌ها فقط به متن اشعار، مانند هر دستیار صوتی گوش می‌دهند، و آن را در یک بانک اطلاعاتی از اشعار جستجو می‌کنند تا به شما بگویند این آهنگ چیست.

ولی اکثر برنامه‌های شناسایی موسیقی قادر به گفتن نام ساز یا حتی خواننده یک آهنگ هستند. دلیل این است که، به جای تجزیه و تحلیل اشعار آهنگ، به دنبال “اثر انگشت” هستند که برای هر آهنگ در پایگاه داده‌های گسترده خود دارند.

فناوری چاپ اثر انگشت Fingerprinting


دستگاه‌هایی که با استفاده از اثر انگشت قفل آن‌ها را باز می‌کنید، خطوط کوچک روی انگشت را شناسایی می‌کنند. به طور مشابه، هنگامی که میکروفون را برای ضبط کلیپ مختصر از یک آهنگ نگه دارید، این کلیپ به داده‌ای تبدیل می‌شود که Shazam یا برنامه دیگری می‌تواند در پایگاه داده جستجو کند.

در نگاه اول، این روش چندین مشکل دارد. در بیشتر مواقعی که موسیقی را در مکان عمومی می‌شنوید، صدای پس‌زمینه و اعوجاج ناشی از بلندگوها وجود دارد که می‌تواند آهنگ‌ها را غیرقابل شناسایی کند. همچنین داده‌های زیادی حتی در یک کلیپ صوتی کوتاه وجود دارد که می تواند در بانک اطلاعاتی میلیون‌ها آهنگ سرچ شوند.

اطلاعات یک کلیپ صوتی را می‌توان با یک نمودار سه‌بعدی که به نام طیف‌سنج معروف است، تجسم کرد که نشان‌دهنده تغییر در فرکانس‌ها در یک دوره زمانی است. بنابراین طیف‌سنج به میزان قدرت صدای آهنگ،  شدت رنگ را نمایش می‌دهد.

به همان روشی که انسان قادر به درک صدا مگر در یک فرکانس خاص نیست،شزم نیز بجای اینکه کلیت یک آهنگ را هنگام جستجو در نظر بگیرد، فقط “peaks” را می‌گیرد که بالاترین میزان انرژی در یک کلیپ صوتی است. اثر انگشتی که از آهنگ ضبط می‌شود بالاترین نقطه فرکانسی است.

وانگ در مقاله تحقیقاتی برای دانشگاه کلمبیا اظهار داشت که این روش به آن‌ها اجازه می‌دهد تا اکثر قسمت‌های غیرضروری یک کلیپ صوتی مانند سر و صدای پس‌زمینه را بیرون بکشند و اعوجاج را پاک کنند.

تأثیر Shazam


نرم‌افزارهای شناسایی موسیقی به شکل دهی دنیای موسیقی نیز کمک می‌کنند. ایستگاه‌های رادیویی اغلب از داده‌های مربوط به آنچه مردم استفاده می‌کنند دقت می‌کنند تا بفهمند چه آهنگ‌هایی توسط مردم گوش داده می‌شود.

دانلود برنامه شزم Shazam


دانلود برنامه Shazam دانلود برنامه Shazam دانلود برنامه Shazam

پرسش و پاسخ


لیست بهترین برنامه‌های شناسایی موسیقی اندروید ۲۰۲۰
Shazam.
SoundHound
MusixMatch
Google Now Playing
Music ID
Genius
BeatFind
Soly

Shazam ریمیکسهای زنده یک آهنگ را بررسی نمی‌کند، Shazam مکالمات و سر و صدای پس‌زمینه را بخشی از آهنگ تفسیر می‌کند و ممکن است آهنگ را شناسایی نکند.

به نظر می‌رسد که SoundHound به وضوح برنامه بهتری بین این دو است، اما وقتی تست موسیقی صورت گرفت، Shazam دقیق تر بود.

NoteDetector تنها راه برای پیداکردن متن موسیقی بر روی آی فون است.

با جستجوی صدا در Google نام آهنگ را پیدا کنید.
در اپلیکیشن Google Search در گوشی موبایل، صفحه اصلی را لمس کرده و نگه دارید.
روی Widgets ضربه بزنید.
انگشت خود را به سمت راست بکشید یا به سمت پایین بروید تا “Google” را ببینید. برای یافتن “Sound Search” به سمت راست بروید. نماد note یا یادداشت را به صفحه اصلی بکشید.

Shazam به تازگی بروزرسانی جدیدی را برای ویندوز ۱۰ منتشر کرده است که هم اکنون برای دانلود به صورت رایگان از فروشگاه ویندوز در دسترس است.

ارسال یک پاسخ

آدرس ایمیل شما منتشر نخواهد شد.