پیشرفت محسوس در تشخیص صدا

مدتها  پیش مطلبی خوندم با این موضوع که گوگل داره روی سیستمی کار می‌کنه که subtitle خودکار برای ویدئو‌ها تولید کنه.
دیروز بعد از مدت‌ها یه سر به Youtube زدم و دیدم که گوگل این امکان را فعال کرده است. کافی است که روی نوار ابزار پخش کلیک کنید و بگین زیرنویس ویدئوها را نمایش بده.
حتی شما می‌تونید این امکان را با امکان ترجمه آنلاین فعال کنید. من این امکان را با تکه‌ای از فیلم dead poet society امتحان کردم. زیرنویس‌ها صددرصد درست نبود و ترجمه فارسی از اون هم بدتر اما واقعا کار می‌کرد و خروجیش بخصوص برای زبان انگلیسی قابل قبول بود.
یادمه یه زمانی برنامه‌های تشخیص صدا (speech recognition) به بازار اومده بود و ساعت‌ها باید باهاش حرف می‌زدی تا تم صدات را یاد بگیره و بعد از اون هنوز هم نتایج بدون اشکال نبود.
این قضیه وقتی که میرسه به سیستمی که هر ویدئویی را با صداهای مختلف بتونه تشخیص بده یعنی یه پیشرفت بزرگ.
چیزی که یه زمانی رویا بود الان دم دست به نظر می‌رسه. یه سیستم ارتباطی صوتی تصویری -تو مایه‌های ویدئو کنفرانس- با این تفاوت که مهم نیست به چه زبانی با چه کسی گفتگو می‌کنید! شما با هر زبانی که صحبت کنید مخاطبین شما با صدای شما و به زبان خودشان صدای شما را خواهند شنید و شما هم صدای آن‌ها را به زبان محلی خودتان دریافت خواهید کرد.
یکی دیگر از مرزهای ارتباطی بار دیگر فرو می‌ریزد و دورانی جدید از بشریت آغاز خواهد شد.

2 دیدگاه برای “پیشرفت محسوس در تشخیص صدا”

  1. تو برنامه کلیک شبکه فارسی بی بی سی هم دیدم که یه شرکتی دستگاههای تشخیص صدایی را برای ترجمه اختراع کرده البته بعضی از اونا از 3000 مترجم انسانی استفاده میکنن ولی پیشرفت قابل ملاحظه ای بود.یادمه استاد هوش مصنوعی ما سال قبل میگفت هوش مصنوعی تا 20 30 سال دیگه پیشرفت محسوسی نمیکنه!حالا باید نشست دید،یا شایدم دست به کار شد و دید :دی

دیدگاه‌ها بسته شده‌اند.