راهی برای تبدیل مستقیم سیگنال‌های مغزی به گفتار

بیگ بنگ: دانشمندان در آزمایشی منحصربفرد توانستند سیگنال‌های مغز را به طور مستقیم به گفتار قابل فهم تبدیل کنند. شاید در نگاه اول چیزی بیش از ایده علمی – تخیلی به نظر نیاید، اما این دستاورد می تواند به کمکِ افرادی بیاید که مشکلات گفتاری دارند. افزون بر این، ما می توانیم در آینده با این دستاورد به میانجی‌های رایانه‌ای مفید و مهمی دست پیدا کنیم.

به گزارش بیگ بنگ، یک الگوریتم هوش مصنوعی در این سیستم نقش کلیدی ایفا می کند. با این الگوریتم، آنچه فرد می شنود با الگوی فعالیت الکتریکی مطابقت پیدا می کند و سپس آنها به کمک الگوریتم به گفتاری تبدیل می شوند که واقعا برای شنونده قابل درک و منطقی به نظر می رسد. ما از تحقیقات قبلی می دانیم که وقتی حرف می زنیم، الگوهای متمایزی در شبکه‌های عصبی مغز شکل می گیرند. در این مورد، سیستم به رمزگشایی واکنش‌های مغز می پردازد، نه اینکه افکار حقیقی را به گفتار تبدیل کند. اما این قابلیت را هم دارد، فقط به پیشرفت بیشتری در این زمینه نیاز است.

«نیما مسگرانی»، نویسنده و محقق از دانشگاه کلمبیا در نیویورک بیان کرد: «صدایمان به ما کمک می کند تا با دوستان، خانواده و دنیای پیرامون خود پیوند برقرار کنیم. به همین خاطر است که از دست دادن قدرت تولید صدا به دلیل آسیب یا بیماری، خیلی دردناک و مخرب است. ما با انجام مطالعات جدید، به راهکار بالقوه‌ای برای احیای آن قدرت دست یافته‌ایم. ما نشان دادیم که با فناوری مناسب، افکار این افراد میتواند رمزگشایی شده و توسط هر شنونده‌ای فهمیده شود.»

الگوریتمِ مورد استفاده «vocoder» نام دارد؛ یعنی همان نوع الگوریتمی که میتواند گفتار را پس از دیدنِ آموزش‌هایی دربارۀ حرف زدن انسان تولید کند. وقتی پاسخی از «سیری» یا «اَلِکسا» می شنوید، باید بدانید که در آن لحظه از الگوریتم «vocoder» استفاده می شود. به عبارت دیگر، آمازون یا اپل نیازی ندارند تا تمامی کلمات را در دستگاه‌های خود برنامه‌نویسی کنند؛ آنها از این الگوریتم برای تولید صدای واقع‌گرایانه استفاده می کنند. در اینجا، الگوریتم «vocoder» نه با گفتار انسان، بلکه با فعالیت عصبی در بخش کورتکس شنیداری مغز آموزش دیده است.

این فعالیت در بیمارانی که جراحی مغزی در آنها انجام می شود و در عین حال جملاتی با صدای بلند برایشان پخش می شود، اندازه‌گیری می شود. با این بانک داده‌ای، همزمان که بیماران به اعداد 0 تا 9 با صدای بلند گوش می دادند، سیگنال‌های مغز ثبت شده و این الگوریتم به کار برده می شود. سپس، با انجام تجزیه و تحلیل‌های جامع هوش مصنوعی، بررسی‌های دقیق‌تری صورت می گیرد. سیگنال‌های ثبت شده مطابقت خوبی با صداهای شنیده شده داشتند. این روش بسیار قدرتمندتر و موثرتر از روش‌های قبلی بود. در روش‌های قبلی از مدل‌های کامپیوتری ساده‌تر استفاده می شد.

مِسگرانی در ادامه افزود: «ما دریافتیم که افراد می توانند تقریبا در 75 درصد از مواقع صداها را درک کرده و تکرار کنند؛ یعنی خیلی بهتر و بیشتر از دفعات قبلی. این نتیجه برای ما کاملا دور از انتظار بود. این برنامۀ حساس و شبکه‌های عصبی قوی، صداهایی را که بیماران به آنها گوش داده بودند را با دقتی شگفت‌انگیز، ارائه کردند. » هنوز کارهای زیادی برای انجام دادن وجود دارد، اما این دستاورد میتواند پتانسیل‌های فراوانی را به ارمغان بیاورد. بار دیگر باید به این نکته تاکید کرد که سیستم افکار ذهنی را به گفتار تبدیل نمی کند، اما شاید روزی بتواند از پسِ انجام این کار هم بر بیاید. این همان چالشی است که محققان می خواهند در آینده بر آن فائق آیند. شاید روزی فرا برسد که با صدور یک فرمان ذهنی، چراغ‌های گوشی هوشمند خود را روشن کنید.

البته بدیهی است که این کار به زمان بیشتری نیاز دارد و باید در آینده چنین اتفاقی می افتد یا خیر. در آینده‌ای نه چندان دور، شاید برخی بیماران بتوانند افکار خود را با سیستم فوق‌الذکر به گفتار تبدیل کرده و قسمت عمده‌ای از نیازهای خود را برطرف نمایند. این دستاورد می تواند تحولی عظیم و قابل توجه باشد. برای کسی که قدرت تکلم و صدایش را از دست داده است، باورِ چنین دستاوردی فراتر از ذهن است. آنان می توانند در این صورت بار دیگر با دنیای پیرامون خود ارتباط مستمر برقرار کنند. جزئیات بیشتر این مقاله پژوهشی در Scientific Reports منتشر شده است.

ترجمه: منصور نقی لو/ سایت علمی بیگ بنگ

منبع: sciencealert.com

لینک کوتاه مقاله : https://bigbangpage.com/?p=82716