نوعی از هوش مصنوعی اخیرا توسعه یافته است که می تواند کلمات و جملات مربوط به فعالیت مغز را با دقت شگفت آور و البته محدود رمزگشایی کند. این هوش مصنوعی تنها با استفاده از چند ثانیه از داده های فعالیت مغز انسان می تواند آنچه را که فرد شنیده است حدس بزند. در یک مطالعه اولیه، محققان دریافتند که این هوش مصنوعی می تواند پاسخ صحیح را در 73 درصد مواقع در بین 10 احتمال برتر قرار دهد.
جیووانی دی لیبرتویک دانشمند کامپیوتر فعال در کالج ترینیتی دوبلین، که در این تحقیق شرکت نداشت، می گوید:
عملکرد هوش مصنوعی بالاتر از آن چیزی بود که بسیاری از مردم در آن زمان تصور می کردند.
محققان در 25 آگوست امسال (حدود دو هفته پیش) در arXiv.org گزارش دادند که هوش مصنوعی توسعه یافته در متا، شرکت مادر فیس بوک، در نهایت می تواند به هزاران نفر در سراسر جهان کمک کند تا از طریق گفتار ارتباط برقرار کنند. ، از نوشتن یا زبان اشاره خودداری کنید. این وضعیت وخیم و دشوار شامل بسیاری از بیمارانی می شود که از حداقل هوشیاری یا “حالت نباتی” رنج می برند. وضعیتی که اکنون به عنوان سندرم بیداری بدون پاسخ شناخته می شود.
بیشتر فناوریهای موجود برای کمک به چنین بیمارانی برای برقراری ارتباط، نیاز به جراحیهای خطرناک مغز برای کاشت الکترود دارند. ژان ریمی کینگعصب شناس و محقق هوش مصنوعی در Meta که در حال حاضر در École Normale Supérieure در پاریس مشغول به کار است، می گوید:
رویکرد جدید ممکن است یک رویکرد مناسب برای کمک به بیماران مبتلا به نقص های ارتباطی بدون استفاده از روش های تهاجمی ارائه دهد.
کینگ و همکارانش یک ابزار محاسباتی برای تشخیص کلمات و جملات در 56000 ساعت گفتار ضبط شده از 53 زبان آموزش دادند. ابزار دوم که به عنوان مدل زبان نیز شناخته میشود، سرانجام توانست تشخیص دهد که ویژگیهای خاص یک زبان چه در سطح خوب (حروف یا هجاهای فکری) و چه در سطح وسیعتر، مانند یک کلمه یا جمله و غیره کار میکنند. -که در هوش مصنوعی عمومی نامیده می شوند آنها را یاد خواهند گرفت.
این تیم تحقیقاتی هوش مصنوعی را در این مدل زبان و پایگاههای اطلاعاتی چهار موسسه که شامل فعالیت مغزی 169 داوطلب میشد، اعمال کردند. شرکت کنندگان در این پایگاه های اطلاعاتی به داستان ها و جملات مختلفی گوش دادند، از جمله پیرمرد و دریا اثر ارنست همینگوی و ماجراهای آلیس در سرزمین عجایب نوشته لوئیس کارول. این گوش دادن زمانی اتفاق میافتد که مغز افراد به طور همزمان از آن استفاده میکند مگنتوآنسفالوگرافی یا الکتروانسفالوگرافی در حال اسکن بود. لازم به ذکر است که تکنیک های ذکر شده قسمت های مغناطیسی یا الکتریکی سیگنال های مغز را اندازه گیری و ارزیابی می کنند.
با استفاده از یک روش محاسباتی که به توضیح تفاوتهای فیزیکی بین مغزهای واقعی کمک میکند، تیم تحقیقاتی سپس سعی کردند آنچه را که شرکتکنندگان شنیدهاند با استفاده از تنها سه ثانیه دادههای مربوط به فعالیت مغز رمزگشایی کنند. آنها به هوش مصنوعی دستور دادند صداهای گفتاری تولید کند. نتایج را تراز و اندازهگیری کنند. از جریان های داستانی با الگوهای فعالیت مغز محاسبه شده توسط هوش مصنوعی بر اساس آنچه مردم شنیده اند. سپس، با نگاهی به بیش از 1000 احتمال مختلف، هوش مصنوعی پیشبینیهایی درباره آنچه فرد در آن مدت کوتاه شنیده بود، انجام داد.
با استفاده از مگنتوآنسفالوگرافی یا MEG، پاسخ صحیح در 73 درصد مواقع در میان 10 حدس برتر هوش مصنوعی قرار داشت. این مقدار با الکتروانسفالوگرافی به بیش از 30 درصد کاهش یافت. DeLiberto می گوید عملکرد MEG بسیار خوب است. اما او به کاربرد عملی آن خوشبین نیست:
با آن چه کنیم؟ هیچی مطلقا هیچی
دلیل اصلی ناامیدکننده لیبرتو او این است که MEG اساساً به دستگاهی حجیم و گران قیمت نیاز دارد. آوردن این فناوری به کلینیک ها نیازمند نوآوری علمی است. نوآوری هایی که می تواند خودروها را ارزان تر و آسان تر کند.
به گفته جاناتان برنان، زبان شناس دانشگاه میشیگان، درک معنای واقعی «رمزگشایی» نیز در این تحقیق مهم است. این کلمه اغلب برای توصیف فرآیند رمزگشایی اطلاعات به طور مستقیم از یک منبع (و در این مورد گفتار از فعالیت مغز) استفاده می شود. اما هوش مصنوعی تنها توانست در چنین کاری موفق شود زیرا لیست محدودی از پاسخ های صحیح ممکن برای حدس زدن ارائه شده بود. برنان می گوید:
در مورد زبان، اگر بخواهیم آن را برای استفاده عملی به مقیاس کوچکتری تقلیل دهیم، این امکان پذیر نیست. زیرا زبان بی نهایت است.
علاوه بر این، هوش مصنوعی اطلاعات شرکتکنندگانی را که منفعلانه به صدا گوش میدهند رمزگشایی میکند، که مستقیماً به بیماران غیرکلامی مربوط نمیشود. برای اینکه ابزار فوق واقعاً به یک ابزار ارتباطی معنادار تبدیل شود، دانشمندان باید کشف کنند که چگونه فعالیت مغز این بیماران را برای آنچه که واقعاً قصد بیان آن را دارند رمزگشایی کنند. از جمله سوالات اساسی مانند ابراز گرسنگی، ناراحتی یا به سادگی بله یا خیر.
کینگ با این انتقادات موافق است و بیان میکند که تحقیق جدید «رمزگشایی ادراک گفتار» است. تولید او نیست. اگرچه هدف نهایی دانشمندان تولید گفتار است، اما به نظر می رسد راه درازی در پیش داریم.