ساخت هوش مصنوعی با قابلیت رمزگشایی دقیق گفتار از فعالیت مغز

نوعی از هوش مصنوعی اخیرا توسعه یافته است که می تواند کلمات و جملات مربوط به فعالیت مغز را با دقت شگفت آور و البته محدود رمزگشایی کند. این هوش مصنوعی تنها با استفاده از چند ثانیه از داده های فعالیت مغز انسان می تواند آنچه را که فرد شنیده است حدس بزند. در یک مطالعه اولیه، محققان دریافتند که این هوش مصنوعی می تواند پاسخ صحیح را در 73 درصد مواقع در بین 10 احتمال برتر قرار دهد.

جیووانی دی لیبرتویک دانشمند کامپیوتر فعال در کالج ترینیتی دوبلین، که در این تحقیق شرکت نداشت، می گوید:

عملکرد هوش مصنوعی بالاتر از آن چیزی بود که بسیاری از مردم در آن زمان تصور می کردند.

محققان در 25 آگوست امسال (حدود دو هفته پیش) در arXiv.org گزارش دادند که هوش مصنوعی توسعه یافته در متا، شرکت مادر فیس بوک، در نهایت می تواند به هزاران نفر در سراسر جهان کمک کند تا از طریق گفتار ارتباط برقرار کنند. ، از نوشتن یا زبان اشاره خودداری کنید. این وضعیت وخیم و دشوار شامل بسیاری از بیمارانی می شود که از حداقل هوشیاری یا “حالت نباتی” رنج می برند. وضعیتی که اکنون به عنوان سندرم بیداری بدون پاسخ شناخته می شود.

بیشتر فناوری‌های موجود برای کمک به چنین بیمارانی برای برقراری ارتباط، نیاز به جراحی‌های خطرناک مغز برای کاشت الکترود دارند. ژان ریمی کینگعصب شناس و محقق هوش مصنوعی در Meta که در حال حاضر در École Normale Supérieure در پاریس مشغول به کار است، می گوید:

رویکرد جدید ممکن است یک رویکرد مناسب برای کمک به بیماران مبتلا به نقص های ارتباطی بدون استفاده از روش های تهاجمی ارائه دهد.

کینگ و همکارانش یک ابزار محاسباتی برای تشخیص کلمات و جملات در 56000 ساعت گفتار ضبط شده از 53 زبان آموزش دادند. ابزار دوم که به عنوان مدل زبان نیز شناخته می‌شود، سرانجام توانست تشخیص دهد که ویژگی‌های خاص یک زبان چه در سطح خوب (حروف یا هجاهای فکری) و چه در سطح وسیع‌تر، مانند یک کلمه یا جمله و غیره کار می‌کنند. -که در هوش مصنوعی عمومی نامیده می شوند آنها را یاد خواهند گرفت.

  باز کردن بسته بندی OnePlus 10 Pro

این تیم تحقیقاتی هوش مصنوعی را در این مدل زبان و پایگاه‌های اطلاعاتی چهار موسسه که شامل فعالیت مغزی 169 داوطلب می‌شد، اعمال کردند. شرکت کنندگان در این پایگاه های اطلاعاتی به داستان ها و جملات مختلفی گوش دادند، از جمله پیرمرد و دریا اثر ارنست همینگوی و ماجراهای آلیس در سرزمین عجایب نوشته لوئیس کارول. این گوش دادن زمانی اتفاق می‌افتد که مغز افراد به طور همزمان از آن استفاده می‌کند مگنتوآنسفالوگرافی یا الکتروانسفالوگرافی در حال اسکن بود. لازم به ذکر است که تکنیک های ذکر شده قسمت های مغناطیسی یا الکتریکی سیگنال های مغز را اندازه گیری و ارزیابی می کنند.

مقاله مرتبط:

با استفاده از یک روش محاسباتی که به توضیح تفاوت‌های فیزیکی بین مغزهای واقعی کمک می‌کند، تیم تحقیقاتی سپس سعی کردند آنچه را که شرکت‌کنندگان شنیده‌اند با استفاده از تنها سه ثانیه داده‌های مربوط به فعالیت مغز رمزگشایی کنند. آنها به هوش مصنوعی دستور دادند صداهای گفتاری تولید کند. نتایج را تراز و اندازه‌گیری کنند. از جریان های داستانی با الگوهای فعالیت مغز محاسبه شده توسط هوش مصنوعی بر اساس آنچه مردم شنیده اند. سپس، با نگاهی به بیش از 1000 احتمال مختلف، هوش مصنوعی پیش‌بینی‌هایی درباره آنچه فرد در آن مدت کوتاه شنیده بود، انجام داد.

با استفاده از مگنتوآنسفالوگرافی یا MEG، پاسخ صحیح در 73 درصد مواقع در میان 10 حدس برتر هوش مصنوعی قرار داشت. این مقدار با الکتروانسفالوگرافی به بیش از 30 درصد کاهش یافت. DeLiberto می گوید عملکرد MEG بسیار خوب است. اما او به کاربرد عملی آن خوشبین نیست:

با آن چه کنیم؟ هیچی مطلقا هیچی

دلیل اصلی ناامیدکننده لیبرتو او این است که MEG اساساً به دستگاهی حجیم و گران قیمت نیاز دارد. آوردن این فناوری به کلینیک ها نیازمند نوآوری علمی است. نوآوری هایی که می تواند خودروها را ارزان تر و آسان تر کند.

  300 میلیارد ضرر به شرکت های پرداخت الکترونیکی از محدودیت های اینترنتی

به گفته جاناتان برنان، زبان شناس دانشگاه میشیگان، درک معنای واقعی «رمزگشایی» نیز در این تحقیق مهم است. این کلمه اغلب برای توصیف فرآیند رمزگشایی اطلاعات به طور مستقیم از یک منبع (و در این مورد گفتار از فعالیت مغز) استفاده می شود. اما هوش مصنوعی تنها توانست در چنین کاری موفق شود زیرا لیست محدودی از پاسخ های صحیح ممکن برای حدس زدن ارائه شده بود. برنان می گوید:

در مورد زبان، اگر بخواهیم آن را برای استفاده عملی به مقیاس کوچکتری تقلیل دهیم، این امکان پذیر نیست. زیرا زبان بی نهایت است.

علاوه بر این، هوش مصنوعی اطلاعات شرکت‌کنندگانی را که منفعلانه به صدا گوش می‌دهند رمزگشایی می‌کند، که مستقیماً به بیماران غیرکلامی مربوط نمی‌شود. برای اینکه ابزار فوق واقعاً به یک ابزار ارتباطی معنادار تبدیل شود، دانشمندان باید کشف کنند که چگونه فعالیت مغز این بیماران را برای آنچه که واقعاً قصد بیان آن را دارند رمزگشایی کنند. از جمله سوالات اساسی مانند ابراز گرسنگی، ناراحتی یا به سادگی بله یا خیر.

مقاله مرتبط:

کینگ با این انتقادات موافق است و بیان می‌کند که تحقیق جدید «رمزگشایی ادراک گفتار» است. تولید او نیست. اگرچه هدف نهایی دانشمندان تولید گفتار است، اما به نظر می رسد راه درازی در پیش داریم.

دیدگاهتان را بنویسید