
متا و رمز گشایی افکار انسانی با هوش مصنوعی
در ده سال گذشته، آزمایشگاه تحقیقات بنیادی هوش مصنوعی متا (FAIR) در شهر پاریس فرانسه، پیشگام پیشرفتهای علمی بوده است. مدیر متا در این باره توضیح می دهد. ما دستاوردها و پیشرفتهای مهمی در حوزه پزشکی، اقلیم شناسی و حفاظت از محیط زیست داشتهایم و همچنان به تعهد خود نسبت به علمی باز و تکرار پذیر پا برجا هستیم. با نگاهی به ده سال آینده، تمرکز فعلی ما به دستیابی هوش ماشینی پیشرفته (AMI) و استفاده از آن برای توسعه محصولات و نوآوریهایی است که به نفع همه انسانها باشد.
امروز برای موضوعات شناختی، مغزی و زبانی با همکاری مرکز باسک که یک مرکز پیشرو در پژوهش میانرشتهای در شهر سن سباستین کشور اسپانیا است دو دستاورد مهم را به اشتراک میگذاریم. این دستاوردها نشان میدهند چگونه هوش مصنوعی میتواند به پیشرفت فهم ما از هوش انسانی کمک کند و ما را یک گام به هوش ماشینی پیشرفته (AMI) نزدیکتر کند.
استفاده از هوش مصنوعی برای رمزگشایی زبان مغز و پیشرفت درک ما از ارتباطات انسانی
بر پایه تحقیقات پیشین، با استفاده از فعالیت های مغزی در زمینه رمزگشایی در این پژوهش توانسته ایم ، درک تصاویر و گفتار و همینطور تولید جملات را از طریق ثبت غیرتهاجمی سیگنالهای مغزی رمزگشایی کنیم. این روش میتواند تا ۸۰٪ از کاراکترها را با دقت بالا شناسایی کرده و در بسیاری از موارد، جملات کامل را تنها از روی سیگنالهای مغزی بازسازی کند.
در مطالعهای دیگر، بررسی کردهایم که چگونه هوش مصنوعی میتواند به درک بهتر این سیگنالهای مغزی کمک کند و روشن نماید مغز چگونه افکار را بهطور مؤثر به یک توالی از کلمات تبدیل میکند.
استفاده از هوش مصنوعی برای رمز گشایی زبانی از سیگنال های ثبت شده به روش غیر تهاجمی در مغز
هر ساله، میلیونها نفر در جهان دچار ضایعات مغزی میشوند. این موضوع میتواند توانایی آنها را در برقراری ارتباط مختل کند. روشهای فعلی نشان میدهند که این ارتباط را میتوان با استفاده از یک نوروپروتز که سیگنالهای فرمان را به یک رمزگشای هوش مصنوعی ارسال میکند، بازگرداند. با این حال، روشهای ثبت سیگنال به روش تهاجمی مغز مانند الکتروانسفالوگرافی استریوتاکتیک (sEEG) و الکتروکورتیکوگرافی (ECoG) نیاز به جراحی مغز دارند و مقیاسپذیری آنها مشکل است. تاکنون، استفاده از روشهای غیرتهاجمی معمولاً به دلیل پیچیدگی و نویز بالای سیگنالهای ثبتشده با محدودیت مواجه بوده اند.
شناخت مغز و زبان هنگام تایپ
ما در اولین مطالعه خود در مرکز باسک برای شناخت، مغز و زبان (BCBL) هنگام تایپ کردن، از MEG و EEG (دو دستگاه غیرتهاجمی که میدانهای مغناطیسی و الکتریکی ناشی از فعالیت عصبی را اندازهگیری میکنند) برای ثبت فعالیت مغزی ۳۵ داوطلب سالم استفاده کردیم. سپس، یک مدل جدید هوش مصنوعی را برای بازسازی جمله صرفاً از روی سیگنالهای مغزی آموزش دادیم. این مدل توانست در جملات جدید، تا ۸۰٪ کاراکترهای تایپشده توسط شرکتکنندگان را از دادههای ثبتشده با MEG رمزگشایی کند. این مورد حداقل دو برابر بهتر از دقتی است که با سیستم کلاسیک EEG قابل دستیابی است.
بازیابی ارتباطات
این پژوهش میتواند مسیر جدیدی برای رابطهای غیرتهاجمی مغز و کامپیوتر ایجاد نماید تا به افرادی که توانایی صحبت کردن را از دست دادهاند، در بازیابی ارتباط کمک کنند. با این حال، چند چالش مهم وجود دارد که باید پیش از بهکارگیری این روش در محیطهای بالینی برطرف شوند.
نخستین چالش مربوط به عملکرد است، زیرا دقت رمزگشایی هنوز کامل نیست. چالش دوم عملیاتی است، زیرا MEG نیاز دارد که فرد در یک اتاق با محافظ مغناطیسی قرار گرفته و کاملاً بیحرکت بماند. در نهایت، از آنجا که این پژوهش با داوطلبان سالم انجام شده است، تحقیقات آیندگان باید این موضوع را ابررسی کند که این روش چگونه میتواند به افرادی که دچار آسیبهای مغزی شدهاند، کمک کند؟
استفاده از هوش مصنوعی برای درک چگونگی شکلگیری زبان در مغز انسان
ما همچنین یک دستاورد مهم در زمینه درک مکانیسمهای عصبی هماهنگکننده تولید زبان در مغز انسان را به اشتراک میگذاریم. مطالعه فعالیت مغز در هنگام گفتار همواره یک چالش بزرگ برای علوم اعصاب بوده است، بخشی از آن به دلیل یک مشکل فنی ساده است: حرکت دهان و زبان باعث ایجاد اختلال شدید در سیگنالهای تصویربرداری عصبی میشود.
برای بررسی اینکه مغز ما چگونه افکار را به دنبالههای پیچیدهای از کنشهای حرکتی تبدیل میکند، از هوش مصنوعی برای تفسیر سیگنالهای MEG در هنگام تایپ جملات توسط شرکتکنندگان استفاده کردیم. با ثبت ۱۰۰۰ تصویر لحظهای از مغز در هر ثانیه، توانستیم دقیقاً لحظهای را که افکار به کلمات، هجیها و حتی حروف منفرد تبدیل میشوند، شناسایی کنیم.
توالی مغز در هماهنگی
مطالعه ما نشان میدهد که مغز یک توالی از جانمایی را ایجاد میکند که از سطحی کاملاً انتزاعی، یعنی معنای جمله، آغاز شده و بهتدریج به مجموعهای از کنشها، مانند حرکت واقعی انگشتان روی صفحهکلید، تبدیل میشود.
نکته مهم بعدی این است که این پژوهش نشان میدهد مغز چگونه بهطور همزمان و هماهنگ، کلمات و کنشهای متوالی را در خود جانمایی میکند. نتایج ما نشان میدهد که مغز از یک "کد عصبی پویا" استفاده میکند (یک مکانیسم عصبی ویژه که جانمایی های متوالی را به هم متصل میکند و همزمان هر یک را برای مدت طولانی حفظ میکند)
رمزگشایی کدهای عصبی زبان همچنان یکی از بزرگترین چالشهای هوش مصنوعی و علوم اعصاب است. توانایی استفاده از زبان، که منحصراً مختص انسان است، به گونهی است که برخلاف هر موجود دیگری روی این سیاره این امکان را دارد که استدلال کند، بیاموزد و دانش را ذخیره کند. از این رو، درک ساختار عصبی زبان و اصول محاسباتی آن یک مسیر کلیدی برای توسعه هوش ماشینی پیشرفته (AMI) به حساب میآید.
ایجاد پیشرفتهای پزشکی با هوش مصنوعی لایه باز (منبع باز)
ما در متا، در موقعیت منحصربه فردی قرار داریم تا با استفاده از هوش مصنوعی به حل برخی از بزرگترین چالشهای جهان کمک کنیم. تعهد ما به لایه باز بودن این امکان را برای جامعه هوش مصنوعی فراهم می کند تا بر پایه مدلهای ما کار کنند و به پیشرفتهای جدیدی دست یابند.
ماه گذشته، اعلام کردیم که شرکت Bright Heart، که در فرانسه مستقر است، از مدل DINOv2 در نرمافزار هوش مصنوعی خود استفاده میکند تا به پزشکان در تشخیص یا رد علائم نقص مادرزادی قلب در سونوگرافی قلب جنین کمک کند. سال گذشته، Bright Heart موفق به دریافت تأییدیه FDA 510(k) برای نرمافزار خود شد، که بخشی از این موفقیت را به مشارکتهای لایه باز متا نسبت میدهند.
شرکت Virgo، مستقر در ایالات متحده، از مدل DINOv2 برای تحلیل ویدئوهای آندوسکوپی از این موضوع استفاده میکند. این شرکت در طیف بزرگی از شاخصهای هوش مصنوعی مرتبط با دستگاه آندوسکوپی، از جمله طبقهبندی نقاط تشخیصی آناتومی بدن، ارزیابی شدت بیماری کولیت اولسراتیو و بخشبندی پولیپها، توانسته به دقتی در سطح پیشرفتهترین فناوریهای دنیا دست یابد.
شگفت انگیز است که با نگاهی به ده سال آینده، ببینیم دستاوردهای امروز چگونه میتوانند به نفع جامعه تمام شوند. ما مشتاقانه منتظریم تا گفتوگوهای مهم خود را با جامعه علمی ادامه دهیم و در کنار یکدیگر، برای حل برخی از بزرگترین چالشهای اجتماعی گام برداریم.