برای تشخیص افسردگی، پزشکان با بیماران مصاحبه می کنند و سؤالات خاصی را در مورد بیماری های روحی گذشته، شیوه زندگی و خلق می کنند و شرایط را بر اساس پاسخ بیمار مشخص می کنند.
در سال های اخیر، یادگیری ماشین به عنوان یک ابزار مفید برای تشخیص مورد حمایت قرار گرفته است. برای مثال، مدل های یادگیری ماشین توسعه یافته اند که می توانند کلمات و گفتاری را شناسایی کنند که ممکن است افسردگی را نشان دهند. اما این مدل ها پیش بینی می کنند که یک فرد افسرده است یا نه، بر اساس پاسخ های خاص فرد به سوالات خاص تشخیص می دهد. این روش ها دقیق هستند، اما وابستگی آنها به نوع سوال پرسیدن محدود کردن چگونگی و جایی است که می توان آنها را استفاده کرد.
در مقاله ای که در کنفرانس Interspeech ارائه شده است، محققان MIT یک مدل شبکه عصبی را که می توانند بر روی متن خام و داده های صوتی از مصاحبه ها به منظور کشف الگوهای گفتاری نشان دهنده افسردگی را رها کنند، به تفصیل شرح داده است. با توجه به یک موضوع جدید، می توان آن را دقیقا بدون نیاز به هر گونه اطلاعات دیگر در مورد سوالات و پاسخ پیش بینی کرد.
محققان امیدوارند که این روش بتواند برای توسعه ابزارهایی برای تشخیص علائم افسردگی در مکالمه طبیعی استفاده شود. در آینده، این مدل می تواند، مثلا، قدرت برنامه های تلفن همراه را که متن و صدای کاربر را برای ناراحتی ذهنی نظارت می کند و هشدارها را ارسال کند. این امر می تواند برای کسانی که نمی توانند به دلیل تشخیص اولیه، به علت فاصله، هزینه، یا کمبود آگاهی که ممکن است اشتباه باشد، برای آنها مفید باشد.
نخستین نوشتۀ توکا الهانی، محقق در آزمایشگاه هوش مصنوعی (که در آن از یک آزمایشگاه هوش مصنوعی و کامپیوتری استفاده می شود) می گوید: “اولین نکاتی که ما در مورد اینکه یک فرد خوشحال، هیجان زده، غمگین و یا برخی از شرایط شناختی جدی، مانند افسردگی است) “اگر میخواهید مدل های تشخیص افسردگی را به شیوه مقیاس پذیری بکار ببرید و می خواهید میزان محدودیت هایی را که بر روی داده های استفاده کنید به حداقل برسانید. شما می توانید در هر مکالمه معمولی آن را بکار ببرید و مدل انتخاب کنید از تعامل طبیعی، وضعیت فرد باخبر شوید ”
البته این تکنولوژی هنوز هم می تواند برای شناسایی اختلالات روانی در مکالمه های گاه به گاه در دفاتر بالینی مورد استفاده قرار گیرد، جیمز شیشه، یکی از محققان ارشد پژوهشی در CSAIL، افزوده است. او می گوید: “هر بیمار به طور متفاوتی صحبت خواهد کرد و اگر مدل تغییرات را تغییر دهد شاید پرچم پزشک باشد. این یک قدم به جلو در حال مشاهده است اگر ما بتوانیم کمک های بالینی را برای کمک به پزشکان انجام دهیم.”
یکی دیگر از نویسندگان این مقاله، محمد قاسمی، عضو موسسه مهندسی پزشکی و علوم (IMES) است.
مدل سازی بدون محتوا
نوآوری کلیدی این مدل در توانایی آن در تشخیص الگوهایی است که نشان دهنده افسردگی است، و سپس آن الگوها را به افراد جدید بدون اطلاعات اضافی نشان می دهد. آلنانی می گوید: ما آن را” مستقل از متن “می نامیم، زیرا شما هیچگونه محدودیتی در نوع سوالاتی که دنبال آن هستید، و نوع پاسخ به آن سوالات ندارید.
مدل های دیگر با مجموعه ای خاص از سوالات ارائه می شوند و سپس نمونه هایی از نحوه پاسخ فردی بدون افسردگی و نمونه هایی از نحوه پاسخ فردی به افسردگی داده می شود . به عنوان مثال، پرس و جو ساده، “آیا شما سابقه افسردگی دارید؟” از آن پاسخ های دقیق استفاده می کنند تا پس از تعیین اینکه آیا یک شخص جدید هنگام پرسیدن دقیق همان سوال، افسرده شده است یا خیر. آلنانی می گوید: “اما این به این معنا نیست که گفتگو های طبیعی چگونه انجام می شود.”
از سوی دیگر محققان از تکنیکی به نام مدل توالی استفاده می کنند که اغلب برای پردازش گفتار استفاده می شود. با استفاده از این تکنیک، آنها توالی مدل داده های صوتی و متنی را از سوالات و پاسخ ها، از افراد افسرده و غیر افسرده، به صورت یک به یک تغذیه می کردند. همانطور که توالی انباشته شده است، مدل استخراج الگوهای گفتاری است که برای افرادی که با افسردگی یا بدون افسردگی ظهور کرده اند، ظهور یافت. واژه هایی مانند «غمگین»، «کم» یا «پایین» ممکن است با سیگنال های صوتی که از نظر فطری و یکنواخت تر هستند، متصل شوند.
افراد مبتلا به افسردگی نیز ممکن است صحبت کند و از مکاتب طولانی تر بین کلمات استفاده کنند. این شناسه های متن و صوتی برای اختلال روانی در تحقیقات قبلی مورد بررسی قرار گرفته است. در نهایت به مدل رسیده بود تا تعیین کند که آیا هر الگو برای افسردگی پیش بینی شده است یا خیر.
آلنانی می گوید: “مدل توالی کلمات یا سبک گفتار را می بیند و تعیین می کند که این الگوها بیشتر در افراد افسرده دیده می شود. “سپس، اگر توالی های مشابه را در موضوعات جدید ببیند، می تواند پیش بینی کند که آنها نیز افسرده اند.”
این تکنیک توالی نیز به مدل کمک می کند تا در مکالمه به عنوان یک کل نگاه کند و تفاوت های بین این که چگونه افراد با افسردگی و بدون افسردگی در طول زمان صحبت می کنند، توجه کنند.
تشخیص افسردگی
محققان مدل خود را بر روی مجموعه ای از 142 تعامل از مصاحبه تجزیه و تحلیل افسردگی که شامل مصاحبه های صوتی، متن و مصاحبه های ویدئویی از بیماران با مسائل بهداشت روانی و عوامل مجازی تحت کنترل انسان است، آموزش داده و آزمایش کردند. هر سوژه با توجه به افسردگی در مقیاس بین 0 تا 27، با استفاده از پرسشنامه سلامت شخصی ارزیابی می شود. نمرات بالاتر از قطع بین متوسط (10 تا 14) و متوسط (15 تا 19) در نظر گرفته شده افسرده، در حالی که همه دیگر زیر این آستانه در نظر گرفته نمی شوند. از میان همه افراد در مجموعه داده ها، 28 (20 درصد) به عنوان افسرده نامگذاری شده اند.
در آزمایشات، مدل با استفاده از معیارهای دقیق و فراخوانی مورد ارزیابی قرار گرفت. اقدامات دقیق که افراد مبتلا به افسردگی شناسایی شده توسط این مدل افسرده تشخیص داده شدند. به یاد بیاورید که دقت مدل را در تشخیص همه افراد که در کل مجموعه داده های افسرده تشخیص داده می شود اندازه گیری می کنند. در دقت، مدل 71 درصد و به یاد می آورد، 83 درصد به دست آورد. نمره ترکیبی میانگین برای این معیارها، با توجه به هر گونه اشتباه، 77 درصد بود. در اکثر آزمایشات، مدل محققان تقریبا تمام مدل های دیگر را به خوبی پیش برد.
آلنانی یادآور می شود که یک دید کلی از تحقیق این است که در طول آزمایش، مدل نیاز به اطلاعات بسیار بیشتری برای پیش بینی افسردگی از صدا نسبت به متن داشت. با استفاده از متن، مدل می تواند به طور دقیق افسردگی را با استفاده از میانگین هفت توالی سوال و پاسخ تشخیص دهد. با صدا، مدل مورد نیاز حدود 30 توالی است. الحانی می گوید: “این بدان معنی است که مردم از این الگوها در کلمات استفاده می کنند که پیش بینی افسردگی در متن کوتاهتر از متن در صوتی اتفاق می افتد.” چنین بینشی می تواند به محققین MIT و دیگران کمک کند تا مدل های خود را بهبود بخشند.
Glass می گوید: این کار یک خلبان بسیار دلگرم کننده است. اما اکنون محققان به دنبال کشف الگوهای خاصی هستند که مدل در بین نمرات داده های خام مشخص می شود.
GLASSمی گوید: “در حال حاضر کمی از یک جعبه سیاه است.” با این وجود، این سیستم ها، زمانی که شما توضیحی از آنچه را که برداشت می کنید، بیشتر قابل اعتماد هستند. چالش بعدی کشف کردن اطلاعاتی است که داده شده است. ”
محققان همچنین قصد دارند این روش ها را بر روی داده های اضافی از بسیاری از افراد دیگر با سایر شرایط شناختی مانند دمانس آزمایش کنند. آلنانی می گوید: “این نه افسردگی را تشخیص می دهد، بلکه یک مفهوم مشابه از ارزیابی سیگنال روزانه در سخنرانی، که کسی نقص شناختی دارد یا نه.”
منبع:
موارد ارائه شده توسط موسسه فناوری ماساچوست