مدلی که کامپیوترها را به درک زبان انسان نزدیکتر میکند
پیوتر زلاسکو، مهندس مرکز پردازش زبان و گفتار جانز هاپکینز، مدل یادگیری ماشینی را تولید کرده است که میتواند نقشهای گفتاری را در متن گفتوگوهایی که سیستمهای درک زبان (LU) پیاده کردهاند، تشخیص دهد. کامپیوترها با استفاده از این روش در نهایت میتوانند متن گفتاری یا نوشتاری را همانند انسانها درک کنند.
مدل جدید، نیت گوینده را از روی واژههای بهکاررفته تشخیص میدهد و آنها را در رونوشت نهایی به مقولههایی مانند «خبر»، «پرسش» یا «وقفه» تقسیم میکند؛ این عمل «تشخیص کنش گفتوگو» نامیده میشود. مدل زلاسکو میتواند نسخههایی منظمتر و تقسیمبندیشدهتر از متنها را برای مدلهای دیگر فراهم کند و اینگونه، اولین گام را در فهم یک مکالمه بردارد.
زلاسکو بیان کرد: «سیستمهای درک زبان با استفاده از این روش جدید، دیگر با متنهای طولانی و غیرساختمندی سروکار ندارند که برای تعیین مواردی از قبیل موضوع، احساس یا نیت آنها با مشکل مواجه هستند. در عوض میتوانند با مجموعهای از عبارتها کار کنند که در بر دارنده مطالب کاملاً مشخصی مانند پرسش یا وقفه هستند. مدلی که من تولید کردهام، این سیستمها را قادر میسازد که در زمینههایی کار کنند که در صورت نبود این مدل، در انجام آنها ناموفق بودند.» پژوهش زلاسکو بهتازگی در مجله Transactions of the Association for Computational Linguistics به چاپ رسیده است.
زلاسکو در این مقاله از برخی مدلهای جدید درک زبان بهمنظور سازماندهی و مقولهبندی واژهها و عبارتها استفاده کرده و تأثیر متغیرهای مختلفی مانند نقطهگذاری را بر عملکرد این مدلها، بررسی کرده است.
به گفته زلاسکو، مشخص شد که نقطهگذاری، سرنخهای بسیار محکمی مانند محتوای گفتوگو را برای مدلها فراهم میکند که در نبود نقطهگذاری مناسب، این قبیل سرنخها هم به دست نمیآمدند.
زمانی که زلاسکو در عرصه صنعت بر روی تحلیل گفتوگوهای انسان با انسان کار میکرد، متوجه شد که بسیاری از الگوریتمهای پردازش زبان طبیعی، تنها زمانی که متن دارای ساخت روشنی باشد، بهدرستی کار میکنند؛ بهعنوان مثال، زمانی که فرد جملات را بهصورت کامل ادا میکند، اما در واقعیت، بهندرت اتفاق میافتد که افراد این چنین رسمی صحبت کنند و به همین دلیل برای سیستمها دشوار است که شروع و پایان جملهها را بهدرستی تعیین کنند. زلاسکو قصد داشت سیستمی تولید کند که گفتوگوهای طبیعی را درک کند.
زلاسکو گفت: «اینجاست که چارچوب «کنش گفتوگو» وارد عمل میشود. با استفاده از این چارچوب حداقل میتوانیم «واحدهای» یک مکالمه را پیدا کنیم. این دستاورد میتواند به انجام طیف وسیعی از تکالیف از قبیل خلاصهسازی، تشخیص نیت و تعیین عبارتهای کلیدی، کمک کند.»
زلاسکو بر این باور است که مدل تولیدی او، در نهایت به کار شرکتهایی میآید که از فرایند تحلیل گفتار استفاده میکنند؛ برخی از کسبوکارها از این فرایند برای تحلیل مکالمات مشتریان و پاسخگویان مرکز پشتیبانی از مشتری استفاده میکنند. سیستمهای تحلیل گفتار معمولاً کار پیادهسازی خودکار مکالمات و جستوجوی کلیدواژهها را انجام میدهند که به گفته زلاسکو، اطلاعات کمی از این مکالمهها به دست میدهند، در حالی که شرکتها، نیازمند ابزاری هستند که علاوه بر کلیدواژهها، واقعاً مکالمه را درک کنند.
زلاسکو پیشبینی میکند که روزی پزشکان نیز از مدل او استفاده کنند و اینگونه در زمان ارزشمندی که اکنون هنگام گفتوگو با بیمار، صرف یادداشتبرداری میکنند، صرفهجویی میشود. در عوض، دستگاهی که از مدل زلاسکو استفاده میکند، میتواند بهسرعت متن مکالمه را پیاده و فرمها را بهصورت خودکار، پر کند و به پزشکان امکان میدهد که فقط روی بیمار خود تمرکز کنند.
زلاسکو در ژانویۀ 2020 به مرکز پردازش زبان و گفتار جانز هاپکینز ملحق شد. از نظر او این مرکز، محیط پژوهشی نوآورانهای است که با صنعت نیز همکاری دارد و به پیشرفت او کمک میکند.
وی گفت: «افراد برای موفقیت نیاز به فضایی دارند که به آنها اجازه دهد خلاقیت خود را بروز دهند، در فرصت مناسب نتایج آزمایشهای خود را بررسی کنند و از آنها درس بگیرند و در دفعات بعدی آن را درست انجام دهند. هنگام انجام این نوع پژوهشها توجه به ملاحظات و محدودیتهای عملی نیز اهمیت دارد؛ به همین دلیل، مرکز پردازش زبان و گفتار، جای بسیار مناسبی برای انجام این کار است، زیرا سابقه خوبی در زمینه همکاری با صنعت دارد.»
جدیدترین اخبار هوش مصنوعی ایران و جهان را با هوشیو دنبال کنید