
آموزش پردازش زبان طبیعی با اکوسیستم هاگینگ فیس ؛ توکن کننده ها (قسمت چهارم فصل دوم)
توکن کننده ها یکی از اجزای اصلی پایپلاین «پردازش زبان طبیعی» هستند. هدف آنها تبدیل متن به دادههای قابل پردازش است. مدلها فقط قادر به پردازش اعداد میباشند؛ اما توکن کننده ها ورودیهای متنی را به دادههای عددی تبدیل میکنند. جزئیات پایپلاین توکنسازی در این بخش بیان میشود. دادههایی که
شما بهعنوان یک انسان، میتوانید به انگلیسی، اسپانیایی یا چینی صحبت کنید و بنویسید. اما زبان مادری کامپیوتر، که بهعنوان کد ماشین یا زبان ماشین شناخته میشود، برای اکثر مردم تا حد زیادی نامفهوم است. در پایینترین سطوح دستگاه شما، ارتباط نه با کلمات، بلکه از طریق میلیونها صفر و یک انجام میشود که اقدامات منطقی ایجاد میکنند. درواقع، برنامه نویسان 70 سال پیش از کارتهای پانچ برای برقراری ارتباط با اولین رایانهها استفاده کردند. این فرآیند دستی و سخت توسط تعداد نسبتاً کمی از مردم قابلدرک بود. اما امروزه شما میتوانید بگویید “الکسا، من این آهنگ را دوست دارم” و دستگاهی که در خانه شما موسیقی پخش میکند. این امر به لطف پردازش زبان طبیعی ممکن است.





































