Filter by دسته‌ها
chatGTP
ابزارهای هوش مصنوعی
اخبار
گزارش
تیتر یک
چندرسانه ای
آموزش علوم داده
اینفوگرافیک
پادکست
ویدیو
دانش روز
آموزش‌های پایه‌ای هوش مصنوعی
اصول هوش مصنوعی
یادگیری بدون نظارت
یادگیری تقویتی
یادگیری عمیق
یادگیری نیمه نظارتی
آموزش‌های پیشرفته هوش مصنوعی
بینایی ماشین
پردازش زبان طبیعی
پردازش گفتار
چالش‌های عملیاتی
داده کاوی و بیگ دیتا
رایانش ابری و HPC
سیستم‌‌های امبدد
علوم شناختی
دیتاست
رویدادها
جیتکس
کاربردهای هوش مصنوعی
کتابخانه
اشخاص
شرکت‌های هوش مصنوعی
محصولات و مدل‌های هوش مصنوعی
مفاهیم
کسب‌و‌کار
تحلیل بازارهای هوش مصنوعی
کارآفرینی
هوش مصنوعی در ایران
هوش مصنوعی در جهان
مقاله
 چگونه با NotebookLM در چند ثانیه یک پادکست با موضوع دلخواه بسازیم؟

چگونه با NotebookLM در چند ثانیه یک پادکست با موضوع دلخواه بسازیم؟

زمان مطالعه: 4 دقیقه

یکی از سرویس‌های مبتنی بر هوش مصنوعی گوگل که می‌تواند کمک زیادی به تولیدکنندگان محتوا در مرحله تحقیق کند، NotebookLM نام دارد. اما جنجالی‌ترین موضوع درباره این سرویس مربوط به قابلیت صوتی این سرویس است. چیزی که باعث شده تولید محتوای صوتی به شکل یک پادکست گفتگو محور (به انگلیسی) بسیار ساده شود.

مروری بر قابلیت‌های صوتی NotebookLM

نوت‌بوک‌ام‌ال، یک سرویس هوش مصنوعی از گوگل است که به شما امکان می‌دهد محتوای را از منابع مختلفی مانند فایل‌های PDF، فایل‌های متنی، لینک‌های یوتیوب، وب‌سایت‌ها، یا متن‌های کپی شده را در یک «دفترچه» آپلود کنید. هر دفترچه در واقع یک پوشه است که می‌تواند تا ۵۰ آیتم محتوایی را شامل شود.

تمام اطلاعاتی که نوت‌بوک‌ام‌ال با آن کار می‌کند، از همین محتواها به دست می‌آید، به همین دلیل کمتر احتمال دارد که حقایق یا نقل‌قول‌های اشتباه تولید کند. شما می‌توانید  از آن سوال بپرسید، درخواست کنید که انواع محتوا را بر اساس داده‌های شما تولید کند.

یکی دیگر از ویژگی نوت‌بوک‌ام‌ال که اخیراً بیشترین توجه را جلب کرده، توانایی آن در ایجاد چیزی است که گوگل آن را «مرورهای صوتی» (Audio Overviews) می‌نامد. این خلاصه‌های صوتی شبیه به خواندن رباتیک اطلاعات نیستند؛ بلکه بیشتر شبیه به یک گفت‌وگوی پادکستی بین دو نفر هستند. این مکالمات به طرز شگفت‌آوری طبیعی و انسانی به نظر می‌رسند؛ یعنی مکث می‌کنند، گاهی حرف یکدیگر را قطع کرده و از کلماتی مانند «اِمم»، «مثلاً» و «می‌دونی» استفاده می‌کنند.

یکی از کاربردهای این ویژگی، خلاصه کردن محتواهای طولانی یا پیچیده به صورتی است که به راحتی قابل استفاده باشد؛ مثلاً زمانی که در حال رانندگی، پیاده‌روی یا ورزش هستید. تصور کنید دو فرد باهوش سه مقاله تحقیقاتی طولانی را بخوانند و در عرض ده دقیقه درباره یافته‌های اصلی، روش‌ها و جزئیات مهم آن‌ها گفت‌وگو کنند.

چگونه یک مرور صوتی با NotebookLM ایجاد کنیم

برای ایجاد یک مرور صوتی با نوت‌بوک‌ام‌ال باید مراحل مختلفی طی شود:

انتخاب محتوای مورد نظر

ابتدا محتوایی را که می‌خواهید خلاصه شود، انتخاب کنید. می‌توانید از هر نوع محتوایی مانند اسناد، وب‌سایت‌ها، لینک‌های یوتیوب و… استفاده کنید. توجه داشته باشید که تنها یک خلاصه دریافت خواهید کرد، بنابراین اگر می‌خواهید یک «پادکست» درباره یک موضوع خاص داشته باشید، مطمئن شوید که محتوای انتخابی به طور مستقیم به همان موضوع مرتبط باشد.

وارد شدن با حساب کاربری گوگل

با استفاده از مرورگر به سایت نوت‌بوک‌ام‌ال بروید. اگر قبلاً وارد حساب کاربری گوگل خود نشده‌اید، ابتدا باید وارد شوید. اگر اولین بارتان است که از نوت‌بوک‌ام‌ال استفاده می‌کنید، چند دفترچه نمونه و یک دکمه برجسته با عنوان «Create» را خواهید دید. می‌توانید نمونه‌ها را بررسی کنید، اما برای این آموزش، کافی است روی دکمه Create کلیک کنید.

اضافه کردن منابع

روش‌های مختلفی برای اضافه کردن محتوا به دفترچه جدید شما وجود دارد. پس از کلیک روی دکمه Create، گزینه‌های زیر را مشاهده خواهید کرد:

  • کشیدن یا انتخاب فایل‌ها: می‌توانید فایل‌هایی مانند PDF (از یک صفحه تا یک کتاب کامل) یا انواع دیگر فایل‌ها مانند متن (txt، Markdown) یا صوتی (mp3 و غیره) اضافه کنید. توجه داشته باشید که در حال حاضر نمی‌توانید از فایل‌های ورد یا اکسل استفاده کنید.
  • اضافه کردن از گوگل درایو: می‌توانید از فایل‌های Google Docs یا Google Slides نیز استفاده کنید.
  • وب‌سایت‌ها و ویدیوها: می‌توانید یک وب‌سایت یا صفحه خاصی از آن را اضافه کنید. همچنین می‌توانید لینک یک ویدیو در یوتیوب را نیز قرار دهید.
  • متن: می‌توانید متن را از کلیپ‌بورد خود کپی کنید یا به سادگی آن را تایپ کنید.

برای اضافه کردن منابع بیشتر، این مراحل را تکرار کنید. شما می‌توانید تا ۵۰ منبع اضافه کنید، اما معمولاً یک تا پنج منبع برای اکثر مقاصد کافی است.

ایجاد مرور صوتی خود

پس از بارگذاری محتوای خود، صفحه «راهنمای دفترچه» را مشاهده خواهید کرد. این صفحه خلاصه‌ای کوتاه از منابع شما ارائه می‌دهد و گزینه‌هایی مانند ایجاد لیست سوالات متداول، راهنمای مطالعه و غیره را در اختیار شما قرار می‌دهد. همچنین سوالات پیشنهادی و یک جعبه متنی وجود دارد که می‌توانید در آن درخواست‌های مختلفی مانند پاسخ به یک سوال، نوشتن پستی برای لینکدین یا مقاله تفصیلی را مطرح کنید.

برای مثال، من دو فایل PDF (هر کدام حدود ۳۰ صفحه) درباره روندهای صنعت سخنرانی در سال‌های ۲۰۲۳ و ۲۰۲۴ بارگذاری کردم. این سیستم بسیار هوشمند است و بدون اینکه من چیزی بگویم، اولین سوال پیشنهادی‌اش این بود: «چگونه صنعت سخنرانی از ۲۰۲۳ تا ۲۰۲۴ تغییر کرده است؟»

البته امروز ما می‌خواهیم یک مرور صوتی ایجاد کنیم. تنها کاری که باید انجام دهیم این است که روی دکمه Generate کلیک کنیم.

پخش، اشتراک‌گذاری یا دانلود مرور صوتی شما

در این مورد، خلاصه صوتی برای دو فایل PDF طولانی تقریباً ده دقیقه طول می‌کشد و کیفیت آن خوب است. جالب اینجاست که نوت‌بوک‌ام‌ال بدون هیچ دستوری متوجه شد که این گزارش‌ها اطلاعات مشابهی را برای دو سال بررسی کرده‌اند. بنابراین، مجریان گفتگو را با تمرکز بر افزایش تمایل به برگزاری رویدادهای حضوری به جای رویدادهای مجازی آغاز می‌کنند.

سپس به بررسی موضوعات داغ سال ۲۰۲۴ می‌پردازند. وقتی مجری مرد به موضوع سوم، یعنی هوش مصنوعی، می‌رسد، به‌طور شوخی می‌گوید که این موضوع او را «نگران امنیت شغلی خود» کرده است.

اگر از نتایج کار راضی هستید، به‌مانند من می‌توانید با کپی کردن یک لینک، آن را به اشتراک بگذارید. همچنین می‌توانید فایل صوتی را دانلود کرده و در وب‌سایت خود قرار دهید یا آن را با سایر فایل‌های صوتی و ویدیویی ترکیب کنید.

محدودیت‌های مرورهای صوتی NotebookLM

نوت‌بوک‌ام‌ال قادر است صدای بسیار واقع‌گرایانه‌ای تولید کند، اما چند محدودیت دارد. شما نمی‌توانید تعداد یا جنسیت گویندگان را کنترل کنید و در حال حاضر فقط به زبان انگلیسی کار می‌کند. همچنین نمی‌توانید طول فایل صوت را تنظیم کنید؛ اکثر مرورها بیشتر از پنج دقیقه و کمتر از ۱۵ دقیقه هستند. تمام صداها در یک ترک واحد قرار دارند، بنابراین هماهنگ کردن آن با آواتارهای ویدیویی زمان‌بر است.

با اینکه نحوه بیان به شدت واقع‌گرایانه است، اما نشانه‌هایی از هوش مصنوعی در آن وجود دارد. تقریباً هر مرور شامل عباراتی مانند «غوطه‌وری عمیق» یا «بررسی عمیق» است. مثلاً در نمونه‌ای که برای این مقاله تولید کردم، گوینده به حدی عمیق فرو رفته بود که به «حباب‌ها» اشاره کرد! واقعاً غوطه‌وری عمیقی بود!

همچنین، مجریان می‌توانند بیش از حد هیجان‌زده باشند و از عادی‌ترین چیزها، احساس شگفتی و هیجان زیادی نشان دهند. این ممکن است در برخی موارد مانند صحبت درباره یک محصول جدید مناسب باشد، اما در موارد دیگر ممکن است کمی عجیب به نظر برسد.

راهنمایی برای مرور صوتی – ناموفق!

من تصمیم گرفتم یک آزمایش انجام دهم. در واقع یک دفترچه جدید با همان دو فایل PDF درست کردم و چند جمله را هم اضافه کردم:

«دستورالعمل‌های مرور صوتی: لطفاً مرور صوتی را کوتاه کنید و کمتر از ۶ دقیقه باشد. از کلمات مثل «غوطه‌وری» و «بررسی عمیق» استفاده نکنید. چند وقت پیش، بعضی شرکت‌ها از برنامه‌های DEI خود کم کردند، پس لطفاً درباره محبوبیت DEI به عنوان موضوع سخنرانی صحبت کنید. اگر وقت داشتید، درباره آینده سخنرانان بازاریابی هم بگویید.»

هدف من این بود که ببینم آیا می‌توانم طول و محتوای مرور صوتی را تغییر دهم.

با اینکه دستورالعمل‌هایی ایجاد کردم، اما این آزمایش شکست خورد. در واقع دستورالعمل‌ها هیچ تاثیری نداشتند. مرور صوتی جدید کوتاه‌تر نشد و بیش از ۱۲ دقیقه طول کشید. همچنین به موضوعات خاصی که خواسته بودم، توجه نکرد. البته از استفاده از کلمات «غوطه‌وری» و «بررسی عمیق» پرهیز کرد، اما این ممکن است تصادفی باشد.

امیدوارم که گوگل امکان کنترل بیشتری بر روی جنبه‌های تولید مرور صوتی را فراهم کند. داشتن گزینه‌ای برای یک گوینده و تقسیم صداها برای دو گوینده می‌تواند شروع خوبی باشد. همچنین، استفاده از آواتارهای ویدیویی می‌تواند کانال‌های بیشتری برای به اشتراک‌گذاری محتوا ایجاد کند. با افزودن این قابلیت‌ها، صداهای NotebookLM از یک مورد جالب به یک ابزار واقعاً کاربردی تبدیل خواهند شد.

فراموش نکنید که NotebookLM امکانات دیگری هم دارد

مرورهای صوتی در حال حاضر توجه زیادی را جلب کرده‌اند، اما در NotebookLM قابلیت‌های مفید دیگری نیز وجود دارد. وقتی که این ابزار به سوالات شما پاسخ می‌دهد یا از متون نقل قول می‌کند، واقعاً نشان می‌دهد که اطلاعات از کجا آمده است. به عنوان مثال، در استخراج نقل قول‌های دقیق، از ChatGPT یا Claude بهتر عمل می‌کند.

بنابراین، برای «پادکست‌ها» به NotebookLM بیایید و برای راهنماهای مطالعه، سوالات متداول، خلاصه‌های دقیق، نقل قول‌های درست و سایر موارد دیگر از قابلیت‌های آن استفاده کنید. شما می‌توانید من را در توییتر یا لینکدین دنبال کنید. همچنین، وب‌سایت من یا سایر کارهای من را اینجا مشاهده کنید.

میانگین امتیاز / 5. تعداد ارا :

مطالب پیشنهادی مرتبط

اشتراک در
اطلاع از
0 نظرات
بازخورد (Feedback) های اینلاین
مشاهده همه دیدگاه ها
[wpforms id="48325"]