چگونه با NotebookLM در چند ثانیه یک پادکست با موضوع دلخواه بسازیم؟
یکی از سرویسهای مبتنی بر هوش مصنوعی گوگل که میتواند کمک زیادی به تولیدکنندگان محتوا در مرحله تحقیق کند، NotebookLM نام دارد. اما جنجالیترین موضوع درباره این سرویس مربوط به قابلیت صوتی این سرویس است. چیزی که باعث شده تولید محتوای صوتی به شکل یک پادکست گفتگو محور (به انگلیسی) بسیار ساده شود.
مروری بر قابلیتهای صوتی NotebookLM
نوتبوکامال، یک سرویس هوش مصنوعی از گوگل است که به شما امکان میدهد محتوای را از منابع مختلفی مانند فایلهای PDF، فایلهای متنی، لینکهای یوتیوب، وبسایتها، یا متنهای کپی شده را در یک «دفترچه» آپلود کنید. هر دفترچه در واقع یک پوشه است که میتواند تا ۵۰ آیتم محتوایی را شامل شود.
تمام اطلاعاتی که نوتبوکامال با آن کار میکند، از همین محتواها به دست میآید، به همین دلیل کمتر احتمال دارد که حقایق یا نقلقولهای اشتباه تولید کند. شما میتوانید از آن سوال بپرسید، درخواست کنید که انواع محتوا را بر اساس دادههای شما تولید کند.
یکی دیگر از ویژگی نوتبوکامال که اخیراً بیشترین توجه را جلب کرده، توانایی آن در ایجاد چیزی است که گوگل آن را «مرورهای صوتی» (Audio Overviews) مینامد. این خلاصههای صوتی شبیه به خواندن رباتیک اطلاعات نیستند؛ بلکه بیشتر شبیه به یک گفتوگوی پادکستی بین دو نفر هستند. این مکالمات به طرز شگفتآوری طبیعی و انسانی به نظر میرسند؛ یعنی مکث میکنند، گاهی حرف یکدیگر را قطع کرده و از کلماتی مانند «اِمم»، «مثلاً» و «میدونی» استفاده میکنند.
یکی از کاربردهای این ویژگی، خلاصه کردن محتواهای طولانی یا پیچیده به صورتی است که به راحتی قابل استفاده باشد؛ مثلاً زمانی که در حال رانندگی، پیادهروی یا ورزش هستید. تصور کنید دو فرد باهوش سه مقاله تحقیقاتی طولانی را بخوانند و در عرض ده دقیقه درباره یافتههای اصلی، روشها و جزئیات مهم آنها گفتوگو کنند.
چگونه یک مرور صوتی با NotebookLM ایجاد کنیم
برای ایجاد یک مرور صوتی با نوتبوکامال باید مراحل مختلفی طی شود:
انتخاب محتوای مورد نظر
ابتدا محتوایی را که میخواهید خلاصه شود، انتخاب کنید. میتوانید از هر نوع محتوایی مانند اسناد، وبسایتها، لینکهای یوتیوب و… استفاده کنید. توجه داشته باشید که تنها یک خلاصه دریافت خواهید کرد، بنابراین اگر میخواهید یک «پادکست» درباره یک موضوع خاص داشته باشید، مطمئن شوید که محتوای انتخابی به طور مستقیم به همان موضوع مرتبط باشد.
وارد شدن با حساب کاربری گوگل
با استفاده از مرورگر به سایت نوتبوکامال بروید. اگر قبلاً وارد حساب کاربری گوگل خود نشدهاید، ابتدا باید وارد شوید. اگر اولین بارتان است که از نوتبوکامال استفاده میکنید، چند دفترچه نمونه و یک دکمه برجسته با عنوان «Create» را خواهید دید. میتوانید نمونهها را بررسی کنید، اما برای این آموزش، کافی است روی دکمه Create کلیک کنید.
اضافه کردن منابع
روشهای مختلفی برای اضافه کردن محتوا به دفترچه جدید شما وجود دارد. پس از کلیک روی دکمه Create، گزینههای زیر را مشاهده خواهید کرد:
- کشیدن یا انتخاب فایلها: میتوانید فایلهایی مانند PDF (از یک صفحه تا یک کتاب کامل) یا انواع دیگر فایلها مانند متن (txt، Markdown) یا صوتی (mp3 و غیره) اضافه کنید. توجه داشته باشید که در حال حاضر نمیتوانید از فایلهای ورد یا اکسل استفاده کنید.
- اضافه کردن از گوگل درایو: میتوانید از فایلهای Google Docs یا Google Slides نیز استفاده کنید.
- وبسایتها و ویدیوها: میتوانید یک وبسایت یا صفحه خاصی از آن را اضافه کنید. همچنین میتوانید لینک یک ویدیو در یوتیوب را نیز قرار دهید.
- متن: میتوانید متن را از کلیپبورد خود کپی کنید یا به سادگی آن را تایپ کنید.
برای اضافه کردن منابع بیشتر، این مراحل را تکرار کنید. شما میتوانید تا ۵۰ منبع اضافه کنید، اما معمولاً یک تا پنج منبع برای اکثر مقاصد کافی است.
ایجاد مرور صوتی خود
پس از بارگذاری محتوای خود، صفحه «راهنمای دفترچه» را مشاهده خواهید کرد. این صفحه خلاصهای کوتاه از منابع شما ارائه میدهد و گزینههایی مانند ایجاد لیست سوالات متداول، راهنمای مطالعه و غیره را در اختیار شما قرار میدهد. همچنین سوالات پیشنهادی و یک جعبه متنی وجود دارد که میتوانید در آن درخواستهای مختلفی مانند پاسخ به یک سوال، نوشتن پستی برای لینکدین یا مقاله تفصیلی را مطرح کنید.
برای مثال، من دو فایل PDF (هر کدام حدود ۳۰ صفحه) درباره روندهای صنعت سخنرانی در سالهای ۲۰۲۳ و ۲۰۲۴ بارگذاری کردم. این سیستم بسیار هوشمند است و بدون اینکه من چیزی بگویم، اولین سوال پیشنهادیاش این بود: «چگونه صنعت سخنرانی از ۲۰۲۳ تا ۲۰۲۴ تغییر کرده است؟»
البته امروز ما میخواهیم یک مرور صوتی ایجاد کنیم. تنها کاری که باید انجام دهیم این است که روی دکمه Generate کلیک کنیم.
پخش، اشتراکگذاری یا دانلود مرور صوتی شما
در این مورد، خلاصه صوتی برای دو فایل PDF طولانی تقریباً ده دقیقه طول میکشد و کیفیت آن خوب است. جالب اینجاست که نوتبوکامال بدون هیچ دستوری متوجه شد که این گزارشها اطلاعات مشابهی را برای دو سال بررسی کردهاند. بنابراین، مجریان گفتگو را با تمرکز بر افزایش تمایل به برگزاری رویدادهای حضوری به جای رویدادهای مجازی آغاز میکنند.
سپس به بررسی موضوعات داغ سال ۲۰۲۴ میپردازند. وقتی مجری مرد به موضوع سوم، یعنی هوش مصنوعی، میرسد، بهطور شوخی میگوید که این موضوع او را «نگران امنیت شغلی خود» کرده است.
اگر از نتایج کار راضی هستید، بهمانند من میتوانید با کپی کردن یک لینک، آن را به اشتراک بگذارید. همچنین میتوانید فایل صوتی را دانلود کرده و در وبسایت خود قرار دهید یا آن را با سایر فایلهای صوتی و ویدیویی ترکیب کنید.
محدودیتهای مرورهای صوتی NotebookLM
نوتبوکامال قادر است صدای بسیار واقعگرایانهای تولید کند، اما چند محدودیت دارد. شما نمیتوانید تعداد یا جنسیت گویندگان را کنترل کنید و در حال حاضر فقط به زبان انگلیسی کار میکند. همچنین نمیتوانید طول فایل صوت را تنظیم کنید؛ اکثر مرورها بیشتر از پنج دقیقه و کمتر از ۱۵ دقیقه هستند. تمام صداها در یک ترک واحد قرار دارند، بنابراین هماهنگ کردن آن با آواتارهای ویدیویی زمانبر است.
با اینکه نحوه بیان به شدت واقعگرایانه است، اما نشانههایی از هوش مصنوعی در آن وجود دارد. تقریباً هر مرور شامل عباراتی مانند «غوطهوری عمیق» یا «بررسی عمیق» است. مثلاً در نمونهای که برای این مقاله تولید کردم، گوینده به حدی عمیق فرو رفته بود که به «حبابها» اشاره کرد! واقعاً غوطهوری عمیقی بود!
همچنین، مجریان میتوانند بیش از حد هیجانزده باشند و از عادیترین چیزها، احساس شگفتی و هیجان زیادی نشان دهند. این ممکن است در برخی موارد مانند صحبت درباره یک محصول جدید مناسب باشد، اما در موارد دیگر ممکن است کمی عجیب به نظر برسد.
راهنمایی برای مرور صوتی – ناموفق!
من تصمیم گرفتم یک آزمایش انجام دهم. در واقع یک دفترچه جدید با همان دو فایل PDF درست کردم و چند جمله را هم اضافه کردم:
«دستورالعملهای مرور صوتی: لطفاً مرور صوتی را کوتاه کنید و کمتر از ۶ دقیقه باشد. از کلمات مثل «غوطهوری» و «بررسی عمیق» استفاده نکنید. چند وقت پیش، بعضی شرکتها از برنامههای DEI خود کم کردند، پس لطفاً درباره محبوبیت DEI به عنوان موضوع سخنرانی صحبت کنید. اگر وقت داشتید، درباره آینده سخنرانان بازاریابی هم بگویید.»
هدف من این بود که ببینم آیا میتوانم طول و محتوای مرور صوتی را تغییر دهم.
با اینکه دستورالعملهایی ایجاد کردم، اما این آزمایش شکست خورد. در واقع دستورالعملها هیچ تاثیری نداشتند. مرور صوتی جدید کوتاهتر نشد و بیش از ۱۲ دقیقه طول کشید. همچنین به موضوعات خاصی که خواسته بودم، توجه نکرد. البته از استفاده از کلمات «غوطهوری» و «بررسی عمیق» پرهیز کرد، اما این ممکن است تصادفی باشد.
امیدوارم که گوگل امکان کنترل بیشتری بر روی جنبههای تولید مرور صوتی را فراهم کند. داشتن گزینهای برای یک گوینده و تقسیم صداها برای دو گوینده میتواند شروع خوبی باشد. همچنین، استفاده از آواتارهای ویدیویی میتواند کانالهای بیشتری برای به اشتراکگذاری محتوا ایجاد کند. با افزودن این قابلیتها، صداهای NotebookLM از یک مورد جالب به یک ابزار واقعاً کاربردی تبدیل خواهند شد.
فراموش نکنید که NotebookLM امکانات دیگری هم دارد
مرورهای صوتی در حال حاضر توجه زیادی را جلب کردهاند، اما در NotebookLM قابلیتهای مفید دیگری نیز وجود دارد. وقتی که این ابزار به سوالات شما پاسخ میدهد یا از متون نقل قول میکند، واقعاً نشان میدهد که اطلاعات از کجا آمده است. به عنوان مثال، در استخراج نقل قولهای دقیق، از ChatGPT یا Claude بهتر عمل میکند.
بنابراین، برای «پادکستها» به NotebookLM بیایید و برای راهنماهای مطالعه، سوالات متداول، خلاصههای دقیق، نقل قولهای درست و سایر موارد دیگر از قابلیتهای آن استفاده کنید. شما میتوانید من را در توییتر یا لینکدین دنبال کنید. همچنین، وبسایت من یا سایر کارهای من را اینجا مشاهده کنید.