یادگیری تقویتی

Filter by دسته‌ها
chatGTP
ابزارهای هوش مصنوعی
اخبار
گزارش خبری
پرامپت‌ نویسی
تیتر یک
چندرسانه ای
آموزش علوم داده
اینفوگرافیک
پادکست
ویدیو
دانش روز
آموزش‌های پایه‌ای هوش مصنوعی
اصول هوش مصنوعی
یادگیری بدون نظارت
یادگیری تقویتی
یادگیری عمیق
یادگیری نیمه نظارتی
آموزش‌های پیشرفته هوش مصنوعی
بینایی ماشین
پردازش زبان طبیعی
پردازش گفتار
چالش‌های عملیاتی
داده کاوی و بیگ دیتا
رایانش ابری و HPC
سیستم‌‌های امبدد
علوم شناختی
خطرات هوش مصنوعی
دیتاست
مدل‌های بنیادی
رویدادها
جیتکس
کاربردهای هوش مصنوعی
کتابخانه
اشخاص
شرکت‌های هوش مصنوعی
محصولات و مدل‌های هوش مصنوعی
مفاهیم
کسب‌و‌کار
تحلیل بازارهای هوش مصنوعی
کارآفرینی
هوش مصنوعی در ایران
هوش مصنوعی در جهان
مقاله
پیاده‌سازی هوش مصنوعی
گزارش
مصاحبه
هوش مصنوعی در عمل

مقالاتی برای تقویتِ یادگیری تقویتی

یادگیری تقویتی الگوریتم‌ها و روش‌هایی را توسعه داده که براساس آنها، سیستم‌های هوشمند بتوانند، تعاملات خود با یک محیط پویا را از طریق سعی و خطا بهینه نمایند. ایده بنیادی یادگیری تقویتی بر این اصل استوار است که اگر عملی منجر به بهبود عملکرد گردد میل به انجام آن عمل تشدید یا تقویت میگردد. درباره یادگیری تقویتی بیشتر بخوانید.

پردرآمدترین شغل‌های یادگیری ماشین
LlamaIndex فراتر از RAG عمل می‌کند تا دستیاران هوش مصنوعی بتوانند تصمیمات پیچیده‌تری بگیرند
تفکر یا پردازش؟ جدال بر سر هوش مصنوعی o1
معرفی و کارکرد تشخیص صدا بیومتریک
معرفی و کارکرد تشخیص راه رفتن بیومتریک
معرفی و کارکرد کف دست بیومتریک
معرفی و کارکرد عنبیه چشم بیومتریک
معرفی و کارکرد تشخیص چهره بیومتریک
6 نوع ربات سخنگو، کدام یک برای شما مناسب‌تر است؟
یادگیری ماشین چیست؟ تعریف دقیق ماشین لرنینگ و توصیف انواع آن
Pepper؛ رباتی که با تکیه بر گفتار درونی تعاملات خود با انسان‌ها را بهبود می‌بخشد
شبکه عصبی بازگشتی و مروری بر مفهوم حافظه کوتاه‌مدت بلند
الگوریتم بینایی ماشین در هوش مصنوعی با انرژی مصرفی یک یخچال اجرا می‌شود!
چارچوب های کاری یادگیری تقویتی: فعالان این حوزه برای حل مسائل پیچیده چه می‌کنند؟
یادگیری تقویتی چیست؟ هر آنچه باید در مورد این رویکرد بدانید
یادگیری ماشین خودکار و جست‌وجوی معماری شبکۀ عصبی 
محققان با طراحی الگوریتمی «خودآگاه» به مبارزه با هکرها می‌روند
با استفاده از یادگیری تقویتی عمیق یک الگوریتم شطرنج طراحی کنید
آموزش قایم باشک به ربات ها؛ کلید دستیابی به نسل بعدی AI
هوش مصنوعی به قوه تخیل مجهز می‌شود
الگوریتم‌های یادگیری تقویتی و مقدمه‌ای بر انواع آن
توضیح ساده و جامع مدل پنهان مارکوف (HMM)
رباتیک عصبی-تکاملی: راهی برای پر کردن شکاف بین شبیه‌سازی و واقعیت
آموزش پرواز پهپاد از روی موانع با سرعت بالا
XLand ؛ محیط طراحی شده توسط دیپ‌مایند که هوش مصنوعی مدام آن را تغییر می‌دهد
کاربرد کلان داده در صنعت بانکداری و مزایای بی‌شمار آن
بازوی رباتیک جراح یک قدم به واقعیت نزدیک‌ می‌شود
تقویت مهارت برش در ربات ها به کمک شبیه‌ساز
دو بازوی ربات مجازی که با آموزش یکدیگر هوشمندتر می‌شوند
آیا می‌توان 99% از شبکه های عصبی را هرس نمود؛ بدون آن‌که از دقت آن کاسته شود؟
آشنایی با روش تقطیر دانش جهت بهبود عملکرد مدل‌های یادگیری عمیق
آموزش هوش مصنوعی با تقلید از مغز انسان
ربات شناگر با قابلیتی ویژه: خودش را ترمیم می‌کند!
گرادیان کاهشی و گرادیان کاهشی تصادفی و نقش آن‌ها در شبکه‌های عصبی
آلفازیرو خود را بسازید
دانشمندان دیپ مایند: حوزه یادگیری تقویتی برای هوش مصنوعی عمومی کافیست
قسمت دوم از سری RL: یادگیری به کمک شبکه‌ عمیق (DQN)
قسمت اول از سری RL: مقدمه‌ای بر یادگیری تقویتی RL
هوش مصنوعی جدید مرتکب اشتباهات عمدی می‌شود
ربات دو پا که با استفاده از یادگیری تقویتی راه رفتن را به خود آموزش می‌دهد

یادگیری تقویتی

تشخیص صدا بیومتریک

معرفی و کارکرد تشخیص صدا بیومتریک

علاوه بر اثر انگشت، چهره، کف دست و عنبیه، ویژگی‌های فیزیولوژیکی منحصر به فرد دیگری نیز در انسان وجود دارد که با بهره‌گیری از فناوری بیومتریک برای شناسایی هویت به کار می‌روند. یکی از امن‌ترین و دقیق‌ترین روش‌های شناسایی هویت، تشخیص صدا است. این فناوری کاربردهای گسترده‌ای دارد و علاوه

کارکرد تشخیص راه رفتن بیومتریک

معرفی و کارکرد تشخیص راه رفتن بیومتریک

در سال‌های اخیر، پیشرفت‌های تکنولوژیکی با سرعتی چشمگیر رخ داده است و این موضوع منجر به استفاده از الگوهای متنوعی در فرآیند احراز هویت شده است. یکی از جدیدترین سیستم‌های بیومتریک برای شناسایی افراد، احراز هویت از طریق الگوی راه رفتن است که با استفاده از ویژگی‌هایی مانند طول گام،

کارکرد کف دست بیومتریک

معرفی و کارکرد کف دست بیومتریک

استفاده از ویژگی‌های بیومتریک در سیستم‌های احراز هویت یکی از بهترین اقداماتی است که تاکنون انجام شده است. کف دست به عنوان یک ویژگی بیومتریک شناخته می‌شود که الگوی کاملاً منحصر به فردی دارد و با استفاده از فناوری اسکن کف دست در انواع دستگاه‌های احراز هویت، می‌توان به شناسایی

عنبیه چشم بیومتریک

معرفی و کارکرد عنبیه چشم بیومتریک

فناوری بیومتریک از روش‌های متنوعی مانند تشخیص چهره، اثر انگشت، عنبیه چشم و… برای شناسایی و احراز هویت افراد بهره می‌برد که تمامی این روش‌ها از دقت بسیار بالایی برخوردارند. در این میان، شناسایی از طریق عنبیه چشم به عنوان یک فناوری نوین، نسبت به سایر روش‌ها جدیدتر است و

کارکرد تشخیص چهره بیومتریک

معرفی و کارکرد تشخیص چهره بیومتریک

امروزه احراز هویت و شناسایی افراد از طریق روش‌های مختلف مبتنی بر فناوری انجام می‌شود و در بسیاری از مراکز برای ثبت حضور و غیاب یا تأیید حضور افراد مورد استفاده قرار می‌گیرد. یکی از بهترین تکنولوژی‌ها در این زمینه، تشخیص چهره بیومتریک است که با استفاده از ویژگی‌های صورت

ربات سخنگو

6 نوع ربات سخنگو، کدام یک برای شما مناسب‌تر است؟

ربات‌ سخنگو که در وبسایت‌های تجارت الکترونیک مورد استفاده قرار می‌گیرد با ربات سخنگوی وب‌سایت‌های بانکی کاملاً تفاوت دارد. چیزی که انسان‌ها را از یکدیگر متمایز می‌کند خصوصیات اخلاقی و استعدادهای‌شان است. ربات‌ها نیز به لحاظ ظاهری و کارکرد‌‌‌شان با یکدیگر تفاوت دارند! در این نوشتار، به معرفی 6 نوع

ماشین لرنینگ

یادگیری ماشین چیست؟ تعریف دقیق ماشین لرنینگ و توصیف انواع آن

ماشین لرنینگ یا یادگیری ماشین شاخه‌ای از هوش مصنوعی است که به سیستم‌ها توان یادگیری خودکار و پیشرفت می‌دهد. در واقع یادگیری ماشین به زبان ساده جزء مهم حوزه رو به رشد علم داده است. از طریق استفاده از روش‌های آماری، الگوریتم‌ها برای طبقه‌بندی یا پیش‌بینی آموزش داده می‌شوند و

Pepper

Pepper؛ رباتی که با تکیه بر گفتار درونی تعاملات خود با انسان‌ها را بهبود می‌بخشد

آیا تا به حال از خود‌تان پرسیده‌اید که چرا ربات هوشمند خانگی‌تان سؤالات شما را به درستی متوجه نمی‌شود؟ یا چرا برنامه‌کابردی مسیریابی‌تان به جای اتوبان شما را به خیابان‌های فرعی کشانده است؟ گروهی از محققان هوش مصنوعی رباتی به نام Pepper طراحی کرده‌اند که «با صدای بلند فکر می‌کند»

شبکه عصبی بازگشتی

شبکه عصبی بازگشتی و مروری بر مفهوم حافظه کوتاه‌مدت بلند

قبل از آشنا شدن با شبکه عصبی بازگشتی بهتر است مروری بر مفهوم شبکه عصبی داشته باشیم. شبکه‌های عصبی مجموعه‌ای از الگوریتم‌ها هستند که شباهت نزدیکی به مغز انسان داشته و به منظور تشخیص الگوها طراحی شده‌اند. شبکه‌ی عصبی داده‌های حسی را از طریق ادراک ماشینی ، برچسب زدن یا

بینایی ماشین در هوش مصنوعی

الگوریتم بینایی ماشین در هوش مصنوعی با انرژی مصرفی یک یخچال اجرا می‌شود!

هوش مصنوعی یکی از فناوری‌های پر مصرف از لحاظ انرژی است. اما پژوهش جدیدی نشان داده که می‌توان با استفاده از یک تراشه کم مصرف حتی الگوریتم بینایی ماشین در هوش مصنوعی را اجرا کرد. در ادامه این مطلب با هوشیو همراه باشید.

چارچوب های کاری یادگیری تقویتی

چارچوب های کاری یادگیری تقویتی: فعالان این حوزه برای حل مسائل پیچیده چه می‌کنند؟

در این مقاله شما را با چارچوب های کاری یادگیری تقویتی Reinforcement Learning frameworks آشنا خواهیم کرد و توضیح خواهیم داد که چطور می‌توانید وارد دنیای یادگیری تقویتی عمیق شوید. پیش از این نگاهی انداختیم به بازنمایی ساده‌ای از مجموعه‌ای از الگوریتم‌های یادگیری تقویتی که برنامه‌نویسی آن‌ها به نسبت آسان‌تر

یادگیری تقویتی

یادگیری تقویتی چیست؟ هر آنچه باید در مورد این رویکرد بدانید

یادگیری تقویتی یکی از رویکردهای کارآمد و نوینی از یادگیری ماشین است که امروزه توانسته جایگاه خود را در زمینه‌های مختلفی از زندگی بشر گسترش دهد. بطور کلی، یادگیری تکنیکی است که به عامل تصمیم‌گیرنده اجازه می‌دهد تا با نشان دادن عکس‌العمل به محیط و تعامل با آن، پاداش کل

یادگیری ماشین خودکار

یادگیری ماشین خودکار و جست‌وجوی معماری شبکۀ عصبی 

یکی از مهم‌ترین دستاوردها در حوزه هوش مصنوعی در سال 2018، یادگیری ماشین خودکار (AutoML) بود. این فناوری، فرایند یادگیری ماشین را خودکار می‌کند. شرکت گوگل در ژانویه این سال فرایند یادگیری ماشین خودکار را در مسائل بینایی ماشین به کار گرفت و سپس در ژوئیۀ همان سال نسخه دیگری

خودآگاه

محققان با طراحی الگوریتمی «خودآگاه» به مبارزه با هکرها می‌روند

محققان قرار است با طراحی نوعی الگوریتم خودآگاه مانع فعالیت‌های هکرها شوند. هکرها از مرزهای دفاعی یک نیروگاه انرژی هسته‌ای عبور می‌کنند و با تغذیه‌ داده‌های جعلی به سیستم‌ها، کامپیوترها و کارکنان را فریب می‌دهند؛ ماشین‌آلات کلیدی نیروگاه‌ها دچار اختلال شده یا به طور کل از کار می‌افتند. تا وقتی

یادگیری تقویتی عمیق

با استفاده از یادگیری تقویتی عمیق یک الگوریتم شطرنج طراحی کنید

الگوریتم AlphaZero توانست بدون هیچ آموزش قبلی و فقط در عرض چند ساعت رقیبان خود را در بازی‌های Go، شطرنج و Shogi شکست دهد. چه عواملی به موفقیت این الگوریتم کمک کردند؟ برای ساخت این الگوریتم شطرنج از یادگیری تقویتی عمیق استفاده شد.

آموزش قایم باشک به ربات ها

آموزش قایم باشک به ربات ها؛ کلید دستیابی به نسل بعدی AI

آموزش قایم باشک به ربات ها کلید دستیابی به نسل بعدی AI می باشد. هوش مصنوعی عمومی (AGI) شاخه‌ای از AI است و عامل هوش مصنوعی با اتکا به آن می‌تواند همانند انسان‌ها فکر کند و یاد بگیرد؛ AGI مدت‌ها موضوعی محدود به داستان‎های عملی تخیلی بود. اما همزمان با

قوه تخیل

هوش مصنوعی به قوه تخیل مجهز می‌شود

تیمی از پژوهشگران دانشگاه کالیفرنیای جنوبی قصد دارند به هوش مصنوعی کمک کنند تا ندیده‌ها را تصور کند و در واقع به قوه تخیل دست پیدا کند. تحقق این قابلیت منجر به پیدایش هوش مصنوعی منصف‌تر، کشف داروهای جدید و افزایش ایمنی اتومبیل‌های خودران خواهد شد.

الگوریتم‌های یادگیری تقویتی

الگوریتم‌های یادگیری تقویتی و مقدمه‌ای بر انواع آن

یادگیری تقویتی Reinforcement Learning یکی از روش‌های یادگیری ماشین است که در آن، عامل یادگیری پس از ارزیابی هر اقدام عامل ، پاداشی (همراه با تاخیر) Delayed reward به او داده می‌شود. درگذشته، این روش اغلب در بازی‌ها (از جمله بازی‌های آتاری و ماریو) به‌کار گرفته می‌شد و عملکرد آن

مدل پنهان مارکوف

توضیح ساده و جامع مدل پنهان مارکوف (HMM)

مدل پنهان مارکوف (HMM) یک ابزار مدل‌سازی آماری بسیار قدرتمند به شمار می‌رود که در حوزه‌هایی همچون تشخیص گفتار Speech recognition، تشخیص دست‌خط Handwriting recognition و غیره کاربرد دارد. زمانی که خواستیم از این مدل استفاده کنیم متوجه شدیم توضیحات جامع و واضحی در مورد آن وجود ندارد و مطالب

رباتیک عصبی-تکاملی

رباتیک عصبی-تکاملی: راهی برای پر کردن شکاف بین شبیه‌سازی و واقعیت

رباتیک عصبی-تکاملی Neuro-Evolutionary robotics چشم‌اندازی جدید به مطالعه‌ رفتارهای جمعی ربات‌های گروهی فراهم می‌آورد. این حوزه پژوهش‌های فراوانی به خود اختصاص داده است و روش‌ها و ایده‌های زیادی برای کمک به آن مطرح شده‌اند؛ با این وجود، ارزیابی‌های تجربی و تحلیل‌های مقایسه‌ای تا کنون نادر بوده‌اند.

پرواز پهپاد

آموزش پرواز پهپاد از روی موانع با سرعت بالا

تیم‌های حاضر در مسابقات پهپادهای خودران گاهی سرافراز بیرون می‌آیند و گاهی در پی حوادث پیش‌بینی نشده از گردونه مسابقات کنار می‌روند. در این مسابقات، پهپادی که مسیر مسابقه را با بالاترین سرعت طی کند، برنده است. اما هرچه سرعت پرواز پهپاد بیشتر باشد، ناپایدارتر و پیش‌بینی آیرودینامیک آن‌ها دشوارتر

کاربرد کلان داده در صنعت بانکداری

کاربرد کلان داده در صنعت بانکداری و مزایای بی‌شمار آن

کاربرد کلان داده در صنعت بانکداری به تقسیم‌بندی مشتریان کمک می‌کند تا یک راه حل جامع ارائه دهد که برای کسب و کارها و مشتریانشان بهتر کار کند. تقسیم‌بندی قبلی مشتریان، خواسته‌ها و نیازهای مشتری را بدون پرداختن به هیچ یک از نقاط درد آن‌ها، تعمیم می‌دهد. نقاط درد به

بازوی رباتیک

بازوی رباتیک جراح یک قدم به واقعیت نزدیک‌ می‌شود

محققان دانشگاه نورث‌ایسترن در تلاشند حرکات تند و نامنظم بازوهای رباتیک را رفع کنند. بدین ترتیب حرکات بازوی رباتیک به اندازه‌ای ملایم و ماهرانه می‌شوند که برای مثال می‌توانند به آرامی تخم‌مرغی را بردارند و یا بشقاب‌ها را بر روی هم قرار دهند. ممکن است روزی فرا برسد که پزشکان

تقویت مهارت برش در ربات ها

تقویت مهارت برش در ربات ها به کمک شبیه‌ساز

محققان دانشکده علوم کامپیوتر در دانشگاه کالیفرنیای جنوبی (USC) و NVIDIA از شبیه‌سازی برای تقویت مهارت برش در ربات ها رونمایی کرده‌اند؛ این شبیه‌ساز قادر به بازسازی نیروهای وارده به چاقو (برای مثال، برش دادن مواد غذایی از جمله میوه‌ها و سبزیجات) است. علاوه بر این، این سیستم می‌تواند بُرش

بازوی ربات

دو بازوی ربات مجازی که با آموزش یکدیگر هوشمندتر می‌شوند

یک بازوی ربات مجازی یاد گرفته است که بدون نیاز به آموزش مجدد برای هر کدام از کارهای محوله، طیف گسترده‌ای از پازل‌های مختلف را حل کند. این بازوی ربات مجازی، این کار را با بازی در برابر بازوی ربات دوم انجام داد که برای ایجاد چالش‌های سخت‌تر و پیچیده‌تر

شبکه های عصبی

آیا می‌توان 99% از شبکه های عصبی را هرس نمود؛ بدون آن‌که از دقت آن کاسته شود؟

حتی در رایج‌­ترین معماری­‌های شبکه­ های عصبی هم تعداد بسیار زیادی پارامتر وجود دارد. شبکه عصبی ResNet50 که مدل پایه‌­ا‌ی متدوالی است حدود 25 میلیون پارامتر دارد؛ به این معنی که هنگام آموزش شبکه در واقع با یک فضای پارامتر 25 میلیون بُعدی سروکار داریم.

تقطیر دانش

آشنایی با روش تقطیر دانش جهت بهبود عملکرد مدل‌های یادگیری عمیق

تا کنون مدل­‌های پیچیده­‌ای ساخته‌­ایم که قادر به انجام وظایف و حل مسائل پیچیده هستند، اما چالشی که اکنون با آن روبرو هستیم این است که چطور می­‌توانیم چنین مدل­‌های سنگینی را برای استفاده­‌ی فوری روی دستگاه­‌های موبایل پیاده کنیم؟ شاید بتوانیم مدل را روی ابر به کار انداخته و

تقلید هوش از مغز انسان

آموزش هوش مصنوعی با تقلید از مغز انسان

آیا می‌توانیم به ربات‌ها آموزش دهیم که آموخته‌هایشان را عمومی کنند؟ چطور الگوریتم‌ها می‌توانند منطقی‌تر باشند؟ آیا سبک یادگیری یک بچه می‌تواند روی هوش مصنوعی تاثیر بگذارد؟ آموزش هوش مصنوعی به چه صورت انجام می شود؟

ربات شناگر

ربات شناگر با قابلیتی ویژه: خودش را ترمیم می‌کند!

ساخت یک ربات شناگر از نظر علم رباتیک و هوش مصنوعی خیلی پیچیده نیست؛ اما اگر این قابلیت را داشته باشد که خودش را ترمیم کند شرایط متفاوت خواهد بود. دنیا در حال رفتن به سمت و سویی است که ربات‌های بیشتری را برای انجام کارهای خطرناکی همچون پاکسازی در

گرادیان کاهشی

گرادیان کاهشی و گرادیان کاهشی تصادفی و نقش آن‌ها در شبکه‌های عصبی

اگر قبلاً یک شبکه‌ عصبی آموزش داده‌اید، به طور حتم با الگوریتم گرادیان کاهشی و انواع آن آشنایی دارید. در شبکه های عصبی به منظور یافتن پارامتری که بتواند مقدار تابع زیان را به حداقل برساند، از این الگوریتم‌ها استفاده می‌شود. عملکرد این الگوریتم‌ها بسیار ساده است: به ازای تمامی

آلفازیرو

آلفازیرو خود را بسازید

در این مقاله به موارد زیر خواهیم پرداخت: دو دلیلی که آلفازیرو AlphaZero را به یک پیشرفت بزرگ در دنیای هوش مصنوعی تبدیل می‌کند. چگونه می‌توان رونوشتی از متدولوژی آلفازیرو تهیه کرد که بازی Connect4 را انجام دهد. و چگونه می‌توان با تغییر کدها، الگوریتم را در سایر بازی‌ها نیز

DQN

قسمت دوم از سری RL: یادگیری به کمک شبکه‌ عمیق (DQN)

در این مقاله می‌خواهیم به کدنویسی DQN بپردازیم و یادگیری به کمک شبکه عمیق را مورد بررسی اساسی قرار دهیم. عکس صفحه LunarLander-v0 از OpenAI Gym. جسم بنفش فضاپیمایی است که عامل RL باید کنترل آن را بیاموزد. پیاده‌سازی مربوطه در کتابخانه‌ی PyTorch را می‌توانید در این لینک Github مشاهده

RL

قسمت اول از سری RL: مقدمه‌ای بر یادگیری تقویتی RL

ابتدا می‌خواهیم با مفاهیم پایه آشنا شویم. اولین سؤالی که باید پاسخ دهیم این است که یادگیری تقویتی RL چیست؟ فرض کنید دوستتان برای آشنایی با DQN (یکی از الگوریتم‌های یادگیری تقویتی) و اصلاح اشتباهی که در پیاده‌سازی آن مرتکب شده، از شما کمک می‌خواهد. برای کمک به او ابتدا

هوش مصنوعی جدید

هوش مصنوعی جدید مرتکب اشتباهات عمدی می‌شود

برنامه شطرنجی که از خطاهای انسان‌ها می‌آموزد، می‌تواند عملکرد بهتری در کار و گفت‌ و گو با آن‌ها داشته باشد. نزدیک به 50 سال طول کشید تا کامپیوترها بالاخره بتوانند در بازی حساس شطرنج، انسان‌ها را شکست دهند. در حال حاضر، حتی یک گوشی همراه هوشمند می‌تواند هر حرکتی که

ربات دو پا

ربات دو پا که با استفاده از یادگیری تقویتی راه رفتن را به خود آموزش می‌دهد

گروهی از پژوهشگران دانشگاه کالیفرنیا، برکلی، موفق به ساخت یک ربات دو پا شده‌اند که می‌تواند به کمک یادگیری تقویتی راه رفتن را به خود آموزش دهد. این پژوهشگران در مقاله‌ای فرایند کاری‌شان را توضیح داده و آن را در سرور پیش انتشار arXiv بارگذاری کرد‌ند. طی این فرایند یک

[wpforms id="48325"]