مقالاتی برای تقویتِ یادگیری تقویتی

یادگیری تقویتی الگوریتم‌ها و روش‌هایی را توسعه داده که براساس آنها، سیستم‌های هوشمند بتوانند، تعاملات خود با یک محیط پویا را از طریق سعی و خطا بهینه نمایند. ایده بنیادی یادگیری تقویتی بر این اصل استوار است که اگر عملی منجر به بهبود عملکرد گردد میل به انجام آن عمل تشدید یا تقویت میگردد. درباره یادگیری تقویتی بیشتر بخوانید.

رقابت Perplexity با غول‌های هوش مصنوعی؛ تغییر قواعد بازی!

مواظب باشید وقتی هوش مصنوعی این آزمون را رد کند؛ «آزمون پایانی بشریت»

اجاره آپارتمان در سان‌فرانسیسکو در عصر هوش مصنوعی؟

تشخیص علائم افسردگی و اضطراب با استفاده از هوش مصنوعی

استراتژی در عصری سرشار از تخصص

یادگیری تقویتی

معماری‌های ترکیبی غیرقابل مذاکره هستند

۲۵ شهریور ۱۴۰۴

در دنیای به سرعت در حال تحول کاربردهای هوش مصنوعی تولیدی، معماری ترکیبی به عنوان چارچوبی برای ساخت برنامه‌های کاربردی مقیاس‌پذیر مبتنی بر هوش مصنوعی در حال ظهور است.

6 نوع ربات سخنگو، کدام یک برای شما مناسب‌تر است؟

۲۸ تیر ۱۴۰۴

ربات‌ سخنگو که در وبسایت‌های تجارت الکترونیک مورد استفاده قرار می‌گیرد با ربات سخنگوی وب‌سایت‌های بانکی کاملاً تفاوت دارد.

پردرآمدترین شغل‌های یادگیری ماشین

۱۹ فروردین ۱۴۰۴

یادگیری ماشین در حال دگرگون کردن قواعد بازی است به همین دلیل تقاضا برای متخصصان با دانش در زمینه یادگیری ماشین به اوج خود رسیده است.

LlamaIndex فراتر از RAG عمل می‌کند تا دستیاران هوش مصنوعی بتوانند تصمیمات پیچیده‌تری بگیرند

۹ فروردین ۱۴۰۴

LlamaIndex به‌عنوان چارچوب محبوب هماهنگی هوش مصنوعی، معماری جدیدی به نام ADW (Agent Document Workflow) معرفی کرده است.

تفکر یا پردازش؟ جدال بر سر هوش مصنوعی o1

۲۰ مهر ۱۴۰۳

مدل جدید OpenAI با نام «o1» به تازگی منتشر شده و ادعا می‌کند که قادر به «استدلال» و حتی «تفکر» است، اما این ادعا با شک و تردید مواجه شده است.

معرفی و کارکرد تشخیص صدا بیومتریک

۱۷ شهریور ۱۴۰۳

علاوه بر اثر انگشت، چهره، کف دست و عنبیه، ویژگی‌های فیزیولوژیکی منحصر به فرد دیگری نیز در انسان وجود دارد که با بهره‌گیری از فناوری بیومتریک برای شناسایی هویت به کار می‌روند. یکی از امن‌ترین و دقیق‌ترین روش‌های شناسایی هویت، تشخیص صدا است. این فناوری کاربردهای گسترده‌ای دارد و علاوه

معرفی و کارکرد تشخیص راه رفتن بیومتریک

۱۷ شهریور ۱۴۰۳

در سال‌های اخیر، پیشرفت‌های تکنولوژیکی با سرعتی چشمگیر رخ داده است و این موضوع منجر به استفاده از الگوهای متنوعی در فرآیند احراز هویت شده است. یکی از جدیدترین سیستم‌های بیومتریک برای شناسایی افراد، احراز هویت از طریق الگوی راه رفتن است که با استفاده از ویژگی‌هایی مانند طول گام،

معرفی و کارکرد کف دست بیومتریک

۱۷ شهریور ۱۴۰۳

استفاده از ویژگی‌های بیومتریک در سیستم‌های احراز هویت یکی از بهترین اقداماتی است که تاکنون انجام شده است. کف دست به عنوان یک ویژگی بیومتریک شناخته می‌شود که الگوی کاملاً منحصر به فردی دارد و با استفاده از فناوری اسکن کف دست در انواع دستگاه‌های احراز هویت، می‌توان به شناسایی

معرفی و کارکرد عنبیه چشم بیومتریک

۱۷ شهریور ۱۴۰۳

فناوری بیومتریک از روش‌های متنوعی مانند تشخیص چهره، اثر انگشت، عنبیه چشم و… برای شناسایی و احراز هویت افراد بهره می‌برد که تمامی این روش‌ها از دقت بسیار بالایی برخوردارند. در این میان، شناسایی از طریق عنبیه چشم به عنوان یک فناوری نوین، نسبت به سایر روش‌ها جدیدتر است و

معرفی و کارکرد تشخیص چهره بیومتریک

۱۷ شهریور ۱۴۰۳

امروزه احراز هویت و شناسایی افراد از طریق روش‌های مختلف مبتنی بر فناوری انجام می‌شود و در بسیاری از مراکز برای ثبت حضور و غیاب یا تأیید حضور افراد مورد استفاده قرار می‌گیرد. یکی از بهترین تکنولوژی‌ها در این زمینه، تشخیص چهره بیومتریک است که با استفاده از ویژگی‌های صورت

یادگیری ماشین چیست؟ تعریف دقیق ماشین لرنینگ و توصیف انواع آن

۲۲ شهریور ۱۴۰۱

ماشین لرنینگ یا یادگیری ماشین شاخه‌ای از هوش مصنوعی است که به سیستم‌ها توان یادگیری خودکار و پیشرفت می‌دهد. در واقع یادگیری ماشین به زبان ساده جزء مهم حوزه رو به رشد علم داده است. از طریق استفاده از روش‌های آماری، الگوریتم‌ها برای طبقه‌بندی یا پیش‌بینی آموزش داده می‌شوند و

Pepper؛ رباتی که با تکیه بر گفتار درونی تعاملات خود با انسان‌ها را بهبود می‌بخشد

۲۱ خرداد ۱۴۰۱

آیا تا به حال از خود‌تان پرسیده‌اید که چرا ربات هوشمند خانگی‌تان سؤالات شما را به درستی متوجه نمی‌شود؟ یا چرا برنامه‌کابردی مسیریابی‌تان به جای اتوبان شما را به خیابان‌های فرعی کشانده است؟ گروهی از محققان هوش مصنوعی رباتی به نام Pepper طراحی کرده‌اند که «با صدای بلند فکر می‌کند»

شبکه عصبی بازگشتی و مروری بر مفهوم حافظه کوتاه‌مدت بلند

۷ خرداد ۱۴۰۱

قبل از آشنا شدن با شبکه عصبی بازگشتی بهتر است مروری بر مفهوم شبکه عصبی داشته باشیم. شبکه‌های عصبی مجموعه‌ای از الگوریتم‌ها هستند که شباهت نزدیکی به مغز انسان داشته و به منظور تشخیص الگوها طراحی شده‌اند. شبکه‌ی عصبی داده‌های حسی را از طریق ادراک ماشینی ، برچسب زدن یا

الگوریتم بینایی ماشین در هوش مصنوعی با انرژی مصرفی یک یخچال اجرا می‌شود!

۳ خرداد ۱۴۰۱

هوش مصنوعی یکی از فناوری‌های پر مصرف از لحاظ انرژی است. اما پژوهش جدیدی نشان داده که می‌توان با استفاده از یک تراشه کم مصرف حتی الگوریتم بینایی ماشین در هوش مصنوعی را اجرا کرد. در ادامه این مطلب با هوشیو همراه باشید.

چارچوب های کاری یادگیری تقویتی: فعالان این حوزه برای حل مسائل پیچیده چه می‌کنند؟

۶ اردیبهشت ۱۴۰۱

در این مقاله شما را با چارچوب های کاری یادگیری تقویتی Reinforcement Learning frameworks آشنا خواهیم کرد و توضیح خواهیم داد که چطور می‌توانید وارد دنیای یادگیری تقویتی عمیق شوید. پیش از این نگاهی انداختیم به بازنمایی ساده‌ای از مجموعه‌ای از الگوریتم‌های یادگیری تقویتی که برنامه‌نویسی آن‌ها به نسبت آسان‌تر

یادگیری تقویتی چیست؟ هر آنچه باید در مورد این رویکرد بدانید

۱۰ بهمن ۱۴۰۰

یادگیری تقویتی یکی از رویکردهای کارآمد و نوینی از یادگیری ماشین است که امروزه توانسته جایگاه خود را در زمینه‌های مختلفی از زندگی بشر گسترش دهد. بطور کلی، یادگیری تکنیکی است که به عامل تصمیم‌گیرنده اجازه می‌دهد تا با نشان دادن عکس‌العمل به محیط و تعامل با آن، پاداش کل

یادگیری ماشین خودکار و جست‌وجوی معماری شبکۀ عصبی

۵ بهمن ۱۴۰۰

یکی از مهم‌ترین دستاوردها در حوزه هوش مصنوعی در سال 2018، یادگیری ماشین خودکار (AutoML) بود. این فناوری، فرایند یادگیری ماشین را خودکار می‌کند. شرکت گوگل در ژانویه این سال فرایند یادگیری ماشین خودکار را در مسائل بینایی ماشین به کار گرفت و سپس در ژوئیۀ همان سال نسخه دیگری

محققان با طراحی الگوریتمی «خودآگاه» به مبارزه با هکرها می‌روند

۱۸ دی ۱۴۰۰

محققان قرار است با طراحی نوعی الگوریتم خودآگاه مانع فعالیت‌های هکرها شوند. هکرها از مرزهای دفاعی یک نیروگاه انرژی هسته‌ای عبور می‌کنند و با تغذیه‌ داده‌های جعلی به سیستم‌ها، کامپیوترها و کارکنان را فریب می‌دهند؛ ماشین‌آلات کلیدی نیروگاه‌ها دچار اختلال شده یا به طور کل از کار می‌افتند. تا وقتی

با استفاده از یادگیری تقویتی عمیق یک الگوریتم شطرنج طراحی کنید

۷ دی ۱۴۰۰

الگوریتم AlphaZero توانست بدون هیچ آموزش قبلی و فقط در عرض چند ساعت رقیبان خود را در بازی‌های Go، شطرنج و Shogi شکست دهد. چه عواملی به موفقیت این الگوریتم کمک کردند؟ برای ساخت این الگوریتم شطرنج از یادگیری تقویتی عمیق استفاده شد.

آموزش قایم باشک به ربات ها؛ کلید دستیابی به نسل بعدی AI

۶ دی ۱۴۰۰

آموزش قایم باشک به ربات ها کلید دستیابی به نسل بعدی AI می باشد. هوش مصنوعی عمومی (AGI) شاخه‌ای از AI است و عامل هوش مصنوعی با اتکا به آن می‌تواند همانند انسان‌ها فکر کند و یاد بگیرد؛ AGI مدت‌ها موضوعی محدود به داستان‎های عملی تخیلی بود. اما همزمان با

هوش مصنوعی به قوه تخیل مجهز می‌شود

۲۷ آذر ۱۴۰۰

تیمی از پژوهشگران دانشگاه کالیفرنیای جنوبی قصد دارند به هوش مصنوعی کمک کنند تا ندیده‌ها را تصور کند و در واقع به قوه تخیل دست پیدا کند. تحقق این قابلیت منجر به پیدایش هوش مصنوعی منصف‌تر، کشف داروهای جدید و افزایش ایمنی اتومبیل‌های خودران خواهد شد.

الگوریتم‌های یادگیری تقویتی و مقدمه‌ای بر انواع آن

۶ آذر ۱۴۰۰

یادگیری تقویتی Reinforcement Learning یکی از روش‌های یادگیری ماشین است که در آن، عامل یادگیری پس از ارزیابی هر اقدام عامل ، پاداشی (همراه با تاخیر) Delayed reward به او داده می‌شود. درگذشته، این روش اغلب در بازی‌ها (از جمله بازی‌های آتاری و ماریو) به‌کار گرفته می‌شد و عملکرد آن

توضیح ساده و جامع مدل پنهان مارکوف (HMM)

۳۰ آبان ۱۴۰۰

مدل پنهان مارکوف (HMM) یک ابزار مدل‌سازی آماری بسیار قدرتمند به شمار می‌رود که در حوزه‌هایی همچون تشخیص گفتار Speech recognition، تشخیص دست‌خط Handwriting recognition و غیره کاربرد دارد. زمانی که خواستیم از این مدل استفاده کنیم متوجه شدیم توضیحات جامع و واضحی در مورد آن وجود ندارد و مطالب

رباتیک عصبی-تکاملی: راهی برای پر کردن شکاف بین شبیه‌سازی و واقعیت

۸ آبان ۱۴۰۰

رباتیک عصبی-تکاملی Neuro-Evolutionary robotics چشم‌اندازی جدید به مطالعه‌ رفتارهای جمعی ربات‌های گروهی فراهم می‌آورد. این حوزه پژوهش‌های فراوانی به خود اختصاص داده است و روش‌ها و ایده‌های زیادی برای کمک به آن مطرح شده‌اند؛ با این وجود، ارزیابی‌های تجربی و تحلیل‌های مقایسه‌ای تا کنون نادر بوده‌اند.

آموزش پرواز پهپاد از روی موانع با سرعت بالا

۲۸ مهر ۱۴۰۰

تیم‌های حاضر در مسابقات پهپادهای خودران گاهی سرافراز بیرون می‌آیند و گاهی در پی حوادث پیش‌بینی نشده از گردونه مسابقات کنار می‌روند. در این مسابقات، پهپادی که مسیر مسابقه را با بالاترین سرعت طی کند، برنده است. اما هرچه سرعت پرواز پهپاد بیشتر باشد، ناپایدارتر و پیش‌بینی آیرودینامیک آن‌ها دشوارتر

XLand ؛ محیط طراحی شده توسط دیپ‌مایند که هوش مصنوعی مدام آن را تغییر می‌دهد

۲۶ مهر ۱۴۰۰

دیپ‌مایند محیط بازی بزرگی به نام XLand طراحی کرده است که هوش مصنوعی پیوسته آن را تغییر می‌دهد.

کاربرد کلان داده در صنعت بانکداری و مزایای بی‌شمار آن

۲۱ شهریور ۱۴۰۰

کاربرد کلان داده در صنعت بانکداری به تقسیم‌بندی مشتریان کمک می‌کند تا یک راه حل جامع ارائه دهد که برای کسب و کارها و مشتریانشان بهتر کار کند. تقسیم‌بندی قبلی مشتریان، خواسته‌ها و نیازهای مشتری را بدون پرداختن به هیچ یک از نقاط درد آن‌ها، تعمیم می‌دهد. نقاط درد به

بازوی رباتیک جراح یک قدم به واقعیت نزدیک‌ می‌شود

۸ شهریور ۱۴۰۰

محققان دانشگاه نورث‌ایسترن در تلاشند حرکات تند و نامنظم بازوهای رباتیک را رفع کنند. بدین ترتیب حرکات بازوی رباتیک به اندازه‌ای ملایم و ماهرانه می‌شوند که برای مثال می‌توانند به آرامی تخم‌مرغی را بردارند و یا بشقاب‌ها را بر روی هم قرار دهند. ممکن است روزی فرا برسد که پزشکان

تقویت مهارت برش در ربات ها به کمک شبیه‌ساز

۲ شهریور ۱۴۰۰

محققان دانشکده علوم کامپیوتر در دانشگاه کالیفرنیای جنوبی (USC) و NVIDIA از شبیه‌سازی برای تقویت مهارت برش در ربات ها رونمایی کرده‌اند؛ این شبیه‌ساز قادر به بازسازی نیروهای وارده به چاقو (برای مثال، برش دادن مواد غذایی از جمله میوه‌ها و سبزیجات) است. علاوه بر این، این سیستم می‌تواند بُرش

دو بازوی ربات مجازی که با آموزش یکدیگر هوشمندتر می‌شوند

۲۰ مرداد ۱۴۰۰

یک بازوی ربات مجازی یاد گرفته است که بدون نیاز به آموزش مجدد برای هر کدام از کارهای محوله، طیف گسترده‌ای از پازل‌های مختلف را حل کند. این بازوی ربات مجازی، این کار را با بازی در برابر بازوی ربات دوم انجام داد که برای ایجاد چالش‌های سخت‌تر و پیچیده‌تر

آیا می‌توان 99% از شبکه های عصبی را هرس نمود؛ بدون آن‌که از دقت آن کاسته شود؟

۱۲ مرداد ۱۴۰۰

حتی در رایج‌ترین معماری‌های شبکه های عصبی هم تعداد بسیار زیادی پارامتر وجود دارد. شبکه عصبی ResNet50 که مدل پایه‌ا‌ی متدوالی است حدود 25 میلیون پارامتر دارد؛ به این معنی که هنگام آموزش شبکه در واقع با یک فضای پارامتر 25 میلیون بُعدی سروکار داریم.

آشنایی با روش تقطیر دانش جهت بهبود عملکرد مدل‌های یادگیری عمیق

۱۱ مرداد ۱۴۰۰

تا کنون مدل‌های پیچیده‌ای ساخته‌ایم که قادر به انجام وظایف و حل مسائل پیچیده هستند، اما چالشی که اکنون با آن روبرو هستیم این است که چطور می‌توانیم چنین مدل‌های سنگینی را برای استفاده‌ی فوری روی دستگاه‌های موبایل پیاده کنیم؟ شاید بتوانیم مدل را روی ابر به کار انداخته و

آموزش هوش مصنوعی با تقلید از مغز انسان

۱۰ مرداد ۱۴۰۰

آیا می‌توانیم به ربات‌ها آموزش دهیم که آموخته‌هایشان را عمومی کنند؟ چطور الگوریتم‌ها می‌توانند منطقی‌تر باشند؟ آیا سبک یادگیری یک بچه می‌تواند روی هوش مصنوعی تاثیر بگذارد؟ آموزش هوش مصنوعی به چه صورت انجام می شود؟

ربات شناگر با قابلیتی ویژه: خودش را ترمیم می‌کند!

۵ مرداد ۱۴۰۰

ساخت یک ربات شناگر از نظر علم رباتیک و هوش مصنوعی خیلی پیچیده نیست؛ اما اگر این قابلیت را داشته باشد که خودش را ترمیم کند شرایط متفاوت خواهد بود. دنیا در حال رفتن به سمت و سویی است که ربات‌های بیشتری را برای انجام کارهای خطرناکی همچون پاکسازی در

گرادیان کاهشی و گرادیان کاهشی تصادفی و نقش آن‌ها در شبکه‌های عصبی

۳ مرداد ۱۴۰۰

اگر قبلاً یک شبکه‌ عصبی آموزش داده‌اید، به طور حتم با الگوریتم گرادیان کاهشی و انواع آن آشنایی دارید. در شبکه های عصبی به منظور یافتن پارامتری که بتواند مقدار تابع زیان را به حداقل برساند، از این الگوریتم‌ها استفاده می‌شود. عملکرد این الگوریتم‌ها بسیار ساده است: به ازای تمامی

آلفازیرو خود را بسازید

۲۸ تیر ۱۴۰۰

در این مقاله به موارد زیر خواهیم پرداخت: دو دلیلی که آلفازیرو AlphaZero را به یک پیشرفت بزرگ در دنیای هوش مصنوعی تبدیل می‌کند. چگونه می‌توان رونوشتی از متدولوژی آلفازیرو تهیه کرد که بازی Connect4 را انجام دهد. و چگونه می‌توان با تغییر کدها، الگوریتم را در سایر بازی‌ها نیز

دانشمندان دیپ مایند: حوزه یادگیری تقویتی برای هوش مصنوعی عمومی کافیست

۱۴ تیر ۱۴۰۰

این مقاله بخشی از بررسی‌های محققان در حوزه پژوهش‌های هوش مصنوعی را در بردارد و آخرین یافته‌های دنیای هوش مصنوعی در حوزه یادگیری تقویتی را بررسی می‌کند.

قسمت دوم از سری RL: یادگیری به کمک شبکه‌ عمیق (DQN)

۵ خرداد ۱۴۰۰

در این مقاله می‌خواهیم به کدنویسی DQN بپردازیم و یادگیری به کمک شبکه عمیق را مورد بررسی اساسی قرار دهیم. عکس صفحه LunarLander-v0 از OpenAI Gym. جسم بنفش فضاپیمایی است که عامل RL باید کنترل آن را بیاموزد. پیاده‌سازی مربوطه در کتابخانه‌ی PyTorch را می‌توانید در این لینک Github مشاهده

قسمت اول از سری RL: مقدمه‌ای بر یادگیری تقویتی RL

۳ خرداد ۱۴۰۰

ابتدا می‌خواهیم با مفاهیم پایه آشنا شویم. اولین سؤالی که باید پاسخ دهیم این است که یادگیری تقویتی RL چیست؟ فرض کنید دوستتان برای آشنایی با DQN (یکی از الگوریتم‌های یادگیری تقویتی) و اصلاح اشتباهی که در پیاده‌سازی آن مرتکب شده، از شما کمک می‌خواهد. برای کمک به او ابتدا

هوش مصنوعی جدید مرتکب اشتباهات عمدی می‌شود

۱۵ اردیبهشت ۱۴۰۰

برنامه شطرنجی که از خطاهای انسان‌ها می‌آموزد، می‌تواند عملکرد بهتری در کار و گفت‌ و گو با آن‌ها داشته باشد. نزدیک به 50 سال طول کشید تا کامپیوترها بالاخره بتوانند در بازی حساس شطرنج، انسان‌ها را شکست دهند. در حال حاضر، حتی یک گوشی همراه هوشمند می‌تواند هر حرکتی که

مقالات بیشتر

به خبرنامه هوشیو بپیوندید

هوشیو رسانه‌ای تخصصی در حوزه هوش مصنوعی است که با هدف ایجاد محیطی فراگیر و پویا به ترویج و ارتقای این دانش می‌پردازد. ما تلاش می‌کنیم تا علاقه‌مندان به این حوزه درک عمیق‌تری از هوش مصنوعی پیدا کنند، از جدیدترین تحولات آن در ایران و جهان مطلع شوند و فعالان و پیشروان این صنعت را بشناسند. هوشیو با تمرکز بر تولید محتوای چندرسانه‌ای شامل ویدئوکست، پادکست، موشن‌گرافیک و … تجربه‌ای جذاب و آموزنده برای مخاطبان فراهم می‌کند. همچنین، هوشیو با پوشش رسانه‌ای گسترده رویدادهای هوش مصنوعی در ایران و جهان، بستری را برای اطلاع‌رسانی و تعامل میان فعالان و علاقه‌مندان این حوزه ایجاد کرده است.

یادگیری تقویتی

یادگیری تقویتی

به خبرنامه هوشیو بپیوندید

دسترسی سریع

اخرین مطالب