رقابت غولهای فناوری برای توسعه عاملهای هوش مصنوعی
بهار سال گذشته بود که آنتروپیک خبر از توسعه هوش مصنوعی در راستای تقویت دستیاران مجازی داد؛ دستیاران مجازی که میتوانند تحقیقات انجام دهند، به ایمیلها پاسخ دهند و کار پشتیبانی را به تنهایی انجام دهند.
این شرکت از این الگوریتم به عنوان «الگوریتم نسل بعدی برای خودآموزی هوش مصنوعی» یاد کرد، الگوریتمی که معتقد بود، اگر همه چیز طبق برنامه پیش برود، میتواند روزی بخش بزرگی از اقتصاد را خودکار کند.
گفتنی است که آنتروپیک یک استارتآپ هوش مصنوعی آمریکایی است که توسط اعضای سابق اوپنایآی تأسیس شده است. آنتروپیک در توسعه سیستمهای هوش مصنوعی عمومی و مدلهای زبانی با استفاده مسئولانه از هوش مصنوعی فعالیت میکند.
مدت زیادی از خبر آنتروپیک میگذرد و به نظر میرسد که هوش مصنوعی آنها در حال راهاندازی است؛ این شرکت روز سهشنبه یک نسخه ارتقا یافته از مدل Claude 3.5 Sonnet خود را منتشر کرد که میتواند هر برنامه دسکتاپ را درک کند و با آن تعامل داشته باشد.
این مدل میتواند از طریق یک API جدید، ضربههای کلید، کلیک روی دکمهها و حرکات ماوس را تقلید کند و اساساً فردی که پشت رایانه شخصی نشسته است را شبیهسازی کند.
آنتروپیک در خصوص این پیشرفت گفت: «ما به کلود آموزش دادیم تا ببیند چه اتفاقی روی صفحه میافتد و سپس از ابزارهای نرمافزاری موجود برای انجام وظایف استفاده کند. زمانی که یک توسعهدهنده با استفاده از یک نرمافزار رایانهای، کلود را مأمور میکند و دسترسی لازم را به آن میدهد، کلود به اسکرینشاتهایی از آنچه که برای کاربر قابلمشاهده است، نگاه میکند، سپس شمارش میکند که برای حرکتکردن و کلیککردن به چند پیکسل به صورت عمودی یا افقی نیاز دارد.»
توسعهدهندگان میتوانند استفاده از رایانه را از طریق API Anthropic، Amazon Bedrock و پلتفرم Google Cloud Vertex AI امتحان کنند.
ابزاری که بتواند وظایف را در رایانه شخصی خودکار کند، ایده جدیدی نیست؛ شرکتهای بیشماری چنین ابزارهایی را ارائه میکنند.
در رقابت برای توسعه به اصطلاح «عاملهای هوش مصنوعی»، این میدان شلوغتر شده است؛ عوامل هوش مصنوعی به طور کلی به هوش مصنوعی اشاره دارد که میتواند عملکرد نرمافزار را خودکار کند.
برخی از تحلیلگران میگویند که عوامل هوش مصنوعی میتوانند مسیر آسانتری را برای کسب درآمد از میلیاردها دلاری که به هوش مصنوعی سرازیر میشود، برای شرکتها فراهم کنند.
طبق نظرسنجی اخیر Capgemin، ده درصد از سازمانها در حال حاضر از عوامل هوش مصنوعی استفاده میکنند و ۸۲ درصد آنها تا سه سال آینده تصمیم به این کار دارند.
از جمله شرکتهایی که قدم در این راه گذاشتند، میتوان به Salesforce اشاره کرد که در تابستان امسال اطلاعیههای پرشوری در مورد فناوری عامل هوش مصنوعی خود ارائه داد.
مایکروسافت نیز دیروز ابزارهای جدیدی را برای ساخت عوامل هوش مصنوعی تبلیغ کرد. OpenAI، نیز در حال طراحی برند خود از عوامل هوش مصنوعی است.
استارتآپ Rabbit در حال ساخت یک نماینده وب است که میتواند کارهایی مانند خرید آنلاین بلیت سینما را انجام دهد. Adept که اخیراً توسط آمازون خریداری شده است، مدلهایی را برای مرور وبسایتها و پیمایش نرمافزارها آموزش میدهد و Twin Labs از مدلهایی از جمله GPT-4o OpenAI برای خودکارسازی فرآیندهای دسکتاپ استفاده میکند.
آنتروپیک ادعا میکند که Sonnet 3.5 یک مدل قوی است که طبق معیار SWE-bench Verified، حتی از O1 پرچمدار OpenAI بهتر میتواند کارهای کدگذاری را انجام دهد.
علیرغم اینکه صراحتاً برای انجام این کار آموزش ندیده است، Sonnet ارتقا یافته 3.5 در صورت برخورد با موانع، وظایف خود را تصحیح کرده و مجدداً امتحان میکند.
آنتروپیک برداشت خود از مفهوم عامل هوش مصنوعی را «لایه اجرایی» مینامد که به Sonnet 3.5 جدید اجازه میدهد دستورات سطح دسکتاپ را انجام دهد. 3.5 Sonnet به لطف توانایی آن در مرور وب، میتواند از هر وبسایت و هر برنامهای استفاده کند.
در ارزیابی طراحی شده برای آزمایش توانایی یک عامل هوش مصنوعی برای کمک به وظایف رزرو هواپیما، Sonnet جدید 3.5 موفق شد کمتر از نیمی از وظایف را با موفقیت انجام دهد.