راه اندازی یک کسب و کار هوش مصنوعی را فراموش و با یک ماموریت آن شروع کنید!
اندرو انجی، یک پیشگام هوش مصنوعی درباره چگونگی استفاده شرکتها از یادگیری ماشین برای تغییر کاربری و حل مشکلات مهم در راه اندازی یک کسب و کار هوش مصنوعی سخن گفته است.
اندرو انجی در زندگی خود فعالیتهای زیادی داشته است. شاید او را به عنوان بنیانگذار تیم گوگل برین یا دانشمند ارشد سابق بایدو بشناسید. یا ممکن است او را به عنوان مربی خودتان بشناسید. وی از طریق دورههای آنلاین آموزشیاش که طرفداران بسیاری نیز دارد، به تعداد بیشماری از دانشجویان، مخاطبان کنجکاو و رهبران کسبوکار هوش مصنوعی درباره اصول یادگیری ماشین آموزش داده است.
او اکنون در فعالیت اخیر خود، Landing AI که از سال 2017 آغاز کرده است، در حال بررسی این موضوع است که کسبوکارهای فاقد دیتاستهای عظیم چگونه میتوانند به انقلاب هوش مصنوعی بپیوندند.
در 23 مارس، اندرو انجی به رویداد سالانه مجازی هوش مصنوعی EmTech Digital پیوست تا درسهایی را که آموخته است، به اشتراک بگذارد.
مجله MIT تکنولوژی ریویو: مردم مرتباً از شما این سوال را میپرسند که «چگونه میتوانم یک کسب و کار هوش مصنوعی را راهاندازی کنیم؟» شما معمولاً به این سوال چه پاسخی میدهید؟
اندرو انجی: من معمولاً میگویم «این کار را نکنید!» اگر من به تیمی بروم و بگویم «سلام به همه، لطفاً تماما مبتنی بر هوش مصنوعی باشید!»، چنین درخواستی به معنای دعوت از تیم برای تمرکز روی یک فناوری است که میتواند برای یک آزمایشگاه تحقیقاتی عالی باشد. اما از نظر نحوه اداره یک کسبوکار، من بیشتر روی مشتریمداری و پروژهمحوری تاکید دارم و تقریباً هرگز کسی را به تمرکز روی یک فناوری خاص دعوت نمیکنم.
شما در حال حاضر برنامه سرمایهگذاری جدیدی تحت عنوان Landing AI دارید. میتوانید کمی توضیح دهید که این چه برنامهای است؟ و چرا تصمیم گرفتید روی آن کار کنید؟
پس از سرپرستی تیمهای هوش مصنوعی در گوگل و بایدو، متوجه شدم که هوش مصنوعی، کاربری اینترنت مصرفی نرمافزارها را تغییر داده است، مانند جستجوی وب و تبلیغات آنلاین. اما من میخواستم هوش مصنوعی را به تمام صنایع دیگری که بخش بزرگی از اقتصاد است، برسانم. بنابراین پس از بررسی تعداد زیادی از صنایع مختلف، مصمم شدم روی تولید تمرکز کنم. من فکر میکنم در حال حاضر چندین صنعت آماده پذیرش فناوری هوش مصنوعی هستند، اما یکی از الگوهای آمادهسازی بیشتر برای پذیرش هوش مصنوعی این است که یک صنعت دچار برخی تحولات دیجیتال شود. با چنین تغییری، آن صنعت صاحب دادههای ارزشمند دیجیتالی خواهد شد. بنابراین، فرصتی برای تیمهای هوش مصنوعی ایجاد میشود تا از دادهها برای ایجاد ارزش استفاده کنند.
با این توضیحات، یکی از پروژههایی که اخیراً شروع کردهام و واقعا از آن هیجانزدهام، ساخت بازرسی بصری است. آیا میتوانید به تصویری از تلفن هوشمند خارجشده از خط تولید نگاه کنید و ببینید آیا نقصی در آن وجود دارد؟ یا به یک بخش از بدنه یک ماشین نگاه کنید و ببینید آیا نقصی در آن وجود دارد؟ تفاوت بزرگی که وجود دارد، در اینترنت نرمافزار مصرفکننده است. شاید شما یک میلیارد کاربر و مقدار زیادی داده داشته باشید. اما خدا را شکر هیچ کارخانهای در خط تولیدش یک میلیارد یا حتی یک میلیون گوشی هوشمند با صفحه خراشیده تولید نکرده است!
حالا چالش ما این است: آیا میتوانید یک هوش مصنوعی را برای کار با صد تصویر به کار بگیرید؟ احتمالا میتوانید. من در واقع بارها و بارها از این که شما حتی با مقدار کمی داده میتوانید کار کنید، به شگفت آمدهام. حتی اگر همه هیاهوها و هیجانات و خبرهای مربوط به هوش مصنوعی درباره دیتاستهای عظیم باشد، احساس میکنم هنوز فضای زیادی برای رشد وجود دارد و چالشها کاملا متفاوت هستند.
چطور این کار را انجام میدهید؟
یک اشتباه بسیار مکرری هست که میبینم مدیرعاملها و مدیران ارشد فناوری در شرکتها مرتکب میشوند: آنها به من این جملهها را میگویند: «هی، اندرو، ما دادههای زیادی نداریم – یا دادههای ما خراب است. دو سال به من فرصت بده تا یک زیرساخت عالی فناوری اطلاعات بسازم.
بعد همه این دادههای عالی را دو سال دیگر خواهیم داشت و میتوانیم هوش مصنوعی را بر اساس آنها بسازیم.» من همیشه میگویم: «این تصمیم اشتباه است. این کار را نکن! اولا که فکر نمیکنم هیچ شرکتی (حتی غولهای فناوری) اکنون روی کره زمین وجود داشته باشد که فکر کند دادههایش کاملاً تمیز و عالی است! کار با هوش مصنوعی مثل یک سفر میماند. صرف دو یا سه سال برای ایجاد یک زیرساخت عالی و بینقص از دادهها به این معنا است که شما از کمک و همراهی تیم هوش مصنوعی برای ایجاد زیرساختهای فناوری اطلاعات بیبهره هستید.
به عنوان مثال، اگر کاربران زیادی دارید، آیا پرسیدن سوال از آنها در یک نظرسنجی را اولویت خود قرار میدهید تا کمی بیشتر داده به دست آورید؟ یا اگر صاحب یک کارخانه هستید، آیا باید ارتقای سنسور ارتعاشات از 10 بار در ثانیه به 100 بار در ثانیه را در اولویت قرار دهید؟
پاسخ این است که غالباً شروع به انجام یک پروژه هوش مصنوعی با دادههایی که از قبل در اختیار دارید، ممکن میشود. این دادهها هرچقدر هم ناقص و خراب باشند، یک تیم هوش مصنوعی را قادر میسازند بازخورد لازم را برای برای جمعآوری و اولویتبندی دادههای بیشتر به شما ارائه دهد.
در صنایعی که مقیاس اینترنت نرمافزار را در اختیار نداریم، احساس میکنم باید ذهنیت را از « کلان داده» به «داده خوب» تغییر دهیم. اگر یک میلیون تصویر دارید، ادامه دهید و از آن استفاده کنید. همین مقدار هم عالی است. موضوعات بسیاری وجود دارد که امکان استفاده از مجموعه دادههای بسیار کوچکتر را میسر میکند.
میتوانید یک مثال بزنید؟ منظورتان از داده خوب چیست؟
بگذارید ابتدا مثالی از فناوری تشخیص گفتار بیاورم. هنگامی که من با سرچ صوتی کار میکردم، شما کلیپهای صوتی دریافت میکردید که در آن میشنیدید کسی میگوید: «هوای امروز.» سوال این است که رونویسی مناسب برای آن کلیپ صوتی چیست؟ آیا «Um (ویرگول) آب و هوای امروز است» یا «Um (نقطه، نقطه، نقطه) آب و هوای امروز» است یا «Um» چیزی است که ما فقط رونویسی نمیکنیم؟
همه این گزارهها به عنوان جواب میتواند مناسب باشد. اما اگر مشترکان مختلف از هر سه قرارداد برچسبگذاری استفاده کنند، در آن صورت این دادهها خوب نیستند. دادههای شما شلوغ هستند و به سیستم تشخیص گفتار آسیب میرسانند. حالا اگر میلیونها یا یک میلیارد کاربر داشته باشید، میتوانید آن دادههای شلوغ را به کار بگیرید و آن را بسازید. در این شرایط، الگوریتم یادگیری ماشین بهخوبی پیادهسازی میشود. اما اگر در محیطی هستید که مجموعه داده کوچکتری دارید (مثلاً صد مثال)، در این صورت این نوع دادههای پر سروصدا تأثیر زیادی بر عملکرد شما دارند.
مثال دیگر از ساخت: ما کارهای زیادی در زمینه بررسی فولاد انجام دادهایم. اگر اهل رانندگی باشید، احتمالا اطلاع دارید که بدنه ماشین شما از یک ورق فولاد ساخته شده است. گاهی اوقات چین و چروکهای کمی در فولاد وجود دارد، یا فرورفتگی یا لکههای کمی روی آن وجود دارد. برای کنترل کیفیت فولاد در خط تولید بدنه ماشین میتوان از دوربین و فناوری بینایی رایانه استفاده کرد تا کنترل شود آیا نقصی روی ورقه فولاد وجود دارد یا خیر. اما برچسبهای مختلف دادهها را متفاوت تگگذاری میکنند.
برای بسیاری از پروژههای هوش مصنوعی، مدل منبع باز که از GitHub بارگیری میکنید، به اندازه کافی خوب است. نه برای همه مسائل، بلکه برای مسائل اصلی مناسب است. بنابراین من به بسیاری از تیمها گفتهام: «سلام به همه! شبکه عصبی به اندازه کافی خوب است. دیگر خیلی به کد مشغول نشوید. تنها کاری که اکنون میخواهید انجام دهید ساخت فرایندهایی برای بهبود کیفیت دادهها است.» به نظر میرسد این دستورالعمل در بیشتر مواقع منجر به بهبود عملکرد الگوریتم میشود.
وقتی میگویید مجموعه دادههای کوچکتر، اندازه دادهای که فکر میکنید چقدر است؟ شما دارید از صد نمونه صحبت میکنید؟ یا ده نمونه؟
یادگیری ماشین آنقدر متنوع است که پاسخ دادن به یک اندازه متناسب برای همه دشوار است. من روی پروژههایی کار کردهام که برای آنها حدود 200 تا 300 میلیون تصویر داشتم. همچنین روی پروژههایی کار کردم که 10 تصویر در اختیار داشتم. وقتی به برنامههای تولیدشده نگاه میکنم، فکر میکنم چیزی حدود دهها یا شاید صد تصویر برای یافتن نقص در بازرسی بصری ورقههای فولاد چیز غیرمعمولی نیست، اما حتی در داخل کارخانه هم واریانس بسیار زیادی وجود دارد.
اخیراً با یکی از مهندسان بسیار خوب در یکی از شرکتهای بزرگ فناوری چت میکردم. من از ایشان پرسیدم: «اگر برچسبها با یکدیگر ناسازگار باشند، چه میکنید؟» و او گفت: «خوب، ما این تیم چند صد نفری را در خارج از کشور داریم که برچسبگذاری را انجام میدهد.
بنابراین من دستورالعملهای برچسبگذاری را مینویسم، سه نفر را مجبور میکنم که هر تصویر را برچسبگذاری کنند و سپس از نتیجه میانگین استفاده میکنم.» من گفتم: «بله، این کار درستی است که شما باید یک مجموعه کلان داده داشته باشید.» اما وقتی با یک تیم کوچکتر کار میکنم و برچسبها متناقض هستند، فقط دو نفری را که با هم اختلاف نظر دارند پیدا میکنم و از آنها میخواهم که برای رسیدن به یک برچسب واحد با یکدیگر صحبت کنند.
بیایید درباره نظر شما درباره صنعت کلی هوش مصنوعی صحبت کنیم. به نظر میرسد توسعه هوش مصنوعی بیشتر به سمت تحقیقات آکادمیک یا برنامههای شرکتهای بزرگ مانند منابع OpenAI و DeepMind در مقیاس بزرگ متراکم است. در واقع این جریان، فضای زیادی برای مشارکت استارتآپهای کوچک باقی نمیگذارد. به نظر شما برخی از موضوعات عملی که یک کسب و کار هوش مصنوعی برای کمک به تجاریسازی هوش مصنوعی، میتوانند واقعاً روی آنها تمرکز کنند چیست؟
من فکر میکنم بیشتر توجه رسانهها به شرکتهای بزرگ و گاهی به موسسات بزرگ دانشگاهی معطوف است. اما اگر به کنفرانسهای دانشگاهی بروید، کارهای زیادی توسط گروههای تحقیقاتی و آزمایشگاههای تحقیقاتی انجام شده است. وقتی با افراد مختلف در شرکتها و صنایع مختلف صحبت میکنم، احساس میکنم برنامههای تجاری بسیاری وجود دارد که میتوانند از هوش مصنوعی برای مقابله با آنها استفاده کنند.
من معمولاً نزد رهبران کسبوکارها میروم و از آنها میپرسم: «بزرگترین مشکلات کسبوکار شما چیست؟ چه چیزهایی شما را بیشتر نگران میکند؟» بنابراین میتوانم اهداف کسبوکار را بهتر بفهمم و سپس طوفان فکری داشته باشم که آیا برای این مشکلات راهحلی در فناوری هوش مصنوعی وجود دارد یا خیر. گاهی اوقات واقعا راهحلی برای آن مشکلات وجود ندارد و این لزوما چیز بدی نیست.
فقط به چند شکاف اشاره میکنم که به نظر من جالب توجه است. من فکر میکنم امروزه ساخت سیستمهای هوش مصنوعی هنوز بسیار دستی است. شما چند مهندس خبره در حوزه یادگیری ماشین دراختیار دارید و دانشمندان داده کارهایی را در رایانه انجام میدهند و کارها را به سمت تولید سوق میدهند. مراحل دستی زیادی در این روند وجود دارد. به نظر شما جای یک عملیات سازمان یافته و خودکار در این فرایند خالی نیست؟ بسیار خوب. من توجه شما را به عملیات ML [عملیات یادگیری ماشین] به عنوان یک رشته در حال ظهور جلب میکنم که به شما کمک میکند روند ساخت و استقرار سیستمهای هوش مصنوعی سازمان یافتهتر شود.
همچنین، اگر به بسیاری از مشکلات معمول کسبوکارها (همه عملکردها از بازاریابی تا استعدادها) نگاه کنید، فضای زیادی برای اتوماسیون و بهبود کارایی وجود دارد.
من همچنین امیدوارم که جامعه هوش مصنوعی بتواند بزرگترین مشکلات اجتماعی را نیز بررسی کند و برای آنها راهحل ارائه کند. ببینید برای تغییر اقلیم یا بیخانمانی یا فقر چه کاری میتوانیم انجام دهیم. علاوه بر مشکلات تجاری بسیار ارزشمند، باید روی بزرگترین مشکلات اجتماعی نیز کار کنیم و برای آنها در فناوری هوش مصنوعی پاسخ و راهحلی بجوییم.
چگونه فرصتهای مناسب برای استفاده از فناوری یادگیری ماشین در یک کسب و کار هوش مصنوعی خود را شناسایی میکنید؟
در قدم اول، من همیشه سعی میکنم درباره هر تجارت دانش خودم را افزایش دهم و هرچه بیشتر بیاموزم و همچنین به رهبران کسبوکار هم کمک کنم کمی بیشتر درباره هوش مصنوعی بیاموزند. در قدم بعدی، ما معمولاً درباره مجموعهای از پروژهها طوفان فکری برگزار میکنیم. من به نوبه خود در این مرحله برای هر یک از ایدهها، تلاش فنی و همت تجاری خودم را انجام میدهم.
ما این موارد را درباره هر ایده بررسی خواهیم کرد: آیا داده کافی دارید؟ چگونه میتوان دادهها را دوباره بهبود داد و حلقه بیانتهای یادگیری مداوم را به پایان نزدیک کرد؟ برای پاسخ به این سوالات، اطمینان حاصل کنید که انجام این کار از نظر فنی امکانپذیر است. سپس با توجه به نوع کسبوکار، اطمینان حاصل کنید که با این کار، بازگشت سرمایه مورد انتظار ما حاصل میشود. پس از این فرایند، شما بررسی دیگر آیتمهای معمول را پیش رو دارید؛ مانند تخمین منابع، نقاط عطف و سپس مرحله اجرا که امیدوارم در نهایت به آن برسید.
یک پیشنهاد دیگری که دارم این که: مهم است که سریع شروع کنید و اصلا اشکالی ندارد که از ماموریتها و پروژههای کوچک شروع کنید. اولین برنامه تجاری معنادار من در گوگل، تشخیص گفتار بود، نه جستجوی وب یا تبلیغات. اما با کمک به تیم گفتار گوگل در تشخیص دقیق گفتار، این امر به تیم Brain اعتبار و توانایی ادامه همکاریهای بزرگ و بزرگتر را داد.
بعد از آن، گوگل مپ دومین مشارکت بزرگ بود که در آن از فناوری بینایی رایانهای برای خواندن شمارههای خانه برای مکانیابی خانهها در نقشههای گوگل استفاده کردیم. تنها بعد از دو پروژه موفق اول، صحبت جدیتری با تیم تبلیغات داشتم. بنابراین من فکر میکنم شرکتها با شروع کارهای خیلی بزرگ احتمال بیشتری دارد که با شکست مواجه شوند در مقایسه با شروع کارهای کوچک. خوب است که برای شروع کار به عنوان یک سازمان، از یک پروژه کوچک شروع کنید تا مراحل کار را به طور عملی بیاموزید و ببینید آیا استفاده از هوش مصنوعی به شما مسیر موفقیت را نشان میدهد؟ و سپس به پروژههای بزرگتر و موفقیتهای بزرگتر فکر کنید.
به نظر شما، آن چیزی که مخاطبان ما باید از فردا برای پیادهسازی هوش مصنوعی در یک کسب و کار هوش مصنوعی شروع کنند چیست؟
دست بجنبانید! هر چه زودتر به این حوزه وارد شوید. هوش مصنوعی باعث تغییر و پویایی بسیاری از صنایع میشود. بنابراین اگر شرکت شما در حال حاضر خیلی تهاجمی و هوشمندانه سرمایهگذاری نمیکند، زمان خوبی است.