تحلیل داده ؛ پیشبینیهای متخصصان از جایگاه آن در سال 2021
علم تحلیل داده در حال حاضر با سرعت نجومی در حال رشد و توسعه است. از همین رو به سراغ جمعی از بهترین و درخشانترین افراد تاثیرگذار در این صنعت رفتیم تا نظر آنها را درباره آینده علوم داده و تغییراتی که در سال 2021 شاهد خواهیم بود، به اشتراک بگذاریم. کارشناسان و متخصصانی که در این مقاله به اظهارنظر پرداختهاند، در حقیقت نمایندگان باتجربه و برتری هستند که راهحلهای علم داده و تجزیهوتحلیل اطلاعات را ارائه میدهند. پیشبینیهای علوم داده و تجزیهوتحلیل اطلاعات برای ارتباط و توانایی افزودن ارزش تجاری نیز بررسی شده است. آنچه از ظواهر امر آشکار است، این است که همه این پیشبینیها به طریقی عملی هستند و میتوانند بر عملکرد و اندازه سازمانها در آینده تأثیر بگذارند.
دیپتی بورکار (Dipti Borkar)، بنیانگذار و مدیر ارشد محصول در Ahana
منبع باز برای تجزیهوتحلیل عملکرد هوش مصنوعی
ما در سال 2021 شاهد شرکتهای دادهمحوری خواهیم بود که بیشتر از منبع باز برای تجزیهوتحلیل داده ها و نیز تحلیل هوش مصنوعی استفاده میکنند. فناوریهای تجزیهوتحلیل منبع آزاد مانند سیستمهای Presto و Apache Spark Power AI بسیار انعطافپذیرتر و مقرونبهصرفهتر از همتایان سنتی خود هستند. همتایان سنتی این سیستمها همان انبارهای دادههای سازمانی به شمار میروند که کارشان ادغام و تلفیق دادهها در یک مکان بود و اغلب فرایندی وقتگیر و پرهزینه به شمار میرفت. سال آینده شاهد افزایش استفاده از موتورهای تحلیلی مانند Presto برای کاربردهای هوش مصنوعی خواهیم بود و این اقبال عمومی به دلیل ماهیت باز این موتورهای تحلیلی (دارا بودن مجوز منبع باز، قالب باز، رابطهای باز و ابر باز) است.
منبع باز برای تجزیهوتحلیل باز
در سال آینده، شرکتهای فناوری بیشتری رویکرد منبع باز را برای تجزیه و تحلیل داده در پیش میگیرند. این افزایش توجه به این منابع در مقایسه با قالبهای اختصاصی و قفل فناوری که با رویکرد ذخیرهسازی دادههای سنتی ارائه شدهاند قابل توجه است. این انبار باز از Presto منبع باز به عنوان موتور اصلی و از قالبهای باز مانند JSON، Apache ORC، Apache Parquet و سایر موارد استفاده میکند. رابطهایی مانند درایورهای استاندارد JDBC / ODBC برای اتصال به هر ابزار گزارش / داشبورد / نوت بوک و سازگاری ANSI SQL نیز مورد استفاده قرار میگیرند. از آنجا که Presto به عنوان موتور جستجوی بدون ذخیرهسازی کار میکند، بهطور محلی با کانتینرها همسو میشود و میتواند روی هر ابری اجرا شود.
دیو سیممن (Dave Simmen)، بنیانگذار و مدیر ارشد فناوری در Ahana
پیشرفت علم تحلیل داده، یک منبع تفکیک شده را به ارمغان میآورد
یک انبار داده تفکیک شده قادر خواهد بود دادههای جدیدتری را در اختیار ما قرار میدهد. در سال آینده انبار دادههای سنتی جای خود را به پایگاه داده کاملاً بهصرفهتر و کاراتری خواهد داد. با پیشرفتهای بیشتری که در زمینه تحلیل داده رخ خواهد داد، پیشبینی میشود که یک پایگاه داده واحد، دیگر نتواند راهحلی برای پشتیبانی از طیف گستردهای از تجزیه و تحلیل داده ها باشد، زیرا دادهها هم در دریاچههای داده و هم در پایگاه دادههای دیگر ذخیره میشوند. تجزیهوتحلیل SQL برای استعلام در هر دو منبع داده و سایر پایگاهها مورد نیاز خواهد بود. خواهیم دید که این انبار تفکیکشده جدید با استفاده از فناوریهای مبتنی بر SQL مانند موتور جستجوی Presto SQL در هسته، با نوتبوکهایی مانند Jupyter و Zeppelin و ابزارهای BI مانند Tableau، PowerBI و Looker به عنوان استاندارد غالب برای تجزیهوتحلیل محاصره خواهد شد.
بالاجی گانسان (Balaji Ganesan)، بنیانگذار و مدیر عامل شرکت Privacera
دانشمندان داده در کشف «بهترین تصمیم بعدی» آزاد خواهند بود
تیمهای علم داده به خط مقدم همه شرکتها منتقل میشوند و به یک عامل محرک در تجزیهوتحلیل اطلاعات نرمافزارها و افزایش بینش سازمان برای اتخاذ بهترین تصمیمات بعدی تبدیل خواهند شد. این بدان معناست که پشتیبانی از این تیمهای دانش داده به وسیله دادههای مناسب، در زمان مناسب به یک اولویت برای سازمانهای داخلی فناوری اطلاعات در سال 2021 تبدیل خواهد شد؛ چرا که دادهها همچنان به عنوان سوخت استفاده نشده آنها تلقی میشوند. با این وجود، در صورت مدیریت نادرست، دادهها بهراحتی میتوانند به بزرگترین مسئولیت شرکت تبدیل شوند.
کارین جنسون (Karin Jenson)، مدیر تحلیل هوش تجاری موفق در DataRobot
تفسیر، اعتمادسازی و توضیح مدلهای هوش مصنوعی و تشخیص و کاهش سوگیریهای مدلهای هوش مصنوعی، برای هر کسی که از دادههای مربوط به انسان در کارهای مدل سازی خود استفاده میکند، به آستانه تغییر تبدیل خواهد شد. دیگر میتوانید به راحتی جعبه سیاه را باز کنید!
عدم اطمینانی که به واسطه همهگیری ویروس کرونا در میان جوامع ایجاد شده است، همچنان اهمیت مدلهای هوش مصنوعی نظارتی را به عنوان یک جزء مهم از روند موثر یادگیری ماشین آشکار میکند. همانطور که هیچ مدلی نتوانست پیامدهای گسترده و متنوعی را که کووید19 بر جهان اعمال کرد را پیشبینی کند، هیچ مدلی نیز اثرات مداوم آن را برای تجارت جهانی و رفتار مصرفکننده پیشبینی نخواهد کرد. راهحلهای نظارت دستی نیز آن را کاهش نخواهد داد.
آرون کالب (Aaron Kalb)، بنیانگذار و مدیر ارشد داده و تحلیل اطلاعات در Alation
تحلیل داده مثل یک ققنوس از میان ویرانیهای 2020 برمیخیزد!
در سال آینده از میان ویرانیهای بحران کرونا مثل یک ققنوس برمیخیزیم. هنگامی که همهگیری کووید 19 اقتصاد جهانی را زیر و رو کرد، سازمانها مجبور شدند سریعاً روی هوش تجاری و نرمافزار فهرست داده سرمایهگذاری کنند تا بتوانند دریابند که واقعا در جهان چه خبر است! و آن زمان بود که توانستند تصمیمات اساسی را درباره کسبوکار خود و کل تجارت خود بگیرند. با ورود به شرایط عادی جدید در سال 2021، آنها میتوانند از آن سرمایهگذاریهای واکنشی برای بهینهسازی فرایند تجارت فعال استفاده کنند.
سواد دادهای جریان اصلی را به دست خواهد گرفت
در سال 2019، بیشتر افراد علم ریاضیات، آمار و دادهها را کسلکننده، ترسناک یا بیربط میدانستند. اما پس از یک سال بررسی دقیق خطاهایی که در نظرسنجیهای انتخاباتی ایجاد شد و بعد از تماشای منحنیهای نمایی کووید 19 و آموزش در زمینه “R-naught”، این علوم حالا دیگر مهم و تأثیرگذار به نظر میرسند و همچنین نسبت به گذشته قابل دسترسیترند.
کارول مک نرنی (Carol McNerney)، مدیر ارشد بازاریابی در ibi
دسترسی به دادهها تفاوت بین موفقیت و مبارزه تجاری خواهد بود
تجسم و تصویرسازی میتواند ابزار عالی کسبوکار باشد، اما اگر دادههایی که برای مدلسازی کسبوکار استفاده میشود، کامل یا دقیق نباشد، بهراحتی میتواند پیشرفتهای مهم تجاری را به تعویق بیندازد. کارمندان و مدیران باید به تصمیمات تجاری خود اعتماد کنند؛ بهویژه در یک فضای مهم تجاری و در حال پیشرفت این اعتماد ضروری است و همه اینها با دسترسی به دادههای مورد اعتماد شروع میشود. وقتی کارمندان به راحتی به دادههای مورد نیاز خود دسترسی پیدا کنند، قادر خواهند بود اطلاعات را در همه چیز جاسازی کنند.
لوک هان (Luke Han)، بنیانگذار و مدیرعامل شرکت Kyligence
مهمتر از همه تجزیهوتحلیل داده ها و سپس، چند پلت فرمی و چند ابری
CDO و CAO شرکتها به طور فزایندهای مجموعه دادهها و تجزیهوتحلیلهای خود را فراتر از مرزهای سیستم عاملهای ابری و دادهها مشاهده خواهند کرد. در حالی که هزینه جابهجایی دادهها انگیزه تیمهای داده را برای ترک دادهها در محل تولد خود فراهم میکند، بسیاری از آنها به دنبال مهندسی خطوط لوله تجزیهوتحلیل خود برای تهیه داده از چندین سیستم عامل ابری عمومی و خصوصی و ذخیره سازی ابر، انبارهای داده و دریاچههای داده هستند.
شاون راجرز (Shawn Rogers)، معاون استراتژی تحلیلی در نرمافزار TIBCO
مراکز تحلیلی قدرتمند برای موفقیت در سال 2021 حیاتی هستند
چابکی، استاندارد سازی، استفاده مجدد و بازگشت سرمایه مراکز تجزیهوتحلیل قدرتمند (ACE) را به یک ابتکار کلیدی استراتژیک برای سال 2021 تبدیل کرده است. هوش تجاری و تجزیهوتحلیل تأثیر خود را بر مشاغل داده محور اثبات کرده است. بلوغ آن استراتژی اغلب به بلوغ سازمانی نیز نیاز دارد. تعهد به ساختار ACE باعث عملکرد سریعتر و همکاری بیشتر تیمها میشود و مجموعههای متنوعی از مهارت را برای یک گروه نوآور به ارمغان میآورد. ACE کاملاً سازمانیافته امکان استانداردسازی اضافی فرایندها، مدلها و دادهها را فراهم میکند، در حالی که از بازسازی مداوم توسط تیمها نیز جلوگیری میکند و در نتیجه صرفهجویی قابل توجهی در هزینهها ایجاد میشود.
ویکاس ماتور (Vikas Mathur)، معاون ارشد محصول در شرکت Actian
تجزیهوتحلیل داده ها به بهبود زنجیره تامین کمک میکند
ما در ابتدای شیوع کووید 19 در ماه مارس شاهد یک مورد سنتی از شکسته شدن زنجیره عرضه و تقاضا بودیم. تقاضا برای محصولات خاص افزایش یافت، در حالی که به دلیل توقف کارخانهها، تولید به شدت کاهش یافت و باعث وحشت و اختلال در رفتار مصرفکننده و تأخیر در زنجیره تأمین شد. صنایع تولیدی و زنجیره تأمین سالهاست که برای دیجیتالیشدن کاملا آمادهاند، اما اکنون، با شیوع همهگیری کرونا، زنجیرههای تأمین باید پیش از فصل تعطیلات و در سال 2021 به صورت توزیعشده و مبتنی بر داده کار کنند.
تولیدکنندگان میتوانند با تشدید فرایندهای فروش و برنامهریزی عملیاتی خود، نمایشی شفاف از موجودی، برنامه تولید کارخانه و زمان تحویل را برای تصمیمگیری بهتر در سطح متمرکز فراهم کنند. استفاده از تجزیهوتحلیل داده ها برای نگاهی اجمالی به دادههای زمان واقعی برای فرایندهای موجود در زنجیره تامین، شبکههای توزیع و راهحلهای حملونقل، همچنین میتواند به یافتن نقاط درد و فرصتها کمک کند. این تغییرات به نوبه خود میتواند زنجیره تأمین را پیش از بروز مشکلات، به طور فعالانهای بهبود بخشد.
هائویان لی (Haoyuan Li)، بنیانگذار و مدیرعامل Alluxio
«کانتینرها» همه جا برای تجزیهوتحلیل داده ها و هوش مصنوعی
استقرار برنامههای کاربردی کانتینر شده و کوبرنتها با شرکتهایی که به طور فزایندهای از دریاچههای داده مبتنی بر هدوپ Hadoop دور میشوند، در سال آینده مورد توجه قرار میگیرند. شرکتها ضمن دورشدن از فضاهای سنتی، در حال درک مزیت انتزاع زیرساختهای فیزیکی و در عین حال ابرهای عمومی برای چابکی بیشتر سازمان خود هستند. استقرار کانتینرها برای انتزاع محاسباتی در کنار سرویسهای جدید انتزاع برای ذخیرهسازی در هر نقطه، راهحل انتخابی برای شرکتهای خارج از هدوپ خواهد بود.