هوش تجاری Business Intelligence

کسب و کار هوشمند برای شناسایی، تجزیه و تحلیل، مدل سازی، ساختار و بهینه سازی فرآیندهای کسب و کار نیازمند به هوش تجاری Business Intelligence یا به اختصار BI می باشد. علاوه بر این، برای شناخت مقادیر زیاد داده های بدون ساختار جهت پوشش تصمیمات بسیار حساس و غیر حساس نیازمند دانش هوش تجاری می‌باشد.

اصطلاح “کسب و کارهای هوشمند” صرفا برای شرکت های تجاری، دولت های هوشمند، موسسات آموزشی هوشمند مدیریت شده و بیمارستان های کارآمد و …. استفاده نمی‌شود بلکه هر فعالیت تجاری پیچیده می تواند از BI استفاده کند.

BI به بحث کلیدی اکثر تحلیلگران فناوری اطلاعات تبدیل شده است و با توجه به روند رشد آن، انتظار می‌رود آینده ای روشن و پرانرژی داشته باشد. تقریبا تمام موسسات و سازمان های متوسط و بزرگ هم اکنون از نرم افزارهای BI استفاده می کنند و یا برنامه ای برای استفاده از آن در چند سال آینده دارند. با توجه به سرعت رشد BI نیاز به متخصصان BI وجود دارد. نیاز به کارشناسان در “یادگیری ماشین” و “تجزیه و تحلیل داده ها” مشهود است. از آنجایی که این رشته ها برای تبلیغات Big Data مهم هستند و به نظر می رسد که گوگل، فیس بوک و سایر شرکت ها تعداد زیادی از مشاغل خود را در این رشته ها متمرکز نموده‌اند، دانش آموزان قطعا به یادگیری ماشین و تجزیه و تحلیل داده‌ها نیاز دارند. در نتیجه بسیاری از بخش های علوم رایانه، برنامه های درسی خود را با توجه به این زمینه ها تقویت کرده اند.

با این حال، یادگیری ماشین، تجزیه و تحلیل داده ها و داده کاوی تنها بخشی از فناوری BI می‌باشند. قبل از اینکه “ماشین” بتواند از داده ها یاد بگیرد، در واقع نیاز به جمع آوری داده ها دارد تا آنها را به صورت یکپارچه ارائه کند، فرایندی که اغلب به عنوان تهیه داده ها (Data Provisioning) نامیده می شود. این مهم به نوبه خود نیاز به استخراج داده ها از فرآیندهای کسب و کار مرتبط و احتمالا از منابع وب مانند شبکه های اجتماعی، با تمیز کردن(اصلاح)، تبدیل و ادغام داده‌ها و بارگیری آنها در یک انبار داده یا نوع دیگری از پایگاه داده دارد.

برای توانمندسازی کارآیی انسان با مراحل مختلف این فعالیتها، روشها و ابزارهای شبیه سازی داده ضروری هستند. علاوه بر این، BI نیز فراتر از داده های ساده است و هدف آن شناسایی، مدل سازی و بهینه سازی فرآیندهای کسب و کار می‌باشد. تمام این فعالیت های BI به طور کامل مورد بررسی قرار گرفته و هر یک از آنها در تعدادی از مونوگراف ها و کتاب های درسی آمده است. با این حال، چیزی که به شدت مورد نیاز است، یک کتاب است که همه را با هم مرتبط نموده و دیدگاه یکپارچه از جنبه های مختلف هوش تجاری را ارائه دهد.

ویلفرد گروسمن و استفانی ریندلرما کتابی را جهت پر کردن این شکاف ارائه نمودند که منبع اصلی ما برای این مقاله می‌باشد. این کتاب مقدمه ای مفید درباره جنبه های مهم مرتبط با BI است. با این حال، این کتاب نه تنها نقطه ورود به این حوزه است بلکه بخش های مختلف رشته های BI را عمیقا توسعه می دهد و روش ها و تکنیک های عمده را در جزئیات کافی پوشش می‌دهد تا خواننده را قادر سازد که آن را در زمینه کسب و کار در دنیای واقعی اعمال کند. این کتاب به طور خاص در چهار حوزه عمده مرتبط با BI تمرکز دارد: (۱) مدل سازی داده ها و تهیه داده ها از جمله استخراج داده ها، ادغام و انبارداری داده (Warehousing)؛ (۲) داده ها و مجازی سازی فرایندها؛ (۳) یادگیری ماشین، داده کاوی، متن کاوی و تجزیه و تحلیل داده ها؛ و (۴) تجزیه و تحلیل، استخراج و مدیریت فرایندها. این کتاب نه تنها جنبه های استاندارد BI را پوشش می دهد، بلکه موضوعاتی از ارتباطات اخیر مانند تجزیه و تحلیل شبکه های اجتماعی و موضوعاتی از منافع متداول مانند متن کاوی را نیز پوشش می دهد. نویسندگان در انتخاب و ترکیب همه موضوعات مرتبط با یک رویکرد مدرن به هوش کسب و کار و ارائه مفاهیم و روش های متفاوت در چارچوب یکپارچه به خوبی عمل نموده‌اند. به نظر من، این اولین کتابی است که BI را در سطح گستره، منسجم ارائه می‌دهد.

هوش تجاری Business Intelligence

مقدمه ای بر هوش تجاری

وظیفه اصلی هوش تجاری Business Intelligence پشتیبانی از تصمیم گیری برای فعالیت های تجاری بر اساس اطلاعات تجربی می‌باشد. اصطلاح کسب و کار به معنای وسیعتر درک می شود که شامل فعالیت هایی در برنامه ها و دامنه های مختلف برای مثال، یک شرکت، یک دانشگاه یا یک بیمارستان است. حمایت از تصمیم گیری در زمینه کسب و کار می تواند در سطوح مختلفی از پشتیبانی عملیاتی برای یک فعالیت تجاری خاص تا حمایت استراتژیک در سطح بالایی از سازمان مورد بررسی قرار بگیرد. در نتیجه، اصطلاح BI مجموعه‌ای از مدلها و روشهای تحلیلی مانند گزارشدهی، انبارداری داده، استخراج دادهها، استخراج فرآیند، تجزیه و تحلیل، پیش بینی، سازمان کاوی، داده کاوی و متن کاوی را شرح می‌دهد.

ایده اصلی هوش تجاری Business Intelligence این است که تمام انواع فعالیت های تجاری به عنوان فرایند در زمان در نظر گرفته شود و تجزیه و تحلیل این فرایند می تواند بر دیدگاه های مختلف فرایند تأکید داشته باشد. سه دیدگاه متفاوت وجود دارد: (۱) چشم انداز تولید، که مربوط به تامین کننده کسب و کار است؛ (۲) چشم انداز مشتری، که مربوط به کاربران یا مصرف کنندگان کسب و کار ارائه شده است؛ و (۳) دیدگاه سازمانی، که مسائلی مانند عملیات در چشم انداز تولید یا شبکه های اجتماعی را در دیدگاه مشتری در نظر می‌گیرد. عناصر اصلی BI، اطلاعات مربوط به کسب و کار هستند که به توصیف فرآیند و یا نمونه های فرآیند اشاره دارند. این داده ها ممکن است دیدگاه های مختلفی در فرآیند به واسطه ویژگی های ساختاری زیر داشته باشند: (۱) نمایش رویداد، که مستندات دقیق از رویدادهای خاص را ثبت می کند؛ (۲) دیدگاه دولتی، که در طول زمان نظارت، توسعه ویژگی های خاصی از پروسه‌های فرآیند را بررسی می‌کند. و (۳) نمای مقطع عرضی، که خلاصه‌ای از اطلاعات ویژگی‌های مشخص برای نمونه پرونده‌های ثبت شده در یک دوره زمانی خاص را می‌دهد.

مسائلی که برای پشتیبانی از تصمیم مورد نیاز است اغلب مربوط به شاخص های کلیدی عملکرد (KPI) و درک چگونگی وابستگی آنها به عوامل تاثیرگذار خاص، به ویژه ویژگی های کسب و کار است. برای اهداف تحلیلی، لازم است که یک KPI را در تعدادی از اهداف تحلیلی اصلاح کنیم. این اهداف با روش های شناخته شده تجزیه و تحلیل مطابقت دارد و می تواند در زیر اهداف توصیفی کسب و کار، اهداف پیش بینی تجاری کسب و کار و اهداف درک کسب و کار با پشتیبانی از ذینفعان خلاصه شود. اهداف توصیفی کسب و کار معمولا با گزارش گیری، تقسیم بندی (یادگیری بدون نظارت) و شناسایی رفتاری مورد توجه قرار می‌گیرد. اهداف پیش بینی کسب و کار شامل برآورد و طبقه بندی نتایج می‌شود و به عنوان یادگیری تحت نظارت (Supervised) در زمینه یادگیری ماشین شناخته می شود. اهداف درک کسب و کار با پشتیبانی از ذینفعان در درک فرایندهای کسب و کار می‌باشد و با شناسایی فرایند و تجزیه و تحلیل فرآیند صورت گیرد.

بر اساس این چارچوب، ما یک فرمت متد برای فعالیت های هوش تجاری را به سمت ایده هایی از فرمت L برای فرایند کاوی و CRISP برای تجزیه و تحلیل کسب و کار آماده می‌کنیم. وظایف اصلی فرمت عبارتند از وظیفه درک کسب و کار و داده، وظیفه داده، وظیفه مدل سازی، وظیفه تجزیه و تحلیل، وظیفه ارزیابی و گزارش گیری. این وظایف ساختار بخش‌های بعدی را تعریف می‌کند.

بخش دوم به مسائل مربوط به مدل سازی مربوط می شود. طیف گسترده ای از مدل ها در هوش تجاری مطابق با دیدگاه های مختلف کسب و کار، تعدادی از دیدگاه های احتمالی در مورد فرایندها و اهداف تحلیل چند بعدی می‌باشد. برای فهم اصطلاح مدل راه‌های ممکن، ساختارهای مدل اغلب استفاده شده در BI شرح داده می‌شوند، مانند ساختار منطقی جبری، ساختار گراف و ساختارهای احتمالی / آماری. هر ساختار از نظر دیدگاه، خواص اساسی و علامت گذاری آن و همچنین تکنیک های الگوریتمی برای حل سوالات در این ساختارها توصیف می‌شود. دانش تجربی در مورد این ساختارها در سطح مقدماتی در برنامه های کاربردی علوم رایانه ای قرار دارد. علاوه بر این، ملاحظات اساسی در مورد تولید داده ها، کیفیت داده ها و دست زدن به جنبه های زمانی ارائه شده است.

بخش سوم در فرآیند تهیه داده ها، از جمع آوری داده‌ها و استخراج آنها به توضیحات جامع مفاهیم و روش های تبدیل داده‌ها به فرمت‌های داده‌های تحلیلی لازم برای استفاده از داده ها به عنوان ورودی برای مدل‌ها در تجزیه و تحلیل استفاده می‌کند. فرمت‌های داده های تحلیلی نیز، داده‌های زمانی را جهت استفاده در تجزیه و تحلیل فرآیند مورد استفاده قرار می‌دهند.

در بخش چهارم، ما روش‌های پایه‌ای برای توصیف داده‌ها و شبیه سازی داده‌ها را بررسی می‌کنیم که در کار کسب و کار و درک داده ها و همچنین در کار ارزیابی و گزارش گیری استفاده می شود. روش ها برای داده های پردازش‌گرا و داده‌های مقطعی در نظر گرفته شده است. بر اساس این تکنیک های اساسی، ما جنبه های تجسم و گزارش‌گیری تعاملی و پویا را طراحی می‌کنیم.

بخشهای ۵ تا ۸، روش های تحلیلی مختلفی را که برای اهداف تحلیلی اصلی یادگیری نظارتی (پیش بینی و طبقه بندی)، یادگیری بدون نظارت (خوشه بندی) و همچنین شناسایی فرآیند و تجزیه و تحلیل فرآیند، توضیح می‌دهد. هر بخش به نحوی سازماندهی شده است که ابتدا یک دید کلی از اصطلاحات مورد استفاده و ملاحظات روش شناسی عمومی ارائه کند. پس از آن، تکنیک‌های تحلیلی مورد بررسی قرار می‌گیرد.

بخش پنجم به تکنیک‌های تجزیه و تحلیل برای داده های مقطعی، به طور عمده تکنیک های داده کاوی می‌پردازد و برای پیش‌بینی، روش های مختلف رگرسیون مورد بررسی قرار می‌گیرد. برای طبقه بندی، ما تکنیک های مبتنی بر اصول آماری، تکنیک های مبتنی بر درخت تصمیم و ماشین های بردار پشتیبان را در نظر می گیریم. برای یادگیری بدون نظارت، ما خوشه بندی سلسله مراتبی، روش های تقسیم بندی و خوشه بندی مبتنی بر مدل را در نظر می‌گیریم.

در بخش ششم تمرکز بر تکنیک های تجزیه و تحلیل داده ها با ساختار زمانی است. ما از مدلهای احتمالات به طور خاص، زنجیره مارکوف و تکنیک های مبتنی بر رگرسیون (تجزیه و تحلیل رویدادهای گذشته) شروع می‌کنیم و در ادامه، تکنیک های تجزیه و تحلیل را برای تشخیص رفتار در فرایندهایی مانند تجزیه و تحلیل ارتباطات، استخراج توالی و استخراج معادن داده مورد استفاده قرار می‌گیرد.

بخش ففتم روش‌های شناسایی فرآیند، مدیریت فرایند، فرآیند استخراج و انطباق فرآیند را مورد بررسی قرار می‌دهد. در بخش هشتم، تکنیک های تجزیه و تحلیل های مختلف برای مشکلات توضیح داده شده است، که از دیدگاه های مختلف به یک فرایند کسب و کار می‌پردازد. مبانی تجزیه و تحلیل شبکه های اجتماعی، سازمان کاوی، تجزیه و تحلیل نقطه تصمیم گیری و متن کاوی ارائه می‌شود. تکنیک تجزیه و تحلیل این مسائل ترکیبی از تکنیک های فصل‌های قبلی است.

۱- معرفی هوش تجاری Business Intelligence

حال نوبت به آن رسیده تا با چکیده ای کوتاه به معرفی اجزای هوش تجاری بپردازیم و در مقاله های بعدی این اجزا را به صورت کامل شرح دهیم.

چکیده

در این قسمت، ما تعاریف هوش تجاری (BI) را ارائه می دهیم و دورنمای BI را در طول زمان مشخص می کنیم، مخصوصا در مورد سوالات فعلی BI. سناریوهای مختلف برنامه های کاربردی BI در نظر گرفته شده و دیدگاه های تجاری و دیدگاه هوش تجاری در فرآیند کسب و کار بررسی می‌شود. علاوه بر این، اهداف و وظایف BI از دیدگاه مدیریت و تجزیه و تحلیل مورد بحث قرار می گیرد و یک فرمت متد برای برنامه های کاربردی BI پیشنهاد می شود. این فرمت همچنین یک طرح کلی از مطالب را ارائه می دهد. در نهایت، نمونه هایی از دامنه‌های مختلف معرفی شده است که برای آشنایی بیشتر با مباحث استفاده می‌شود. قبل از معرفی اجزای BI یک تعریف کامل از هوش کسب و کار ارائه میگردد.

۱-۱ تعریف هوش کسب و کار

اگر فردی برای تعریف اصطلاح هوش تجاری Business Intelligence (BI) بخواهد تعریفی بیاورد، باید اولین مرجع در سال ۱۹۵۸ در مقاله ای از H.P. Luhn را مطالعه نماید. ابتدا از تعریف جدای اصطلاحات “هوش” و “کسب و کار” به صورت زیر شروع میکند:

هوش: توانایی درک ارتباط حقایق ارائه شده به گونه ای که جهت آن به سوی یک هدف مطلوب باشد

کسب و کار: مجموعه ای از فعالیت های انجام شده برای رسیدن به هر هدف والا، مانند علم، فناوری، تجارت، صنعت، قانون، دولت، دفاع، و غیره

در این مقاله هوش کسب و کار (هوش تجاری) را به عنوان” سیستم اتوماتیک که در حال توسعه برای انتشار اطلاعات به بخش های مختلف هر صنعت، سازمان علمی یا دولتی است”معرفی نموده و وظیفه اصلی سیستم لوون، ذخیره و نگهداری اتوماتیک اطلاعات و ارائه این اطلاعات به موارد مناسب به اصطلاح عمل (Action) است.

این تعریف برای ۳۰ سال به اثبات نرسید تا در سال ۱۹۸۹ هوارد دیزنر (Howard Dresner) اصطلاح “هوش تجاری” (BI) را دوباره به کار گرفت. او از این اصطلاح به عنوان یک اصطلاح کلیدی برای مجموعه ای از مفاهیم و روش های بهبود تصمیم‌گیری در کسب و کار، با استفاده از سیستم های مبتنی بر حقایق معرفی کرد.

بسیاری از تعاریف مشابه در زمان‌های مختلف ارائه شده است. Negash ، جنبه های مهم هوش تجاری را با بیان اینکه ” سیستم های اطلاعاتی کسب و کار اطلاعات عملیاتی ارائه شده در زمان مناسب، در محل مناسب و در فرم مناسب را برای کمک به تصمیم‌گیرندگان فراهم می کنند” تعریف نمود.

امروزه می توان تعاریف بسیار مختلفی پیدا کرد که نشان می دهد که در سطح بالا هدف هوش تجاری خیلی تغییر نکرده است. به عنوان مثال، در BI، “یک رویکرد کل یکپارچه، مبتنی بر فناوری اطلاعات برای پشتیبانی تصمیم گیری مدیریتی” تعریف شده است و ویکیپدیا “BI” را “مجموعه ای از نظریه ها، روش ها، فرآیندها، معماری ها و فن آوری هایی که تبدیل داده های خام را به اطلاعات معنی دار و مفید برای اهداف کسب و کار می رساند تعریف نموده است. طبق تعاریف مختلف، هوش تجاری را می توان با ویژگی‌های زیر معرفی نمود:

  • وظیفه BI: وظیفه اصلی هوش تجاری، ارائه پشتیبان تصمیم‌گیری برای اهداف خاص تعریف شده در زمینه فعالیت های تجاری در حوزه های مختلف آن، با توجه به چارچوب سازمانی و صنعتی است،
  • پایه BI: پشتیبانی تصمیم گیری هوش تجاری عمدتا به اطلاعات تجربی بر اساس داده ها متکی است. علاوه بر این زمینه تجربی، BI همچنین از انواع مختلف دانش و نظریه ها برای تولید اطلاعات استفاده می کند.
  • تحقق (پیاده سازی) BI: پشتیبان تصمیم‌گیری باید به عنوان یک سیستم با استفاده از قابلیت های واقعی در فناوری اطلاعات و ارتباطات (ICT) تحقق یابد.
  • خروجی (تحویل) BI: سیستم هوش تجاری باید اطلاعات را در زمان مناسب به افراد مناسب در فرم مناسب ارسال کند.

با توجه به توسعه فناوری اطلاعات و در دسترس بودن داده ها، ما می توانیم دوره های مختلفی را در BI معرفی کنیم. در گذشته هوش تجاری عمدتا تحت عنوان سامانه پشتیبان تصمیم گیری (DSS) شناخته می شد. در بررسی انجام شده که از دهه ۱۹۶۰ تا آغاز قرن بیست و یکم را شامل می شود، توسعه تئوری سیستمها در علوم کامپیوتری، به سمت بهینه سازی و دامنه های کاربردی و همچنین توسعه سیستم ها مانند مدل DSS (مدل های برنامه ریزی یا شبیه سازی)، هدفمندی DSS (از پایگاه داده ها تا سیستم های OLAP)، DSS مبتنی بر ارتباطات (شبکه های همکاری)، DSS مبتنی بر سند (بازپخش و تجزیه و تحلیل اسناد) و DSS مبتنی بر دانش (سیستم های متخصص) در حرکت است.

بر اساس تعریف هوارد درسنر در سال ۱۹۸۹، اصطلاح BI در دهه ۱۹۹۰ مشهور شد و عمدتا به عنوان سیستم پشتیبان تصمیم‌گیری مبتنی بر داده ها به طور دقیق در ارتباط با توسعه انبار داده، استفاده از پردازش تحلیلی آنلاین (OLAP) و ابزار گزارش دهی شناخته شد. به موازات تحولات در زمینه مدیریت داده ها، دیگر ابزارهای تجزیه و تحلیل مانند داده کاوی یا تجزیه و تحلیل پیش بینی (predictive analytics) محبوب شدند. بعضی اوقات، اینها تحت عنوان تجزیه و تحلیل کسب و کار خلاصه شده بودند، و این تصور می شد که هوش تجاری یک مجموعه ناهمگونی از ابزارهای پشتیبانی از وظایف مختلف در یک کسب و کار است. از این رو، لازم بود که خطوط مختلف توسعه را تقویت کنیم و دوباره به چشم انداز سیستم پشتیبان تصمیم گیری تمرکز کنیم.

یک رویکرد تأثیرگذار قرار دادن انبار داده در مرکز توجه روش Kimball است. این روش یک چرخه عمر برای راه حل های انبار داده ها را با مدل سازی بر اساس ابعاد (dimensional modeling) به عنوان عنصر اصلی تعریف می کند. طراحی معماری‌های فنی مناسب موجب تحقق یک انبار داده می‌شود. برنامه‌های کاربردی مانند ابزارهای گزارش‌گیری و مدل‌های تحلیلی تصمیم‌گیرندگان با اطلاعات مناسب فراهم می‌شود.

مدل چرخه عمر نرم افزار به عنوان چارچوبی برای ادغام جنبه های مختلف هوش تجاری استفاده شده است. رویکردهای دیگر مانند CRISP از فرایند تجزیه و تحلیل در کشف دانش از پایگاه داده ها آغاز می شود. علاوه بر این ایده های مفهومی، می توان به طور مکرر تعاریف عملی را پیدا کرد. می توان نتیجه گرفت که BI باید به پرس و جو، گزارش دهی، OLAP، ابزار هشدار و تجزیه و تحلیل کسب و کار تقسیم شود.

در این تعریف؛ تجزیه و تحلیل کسب و کار یک زیر مجموعه از هوش تجاری بر اساس آمار، پیش بینی و بهینه سازی است. در این مقاله، ما این ایده را دنبال خواهیم کرد و BI را با منطق کامل درک خواهیم کرد.

در سال های گذشته، قابلیت دسترسی به داده ها و قابلیت‌های آنالیز داده بسیار افزایش یافته است و زمینه های تحقیقاتی جدیدی برای هوش تجاری بوجود آمده است. تعدادی از موضوعات تحت عنوان Business Intelligence 2.0 ذکر شده است. با نگاهی به این مباحث از منظر چهار ویژگی اصلی BI که در قسمت قبل ذکر شد، می توانید این چالش های جدید را مشاهده کنید.

۱-۲ چالش های واقعی هوش تجاری Business Intelligence

  • وظایف BI: امروزه ما می توانیم درک خوبی از منطق کسب و کار تقریبا در تمام زمینه ها پیدا کنیم. این درک جدید نیز منجر به یک دیدگاه مفهومی فرآیند گرا شده است که ملاحظات گردش کار و استخراج معادلات را در BI ادغام می کند. یکی دیگر از جنبه‌ها این است که ساختارهای سازمانی جدید مانند سازمان‌های غیرمتمرکز می‌خواهند در حوزه محیط خود از پشتیبان تصمیم بگیرند، و از این رو، ایده هایی از هوش جمعی یا منابع جمع آوری شده در BI استفاده می‌شود.
  • مبانی BI: علاوه بر انبار داده های سنتی، ما همچنین باید داده ها را بر روی وب حساب کنیم. چنین اطلاعاتی اغلب به خوبی ساختار یافته نیست، بلکه فقط به صورت نیمه ساختاری مانند داده های متنی است. نیاز به ادغام داده های مختلف مفید برای پشتیبان تصمیم گیری به صورت یکپارچه منجر به نیاز برای مدل هایی جهت اتصال داده ها در هوش تجاری است. در ارتباط با چنین داده‌های جدیدی، دامنه روش های تحلیلی گسترش یافته و ابزارهای جدیدی همچون بینایی ماشین، متن کاوی، تحلیل نظرات یا تجزیه و تحلیل شبکه های اجتماعی مطرح شده است.
  • تحقق سیستم های BI: معماری های نرم افزاری امروز اجازه می دهد تا سیستم ها BIجدید را جذاب تر کنند. از منظر کاربر، نرم افزار به عنوان یک سرویس (SaaS) توسعه جالب برای سیستم های هوش تجاری را ایجاد می‌کند. از نقطه نظر محاسباتی، ما امروزه باید با مجموعه داده های بزرگ و پیچیده برخورد کنیم. علاوه بر این، محاسبات ابری و محاسبات توزیع شده مفاهیم مهم هستند که فرصت های جدیدی برای برنامه های کاربردی BI ایجاد می‌کنند.
  • تحویل BI: دستگاه های تلفن همراه ابعاد جدیدی را برای ارائه اطلاعات به کاربران در زمان واقعی ارائه می دهند. با این حال، این تحولات باید توجه داشته باشند که کیفیت اطلاعات در زمان واقعی یک چالش جدید برای هوش تجاری است.

بدیهی است، بسیاری از پیشرفت های ذکر شده در این زمینه بیش از یک جنبه از ویژگی های BI ذکر شده را پوشش می دهند، اما این طبقه بندی باید از درک این مطلب که تعریف اساسی و خصوصیات هوش تجاری هنوز معتبر هستند، پشتیبانی کند.

با توجه به اهمیت BI برای برنامه های کاربردی تجاری، یک بازار بزرگ وجود دارد و بسیاری از شرکت ها راهکارهای BI را ارائه می دهند. این فروشندگان بسیاری از اصطلاحات و لغات را ایجاد می‌کنند و فرمت های یکپارچه را برای برنامه های کاربردی هوش تجاری پیشنهاد می دهند، اما تعاریف دقیق و عمومی از اصطلاحات اغلب در متن BI وجود ندارد.

پس از این تعریف کامل از BI قصد داریم شرح مختصری از دیگر اجزای هوش تجاری بیان کنیم.

۲- مدل سازی در هوش تجاری Business Intelligence

مدل ها نقش مهمی را در هوش تجاری برای دستیابی به اهداف تحلیلی بازی می کنند. بسته به منظر تجاری، دیدگاه فرآیند کسب و کار، اهداف تجزیه و تحلیل و داده های موجود، مدل سازی در هوش تجاری متفاوت است. این بخش اختصاص یافته به یک مرور کلی از رویکردهای رسمی مختلف به مدل سازی و ایده های مربوط به ساخت مدل و بخشهای آن به طور مختصر شرح داده می شود.

مدلسازی در هوش تجاری

۲-۱ مدل ها و مدل سازی در هوش تجاری

همانطور که گفته شد در رشته های علمی، اصطلاحات مدل و مدل سازی بارها در زمینه هوش تجاری استفاده شده است و می‌توان به وفور انواع مدل ها را پیدا کرد، به عنوان مثال، مدل های فرایند کسب و کار، مدل های سازمانی، مدل های رگرسیون، مدل های طبقه بندی، مدل های گرافیکی ، مدل داده ها یا مدل های نرم افزاری. نگاه دقیق تر به تعاریف این مدل ها نشان می دهد که این مفهوم مبهم است، اگرچه قصد کلی مشابه است. با توجه به طیف گسترده ای از مدل های BI، ما ابتدا مدل ها و مدل سازی ها را از دیدگاه نسبتا عمومی، بر اساس ایده هایی مورد بحث قرار می دهیم.

۲-۲ ساختارهای منطقی و جبری

در هوش تجاری، ساختارهای منطقی و جبری به طور عمده برای توصیف معانی حوزه ها استفاده می شود. آنها برای تعریف یک پایگاه دانش، یک سیستم سازمان دانش، یک طرح XML یا archetypes( یک اصطلاح رایج در فناوری اطلاعات پزشکی) مفید هستند و زمینه برای ارائه داده ها را در نظر می گیرند.

۲-۳ ساختارهای گراف

ساختارهای گراف در بسیاری از مدل‌های BI نقش مهمی ایفا می‌کنند و برای مدل سازی روابط در فرآیند کسب و کار مفید هستند. معناشناسی ساختارهای گراف، تعدادی از ساختارها را برای تحلیل خاص چنین روابطی ارائه می دهد. در مقالات بعدی ساختار مدل های گراف را با روش های مختلف مدل سازی توصیف خواهیم کرد.

۲-۴ ساختار تحلیلی

ساختار تحلیلی مهمترین ساختار مدل برای BI در مقایسه با داده ها در دیدگاه مقطعی است. مدل سازی ترکیبی از مفاهیم (ارزش های واقعی) توابع، احتمال و آمار است. بر این اساس، در مقالات بعدی ما ابتدا اصول اولیه این سه ساختار را ارائه می کنیم و سپس نشان می دهیم که چگونه در مدل سازی ترکیب می شوند. ما فرض می کنیم که خواننده با ریاضیات، احتمال و آمار در سطح مقدماتی برای علوم کاربردی کامپیوتر و یا مدیریت کسب و کار آشنا است.

کتاب های درسی متعددی این موضوعات را پوشش می دهند. بگذارید تنها به عنوان یک مقدمه کلاسیک در احتمال و آمار با استفاده از تنها ریاضی پایه شرح داده شود.. Mendenhall و همکاران. به عنوان یک کتاب درسی سنتی در مورد احتمال و آمار، برای رویکرد بیشتر به آمار محاسباتی پیشنهاد می شود.

۲-۵ داده و مدلها

علاوه بر فراهم نمودن داده‌ها، تولید داده‌ها و کیفیت داده‌ها در BI نقش مهمی ایفا می کند. در این بخش، ما جنبه های مهم تولید داده، جنبه های زمانی داده‌ها و کیفیت داده‌ها را مورد بحث قرار می دهیم.

۳- تهیه داده‌ها

در این بخش فرآیند تهیه داده‌ها، جمع آوری و استخراج داده‌ها به توضیحات جامع مفاهیم و روش های تبدیل داده‌های تراکنش به فرمت‌های داده تحلیلی، بررسی می‌شود. با اصطلاح تراکنش داده ها، ما داده ها را با یک ساختار زمانی مشخص در نظر می‌گیریم که بعدا در تجزیه و تحلیل فرآیند مورد استفاده قرار خواهد گرفت. تمرکز بیشتر روی داده‌های بزرگ (Big Data) و کیفیت داده قرار می‌گیرد.

تهیه داده ها

۳-۱ مقدمه و اهداف

تهیه داده‌ها پیش نیاز پروژه هوش تجاری (BI) را فراهم می‌کند. واضح است که بدون هیچ گونه داده ای، هیچ تجزیه و تحلیل و پایگاه داده با کیفیت خوب وجود نخواهد داشت، در چنین شرایطی انتظار می رود کیفیت تجزیه و تحلیل نیز کم باشد.

۳-۲ جمع آوری و توصیف داده ها

اغلب تلاش برای جمع آوری داده‌ها، از جمله شناسایی و انتخاب منابع داده مربوطه برای پروژه BI دست کم گرفته می‌شود. در بعضی از پروژه ها، منابع داده‌ها ممکن است به عنوان یک منبع برای تجزیه و تحلیل بعدی تبدیل شوند، حتی ممکن است، اهداف تحلیلی تا حدودی وابسته به منابع داده موجود باشند. واضح است که در مورد اهداف تحلیلی، جمع آوری داده ها در مورد نتیجه پروژه BI بیشتر امیدوار کننده باشد. در عمل، یک نتیجه واقع بینانه اغلب اتفاق می افتد، سازش بین اهداف تجزیه و تحلیل مورد نظر و داده های موجود.

۳-۳ استخراج اطلاعات

پس از انتخاب منابع مربوط به داده ها و توصیف آنها از جمله سوالات تجزیه و تحلیل و فرمت، گام بعدی، استخراج اطلاعات مربوطه از منابع آنها است. به طور معمول، استخراج داده ها بخشی از فرایند به “اصطلاح استخراج تبدیل بار” (ETL) است که در مقالات بعدی توضیح داده خواهد شد. ما همچنین در مورد چالش های مربوط به استخراج متن در داده‌های بزرگ (Big Data) خواهیم پرداخت.

۳-۴ از داده های تراکنشی به سوی داده های تحلیلی

در این بخش نشان خواهیم داد چگونه داده‌ها را از منابع احتمالی ناهمگن برای اهداف تحلیلی بعدی استخراج کنیم. همانطور که تجزیه و تحلیل هر بخش از داده های استخراج شده به صورت جداگانه سازگار نیست، داده های استخراج شده باید تمیز و یکپارچه شوند(Data Cleaning). با این حال، قبل از اینکه یکپارچه سازی داده ها انجام شود، ما باید تصمیم بگیریم که کدام یک از داده ها باید یکپارچه شوند (فرمت ادغام). در برخی موارد، فرمت ادغام همان فرمت پیش فرض است که تجزیه و تحلیل های بعدی با آن کار خواهند کرد. در سایر شرایط، فرمت های تحلیلی اضافی که بر اساس فرمت ادغام هستند، ضروری می‌باشند. تجزیه و تحلیل های مختلف انجام خواهد شد که نیاز به فرمت های مختلف تجزیه و تحلیل دارد. به عبارت دیگر، انتخاب فرمت تحلیلی بستگی به سؤالات تحلیلگر و شاخص‌های کلیدی عملکرد (KPIs) دارد. انتخاب فرمت ادغام بستگی به نتایج مرحله استخراج اطلاعات از جمله ملاحظات در فرمت تحلیلی بعدی دارد. در نهایت، هر دو انتخاب باید با در نظر گرفتن مسائل کیفیت داده ادغام شوند.

۳-۵ یکپارچگی داده و الگو

پس از انتخاب فرمت یکپارچه سازی مناسب، منابع داده‌های احتمالا ناهمگن در این فرمت هدف باید یکپارچه شوند. از این رو، علاوه بر نقشه ها، اضافات و تحولات بین فرمت های مختلف ما باید با چالش های ادغام اگو و ادغام داده‌ها روبرو شویم.

۴- توصیف و تجسم داده

این بخش اصول اساسی توصیف و تجسم داده را ارائه می دهد. پس از معرفی مختصر، ما شرح و تجسم خواص ساختاری فرآیند کسب و کار را در نظر می گیریم. توصیف و تجسم داده برای جمع آوری نمونه های فرایند که بعدها اهداف گرافیکی تعاملی و پویا را مشخص می کند مورد استفاده قرار می‌گیرد. در مقالات بعدی به معرفی تکنیک های تجسمی که اغلب مورد استفاده قرار می‌گیرد، همراه با کاربردهای مورد استفاده می‌پردازیم. سرانجام برخی از جنبه های Infographics و گزارش را مورد بحث قرار می‌دهیم.

۴-۱ معرفی

توصیف و تجسم داده‌ها نقش مهمی در BI دارد و در همه فعالیت های BI استفاده می شود. در ابتدای هر پروژه BI، آنها یک بخش ضروری از تکنیک های کسب و کار و داده ها هستند و از درک فرآیند کسب و کار و ارزیابی داده ها پشتیبانی می‌کنند. در مرحله مدل سازی، آنها به عنوان تکنیک‌های آماده سازی داده‌ها ارائه می‌شوند. در تجزیه و تحلیل، آنها نه تنها برای تجزیه و تحلیل ، بلکه برای ارائه نتایج نیز استفاده می‌شوند.

۴-۲ توصیف و تجسم فرایندهای کسب و کار

این بخش مقدمه ای برای طرح بندی و تجسم فرایندهای کسب و کار است که در طول مراحل چرخه عمر فرآیند، یعنی زمان طراحی و زمان اجرا، سازمان‌دهی شده است. جزئیات تجسم خاص در زمینه تجزیه و تحلیل فرآیند و استخراج معادن داده در مقالات بعدی مورد بحث قرار می‌گیرد.

۴-۳ توصیف و تجسم داده در دیدگاه مشتری

این بخش اصول توصیف و تجسم داده ها را از مجموعه نمونه های فرآیند در دیدگاه مشتری ارائه می‌دهد. داده های مورد استفاده بر اساس نمایش یا نمایش مقطعی است. به این معنی است که ما بر داده های ایجاد شده توسط اجرای تعدادی از نمونه‌ فرایندهای کسب و کار تمرکز می‌کنیم. در مقالات بعدی بحث نمایه گرافیکی معمولی و بخشی همچنین، گرافیک تعاملی و پویا را در مورد بحث قرار می‌دهیم.

۴-۴ تکنیک‌های تجسم پایه

در این بخش، ما برخی از تکنیک های تجسم پایه را ارائه می کنیم. ما همچنین در مورد ساختار و شرح داده‌ها توضیح خواهیم داد. در مقالات بعدی برای جزئیات بیشتر در مورد تجسم داده‌ها، تمام قطعات را با استفاده از نرم افزار آماری R تولید می‌کنیم.

۴-۵ گزارش گیری (Reporting)

در این بخش، ما سه عنصر مختلف گزارش را مورد بحث قرار می دهیم. اولین نگرانی در مورد کیفیت داده ها با تاکید اصلی بر تجسم ساختار مقادیر گم شده و خلاصه ها برای ابعاد مختلف کیفیت است. دومین جنبه، گزارش گیری سطح بالا را در نظر می‌گیرد و در نهایت ما در مورد گزارش بخش‌های اطلاعاتی بحث می کنیم.

۵- داده کاوی برای داده‌های مقطعی (Cross-Sectional)

در این بخش روش‌هایی برای تجزیه و تحلیل داده‌های مقطعی،(داده‌هایی که در فرم ماتریس نشان داده شده‌اند، که در آن هر ردیف یک نمونه فرعی را نشان می‌دهد) پرداخته می‌شود. روش‌های تجزیه و تحلیل را می توان به روش‌های یادگیری نظارتی، همچنین به عنوان تجزیه و تحلیل پیش بینی و یادگیری بدون نظارت تقسیم بندی نمود. در تجزیه و تحلیل پیش بینی ، ما روش های تحلیلی را برای رگرسیون و طبقه بندی (Classification) شرح می‌دهیم، و در مورد یادگیری بدون نظارت ما روش‌هایی برای تحلیل خوشه (Clustring) ارائه می‌کنیم.

داده کاوی در هوش تجاری

۵-۱ مقدمه ای بر یادگیری با نظارت (Supervised Learning)

در این بخش، ما یک توضیح دقیق تر از موضوع یادگیری ماشین پیدا می‌کنیم. دانش ما برای یادگیری نظارت شده توسط داده ها در یک مقیاس مشاهده شده از نمونه های فرآیند ارائه شده است. در این قسمت به این موضوع بسنده می‌کنیم که یادگیری با نظارت به مجموعه اقداماتی گفته می شود که در راستای پیش بینی، دسته بندی، تشخیص هدف و … ، با توجه به معلومات موجود (نظارت شده) و داده های قابل بررسی (داده‌های آموزشی) عمل می‌کند. در مقالات بعدی به طور کامل به این مهم می‌پردازیم.

۵-۲ مقدمه ای بر یادگیری بدون نظارت (Unsupervised Learning)

اصطلاح یادگیری بدون نظارت اشاره به اهداف تحلیل بدون داده‌های آموزشی برای ارزیابی نتایج تجزیه و تحلیل دارد. در این بخش، ما بر مشکلات یادگیری بدون نظارت تمرکز می‌کنیم که هدف تقسیم بندی یا خوشه بندی داده ها است. آنها تحت عنوان تجزیه و تحلیل خوشه مورد بررسی قرار می‌گیرند. از رویکردهای متعدد به تجزیه و تحلیل خوشه ای، در این بخش از روش های سلسله مراتبی، روش های پارتیشن بندی و خوشه بندی مبتنی بر مدل استفاده می‌شود. خوشه بندی برای داده های زمانی در مقالات بعدی مورد بررسی قرار می گیرد.

۶- داده کاوی برای داده های موقتی (Temporal Data)

در این بخش، ما تکنیک‌های تجزیه و تحلیل برای داده‌های موقت را ارائه می‌دهیم. اول از همه، ما در مورد ساختارهای داده های مختلف در معدن داده های موقت بحث می‌کنیم، اهداف تحلیلی مختلف و مدل ها را معرفی می‌کنیم، و در نهایت به بررسی روش‌های تحلیلی مربوطه می‌پردازیم. در ادامه تجزیه و تحلیل ویژگی انحراف زمان و پاسخ را برای خوشه بندی و طبقه بندی، بررسی می‌شود. مدل‌های رگرسیون و نقش آنها در پیش بینی دوره زمانی تا وقوع یک رویداد را مورد بحث قرار می‌دهیم. تجزیه و تحلیل زنجیره مارکوف را معرفی می کنیم. مقالات آینده در این بخش بسیار سنگین و کاربردی می‌باشد.

۷- تحلیل فرایند

در این بخش تکنیک های تجزیه و تحلیل برای فرایندهای کسب و کار ارائه می‌شود. این موارد شامل تجزیه و تحلیل فرایند، شبیه سازی، مدیریت فرآیند، پردازش و استخراج فرآیند است.

تکنیک های تجزیه و تحلیل فرایند برای پاسخ به سوالات مربوط به فرآیند و ارزیابی شاخص های کلیدی عملکرد مانند ” زمان بارگذاری پرونده‌ها ” مورد استفاده قرار می گیرند. به طور خاص، تکنیک‌های تجزیه و تحلیل فرآیند می تواند برای ارزیابی سوالات تجزیه و تحلیل کمی و کیفی در مورد مدل های فرآیند و نمونه های فرآیند مورد استفاده قرار گیرد.

به طور کلی، پرسش‌های کیفی، ساختار، رفتار و کیفیت مدل‌های فرایند کسب و کار را از یک سو و جنبه های اجرایی کیفی نمونه‌های فرآیند را از سوی دیگر مورد بررسی قرار می‌دهیم. با توجه به سوالات کیفی، به شناسایی قطعات غیر ضروری یا مراحل با ارزش بالا مراجعه می‌کنند. علاوه بر این، تجزیه و تحلیل فرآیند کیفی شامل تایید فرایند است، یعنی فرموله کردن و بررسی صحیح مدل های فرایند و نمونه های پردازشی. توجه داشته باشید که ویژگی هایی که باید تأیید شوند، تا حدی به زبان مدل سازی فرآیند کسب و کار بستگی دارند.

۸- تجزیه و تحلیل چشم انداز کسب و کار چندگانه

این بخش سوالات تحلیلی را که در ارتباط بین دیدگاه‌های مختلف BI، یعنی مشتری، تولید و سازمان، مطرح می شود، مورد بحث قرار می‌دهد. به منظور پاسخ به این سؤال‌ها، تحلیل شبکه اجتماعی را به عنوان یک تکنیک جدید معرفی می‌کنیم، تکنیک‌های تجزیه و تحلیل‌های مختلفی را که در بخش‌های قبلی معرفی شده‌اند را به اهداف تحلیلی مورد بررسی تطبیق می‌دهیم و تکنیک‌های تجزیه و تحلیل ترکیبی ایجاد می‌کنیم.

ابتدا با توجه به دیدگاه‌های مختلف BI مشتری، تولید و سازمان را نمایش می دهیم. بخش‌های ۵-۷ تکنیک های تحلیلی را برای تجزیه و تحلیل مقطعی، زمانی و فرآیند معرفی نمودنند. این تکنیک ها عمدتا برای پاسخ به سوالات تحلیلی در مورد مشتری و دیدگاه تولید استفاده می شود. یک سوال ممکن در مورد مثال تجزیه و تحلیل در رابطه با دیدگاه مشتری، توسط تجزیه و تحلیل انجمن پاسخ داده شده باشد که به شرح زیر است:

کدام محصولات به همراه میخ خریداری شدند؟

یک سوال تحلیلی در مورد دیدگاه تولید ممکن است این باشد:

آیا بارگذاری ها پس از مهلت معین انجام شد؟

این سوال را می توان بر اساس روش های تجزیه و تحلیل فرآیند مانند فرایند کاوی و بررسی رعایت حصول اطمینان (راستی آزمایی) پاسخ داد. چشم انداز سازمانی و سوالات مرتبط تا کنون در این مقاله مورد توجه قرار نگرفته است. ما برخی از بینش ها را درباره چگونگی مدل سازی و اطلاعات سازمان در مقالات بعدی ارائه می‌کنیم.

روش های تحلیلی اختصاص یافته به دیدگاه سازمانی هنوز حل نشده است. یک مثال از سوالات تحلیلی که در رابطه با سازمان می توان پرسید:

کدام یک از نیروهای انسانی در یک فرآیند مدارک آموزش عالی مشابهی دارند؟

با استفاده از تجزیه و تحلیل شبکه اجتماعی (SNA) می توانیم سعی کنیم به این سوال پاسخ دهیم. ما مقدمه ای از SNA در مقالات بعدی ارائه خواهیم داد.

نتیجه گیری

نتیجه گیری و خلاصه کردن این مطالب به دریافت و نیازهای مخاطب بستگی دارد. یکی از راه های به دست آوردن عدالت بیشتر در نتیجه گیری، استفاده از معیارهای رسمی برای شناسایی مهم ترین یافته ها است. به طور خاص، ما از روش زیر برای به دست آوردن یک مرور کلی بر مطالب در بخش‌های مختلف استفاده می‌کنیم:

  • تعریف مطالب حاوی هشت بخش.
  • در بخش اول ما تعاریف هوش تجاری (BI) را ارائه دادیم و دورنمای BI را در طول زمان مشخص نمودیم.
  • در بخش دوم یک مرور کلی از رویکردهای رسمی مختلف به مدل سازی و ایده های مربوط به ساخت مدل و بخشهای آن به طور مختصر شرح داده شد.
  • در بخش سوم فرآیند تهیه داده‌ها، جمع آوری و استخراج داده‌ها و روش های تبدیل داده‌های تراکنش به فرمت‌های داده تحلیلی، بررسی شد. و در نهایت با روشهای تهیه داده آشنا شدیم.
  • در بخش چهارم اصول اساسی توصیف و تجسم داده ارائه شد و پس از معرفی مختصر، ما شرح و تجسم خواص ساختاری فرآیند کسب و کار را شرح دادیم.
  • در بخش پنجم وارد داده کاوی در هوش تجاری شدیم و روش‌هایی برای تجزیه و تحلیل داده‌های مقطعی، که خود به دو دسته اصلی با نظارت و بدون نظارت تقسیم می‌شد را شرح دادیم.
  • در بخش ششم، ما تکنیک‌های تجزیه و تحلیل برای داده‌های موقت را ارائه دادیم. اول از همه، ما در مورد ساختارهای داده های مختلف در معدن داده های موقت بحث نمودیم، اهداف تحلیلی مختلف و مدل ها را معرفی کردیم، و در نهایت به بررسی روش‌های تحلیلی مربوطه ‌پرداختیم.
  • در بخش هفتم تکنیک های تجزیه و تحلیل برای فرایندهای کسب و کار ارائه ‌شد. این موارد شامل تجزیه و تحلیل فرایند، شبیه سازی، مدیریت فرآیند، پردازش و استخراج فرآیند بود.
  • در انتها و در بخش هشتم تجزیه و تحلیل چشم انداز کسب و کار چندگانه را مطرح نمودیم که این بخش نمونه ای از سوالات تحلیلی را که در ارتباط بین دیدگاه‌های مختلف BI، یعنی مشتری، تولید و سازمان می‌باشد، مطرح نمود.

در نهایت با تشکر از توجه شما می دانید که مطالب بسیار فشرده و خلاصه و در حد آشنایی شما با مبحث هوش تجاری می باشد. اگر عمری بود از مقالات بعدی شروع به شرح کامل بخش به بخش موضوعات خواهیم نمود.