کسب و کار هوشمند برای شناسایی، تجزیه و تحلیل، مدل سازی، ساختار و بهینه سازی فرآیندهای کسب و کار نیازمند به هوش تجاری Business Intelligence یا به اختصار BI می باشد. علاوه بر این، برای شناخت مقادیر زیاد داده های بدون ساختار جهت پوشش تصمیمات بسیار حساس و غیر حساس نیازمند دانش هوش تجاری میباشد.
اصطلاح “کسب و کارهای هوشمند” صرفا برای شرکت های تجاری، دولت های هوشمند، موسسات آموزشی هوشمند مدیریت شده و بیمارستان های کارآمد و …. استفاده نمیشود بلکه هر فعالیت تجاری پیچیده می تواند از BI استفاده کند.
BI به بحث کلیدی اکثر تحلیلگران فناوری اطلاعات تبدیل شده است و با توجه به روند رشد آن، انتظار میرود آینده ای روشن و پرانرژی داشته باشد. تقریبا تمام موسسات و سازمان های متوسط و بزرگ هم اکنون از نرم افزارهای BI استفاده می کنند و یا برنامه ای برای استفاده از آن در چند سال آینده دارند. با توجه به سرعت رشد BI نیاز به متخصصان BI وجود دارد. نیاز به کارشناسان در “یادگیری ماشین” و “تجزیه و تحلیل داده ها” مشهود است. از آنجایی که این رشته ها برای تبلیغات Big Data مهم هستند و به نظر می رسد که گوگل، فیس بوک و سایر شرکت ها تعداد زیادی از مشاغل خود را در این رشته ها متمرکز نمودهاند، دانش آموزان قطعا به یادگیری ماشین و تجزیه و تحلیل دادهها نیاز دارند. در نتیجه بسیاری از بخش های علوم رایانه، برنامه های درسی خود را با توجه به این زمینه ها تقویت کرده اند.
با این حال، یادگیری ماشین، تجزیه و تحلیل داده ها و داده کاوی تنها بخشی از فناوری BI میباشند. قبل از اینکه “ماشین” بتواند از داده ها یاد بگیرد، در واقع نیاز به جمع آوری داده ها دارد تا آنها را به صورت یکپارچه ارائه کند، فرایندی که اغلب به عنوان تهیه داده ها (Data Provisioning) نامیده می شود. این مهم به نوبه خود نیاز به استخراج داده ها از فرآیندهای کسب و کار مرتبط و احتمالا از منابع وب مانند شبکه های اجتماعی، با تمیز کردن(اصلاح)، تبدیل و ادغام دادهها و بارگیری آنها در یک انبار داده یا نوع دیگری از پایگاه داده دارد.
برای توانمندسازی کارآیی انسان با مراحل مختلف این فعالیتها، روشها و ابزارهای شبیه سازی داده ضروری هستند. علاوه بر این، BI نیز فراتر از داده های ساده است و هدف آن شناسایی، مدل سازی و بهینه سازی فرآیندهای کسب و کار میباشد. تمام این فعالیت های BI به طور کامل مورد بررسی قرار گرفته و هر یک از آنها در تعدادی از مونوگراف ها و کتاب های درسی آمده است. با این حال، چیزی که به شدت مورد نیاز است، یک کتاب است که همه را با هم مرتبط نموده و دیدگاه یکپارچه از جنبه های مختلف هوش تجاری را ارائه دهد.
ویلفرد گروسمن و استفانی ریندلرما کتابی را جهت پر کردن این شکاف ارائه نمودند که منبع اصلی ما برای این مقاله میباشد. این کتاب مقدمه ای مفید درباره جنبه های مهم مرتبط با BI است. با این حال، این کتاب نه تنها نقطه ورود به این حوزه است بلکه بخش های مختلف رشته های BI را عمیقا توسعه می دهد و روش ها و تکنیک های عمده را در جزئیات کافی پوشش میدهد تا خواننده را قادر سازد که آن را در زمینه کسب و کار در دنیای واقعی اعمال کند. این کتاب به طور خاص در چهار حوزه عمده مرتبط با BI تمرکز دارد: (1) مدل سازی داده ها و تهیه داده ها از جمله استخراج داده ها، ادغام و انبارداری داده (Warehousing)؛ (2) داده ها و مجازی سازی فرایندها؛ (3) یادگیری ماشین، داده کاوی، متن کاوی و تجزیه و تحلیل داده ها؛ و (4) تجزیه و تحلیل، استخراج و مدیریت فرایندها. این کتاب نه تنها جنبه های استاندارد BI را پوشش می دهد، بلکه موضوعاتی از ارتباطات اخیر مانند تجزیه و تحلیل شبکه های اجتماعی و موضوعاتی از منافع متداول مانند متن کاوی را نیز پوشش می دهد. نویسندگان در انتخاب و ترکیب همه موضوعات مرتبط با یک رویکرد مدرن به هوش کسب و کار و ارائه مفاهیم و روش های متفاوت در چارچوب یکپارچه به خوبی عمل نمودهاند. به نظر من، این اولین کتابی است که BI را در سطح گستره، منسجم ارائه میدهد.
مقدمه ای بر هوش تجاری
وظیفه اصلی هوش تجاری Business Intelligence پشتیبانی از تصمیم گیری برای فعالیت های تجاری بر اساس اطلاعات تجربی میباشد. اصطلاح کسب و کار به معنای وسیعتر درک می شود که شامل فعالیت هایی در برنامه ها و دامنه های مختلف برای مثال، یک شرکت، یک دانشگاه یا یک بیمارستان است. حمایت از تصمیم گیری در زمینه کسب و کار می تواند در سطوح مختلفی از پشتیبانی عملیاتی برای یک فعالیت تجاری خاص تا حمایت استراتژیک در سطح بالایی از سازمان مورد بررسی قرار بگیرد. در نتیجه، اصطلاح BI مجموعهای از مدلها و روشهای تحلیلی مانند گزارشدهی، انبارداری داده، استخراج دادهها، استخراج فرآیند، تجزیه و تحلیل، پیش بینی، سازمان کاوی، داده کاوی و متن کاوی را شرح میدهد.
ایده اصلی هوش تجاری Business Intelligence این است که تمام انواع فعالیت های تجاری به عنوان فرایند در زمان در نظر گرفته شود و تجزیه و تحلیل این فرایند می تواند بر دیدگاه های مختلف فرایند تأکید داشته باشد. سه دیدگاه متفاوت وجود دارد: (1) چشم انداز تولید، که مربوط به تامین کننده کسب و کار است؛ (2) چشم انداز مشتری، که مربوط به کاربران یا مصرف کنندگان کسب و کار ارائه شده است؛ و (3) دیدگاه سازمانی، که مسائلی مانند عملیات در چشم انداز تولید یا شبکه های اجتماعی را در دیدگاه مشتری در نظر میگیرد. عناصر اصلی BI، اطلاعات مربوط به کسب و کار هستند که به توصیف فرآیند و یا نمونه های فرآیند اشاره دارند. این داده ها ممکن است دیدگاه های مختلفی در فرآیند به واسطه ویژگی های ساختاری زیر داشته باشند: (1) نمایش رویداد، که مستندات دقیق از رویدادهای خاص را ثبت می کند؛ (2) دیدگاه دولتی، که در طول زمان نظارت، توسعه ویژگی های خاصی از پروسههای فرآیند را بررسی میکند. و (3) نمای مقطع عرضی، که خلاصهای از اطلاعات ویژگیهای مشخص برای نمونه پروندههای ثبت شده در یک دوره زمانی خاص را میدهد.
مسائلی که برای پشتیبانی از تصمیم مورد نیاز است اغلب مربوط به شاخص های کلیدی عملکرد (KPI) و درک چگونگی وابستگی آنها به عوامل تاثیرگذار خاص، به ویژه ویژگی های کسب و کار است. برای اهداف تحلیلی، لازم است که یک KPI را در تعدادی از اهداف تحلیلی اصلاح کنیم. این اهداف با روش های شناخته شده تجزیه و تحلیل مطابقت دارد و می تواند در زیر اهداف توصیفی کسب و کار، اهداف پیش بینی تجاری کسب و کار و اهداف درک کسب و کار با پشتیبانی از ذینفعان خلاصه شود. اهداف توصیفی کسب و کار معمولا با گزارش گیری، تقسیم بندی (یادگیری بدون نظارت) و شناسایی رفتاری مورد توجه قرار میگیرد. اهداف پیش بینی کسب و کار شامل برآورد و طبقه بندی نتایج میشود و به عنوان یادگیری تحت نظارت (Supervised) در زمینه یادگیری ماشین شناخته می شود. اهداف درک کسب و کار با پشتیبانی از ذینفعان در درک فرایندهای کسب و کار میباشد و با شناسایی فرایند و تجزیه و تحلیل فرآیند صورت گیرد.
بر اساس این چارچوب، ما یک فرمت متد برای فعالیت های هوش تجاری را به سمت ایده هایی از فرمت L برای فرایند کاوی و CRISP برای تجزیه و تحلیل کسب و کار آماده میکنیم. وظایف اصلی فرمت عبارتند از وظیفه درک کسب و کار و داده، وظیفه داده، وظیفه مدل سازی، وظیفه تجزیه و تحلیل، وظیفه ارزیابی و گزارش گیری. این وظایف ساختار بخشهای بعدی را تعریف میکند.
بخش دوم به مسائل مربوط به مدل سازی مربوط می شود. طیف گسترده ای از مدل ها در هوش تجاری مطابق با دیدگاه های مختلف کسب و کار، تعدادی از دیدگاه های احتمالی در مورد فرایندها و اهداف تحلیل چند بعدی میباشد. برای فهم اصطلاح مدل راههای ممکن، ساختارهای مدل اغلب استفاده شده در BI شرح داده میشوند، مانند ساختار منطقی جبری، ساختار گراف و ساختارهای احتمالی / آماری. هر ساختار از نظر دیدگاه، خواص اساسی و علامت گذاری آن و همچنین تکنیک های الگوریتمی برای حل سوالات در این ساختارها توصیف میشود. دانش تجربی در مورد این ساختارها در سطح مقدماتی در برنامه های کاربردی علوم رایانه ای قرار دارد. علاوه بر این، ملاحظات اساسی در مورد تولید داده ها، کیفیت داده ها و دست زدن به جنبه های زمانی ارائه شده است.
بخش سوم در فرآیند تهیه داده ها، از جمع آوری دادهها و استخراج آنها به توضیحات جامع مفاهیم و روش های تبدیل دادهها به فرمتهای دادههای تحلیلی لازم برای استفاده از داده ها به عنوان ورودی برای مدلها در تجزیه و تحلیل استفاده میکند. فرمتهای داده های تحلیلی نیز، دادههای زمانی را جهت استفاده در تجزیه و تحلیل فرآیند مورد استفاده قرار میدهند.
در بخش چهارم، ما روشهای پایهای برای توصیف دادهها و شبیه سازی دادهها را بررسی میکنیم که در کار کسب و کار و درک داده ها و همچنین در کار ارزیابی و گزارش گیری استفاده می شود. روش ها برای داده های پردازشگرا و دادههای مقطعی در نظر گرفته شده است. بر اساس این تکنیک های اساسی، ما جنبه های تجسم و گزارشگیری تعاملی و پویا را طراحی میکنیم.
بخشهای 5 تا 8، روش های تحلیلی مختلفی را که برای اهداف تحلیلی اصلی یادگیری نظارتی (پیش بینی و طبقه بندی)، یادگیری بدون نظارت (خوشه بندی) و همچنین شناسایی فرآیند و تجزیه و تحلیل فرآیند، توضیح میدهد. هر بخش به نحوی سازماندهی شده است که ابتدا یک دید کلی از اصطلاحات مورد استفاده و ملاحظات روش شناسی عمومی ارائه کند. پس از آن، تکنیکهای تحلیلی مورد بررسی قرار میگیرد.
بخش پنجم به تکنیکهای تجزیه و تحلیل برای داده های مقطعی، به طور عمده تکنیک های داده کاوی میپردازد و برای پیشبینی، روش های مختلف رگرسیون مورد بررسی قرار میگیرد. برای طبقه بندی، ما تکنیک های مبتنی بر اصول آماری، تکنیک های مبتنی بر درخت تصمیم و ماشین های بردار پشتیبان را در نظر می گیریم. برای یادگیری بدون نظارت، ما خوشه بندی سلسله مراتبی، روش های تقسیم بندی و خوشه بندی مبتنی بر مدل را در نظر میگیریم.
در بخش ششم تمرکز بر تکنیک های تجزیه و تحلیل داده ها با ساختار زمانی است. ما از مدلهای احتمالات به طور خاص، زنجیره مارکوف و تکنیک های مبتنی بر رگرسیون (تجزیه و تحلیل رویدادهای گذشته) شروع میکنیم و در ادامه، تکنیک های تجزیه و تحلیل را برای تشخیص رفتار در فرایندهایی مانند تجزیه و تحلیل ارتباطات، استخراج توالی و استخراج معادن داده مورد استفاده قرار میگیرد.
بخش ففتم روشهای شناسایی فرآیند، مدیریت فرایند، فرآیند استخراج و انطباق فرآیند را مورد بررسی قرار میدهد. در بخش هشتم، تکنیک های تجزیه و تحلیل های مختلف برای مشکلات توضیح داده شده است، که از دیدگاه های مختلف به یک فرایند کسب و کار میپردازد. مبانی تجزیه و تحلیل شبکه های اجتماعی، سازمان کاوی، تجزیه و تحلیل نقطه تصمیم گیری و متن کاوی ارائه میشود. تکنیک تجزیه و تحلیل این مسائل ترکیبی از تکنیک های فصلهای قبلی است.
1- معرفی هوش تجاری Business Intelligence
حال نوبت به آن رسیده تا با چکیده ای کوتاه به معرفی اجزای هوش تجاری بپردازیم و در مقاله های بعدی این اجزا را به صورت کامل شرح دهیم.
چکیده
در این قسمت، ما تعاریف هوش تجاری (BI) را ارائه می دهیم و دورنمای BI را در طول زمان مشخص می کنیم، مخصوصا در مورد سوالات فعلی BI. سناریوهای مختلف برنامه های کاربردی BI در نظر گرفته شده و دیدگاه های تجاری و دیدگاه هوش تجاری در فرآیند کسب و کار بررسی میشود. علاوه بر این، اهداف و وظایف BI از دیدگاه مدیریت و تجزیه و تحلیل مورد بحث قرار می گیرد و یک فرمت متد برای برنامه های کاربردی BI پیشنهاد می شود. این فرمت همچنین یک طرح کلی از مطالب را ارائه می دهد. در نهایت، نمونه هایی از دامنههای مختلف معرفی شده است که برای آشنایی بیشتر با مباحث استفاده میشود. قبل از معرفی اجزای BI یک تعریف کامل از هوش کسب و کار ارائه میگردد.
1-1 تعریف هوش کسب و کار
اگر فردی برای تعریف اصطلاح هوش تجاری Business Intelligence (BI) بخواهد تعریفی بیاورد، باید اولین مرجع در سال 1958 در مقاله ای از H.P. Luhn را مطالعه نماید. ابتدا از تعریف جدای اصطلاحات “هوش” و “کسب و کار” به صورت زیر شروع میکند:
هوش: توانایی درک ارتباط حقایق ارائه شده به گونه ای که جهت آن به سوی یک هدف مطلوب باشد
کسب و کار: مجموعه ای از فعالیت های انجام شده برای رسیدن به هر هدف والا، مانند علم، فناوری، تجارت، صنعت، قانون، دولت، دفاع، و غیره
در این مقاله هوش کسب و کار (هوش تجاری) را به عنوان” سیستم اتوماتیک که در حال توسعه برای انتشار اطلاعات به بخش های مختلف هر صنعت، سازمان علمی یا دولتی است”معرفی نموده و وظیفه اصلی سیستم لوون، ذخیره و نگهداری اتوماتیک اطلاعات و ارائه این اطلاعات به موارد مناسب به اصطلاح عمل (Action) است.
این تعریف برای 30 سال به اثبات نرسید تا در سال 1989 هوارد دیزنر (Howard Dresner) اصطلاح “هوش تجاری” (BI) را دوباره به کار گرفت. او از این اصطلاح به عنوان یک اصطلاح کلیدی برای مجموعه ای از مفاهیم و روش های بهبود تصمیمگیری در کسب و کار، با استفاده از سیستم های مبتنی بر حقایق معرفی کرد.
بسیاری از تعاریف مشابه در زمانهای مختلف ارائه شده است. Negash ، جنبه های مهم هوش تجاری را با بیان اینکه ” سیستم های اطلاعاتی کسب و کار اطلاعات عملیاتی ارائه شده در زمان مناسب، در محل مناسب و در فرم مناسب را برای کمک به تصمیمگیرندگان فراهم می کنند” تعریف نمود.
امروزه می توان تعاریف بسیار مختلفی پیدا کرد که نشان می دهد که در سطح بالا هدف هوش تجاری خیلی تغییر نکرده است. به عنوان مثال، در BI، “یک رویکرد کل یکپارچه، مبتنی بر فناوری اطلاعات برای پشتیبانی تصمیم گیری مدیریتی” تعریف شده است و ویکیپدیا “BI” را “مجموعه ای از نظریه ها، روش ها، فرآیندها، معماری ها و فن آوری هایی که تبدیل داده های خام را به اطلاعات معنی دار و مفید برای اهداف کسب و کار می رساند تعریف نموده است. طبق تعاریف مختلف، هوش تجاری را می توان با ویژگیهای زیر معرفی نمود:
- وظیفه BI: وظیفه اصلی هوش تجاری، ارائه پشتیبان تصمیمگیری برای اهداف خاص تعریف شده در زمینه فعالیت های تجاری در حوزه های مختلف آن، با توجه به چارچوب سازمانی و صنعتی است،
- پایه BI: پشتیبانی تصمیم گیری هوش تجاری عمدتا به اطلاعات تجربی بر اساس داده ها متکی است. علاوه بر این زمینه تجربی، BI همچنین از انواع مختلف دانش و نظریه ها برای تولید اطلاعات استفاده می کند.
- تحقق (پیاده سازی) BI: پشتیبان تصمیمگیری باید به عنوان یک سیستم با استفاده از قابلیت های واقعی در فناوری اطلاعات و ارتباطات (ICT) تحقق یابد.
- خروجی (تحویل) BI: سیستم هوش تجاری باید اطلاعات را در زمان مناسب به افراد مناسب در فرم مناسب ارسال کند.
با توجه به توسعه فناوری اطلاعات و در دسترس بودن داده ها، ما می توانیم دوره های مختلفی را در BI معرفی کنیم. در گذشته هوش تجاری عمدتا تحت عنوان سامانه پشتیبان تصمیم گیری (DSS) شناخته می شد. در بررسی انجام شده که از دهه 1960 تا آغاز قرن بیست و یکم را شامل می شود، توسعه تئوری سیستمها در علوم کامپیوتری، به سمت بهینه سازی و دامنه های کاربردی و همچنین توسعه سیستم ها مانند مدل DSS (مدل های برنامه ریزی یا شبیه سازی)، هدفمندی DSS (از پایگاه داده ها تا سیستم های OLAP)، DSS مبتنی بر ارتباطات (شبکه های همکاری)، DSS مبتنی بر سند (بازپخش و تجزیه و تحلیل اسناد) و DSS مبتنی بر دانش (سیستم های متخصص) در حرکت است.
بر اساس تعریف هوارد درسنر در سال 1989، اصطلاح BI در دهه 1990 مشهور شد و عمدتا به عنوان سیستم پشتیبان تصمیمگیری مبتنی بر داده ها به طور دقیق در ارتباط با توسعه انبار داده، استفاده از پردازش تحلیلی آنلاین (OLAP) و ابزار گزارش دهی شناخته شد. به موازات تحولات در زمینه مدیریت داده ها، دیگر ابزارهای تجزیه و تحلیل مانند داده کاوی یا تجزیه و تحلیل پیش بینی (predictive analytics) محبوب شدند. بعضی اوقات، اینها تحت عنوان تجزیه و تحلیل کسب و کار خلاصه شده بودند، و این تصور می شد که هوش تجاری یک مجموعه ناهمگونی از ابزارهای پشتیبانی از وظایف مختلف در یک کسب و کار است. از این رو، لازم بود که خطوط مختلف توسعه را تقویت کنیم و دوباره به چشم انداز سیستم پشتیبان تصمیم گیری تمرکز کنیم.
یک رویکرد تأثیرگذار قرار دادن انبار داده در مرکز توجه روش Kimball است. این روش یک چرخه عمر برای راه حل های انبار داده ها را با مدل سازی بر اساس ابعاد (dimensional modeling) به عنوان عنصر اصلی تعریف می کند. طراحی معماریهای فنی مناسب موجب تحقق یک انبار داده میشود. برنامههای کاربردی مانند ابزارهای گزارشگیری و مدلهای تحلیلی تصمیمگیرندگان با اطلاعات مناسب فراهم میشود.
مدل چرخه عمر نرم افزار به عنوان چارچوبی برای ادغام جنبه های مختلف هوش تجاری استفاده شده است. رویکردهای دیگر مانند CRISP از فرایند تجزیه و تحلیل در کشف دانش از پایگاه داده ها آغاز می شود. علاوه بر این ایده های مفهومی، می توان به طور مکرر تعاریف عملی را پیدا کرد. می توان نتیجه گرفت که BI باید به پرس و جو، گزارش دهی، OLAP، ابزار هشدار و تجزیه و تحلیل کسب و کار تقسیم شود.
در این تعریف؛ تجزیه و تحلیل کسب و کار یک زیر مجموعه از هوش تجاری بر اساس آمار، پیش بینی و بهینه سازی است. در این مقاله، ما این ایده را دنبال خواهیم کرد و BI را با منطق کامل درک خواهیم کرد.
در سال های گذشته، قابلیت دسترسی به داده ها و قابلیتهای آنالیز داده بسیار افزایش یافته است و زمینه های تحقیقاتی جدیدی برای هوش تجاری بوجود آمده است. تعدادی از موضوعات تحت عنوان Business Intelligence 2.0 ذکر شده است. با نگاهی به این مباحث از منظر چهار ویژگی اصلی BI که در قسمت قبل ذکر شد، می توانید این چالش های جدید را مشاهده کنید.
1-2 چالش های واقعی هوش تجاری Business Intelligence
- وظایف BI: امروزه ما می توانیم درک خوبی از منطق کسب و کار تقریبا در تمام زمینه ها پیدا کنیم. این درک جدید نیز منجر به یک دیدگاه مفهومی فرآیند گرا شده است که ملاحظات گردش کار و استخراج معادلات را در BI ادغام می کند. یکی دیگر از جنبهها این است که ساختارهای سازمانی جدید مانند سازمانهای غیرمتمرکز میخواهند در حوزه محیط خود از پشتیبان تصمیم بگیرند، و از این رو، ایده هایی از هوش جمعی یا منابع جمع آوری شده در BI استفاده میشود.
- مبانی BI: علاوه بر انبار داده های سنتی، ما همچنین باید داده ها را بر روی وب حساب کنیم. چنین اطلاعاتی اغلب به خوبی ساختار یافته نیست، بلکه فقط به صورت نیمه ساختاری مانند داده های متنی است. نیاز به ادغام داده های مختلف مفید برای پشتیبان تصمیم گیری به صورت یکپارچه منجر به نیاز برای مدل هایی جهت اتصال داده ها در هوش تجاری است. در ارتباط با چنین دادههای جدیدی، دامنه روش های تحلیلی گسترش یافته و ابزارهای جدیدی همچون بینایی ماشین، متن کاوی، تحلیل نظرات یا تجزیه و تحلیل شبکه های اجتماعی مطرح شده است.
- تحقق سیستم های BI: معماری های نرم افزاری امروز اجازه می دهد تا سیستم ها BIجدید را جذاب تر کنند. از منظر کاربر، نرم افزار به عنوان یک سرویس (SaaS) توسعه جالب برای سیستم های هوش تجاری را ایجاد میکند. از نقطه نظر محاسباتی، ما امروزه باید با مجموعه داده های بزرگ و پیچیده برخورد کنیم. علاوه بر این، محاسبات ابری و محاسبات توزیع شده مفاهیم مهم هستند که فرصت های جدیدی برای برنامه های کاربردی BI ایجاد میکنند.
- تحویل BI: دستگاه های تلفن همراه ابعاد جدیدی را برای ارائه اطلاعات به کاربران در زمان واقعی ارائه می دهند. با این حال، این تحولات باید توجه داشته باشند که کیفیت اطلاعات در زمان واقعی یک چالش جدید برای هوش تجاری است.
بدیهی است، بسیاری از پیشرفت های ذکر شده در این زمینه بیش از یک جنبه از ویژگی های BI ذکر شده را پوشش می دهند، اما این طبقه بندی باید از درک این مطلب که تعریف اساسی و خصوصیات هوش تجاری هنوز معتبر هستند، پشتیبانی کند.
با توجه به اهمیت BI برای برنامه های کاربردی تجاری، یک بازار بزرگ وجود دارد و بسیاری از شرکت ها راهکارهای BI را ارائه می دهند. این فروشندگان بسیاری از اصطلاحات و لغات را ایجاد میکنند و فرمت های یکپارچه را برای برنامه های کاربردی هوش تجاری پیشنهاد می دهند، اما تعاریف دقیق و عمومی از اصطلاحات اغلب در متن BI وجود ندارد.
پس از این تعریف کامل از BI قصد داریم شرح مختصری از دیگر اجزای هوش تجاری بیان کنیم.
2- مدل سازی در هوش تجاری Business Intelligence
مدل ها نقش مهمی را در هوش تجاری برای دستیابی به اهداف تحلیلی بازی می کنند. بسته به منظر تجاری، دیدگاه فرآیند کسب و کار، اهداف تجزیه و تحلیل و داده های موجود، مدل سازی در هوش تجاری متفاوت است. این بخش اختصاص یافته به یک مرور کلی از رویکردهای رسمی مختلف به مدل سازی و ایده های مربوط به ساخت مدل و بخشهای آن به طور مختصر شرح داده می شود.
2-1 مدل ها و مدل سازی در هوش تجاری
همانطور که گفته شد در رشته های علمی، اصطلاحات مدل و مدل سازی بارها در زمینه هوش تجاری استفاده شده است و میتوان به وفور انواع مدل ها را پیدا کرد، به عنوان مثال، مدل های فرایند کسب و کار، مدل های سازمانی، مدل های رگرسیون، مدل های طبقه بندی، مدل های گرافیکی ، مدل داده ها یا مدل های نرم افزاری. نگاه دقیق تر به تعاریف این مدل ها نشان می دهد که این مفهوم مبهم است، اگرچه قصد کلی مشابه است. با توجه به طیف گسترده ای از مدل های BI، ما ابتدا مدل ها و مدل سازی ها را از دیدگاه نسبتا عمومی، بر اساس ایده هایی مورد بحث قرار می دهیم.
2-2 ساختارهای منطقی و جبری
در هوش تجاری، ساختارهای منطقی و جبری به طور عمده برای توصیف معانی حوزه ها استفاده می شود. آنها برای تعریف یک پایگاه دانش، یک سیستم سازمان دانش، یک طرح XML یا archetypes( یک اصطلاح رایج در فناوری اطلاعات پزشکی) مفید هستند و زمینه برای ارائه داده ها را در نظر می گیرند.
2-3 ساختارهای گراف
ساختارهای گراف در بسیاری از مدلهای BI نقش مهمی ایفا میکنند و برای مدل سازی روابط در فرآیند کسب و کار مفید هستند. معناشناسی ساختارهای گراف، تعدادی از ساختارها را برای تحلیل خاص چنین روابطی ارائه می دهد. در مقالات بعدی ساختار مدل های گراف را با روش های مختلف مدل سازی توصیف خواهیم کرد.
2-4 ساختار تحلیلی
ساختار تحلیلی مهمترین ساختار مدل برای BI در مقایسه با داده ها در دیدگاه مقطعی است. مدل سازی ترکیبی از مفاهیم (ارزش های واقعی) توابع، احتمال و آمار است. بر این اساس، در مقالات بعدی ما ابتدا اصول اولیه این سه ساختار را ارائه می کنیم و سپس نشان می دهیم که چگونه در مدل سازی ترکیب می شوند. ما فرض می کنیم که خواننده با ریاضیات، احتمال و آمار در سطح مقدماتی برای علوم کاربردی کامپیوتر و یا مدیریت کسب و کار آشنا است.
کتاب های درسی متعددی این موضوعات را پوشش می دهند. بگذارید تنها به عنوان یک مقدمه کلاسیک در احتمال و آمار با استفاده از تنها ریاضی پایه شرح داده شود.. Mendenhall و همکاران. به عنوان یک کتاب درسی سنتی در مورد احتمال و آمار، برای رویکرد بیشتر به آمار محاسباتی پیشنهاد می شود.
2-5 داده و مدلها
علاوه بر فراهم نمودن دادهها، تولید دادهها و کیفیت دادهها در BI نقش مهمی ایفا می کند. در این بخش، ما جنبه های مهم تولید داده، جنبه های زمانی دادهها و کیفیت دادهها را مورد بحث قرار می دهیم.
3- تهیه دادهها
در این بخش فرآیند تهیه دادهها، جمع آوری و استخراج دادهها به توضیحات جامع مفاهیم و روش های تبدیل دادههای تراکنش به فرمتهای داده تحلیلی، بررسی میشود. با اصطلاح تراکنش داده ها، ما داده ها را با یک ساختار زمانی مشخص در نظر میگیریم که بعدا در تجزیه و تحلیل فرآیند مورد استفاده قرار خواهد گرفت. تمرکز بیشتر روی دادههای بزرگ (Big Data) و کیفیت داده قرار میگیرد.
3-1 مقدمه و اهداف
تهیه دادهها پیش نیاز پروژه هوش تجاری (BI) را فراهم میکند. واضح است که بدون هیچ گونه داده ای، هیچ تجزیه و تحلیل و پایگاه داده با کیفیت خوب وجود نخواهد داشت، در چنین شرایطی انتظار می رود کیفیت تجزیه و تحلیل نیز کم باشد.
3-2 جمع آوری و توصیف داده ها
اغلب تلاش برای جمع آوری دادهها، از جمله شناسایی و انتخاب منابع داده مربوطه برای پروژه BI دست کم گرفته میشود. در بعضی از پروژه ها، منابع دادهها ممکن است به عنوان یک منبع برای تجزیه و تحلیل بعدی تبدیل شوند، حتی ممکن است، اهداف تحلیلی تا حدودی وابسته به منابع داده موجود باشند. واضح است که در مورد اهداف تحلیلی، جمع آوری داده ها در مورد نتیجه پروژه BI بیشتر امیدوار کننده باشد. در عمل، یک نتیجه واقع بینانه اغلب اتفاق می افتد، سازش بین اهداف تجزیه و تحلیل مورد نظر و داده های موجود.
3-3 استخراج اطلاعات
پس از انتخاب منابع مربوط به داده ها و توصیف آنها از جمله سوالات تجزیه و تحلیل و فرمت، گام بعدی، استخراج اطلاعات مربوطه از منابع آنها است. به طور معمول، استخراج داده ها بخشی از فرایند به “اصطلاح استخراج تبدیل بار” (ETL) است که در مقالات بعدی توضیح داده خواهد شد. ما همچنین در مورد چالش های مربوط به استخراج متن در دادههای بزرگ (Big Data) خواهیم پرداخت.
3-4 از داده های تراکنشی به سوی داده های تحلیلی
در این بخش نشان خواهیم داد چگونه دادهها را از منابع احتمالی ناهمگن برای اهداف تحلیلی بعدی استخراج کنیم. همانطور که تجزیه و تحلیل هر بخش از داده های استخراج شده به صورت جداگانه سازگار نیست، داده های استخراج شده باید تمیز و یکپارچه شوند(Data Cleaning). با این حال، قبل از اینکه یکپارچه سازی داده ها انجام شود، ما باید تصمیم بگیریم که کدام یک از داده ها باید یکپارچه شوند (فرمت ادغام). در برخی موارد، فرمت ادغام همان فرمت پیش فرض است که تجزیه و تحلیل های بعدی با آن کار خواهند کرد. در سایر شرایط، فرمت های تحلیلی اضافی که بر اساس فرمت ادغام هستند، ضروری میباشند. تجزیه و تحلیل های مختلف انجام خواهد شد که نیاز به فرمت های مختلف تجزیه و تحلیل دارد. به عبارت دیگر، انتخاب فرمت تحلیلی بستگی به سؤالات تحلیلگر و شاخصهای کلیدی عملکرد (KPIs) دارد. انتخاب فرمت ادغام بستگی به نتایج مرحله استخراج اطلاعات از جمله ملاحظات در فرمت تحلیلی بعدی دارد. در نهایت، هر دو انتخاب باید با در نظر گرفتن مسائل کیفیت داده ادغام شوند.
3-5 یکپارچگی داده و الگو
پس از انتخاب فرمت یکپارچه سازی مناسب، منابع دادههای احتمالا ناهمگن در این فرمت هدف باید یکپارچه شوند. از این رو، علاوه بر نقشه ها، اضافات و تحولات بین فرمت های مختلف ما باید با چالش های ادغام اگو و ادغام دادهها روبرو شویم.
4- توصیف و تجسم داده
این بخش اصول اساسی توصیف و تجسم داده را ارائه می دهد. پس از معرفی مختصر، ما شرح و تجسم خواص ساختاری فرآیند کسب و کار را در نظر می گیریم. توصیف و تجسم داده برای جمع آوری نمونه های فرایند که بعدها اهداف گرافیکی تعاملی و پویا را مشخص می کند مورد استفاده قرار میگیرد. در مقالات بعدی به معرفی تکنیک های تجسمی که اغلب مورد استفاده قرار میگیرد، همراه با کاربردهای مورد استفاده میپردازیم. سرانجام برخی از جنبه های Infographics و گزارش را مورد بحث قرار میدهیم.
4-1 معرفی
توصیف و تجسم دادهها نقش مهمی در BI دارد و در همه فعالیت های BI استفاده می شود. در ابتدای هر پروژه BI، آنها یک بخش ضروری از تکنیک های کسب و کار و داده ها هستند و از درک فرآیند کسب و کار و ارزیابی داده ها پشتیبانی میکنند. در مرحله مدل سازی، آنها به عنوان تکنیکهای آماده سازی دادهها ارائه میشوند. در تجزیه و تحلیل، آنها نه تنها برای تجزیه و تحلیل ، بلکه برای ارائه نتایج نیز استفاده میشوند.
4-2 توصیف و تجسم فرایندهای کسب و کار
این بخش مقدمه ای برای طرح بندی و تجسم فرایندهای کسب و کار است که در طول مراحل چرخه عمر فرآیند، یعنی زمان طراحی و زمان اجرا، سازماندهی شده است. جزئیات تجسم خاص در زمینه تجزیه و تحلیل فرآیند و استخراج معادن داده در مقالات بعدی مورد بحث قرار میگیرد.
4-3 توصیف و تجسم داده در دیدگاه مشتری
این بخش اصول توصیف و تجسم داده ها را از مجموعه نمونه های فرآیند در دیدگاه مشتری ارائه میدهد. داده های مورد استفاده بر اساس نمایش یا نمایش مقطعی است. به این معنی است که ما بر داده های ایجاد شده توسط اجرای تعدادی از نمونه فرایندهای کسب و کار تمرکز میکنیم. در مقالات بعدی بحث نمایه گرافیکی معمولی و بخشی همچنین، گرافیک تعاملی و پویا را در مورد بحث قرار میدهیم.
4-4 تکنیکهای تجسم پایه
در این بخش، ما برخی از تکنیک های تجسم پایه را ارائه می کنیم. ما همچنین در مورد ساختار و شرح دادهها توضیح خواهیم داد. در مقالات بعدی برای جزئیات بیشتر در مورد تجسم دادهها، تمام قطعات را با استفاده از نرم افزار آماری R تولید میکنیم.
4-5 گزارش گیری (Reporting)
در این بخش، ما سه عنصر مختلف گزارش را مورد بحث قرار می دهیم. اولین نگرانی در مورد کیفیت داده ها با تاکید اصلی بر تجسم ساختار مقادیر گم شده و خلاصه ها برای ابعاد مختلف کیفیت است. دومین جنبه، گزارش گیری سطح بالا را در نظر میگیرد و در نهایت ما در مورد گزارش بخشهای اطلاعاتی بحث می کنیم.
5- داده کاوی برای دادههای مقطعی (Cross-Sectional)
در این بخش روشهایی برای تجزیه و تحلیل دادههای مقطعی،(دادههایی که در فرم ماتریس نشان داده شدهاند، که در آن هر ردیف یک نمونه فرعی را نشان میدهد) پرداخته میشود. روشهای تجزیه و تحلیل را می توان به روشهای یادگیری نظارتی، همچنین به عنوان تجزیه و تحلیل پیش بینی و یادگیری بدون نظارت تقسیم بندی نمود. در تجزیه و تحلیل پیش بینی ، ما روش های تحلیلی را برای رگرسیون و طبقه بندی (Classification) شرح میدهیم، و در مورد یادگیری بدون نظارت ما روشهایی برای تحلیل خوشه (Clustring) ارائه میکنیم.
5-1 مقدمه ای بر یادگیری با نظارت (Supervised Learning)
در این بخش، ما یک توضیح دقیق تر از موضوع یادگیری ماشین پیدا میکنیم. دانش ما برای یادگیری نظارت شده توسط داده ها در یک مقیاس مشاهده شده از نمونه های فرآیند ارائه شده است. در این قسمت به این موضوع بسنده میکنیم که یادگیری با نظارت به مجموعه اقداماتی گفته می شود که در راستای پیش بینی، دسته بندی، تشخیص هدف و … ، با توجه به معلومات موجود (نظارت شده) و داده های قابل بررسی (دادههای آموزشی) عمل میکند. در مقالات بعدی به طور کامل به این مهم میپردازیم.
5-2 مقدمه ای بر یادگیری بدون نظارت (Unsupervised Learning)
اصطلاح یادگیری بدون نظارت اشاره به اهداف تحلیل بدون دادههای آموزشی برای ارزیابی نتایج تجزیه و تحلیل دارد. در این بخش، ما بر مشکلات یادگیری بدون نظارت تمرکز میکنیم که هدف تقسیم بندی یا خوشه بندی داده ها است. آنها تحت عنوان تجزیه و تحلیل خوشه مورد بررسی قرار میگیرند. از رویکردهای متعدد به تجزیه و تحلیل خوشه ای، در این بخش از روش های سلسله مراتبی، روش های پارتیشن بندی و خوشه بندی مبتنی بر مدل استفاده میشود. خوشه بندی برای داده های زمانی در مقالات بعدی مورد بررسی قرار می گیرد.
6- داده کاوی برای داده های موقتی (Temporal Data)
در این بخش، ما تکنیکهای تجزیه و تحلیل برای دادههای موقت را ارائه میدهیم. اول از همه، ما در مورد ساختارهای داده های مختلف در معدن داده های موقت بحث میکنیم، اهداف تحلیلی مختلف و مدل ها را معرفی میکنیم، و در نهایت به بررسی روشهای تحلیلی مربوطه میپردازیم. در ادامه تجزیه و تحلیل ویژگی انحراف زمان و پاسخ را برای خوشه بندی و طبقه بندی، بررسی میشود. مدلهای رگرسیون و نقش آنها در پیش بینی دوره زمانی تا وقوع یک رویداد را مورد بحث قرار میدهیم. تجزیه و تحلیل زنجیره مارکوف را معرفی می کنیم. مقالات آینده در این بخش بسیار سنگین و کاربردی میباشد.
7- تحلیل فرایند
در این بخش تکنیک های تجزیه و تحلیل برای فرایندهای کسب و کار ارائه میشود. این موارد شامل تجزیه و تحلیل فرایند، شبیه سازی، مدیریت فرآیند، پردازش و استخراج فرآیند است.
تکنیک های تجزیه و تحلیل فرایند برای پاسخ به سوالات مربوط به فرآیند و ارزیابی شاخص های کلیدی عملکرد مانند ” زمان بارگذاری پروندهها ” مورد استفاده قرار می گیرند. به طور خاص، تکنیکهای تجزیه و تحلیل فرآیند می تواند برای ارزیابی سوالات تجزیه و تحلیل کمی و کیفی در مورد مدل های فرآیند و نمونه های فرآیند مورد استفاده قرار گیرد.
به طور کلی، پرسشهای کیفی، ساختار، رفتار و کیفیت مدلهای فرایند کسب و کار را از یک سو و جنبه های اجرایی کیفی نمونههای فرآیند را از سوی دیگر مورد بررسی قرار میدهیم. با توجه به سوالات کیفی، به شناسایی قطعات غیر ضروری یا مراحل با ارزش بالا مراجعه میکنند. علاوه بر این، تجزیه و تحلیل فرآیند کیفی شامل تایید فرایند است، یعنی فرموله کردن و بررسی صحیح مدل های فرایند و نمونه های پردازشی. توجه داشته باشید که ویژگی هایی که باید تأیید شوند، تا حدی به زبان مدل سازی فرآیند کسب و کار بستگی دارند.
8- تجزیه و تحلیل چشم انداز کسب و کار چندگانه
این بخش سوالات تحلیلی را که در ارتباط بین دیدگاههای مختلف BI، یعنی مشتری، تولید و سازمان، مطرح می شود، مورد بحث قرار میدهد. به منظور پاسخ به این سؤالها، تحلیل شبکه اجتماعی را به عنوان یک تکنیک جدید معرفی میکنیم، تکنیکهای تجزیه و تحلیلهای مختلفی را که در بخشهای قبلی معرفی شدهاند را به اهداف تحلیلی مورد بررسی تطبیق میدهیم و تکنیکهای تجزیه و تحلیل ترکیبی ایجاد میکنیم.
ابتدا با توجه به دیدگاههای مختلف BI مشتری، تولید و سازمان را نمایش می دهیم. بخشهای 5-7 تکنیک های تحلیلی را برای تجزیه و تحلیل مقطعی، زمانی و فرآیند معرفی نمودنند. این تکنیک ها عمدتا برای پاسخ به سوالات تحلیلی در مورد مشتری و دیدگاه تولید استفاده می شود. یک سوال ممکن در مورد مثال تجزیه و تحلیل در رابطه با دیدگاه مشتری، توسط تجزیه و تحلیل انجمن پاسخ داده شده باشد که به شرح زیر است:
کدام محصولات به همراه میخ خریداری شدند؟
یک سوال تحلیلی در مورد دیدگاه تولید ممکن است این باشد:
آیا بارگذاری ها پس از مهلت معین انجام شد؟
این سوال را می توان بر اساس روش های تجزیه و تحلیل فرآیند مانند فرایند کاوی و بررسی رعایت حصول اطمینان (راستی آزمایی) پاسخ داد. چشم انداز سازمانی و سوالات مرتبط تا کنون در این مقاله مورد توجه قرار نگرفته است. ما برخی از بینش ها را درباره چگونگی مدل سازی و اطلاعات سازمان در مقالات بعدی ارائه میکنیم.
روش های تحلیلی اختصاص یافته به دیدگاه سازمانی هنوز حل نشده است. یک مثال از سوالات تحلیلی که در رابطه با سازمان می توان پرسید:
کدام یک از نیروهای انسانی در یک فرآیند مدارک آموزش عالی مشابهی دارند؟
با استفاده از تجزیه و تحلیل شبکه اجتماعی (SNA) می توانیم سعی کنیم به این سوال پاسخ دهیم. ما مقدمه ای از SNA در مقالات بعدی ارائه خواهیم داد.
نتیجه گیری
نتیجه گیری و خلاصه کردن این مطالب به دریافت و نیازهای مخاطب بستگی دارد. یکی از راه های به دست آوردن عدالت بیشتر در نتیجه گیری، استفاده از معیارهای رسمی برای شناسایی مهم ترین یافته ها است. به طور خاص، ما از روش زیر برای به دست آوردن یک مرور کلی بر مطالب در بخشهای مختلف استفاده میکنیم:
- تعريف مطالب حاوي هشت بخش.
- در بخش اول ما تعاریف هوش تجاری (BI) را ارائه دادیم و دورنمای BI را در طول زمان مشخص نمودیم.
- در بخش دوم یک مرور کلی از رویکردهای رسمی مختلف به مدل سازی و ایده های مربوط به ساخت مدل و بخشهای آن به طور مختصر شرح داده شد.
- در بخش سوم فرآیند تهیه دادهها، جمع آوری و استخراج دادهها و روش های تبدیل دادههای تراکنش به فرمتهای داده تحلیلی، بررسی شد. و در نهایت با روشهای تهیه داده آشنا شدیم.
- در بخش چهارم اصول اساسی توصیف و تجسم داده ارائه شد و پس از معرفی مختصر، ما شرح و تجسم خواص ساختاری فرآیند کسب و کار را شرح دادیم.
- در بخش پنجم وارد داده کاوی در هوش تجاری شدیم و روشهایی برای تجزیه و تحلیل دادههای مقطعی، که خود به دو دسته اصلی با نظارت و بدون نظارت تقسیم میشد را شرح دادیم.
- در بخش ششم، ما تکنیکهای تجزیه و تحلیل برای دادههای موقت را ارائه دادیم. اول از همه، ما در مورد ساختارهای داده های مختلف در معدن داده های موقت بحث نمودیم، اهداف تحلیلی مختلف و مدل ها را معرفی کردیم، و در نهایت به بررسی روشهای تحلیلی مربوطه پرداختیم.
- در بخش هفتم تکنیک های تجزیه و تحلیل برای فرایندهای کسب و کار ارائه شد. این موارد شامل تجزیه و تحلیل فرایند، شبیه سازی، مدیریت فرآیند، پردازش و استخراج فرآیند بود.
- در انتها و در بخش هشتم تجزیه و تحلیل چشم انداز کسب و کار چندگانه را مطرح نمودیم که این بخش نمونه ای از سوالات تحلیلی را که در ارتباط بین دیدگاههای مختلف BI، یعنی مشتری، تولید و سازمان میباشد، مطرح نمود.
در نهایت با تشکر از توجه شما می دانید که مطالب بسیار فشرده و خلاصه و در حد آشنایی شما با مبحث هوش تجاری می باشد. اگر عمری بود از مقالات بعدی شروع به شرح کامل بخش به بخش موضوعات خواهیم نمود.