اهمیت سوال در تحلیل داده و انواع سوالات ممکن

وقتی در مورد دیتا آنالیز صحبت میکنیم، در واقع داریم در مورد پاسخ دادن به یک سوال با استفاده از دیتا حرف میزنیم. تو دیتا آنالیز مهمترین چیز سوالیه که باید جواب داده بشه و تمام کارهای که ما میکنیم برای رسیدن به جواب این سواله. اگر قبل از بالا زدن آستینهامون سوال مشخصی نداشته باشیم ممکنه چیزهای باحالی تو داده‌هامون پیدا کنیم و هیجان‌زده شیم. اما به هیچ نقطه‌ی معلومی نمیرسیم و ارزش افزوده‌ای ایجاد نمیکنیم.

شباهت دیتا آنالیز بدون داشتن سوال مشخص مثل سفر کردن بدون مقصد مشخصه. وقتی بدون داشتن مقصد از پیش تعیین شده‌ای به جاده میزنیم ممکنه که جاهای هیجان انگیزی رو ببینیم و بهمون خوش بگذره. اما سر هر پیچ هیچ ایده‌ای نداریم که باید کدوم سمت بپیچیم. چیزی شبیه به این عکس:

data_science_question

سوالاتی که تو دیتاآنالیز وجود دارند انواع مختلفی دارند. به طور کلی این سوالات میتونند یکی از انواع زیر باشند:

۱. توصیفی (Descriptive) : 

در این نوع سوال، هدف ما این خواهد بود که یک دسته داده رو صرفا توصیف کنیم. بدون اینکه نتیجه‌گیری خاصی کنیم. معمولا این نوع تحلیل روی داده‌های سرشماری انجام میشه. مثلا ۲۰درصد جمعیت ایران سیگار میکشند. یا ۳۵ درصد بازدید کنندگان فلان وبلاگ مونث هستند. دقت کنید که توصیف با تفسیر متفاوته و ما میتونیم داده‌ای رو توصیف کنیم بدون اینکه تفسیرش کنیم. 

۲. اکتشافی (Exploratory): 

در این نوع تحلیل، هدف اینه که ارتباط جدید بین انواع داده‌ها پیدا کنیم. برای مثال میتونیم از بررسی داده‌هایی که در مورد زندگی آدم‌های مختلف داریم،‌به این نتیجه برسیم که کسی که سیگار میکشه نسبت به کسی که نمیکشه ۶۰ درصد شانس بیشتری برای ابتلا به آلزایمر داره. البته بهتره که از نتیجه‌ای که از این نوع تحلیل به دست میاریم به عنوان نتیچه‌گیری نهایی و قطعی استفاده نکنیم.

۳.استنباطی (Inferential): 

در این نوع تحلیل از یک فضای نمونه داده استفاده میکنیم تا بتونیم برای داده‌های بزرگتر نتیجه گیری و استدلال کنیم. در واقع تحلیل استنباطی همون دلیلیه که به خاطرش مدلهای آماری رو توصیف و رسم میکنیم. نتیجه‌ای که از این نوع تحلیل میگیریم به شدت به فضای‌ نمونه‌ای که انتخاب کردیم بستگی داره.

۴. پیشگویانه (Predictive): 

این نوع تحلیل برای این به کار میره که از داده‌هایی در مورد یه موضوع،‌ در مورد مقدارهایی راجع به یک موضوع دیگه نتیجه‌گیری کنیم. توجه کنیم که اگر X باعث پیشگویی Y شود، به این معنی نیست که X مسبب Y است. یکی از معروف‌ترین این نوع تحلیل،‌ تحلیل یک دانشمند داده معروف به اسم Nate Silver است که با استفاده از داده‌های وب، به طور دقیقی رای‌ آوردن اوباما در انتخابات رو پیشبینی کرد. اون این کار رو در ۲۰۰۸ و ۲۰۱۲ انجام داد و تو هر دو سال پیشبینی دقیقی کرد.

۵. سببی (Causal): 

این تحلیل برای این به کار میره که بفهمیم وقتی یک متغیر رو تغییر بدیم، برای یک متغیر دیگه چه اتفاقی میوفته. در این نوع تحلیل هر چی داده بیشتری داشته باشیم میتونیم تحلیل دقیقتری انجام بدیم. این تحلیل مخصوصا زمانی که قرار باشه به سوالی در مورد آینده پاسخ بدیم خیلی سخته.

۶. مکانیکی (Mechanistic): 

تحیل مکانیکی یکی از سخت‌ترین انواع تحلیله که خیلی هم کم انجام میشه. این تحلیل رو میشه اینجوری تعریف کرد: فهمیدن مقدار دقیق تغییر در یک متغیر که موجب تغییراتی در متغیر دیگر می‌شود. این نوع تحلیل در فیزیک و مهندسی کاربرد زیادی داره.

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

android application Google I/O HomeBrew ImageMagick Material Design mobile PogressBar RecyclerView splash TEDxKish ux آموزش اندروید الوین تافلر اندروید اپلیکیشن برنامه نویسی برنامه نویسی اندروید برنامه‌نویسی برنامه‌نویسی اندروید تداکس کیش تعمیر تغییر سایز عکس با ترمینال خلاصه کتاب دانش داده دانشگاه دانشگاه ایده‌آل دزد دیتا ساینس رشته مهندسی کامپیوتر ریکامندرسیستم سیستم‌های توصیه‌گر فری‌لنس لپتاپ متریال دیزاین معرفی کتاب موج سوم نوار پیشرفت همایش هوش مصنوعی ُجزیره کیش کار کسب و کار یادگیری عمیق یادگیری ماشین