وبلاگ آمار و بیومتری

وارسی اعتبار مدل در تحلیل رگرسیون (Cross Validation)

پس از ساخت مدل و بررسی دقت و صحت آن نوبت به بررسی این مطلب می رسد که آیا این مدل قابلیت تعمیم به کل جمعیت را دارد یا خیر؟

برای کنترل این موضوع به طور معمول یک مجموعه داده مستقل از داده های بکار رفته در ساخت مدل انتخاب و برای آزمون استفاده می شود. درصورتی که امکان برداشت داده های مذکور وجود نداشته باشد، بخشی از داده ها (معمولا 30 درصد) کنار گذاشته شده و ساخت مدل (Training) با 70 درصد داده ها انجام می شود. آزمون مدل و وارسی اعتبار آن (Validating) هم با 30 درصد کنار گذاشته شده انجام می شود.

برای چنین بررسی هم می توان انطباق اسکاترگرام رابطه متغیرهای مستقل و وابسته را برای دو مدل (ساخته شده و آزمون) بررسی نمود، هم مقادیر ضریب تعیین و پارامترهای مدل و هم می توان آزمون آماری انجام داد.

برای انجام آزمون ابتدا متغیر گروهبندی درست می شود که داده های ساخت مدل را با یک کد و داده های آزمون را با کد دیگر مشخص می کند. سپس از رویه General Linear Model استفاده شده و اثر اصلی این متغیر گروهبندی و اثر متقابل آن با متغیر مستقل در قسمت مدل تعریف می شوند. در خروجی نرم افزار بسته به مقدار P-value مشخص می شود که آیا مقدار ثابت و شیب خط دو مدل اختلاف معنی دار با یکدیگر دارند یا خیر.

البته راههای متعددی وجود دارند که مشخص می کنند مدل آموزش داده شده با مدل آزمون تا چه حد تطبیق دارند. مثلا می توان تحلیل همبستگی بین مقادیر پیشبینی شده توسط دو مدل انجام داد.

رفرنس:

امیری ا. کیانی ب. جعفری ع.ا. 1399. اندازهگیری و مدلسازی نمایه نسبت تاج برای گونه بنه ).Desf atlantica Pistacia )در جنگل حفاظت شده باغ شادی استان یزد. خشکبوم، (2)10: 77-66.

+ نوشته شده در جمعه بیست و دوم تیر ۱۳۹۷ ساعت 11:56 توسط بهمن کیانی |

وبلاگ آمار و بیومتری

مطالب آموزشی آمار و بیومتری

وارسی اعتبار مدل در تحلیل رگرسیون (Cross Validation)

نوشته‌های پیشین

آمارگیر وبلاگ

تبدیل تاریخ

>دیکشنری

موزیک پلیر