- مقدمه:
پیش بینی یک عنصر کلیدی در تصمیم گیری مدیریت است. کار آیی نهائی هر تصمیمیبستگی به طبیعت یک دنباله از حوادث دارد که متعاقب آن تصمیم میآید. توانایی برای حدس زدن جنبه های غیر قابل کنترل این حوادث قبل از تصمیم گیری باید به امکان انتخاب بهتری نسبت به موردی که این توانایی در دسترس نباشد بیانجامد. به این دلیل سیستمهای مدیریت برای طرح ریزی و کنترل عملیات یک سیستم نوعا از یک تابع پیش بینی برخوردارند. برای مثال در علم هیدرولوژی هر گونه طرح و برنامه ریزی که در حوضه های آبریز ومخازن مربوط به آن صورت میگیرد بایستی بر اساس تجزیه و تحلیل داده ها و شناخت الگویی برای سیستم و اطلاعات مربوط به خواص هیدرولوژیکی آن حوضه باشد به این داده های متغیرهای هیدرولوژیکی گفته میشود و شامل اطلاعاتی است که در تصمیم گیری نقش موثر وحیاتی دارد. ملاحظه میشود که پیش بینی حدس وتخمینی از رویدادهای آینده است..هدف پیش بینی کاهش ریسک در تصمیم گیری است. با تخصیص منابع بیشتری به پیش بینی قادر به اصلاح وتکمیل دقت پیش بینی میشویم.
یکی از روشهای تجزیه وتحلیل داده ها در هیدرولوژی روش استوکستیکی و استفاده از مدلهای استوکستیکی است. در این پروژه هدف نهایی تجزیه و تحلیل سری زمانی مربوط به دبی متوسط سالانه رودخانه ای برای مدت 50 سال و مدل سازی و پیش بینی برای 50 سال آینده خواهد بود.
2- تعاریف
1-2 سری زمانی
مشاهدات وآماری که بافاصله زمانی یکسان به دست آمده باشند سری زمانی نامیده میشوند. اگر پدیده ای معین باشد سری زمانی آن معین واگر احتمالی باشد سری زمانی آن احتمالی نامیده میشود.
چند الگوی مشخصات سریهای زمانی در شکل زیر نشان داده شده اند که در آن Xt مشاهده برای پریود t است
شکل 1- مشخصات سریهای زمانی
الف) فرآیند ثابت ب) روند خطی ج) تغییرات سیکلی د) ضربه ه) تابع پله ای
و) جهش
هر یک از حالات در شکل فوق توصیف کننده الگو و مثال خاصی میباشد در این پروژه بعلت سالانه بودن داده ها ما با حالتهای الف وب سرو کار خواهیم داشت که در قسمت مربوطه توضیح داده میشود.
2-2 مدلهای استوکستیکی
قبل از اینکه با در دست داشتن یک سری آماری بخوایم مدل استوکستیکی مناسب را انتخاب کنیم، میبایست خواص اولیه آماری داده ها را تعیین کرد. این خواص شامل میانگین، واریانس، انحراف استاندارد و ضریب چولگی میباشد. از دیگر خواص آماری در سریهای زمانی، تعیین و محاسبه اتوکواریانس (Auto covariance) است که درجه خود وابستگی سری زمانی را نشان میدهد. برای مثال جهت تعیین تاخیر k از سری زمانی از رابطه زیر استفاده مینماییم.
از خواص دیگر تابع همبستگی (Auto correlation function) است تابع همبستگی با تاخیر k را با نمایش داده و داریم
روش دیگر برای عنوان نمودن وابستگی زمانی از ساختار یک سری زمانی, تابع همبستگی جزئی (Partial Auto correlation function) است و با تاخیر k بصورت نمایش میدهند و نمودار و k را Partial correlogram مینامند.
با توجه به مطالب ذکر شده مدلهای ا ستوکستیکی عبارتند از
الف) مدل اتورگرسیو Auto regressive (AR)
این مدل از مدلهای متداول در استوکستیک است از خصوصیات این مدل وابسته بودن مقدار عددی یک متغیر به مقدار عددی متغیر در گذشته است. این مدل برای سریهای زمانی ایستا و نا ایستا بکار برده میشود فرم اصلی این مدل به صورت زیر است
ضرایب اتوگریسوی نامیده میشوند at مستقل از زمان بوده و noise نامیده میشود.
در مدل فوق در صورتیکه همگرا باشد فرآیند ایستا خواهد بود. معمولا در مدلسازی سری زمانی از مدل اتورگرسیو مرتبه اول یا دوم استفاده میشود (p=1,2)
ب) مدل میانگین متحرکت Moving Average (MA)
فرم عمومیمدل با مرتبه q بصورت زیر است.
ج) مدل(ARMA) Auto Regressive moving Avarage
از ترکیب کردن مدل اتورگرسیو با مرتبه p و مدل میانگین متحرک با رتبهq به مدلی خواهیم رسید که مدل ARMA با مرتبه (p,q) نامیده میشود فرم کلی مدل بصورت زیر است.
د) مدل ARIMA
این مدل حالت خاصی از مدل ARMA است و در سری زمانی هائیکه وابستگی زمانی زیاد است با گرفتن اختلاف بین مقادیر Xt آنرا به شکل منظم در آورده و به این صورت این اختلاف میتواند با مرتبه یک یا دو یا d باشد. فرم کلی این مدل بصورت زیر میباشد
.
3- انجام، تجزیه و تحلیل پروژه:
گام اول - رسم سری زمانی و تعیین مقادیر آماره های نمونه
اولین گام در تجزیه و تحلیل سریهای زمانی، رسم داده ها میباشد. با توجه به اطلاعات موجود نمودار سری زمانی دبیهای 50 ساله ترسیم شده است.
شکل 2- ترسیم سری زمانی
مقادیر آماره های توصیفی و هیستو گرام داده ها نیز در شکل زیر آورده شده است
شکل 3- آماره های توصیفی
گام دوم - بررسی وجود مولفه های روند (Trend) و دوره ای Periodic و حذف آنها
همانطور که در قسمت تعاریف آورده شده است در بررسی بعضی از سریهای زمانی دیده میشود که فرآیند در طول زمان در یک سطح ثابتی باقی میماند و به علت دلایل و عوامل تصادفی دارای تغییراتی از یک پریود به پریود دیگر است (شکل 1- الف) در حالت دیگری فرآیند دارای (Trend) است. به نحوی که تغییر از یک پریود به پریود بعدی قابل تخصیص به روند و تغییر تصادفی است. روند میتواند رو به بالا یا رو به پایین باشد. همچنین اگر سری داده ها در دوره کوتاه مدت نوسانات منظمیداشته باشد( شکل 1- ج)
این تغییرات را تغییرات فصلی یا دوره ای (Periodic) گویند. تغییرات فصلی به طور معمول در داده های هفتگی، ماهانه و فصلی بروز میکند. قبل از پردازش مدلهای مانا بر سری زمانی باید مولفه های روند و دوره ای بررسی شده و در صورت وجود حذف شود. در این پروژه چون سری سالانه است لذا سری دوره ای نمیباشد و با رسم سری دیده میشود که دارای روندی به صورت زیر است.
شکل 4- سری زمانی به همراه روند کاهشی
شکل 5- سری زمانی پس از حذف روند
که پس از حذف آن تبدیل به خط مستقیمیخواهد شد که در شکل5 نشان داده شده است.
گام سوم- بررسی نرمال بودن داده ها
با توجه به اینکه تئوری سریهای زمانی با توجه به نرمال بودن داده ها توسعه یافته است. لذا بایستی این مساله مورد نظر قرار گیرد و در صورت عدم فرض نرمال بودن داده ها بایستی داده ها را با تبدیل Y1=lnY1 تبدیل کرد.
در این پروژه با استفاده از نرم افزار Minitab و با استفاده از روش تست نیکوئی برازش (کلموگرف اسمیرنوف) نرمال بودن داده ها تست شد. در این روش مقدار D (حداکثر تفاوت داده ها از مقدار متناظر در توزیع نرمال) باید از مقدار c حد آستانه تعریف شده در روش فوق با توجه به جدول مربوطه کمتر باشد تا فرض نرمال بودن داده ها تایید شود. با توجه به شکل 6 مقدار D برابر با 0.09
بدست میآید و مقدار C در سطح اعتماد 95 درصد از جدول (1) برابر است با
لذا مقدار D از C کمتر بوده و فرض نرمال بودن داده ها تایید میشود
شکل 6- بررسی نرمال بودن داده ها
لازم به ذکر است که روش دیگری به نام ضریب چولگی نیز برای تست نرمال بودن داده ها وجود دارد که در این پروژه به روش تست نیکوئی برازش اکتفا میشود.
جدول 1- مقادیر c حد آستانه
سطح اعتماد
99 درصد 95 درصد 90 درصد تعداد داده ها
0.67 0.56 1.061 5
0.49 0.41 0.986 10
0.4 0.34 0.923 15
0.35 0.29 0.87 20
0.32 0.26 0.825 25
0.29 0.24 0.787 30
0.25 0.21 0.723 40
1.63/
1.36/
1.22/
C حد آستانه
گام چهارم- شناسایی مرتبه مدل با مشاهده منحنی سری زمانی:
صرفا با توجه به منحنی سری زمانه نمیتوان به طور دقیق مرتبه مدل را تعیین کرد با توجه به سالانه بودن سری و عدم وجود مولفه دوره ای در سری مدل های ARMA، AR از مرتبه 1 و 2 میتوانند برای پردازش بر داده ها مناسب باشند. یاد آوری میشود که مدل اتوگرسیو (AR) از ساده ترین مدلها بوده معمولا در مدل سازی سری زمانی از مدل اتورگریسو مرتبه اول و یا دوم استفاده میشود فرم عمومیاین مدلها بصورت زیر خواهد بود.
مرتبه اول AR(1)
مرتبه دوم AR(2)
گام پنجم- تولید سری زمانی یا میانگین صفر (استاندارد کردن داده ها)
همانطور که میدانیم یکی از روشهای تبدیل کردن داده ها به صورت استاندارد کسر میانگین از داده ها میباشد با توجه به معادله زیر مقدار میانگین داده ها محاسبه شده و از داده ها کسر میگردد.
در شکل زیر هیستوگرام داده های نرمال استاندارد بدست آمده است.
شکل 7- هیستوگرام داده های نرمال استاندارد
گام ششم – ترسیم Partial correlogram, corrleogram
اولین قدم در تحصیل سری زمانی رسیم کلو گرامهای خود همبستگی و خود همبستگی جزئی داده ها میباشد. تابع خود همبستگی جزئی در فرآیند تشخیص مفید است. تابع خود همبستگی جزئی به عنوان خود همبستگی ساده ما بین دو متغیر تصادفی در یک توزیع شرطی تعریف میشود.
با توجه به روش بازگشتی ساده با کس وجنکیس میتوان با محاسبه توابع خود همبستگی و خود همبستگی جزئی نمونه آنها را بر روی یک گراف نمایش داد و یک مدل آزمایشی از طریق مقایسه الگوهای مشاهده شده با الگوهای توابع خود همبستگی تئوریک مشخص کرد. این الگوهای تئوریک در جدول زیر نمایش داده شده اند.
جدول 2- خصوصیات نظری PACF,ACF فرآیندهای ایستا
PACF ACF فرآیند
بعد از تاخیر p قطع میشود به صورت یک تنزل نمائی یا موج سینوسی میرا به سمت صفر میل میکند AR(P)
به صورت یک تنزل نمائی با موج سینوسی میرا به سمت صفر میل میکند بعد از تاخیر q قطع میشود MA(q)
بعد از تاخیر p-q به سمت صفر میل میکند بعد از تاخیر p-q به سمت صفر میل میکند ARMA(p,q)
شکل 8- تابع خود همبستگی داده ها
شکل 9- تابع خود همبستگی جزئی داده ها
با توجه به اشکال بالا و جدول 2 در مرحله اول مدلهای MA(2),MA(1), AR(2),AR(1) و از ترکیب آنها مدلهای ARMA (2,2), ARNA (2,1), ARMA(1,2), ARMA(1,1), برای برازش بر داده ها انتخاب میشوند. بعد از محاسبه پارامترهای مدلها واریانس باقیمانده ها و ضریب آکائی نتایج حاصله در جدول زیر آورده شده است.
جدول 3- نتایج برازش مدلهای مختلف بر داده ها و مقادیر پارامترهای محاسبه شده برای مدلها
AIC واریانس مانده ها
747.936 35811.4 - - - 0.345 AR(1)
765.625 33967.5 - - -0.227 0.423 AR(2)
754.75 26896.1 - 0.39 - - MA(1)
762.423 26258.9 -0.97 0.398 - - MA(2)
761.334 - - 0.643 - -0.245 ARMA(1,1)
- - -0.98 -2.04 - 2.41 ARMA(1,2)
802.147 - - 0.601 -0.605 -0.23 ARMA(2,1)
821.5 - -0.186 -0.636 -0.282 1.004 ARMA(2,2)
گام هفتم- بررسی مدلهای انتخاب شده و انتخاب الگوی مناسب
پیدا کردن الگوهای مناسب برای سریهای زمانی کاری مهم است. جهت این کار استراتژی چند مرحله ای که برای ساختن یک الگو توسط باکس و جنکیس وضع شده است وجود دارد. در این روش سه مرحله عمده وجود دارد که از هر یک از آنها ممکن است چندین بار استفاده کرد.
1- تشخیص (یا شناسائی) الگو
2- برازش الگو
3- تشخیص درستی الگو
در تشخیص یا شناسائی الگو، دسته ای از الگوهای سریهای زمانی را که برای سری زمانی مشاهده شده مناسب است انتخاب میکنیم در این مرحله نمودار زمانی سری را مورد توجه قرار داده، و با محاسبه پارامترهای الگو استفاده از دانشمان در زمینه موضوع که داده ها از آنجا ناشی شده اند استفاده میکنیم تاکید میکنیم الگوئی که در این مرحله انتخاب میشود آزمایشی است و به تجدید نظری که بعدا در تجزیه و تحلیل میشود بستگی دارد در انتخاب الگو اصل امساک را در نظر میگیریم، یعنی الگوئی که به کار برده میشود باید کمترین تعداد پارامترها را داشته باشد بطور قطع الگو شامل یک یا چند پارامتر است که باید مقادیرشان از سری مشاهده شده بر آورد شود. برازش الگو پیدا کردن بهترین برآوردهای ممکن پارامترهای نامعلوم الگوی داده شده را شامل میشود. محکهائی مانند کمترین مربعات و ضریب آکائی را برای برآورد در نظر میگیریم. بررسی درستی الگو به تجزیه و تحلیل کیفیت الگوئی که ما تشخیص و برآورد کردیم مربوط میشود. در صورتی که عدم کفایتی پیدا نشود الگوی انتخابی مناسب است. در غیر اینصورت بایستی الگوی دیگری انتخاب شود.
تعریف ضریب آکائی
از این ضریب در مقایسه مدلهای مختلف میتوان استفاده کرد کم بودن مقدار این ضریب برای مدلی در مقایسه با سایر مدلها نشان از مناسب بودن آن میباشد.
ضریب آکائی از رابطه زیر محاسبه میشود.
AIC=-2ln(MLk)+2k
کد MLk مقدار بیشینه تابع احتمال که بصورت رابطه زیر تعریف میشود میباشد.
در مدلهای ARMA کمینه سازی AIC
معادل با کمیته سازی عبارت زیر است
و مقدار از رابطه زیر محاسبه میشود
با توجه به مدلهای انتخابی در گام ششم (مرحله اول) مقادیر پارامترها ضریب آکائی و واریانس باقیمانده های مدلها بوسیله نرم افزار ITSM محاسبه میشود. مطابق جدول (3)
با توجه به جدول (3) مدل ARMA (1,2) به دلیل داشتن پارامترهای بزرگتر از یک حذف میشود.
مدل ARMA (2,2) نیز به دلیل داشتن پارامتر بزرگتر از یک و همچنین تعداد پارامترهای بیشتر حذف میشود.
مدل ARMA(2,1) نیز بعلت داشتن تعداد پارامتر ها و ضریب آکائی بیشتر حذف میشود.
در مرحله دوم مقایسه مدلهای ARMA(1,1), MA(2), MA(1), AR(2),AR(1) باقی میمانند در این مرحله جهت مقایسه و انتخاب مدل مناسب توابع PACF, ACF مدلهای فوق که بر داده ها برازش شده اند رسم میشود در صورتیکه این دو تابع با PACF, ACF داده ها یکسان باشد مدل فوق مناسب خواهد بود لذا در اشکال زیر نمودار این توابع رسم میشوند.
شکل-10 تابع خود همبستگی مدل AR(1)0
شکل-11 تابع خود همبستگی جزئی مدل AR(1)0
شکل-12 تابع خود همبستگی مدل AR(2)0
شکل-13 تابع خود همبستگی جزئی مدل AR(2)0
شکل-14 تابع خود همبستگی مدل MA(1)0
شکل-15 تابع خود همبستگی جزئی مدل MA(1)0
شکل-16 تابع خود همبستگی مدل MA(2)
0
شکل-170 تابع خود همبستگی جزئی مدل MA(2)0
شکل-18 تابع خود همبستگی مدل ARMA(1,1)
0
شکل-19 تابع خود همبستگی جزئی مدل ARMA(1,1)0
با مقایسه اشکال دیده میشود که نمودار های PACF, ACF مدل AR(1) به نمودارهای PACF, ACF داده ها شبیه تر است و سایر اشکال با PACF, ACF داده ها متفاوت است. در نهایت با توجه به مناسب بودن الگو AR برای داده های 50 ساله بارش و کم بودن تعداد پارامترهای مدل AR(1) نسبت به سایر مدلها و همچنین ضریب آکائی کمتر نسبت به سایر مدلها و از همه مهمتر یکسان بودن توابع PACF, ACF این مدل با PACF, ACF داده ها مدل AR(1) انتخاب میشود. همچنین برای کنترل صحت انتخاب مدل بایستی آزمون نرمال بودن باقیمانده ها انجام شود زیرا در یک فرآیند مدلسازی باقیمانده ها باید مستقل و نرمال باشند. چنانچه در شکل دیده میشود مقدار D=0.12 از مقدار C=0.1923 کمتر بوده و نرمال بودن باقیمانده ها تایید میشود
شکل-20 آزمون نرمال بودن باقیمانده ها
گام هشتم پیش بین و تولید نمونه 50 ساله
بعد از انتخاب مدل AR(1) و با توجه به این مساله که نرم افزارهای مختلف مقادیر ثابتی را برای دبی در سالهای آینده پیش بینی میکنند، ابتدا تعداد 60 عدد تصادفی نرمال (NOISE) با میانگین صفر و واریانس یک تولید میکنیم سپس با توجه به فرمولهای زیر .
مقادیر دبی برای 60 سال آینده پیش بینی شده و سپس دو عدد اول را حذف میکنیم و 50 عدد بعد را به عنوان پیش بینی در نظر میگیریم در روابط بالا zt فرمول کلی مدل اتورگرسیو مرتبه اول at مقدار باقیمانده مدل wt مقادیر noise و انحراف معیار Noise و انحراف معیار داده ها میباشند همچنین مقدار ضریب همبستگی p1 و پارامتر مدل باهم برابر بوده و مساوی 0.345 میباشد. در نهایت داده های تولید شده برای مدل
فرمت این مقاله به صورت Word و با قابلیت ویرایش میباشد
تعداد صفحات این مقاله 30 صفحه
پس از پرداخت ، میتوانید مقاله را به صورت انلاین دانلود کنید
دانلود مقاله استفاده از مدلهای استوکستیک در پیش بینی جریان