فرمت فایل : WORD (قابل ویرایش)
تعداد صفحات:112
پایاننامه کارشناسی ارشد شیمی (تجزیه)
عنوان : مدلسازی طول موج ماکزیمم جذب رنگهای آزو توسط الگوریتم مورچه و فعالیت داروئی مشتقات کاپساسین با استفاده از ماشین بردار پشتیبان
فهرست مطالب:
فصل اول
پیشگوئی maxλ مشتقات
رنگ های آزو با استفاده از الگوریتم مورچه
فصل دوم
پیشگوئی EC50 مشتقات کاپساسین توسط ماشین های بردار پشتیبان
بحث و نتیجه گیری
ABSTRACT
چکیده
مشتقات رنگ های آزو سنتزی تهیه می شوند که دارای گروه عاملی N=N می باشند و کاربرد اصلی آنها در صنایع غذائی و نساجی است. قسمت آروماتیکی تعیین کننده رنگ است.
در این کار از الگوریتم کلونی مورچه و مدل رگرسیون خطی جهت پیشگویی λmax یک سری30- تایی از مشتقات رنگ های آزو استفاده شده است. در ابتدا پس از بهینه سازی ساختار مولکولی توسط نرم افزار Hyper Chem، در مجموع 1521 توصیف کننده به وسیله نرم¬افزارهای Hyper Chem و Dragon محاسبه گردید. توصیف کننده ها به عنوان ورودی به برنامه الگوریتم مورچه داده شدند. به منظور به دست آوردن بهترین نتیجه با درصد خطای پایین و توصیف کننده های مناسب، برنامه الگوریتم مورچه را چند بار اجرا کرده و در اجراهای مختلف پارامترهای آن از جمله تعداد مورچه های اولیه، پارامتر تبخیر و تعداد دورها بهینه شدند. 5 توصیف کننده که بالاترین همبستگی را با λmax رنگ های آزو داشتند، توسط الگوریتم مورچه انتخاب شدند. از این توصیف کننده های انتخاب شده، برای ساختن مدل خطی مناسب جهت پیشگویی λmax ترکیبات مورد نظر استفاده شد. این روش نتایج خوبی را در هر دو سری آموزش (9346/0=2R) و پیشگویی (8419/0=2R) فراهم آورد. با توجه به موارد ذکر شده، معلوم گردید الگوریتم مورچه طراحی شده روشی مناسب جهت انتخاب توصیف کننده ها برای مدل سازی و پیشگوییλmax مشتقات رنگ های آزو می¬باشد.
کاپساسین ماده داروئی است که از فلفل قرمز استخراج می شود و مصارف داروئی ازجمله درمان انواع سرطان، آرتروز، رماتیسم مفصلی، زخم معده دارد.
با استفاده ازروش های آموزش آماری ماشین یک رابطه کمی ساختار- فعالیت برای کاپساسین برقرار شده است .99 مولکول کاپساسین مطابق روش قسمت اول رسم شد و 1206 توصیف کننده محاسبه گردید.
برای کاهش تعداد توصیف کننده ها ابتدا از روش های PCA، ICA و Fuzzy Clustering استفاده کردیم که صحت از حدود 62-61% بالاتر نرفت. در رهیافت دیگری از تئوری اطلاعات و معیار" بیشترین ارتباط، کمترین تقلیل پذیری" استفاده شد و پس از بهینه سازی توصیف کننده ها 100 توصیف کننده انتخاب شد. در مرحله بعد مجموع توصیف کننده ها با استفاده از الگوریتم Wrapper بهینه سازی شد که مجموعا 13 توصیف کننده انتخاب شد و صحت برای طبقه بندی به پنج دسته فعالیت بسیار ضعیف ، ضعیف، متوسط ، خوب و فعالیت عالی84% بدست آمد.در کارهای قبلی ]72[ تنها با تقسیم مولکول به سه قسمت و طبقه بندی به فعال و غیر فعال، صحت نزدیک به 80% آمده بود. اما در کار حاضر بدون تقسیم بندی مولکولی و با تکیه به روش های محاسباتی صحتی بالاتر از کارهای سابق به دست آمد که نشانگر مناسب بودن و برتری روش های تئوری اطلاعات و SVM بر روش های قدیمی تر می باشد.
فصل اول
پیشگوئی maxλ مشتقات
رنگ های آزو با استفاده از الگوریتم مورچه
1-1 مقدمه
بشر هوشمند و صاحب تفکر همیشه برای یافتن راهی که زندگی¬ اش را متحول و کامل گرداند، از طبیعت الهام گرفته است.
با گذشت قرن ها، احساس نیاز به الهام گرفتن از طبیعت اسرارآمیز و دوست داشتنی و صد البته منظم، قانونمند و دارای شعور فطری، شدت پیدا کرده است. به گونه ای که از ریزترین موجودات همچون ویروس تا غول آساترین کهکشان ها، برای انسان که همیشه در تکاپوی حقیقت و دانش است، همه، معلمان و راهنمایان خوبی محسوب گردیده¬اند، چرا که طبیعت همیشه رو به سوی کمال دارد.
آنچه کاملاً مشهود است، به نظر می آید جهان هستی از جزء تا کل با یک حرکت آرام ولی پیوسته که به ظاهر تصادفی است رو به یک نقطه بهینه درحال حرکت است. در حقیقت طبق نظریه داروینی، طبیعت در حال بهینه کردن مسائل است.
به طور مثال اگر بخواهیم حجم معینی آب را از کوهستان به دریا منتقل کنیم و تمام ویژگیها و معادلات مربوط به سختی، نوع، دما، جنس و سایر مشخصات آب و محیط اطراف را تعیین کرده و با این معادلات مسیر را بیابیم دقیقاً به همان مسیر جویبارها و رودخانه¬ها می-رسیم که در طبیعت جریان دارند.
بدیهی است که خداوند معلمی است که دانش آموزش، انسان را از طریق نشانه¬هایش در طبیعت به طور کامل هدایت می¬کند.
هم اکنون کار روی توسعه سیستم¬های هوشمند با الهام از طبیعت، از زمینه¬های پرطرفدار هوش مصنوعی است. الگوریتم ژنتیک که با استفاده از ایده تکامل داروینی و انتخاب طبیعی مطرح شده روش بسیار خوبی برای یافتن مسائل بهینه¬سازی است. ایده تکاملی داروینی بیانگر این مطلب است که هر نسل نسبت به نسل قبل دارای تکامل است و آنچه در طبیعت رخ می¬دهد، حاصل میلیون¬ها سال تکامل نسل به نسل موجوداتی مانند مورچه است.
حشراتی مانند مورچه، موریانه، زنبور که به صورت کلونی زندگی می¬کنند، بر رفتار به ظاهر بی¬نظم¬شان نظم و قانونمندی خاصی حکمفرماست که دانشمندان و محققان را به خاطر این پیچیدگی منظم و راهگشا در حل مسائل بهینه¬سازی، شیفته خود ساخته است.
1-2 کمومتریکس
بدست آوردن داده تجزیه¬ای یکی از مراحل اصلی تجزیه می¬باشد، تا اواخر دهه پنجاه قرن بیستم این مرحله به عنوان مشکل¬ترین بخش یک تجزیه به حساب می¬آمد، همچنین زمان عمده یک تجزیه شیمیائی مربوط به جمع¬آوری داده¬های تجزیه¬ای می¬شد.
اما ازآغاز دهه شصت قرن بیستم، زمانی که دستگاه¬های مدرن وارد آزمایشگاه¬ها و مراکز تحقیقاتی گردید، این مشکل برطرف شد و در نتیجه استفاده از چنین دستگاه¬های پیشرفته تعداد زیادی داده از یک نمونه بدست می¬آید. جهت ثبت و ذخیره¬سازی چنین داده¬های وسیعی نیاز به وسیله¬ای بود که بتواند از عهده چنین کاری برآید، به طور همزمان با ظهور دستگاه¬های پیشرفته تعداد زیادی داده از یک نمونه بدست آمد و استفاده از کامپیوتر نیز به عنوان ابزاری جهت ثبت و ذخیره داده¬های حاصل از یک تجزیه شیمیائی رشد چشمگیری یافت، در نتیجه اتصال کامپیوتر به دستگاه¬های آزمایشگاهی ثبت و ذخیره نمودن داده¬ها که قبلاً به عنوان مشکل¬ترین بخش یک تجزیه بوده تبدیل به ساده¬ترین مرحله گردید. ولی مشکل دیگری که به دنبال چنین پیشرفتی، ظاهر گردید، نحوه برخورد با چنین حجم وسیعی از داده بود که باید به اطلاعات تبدیل می¬شدند.
برای مدت¬های طولانی، ریاضی و آمار برای تفسیر نتایج آزمایش¬ها به کار گرفته می¬شدند. ولی با ظهور نرم¬افزارهای پیشرفته رایانه ای تحول شگرفی در نحوه استفاده ریاضی و آمار در حل مسائل شیمیایی به وجود آمد. به طوری که استفاده از ریاضی ، آمار و کامپیوتر در شیمی منجر به ظهور شاخه¬ای جدید به نام کمومتریکس گردید. اگرچه شیمی¬دانهای تجزیه بیش از سایر همکارانشان با این شاخه آشنا هستند و از آن بهره می¬برند، ولی در رشته¬های مرتبط با شیمی از جمله علوم داروئی، بیوشیمی و غیره نیز کاربردهای فراوانی دارد ]5-1[.
برای اولین بار در سال 1971 سوانت ولد اصطلاح "کمومتریکس" را به کار برد و آن را هنر استخراج اطلاعات شیمیائی از داده¬های تجزیه¬ای دانست . در سال 1974 با همکاری کوالسکی انجمن بین¬المللی کمومتریکس تأسیس شد ]6[.
در سال 1982 کوالسکی و فرانک کمومتریکس را شاخه¬ای از علم شیمی که در طراحی آزمایش¬های بهینه¬سازی، برقراری ارتباط بین نتایج تجربی با متغیرهای آزمایش و همچنین استخراج اطلاعات از سیستم¬های شیمیایی با استفاده از ریاضی، آمار و کامپیوتر تعریف کردند ]7[.
ماسارت ، کمومتریکس را یک روش شیمیائی می¬داند که از منطق ریاضیات و آمار برای رسیدن به اهداف زیر بهره می¬جوید ]8[:
1) طراحی با انتخاب فرآیندهای تجربی بهینه شده
2) دسترسی به حداکثر اطلاعات مناسب شیمیائی از طریق داده¬ های تجربی
3) بدست آوردن اطلاعات در زمینه سیستم¬های شیمیائی
براون سردبیر مجله کمومتریکس معتقد است کمومتریکس قسمتی از علم شیمی است که کوشش در پاسخگوئی به سوالات مربوط به سنجش¬های شیمیائی دارد ]9[. سوالاتی از قبیل:
1) اندازه¬گیری کجا و چگونه باید انجام پذیرد؟
2) سیگنال و نویز کدامند؟
3) چگونه می¬ توان از اندازه¬گیری، اطلاعات مناسب را بدست آورد؟
4) منشأ خطاها در نتایج حاصل از اندازه¬گیری¬ها چیست؟
انجمن بین¬المللی کمومتریکس (ICS) تعریف جامعی از کمومتریکس ارائه می¬دهد. براساس تعریف این انجمن کمومتریکس علم برقراری ارتباط بین سنجش¬های انجام شده بر روی یک سیستم یا فرایند شیمیائی و حالتی از سیستم می¬باشد. این ارتباط از طریق کاربرد روش¬های آماری و ریاضی صورت می¬پذیرد.
به هر حال، شاید بتوان اهداف کمومتریکس را چنین بیان نمود که:
با استفاده از کمومتریکس، عوامل موثر و بر همکنش آن¬ها در یک فرایند شیمیائی (اعم از یک فرایند تجزیه¬ای و غیره) مورد شناسائی قرار گرفته و با حداقل آزمایش¬ها، بهینه¬سازی می شوند. بدست آوردن ارتباط بین عوامل موثر و پاسخ سیستم از دیگر اهداف کمومتریکس می¬باشد. در نهایت، تبدیل داده¬های حاصل به اطلاعات نیز هدف نهائی کمومتریکس می¬باشد. واضح است رسیدن به چنین اهدافی نیازمند کمک گرفتن از ریاضی، آمار و کامپیوتر است ]10[.
بسیاری از مسائلی که در کمومتریکس با آنها مواجه می شویم به دلیل پیچیدگی فوق العاده با روش های دقیق قابل حل نیست به زبان علوم کامپیوتر، چنین مسائلی را "چند جمله ای نامعین سخت " می گویند.
زمان لازم برای حل دقیق چنین مسائلی با زیاد شدن تعداد ورودی ها ، به شدت زیاد می¬شود ، در چنین مواردی لازم است از "تقریب های خوب " استفاده کنیم، یکی از این تقریب¬های خوب الگوریتم های هیوریستیک می باشند که از آن برای برقراری رابطه ساختار – خاصیت بهره خواهیم جست ]11[.
1-3 الگوریتم هیوریستیک
هیوریستیک¬ها عبارت از معیارها، روش¬ها یا اصولی برای تصمیم¬گیری بین چندین خط مشی و انتخاب اثربخش¬ترین آن ¬ها برای دستیابی به اهداف مورد نظر می باشند. سیستم¬های پیچیده اجتماعی، تعداد زیادی از مسائل دارای طبیعت ترکیباتی را پیش روی ما قرار می-دهد. به عنوان مثال مسیر کامیون¬های حمل و نقل باید به شکل بهینه تعیین شود. تئوری پیچیدگی به ما می¬گوید که مسائل ترکیباتی اغلب چند جمله¬ ای نیستند. این مسائل در اندازه¬های کاربردی و عملی خود به قدری بزرگ هستند که نمی¬توان جواب بهینه آنها را در مدت زمانی قابل قبول به دست آورد. با این وجود، این مسائل باید حل شوند و بنابراین چاره-ای نیست که به جواب¬های با تقریب بهینه بسنده نمود.
پایان نامه مدلسازی طول موج ماکزیمم جذب رنگهای آزو توسط الگوریتم مورچه و فعالیت داروئی مشتقات کاپساسین