1-12-4- تیازولیدیندایون‌ها (TZD)33
1-12-5- مگلی تینایدها33
فصل دوم: روش کار
2-1- رسم مشتقات36
2-1-1- اضافه کردن متد و بهینه سازی مشتقات36
2-1-2- اضافه کردن توصیفگرهای مولکولی به مشتقات36
2-1-3- ساختن ماتریس و غربالگری توصیفگرها برای مشتقات37
2-1-4- محاسبات GA38
2-1-5- محاسبات GA-ANN39
2-1-6- محاسبات جک نایف39
2-1-7- محاسبات GA –MLR39
2-1-8- تجزیه و تحلیل با روش هایPLS ، PCR و MLR40
2-1-9- تجزیه و تحلیل با روش های GA-MCR،GA-PLS ،GA-PCR ، GA-MLR و GA-RS40
2-1-10- پیش بینی ساختار40
بخش دوم: بحث و نتیجه گیری
2-2- بحث و نتیجه گیری42
پیشنهاد برای کارهای اینده124
منابع و مأخذ125
فهرست جداول
عنوان صفحه
جدول1. ساختار مربوط به مشتقات57
جدول2. مقادیر عددی پارامتر RMSE با روشGA-ANN برای همبستگی های مختلف60
جدول3. توصیفگرهای انتخاب شده با روش GA-STEPWISE MLR برای همبستگی با هدف 0.360
جدول4. توصیفگرهای انتخاب شده با روش GA-STEPWISE MLR برای همبستگی با هدف 0.461
جدول5. مقادیر عددی پارامتر RMSE با روش GA-ANN برای همبستگی با هدف 0.361
جدول6. مقادیر عددی پارامتر RMSE با روش GA-ANN برای همبستگی با هدف 0.462

در این سایت فقط تکه هایی از این مطلب(به صورت کاملا تصادفی و به صورت نمونه) با شماره بندی انتهای صفحه درج می شود که ممکن است هنگام انتقال از فایل ورد به داخل سایت کلمات به هم بریزد یا شکل ها درج نشود-این مطالب صرفا برای دمو می باشد

ولی برای دانلود فایل اصلی با فرمت ورد حاوی تمامی قسمت ها با منابع کامل

اینجا کلیک کنید

جدول7. توصیفگرهای انتخاب شده با روش GA-STEPWISE MLR برای همبستگی با هدف 0.3 برای لایه 262
جدول8. توصیفگرهای انتخاب شده با روش GA-STEPWISE MLR برای همبستگی با هدف 0.3 برای لایه 362
جدول9. توصیفگرهای انتخاب شده با روش GA-STEPWISE MLR برای همبستگی با هدف 0.3 برای لایه 463
جدول10. توصیفگرهای انتخاب شده با روش GA-STEPWISE MLR برای همبستگی با هدف 0.3 برای لایه 563
جدول11. توصیفگرهای انتخاب شده با روش GA-STEPWISE MLR برای همبستگی با هدف 0.3 برای لایه 663
جدول12. توصیفگرهای انتخاب شده با روش GA-STEPWISE MLR برای همبستگی با هدف 0.3 برای لایه 764
جدول13. توصیفگرهای انتخاب شده با روش GA-STEPWISE MLR برای همبستگی با هدف 0.3 برای لایه 864
جدول14. توصیفگرهای انتخاب شده با روش GA-STEPWISE MLR برای همبستگی با هدف 0.3 برای لایه 964
جدول15. توصیفگرهای انتخاب شده با روش GA-STEPWISE MLR برای همبستگی با هدف 0.3 برای لایه 1065
جدول16. توصیفگرهای انتخاب شده با روش GA-STEPWISE MLR برای همبستگی با هدف 0.3 برای لایه 1165
جدول17. توصیفگرهای انتخاب شده با روش GA-STEPWISE MLR برای همبستگی با هدف 0.4 برای لایه 265
جدول18. توصیفگرهای انتخاب شده با روش GA-STEPWISE MLR برای همبستگی با هدف 0.4 برای لایه 366
جدول19. توصیفگرهای انتخاب شده با روش GA-STEPWISE MLR برای همبستگی با هدف 0.4 برای لایه 466
جدول20. توصیفگرهای انتخاب شده با روش GA-STEPWISE MLR برای همبستگی با هدف 0.4 برای لایه 566
جدول21. توصیفگرهای انتخاب شده با روش GA-STEPWISE MLR برای همبستگی با هدف 0.4 برای لایه 667
جدول22. توصیفگرهای انتخاب شده با روش GA-STEPWISE MLR برای همبستگی با هدف 0.4 برای لایه 767
جدول23. توصیفگرهای انتخاب شده با روش GA-STEPWISE MLR برای همبستگی با هدف 0.4 برای لایه 867
جدول24. توصیفگرهای انتخاب شده با روش GA-STEPWISE MLR برای همبستگی با هدف 0.4 برای لایه 968
جدول25. توصیفگرهای انتخاب شده با روش GA-STEPWISE MLR برای همبستگی با هدف 0.4 برای لایه 1068
جدول26. توصیفگرهای انتخاب شده با روش GA-STEPWISE MLR برای همبستگی با هدف 0.4 برای لایه 1168
جدول27. پارامترهای بدست آمده با روش GA-STEPWISE MLR برای همبستگی 0.3برای لایه های مختلف69
جدول28. پارامترهای بدست آمده با روش GA-STEPWISE MLR برای همبستگی 0.4برای لایه های مختلف69
جدول29. مقادیر عددی توصیفگرهای انتخاب شده با روش GA-STEPWISE MLR برای همبستگی با هدف 0.370
جدول30. مقادیر عددی توصیفگرهای انتخاب شده با روش GA-STEPWISE MLR برای همبستگی با هدف 0.472
جدول31. پارامترهای بدست آمده با روش PLS برای همبستگی0.3 برای لایه های مختلف73
جدول32. پارامترهای بدست آمده با روش GA-PLS برای همبستگی 0.3 برای لایه های مختلف74
جدول34. پارامترهای بدست آمده با روش PCR برای همبستگی های مختلف75
جدول35. پارامترهای بدست آمده با روش GA-PCR برای همبستگی 0.3 برای لایه های مختلف75
جدول36. پارامترهای بدست آمده با روش GA-PCR برای همبستگی 0.4 برای لایه های مختلف76
جدول37. مقادیر عددی پارامترRMSE با روش GA-ANN برای لایه های فرد و همبستگی های مختلف76
جدول38. مقادیر عددی پارامترRMSE با روش GA-ANN برای لایه‎های زوج و همبستگی های مختلف76
جدول39. مقادیر عددی پارامتر RMSE و R2 با روش جک نایف برای لایه های فرد و همبستگی های مختلف77
جدول40. مقادیر عددی پارامتر RMSE و R2 با روش جک نایف برای لایه های زوج و همبستگی های مختلف77
جدول41. مقادیر عددی از مشاهداتLOG (1/IC50) ، پیش بینی جک نایف و Ө∆ برای لایه 2-1 و همبستگی با هدف 0.377
جدول42. مقادیر عددی از مشاهداتLOG (1/IC50) ، پیش بینی جک نایف و Ө∆ برای لایه3-1 و همبستگی با هدف 0.378
جدول43. مقادیر عددی از مشاهداتLOG (1/IC50) ، پیش بینی جک نایف و Ө∆ برای لایه 4-1 و همبستگی با هدف 0.378
جدول44. مقادیر عددی از مشاهداتLOG (1/IC50) ، پیش بینی جک نایف و Ө∆ برای لایه5-1 و همبستگی با هدف 0.379
جدول45. مقادیر عددی از مشاهداتLOG (1/IC50) ، پیش بینی جک نایف و Ө∆ برای لایه 6-1 و همبستگی با هدف 0.379
جدول46. مقادیر عددی از مشاهداتLOG (1/IC50) ، پیش بینی جک نایف و Ө∆ برای لایه 7-1 و همبستگی با هدف 0.380
جدول47. مقادیر عددی از مشاهداتLOG (1/IC50) ، پیش بینی جک نایف و Ө∆ برای لایه 8-1 و همبستگی با هدف 0.380
جدول48. مقادیر عددی از مشاهداتLOG (1/IC50) ، پیش بینی جک نایف و Ө∆ برای لایه 9-1 و همبستگی با هدف 0.381
جدول49. مقادیر عددی از مشاهداتLOG (1/IC50) ، پیش بینی جک نایف و Ө∆ برای لایه 10-1 و همبستگی با هدف 0.381
جدول50. مقادیر عددی از مشاهداتLOG (1/IC50) ، پیش بینی جک نایف و Ө∆ برای لایه 11-1 و همبستگی با هدف 0.382
جدول51. مقادیر عددی از مشاهداتLOG (1/IC50) ، پیش بینی جک نایف و Ө∆ برای لایه 2-1 و همبستگی با هدف 0.482
جدول52. مقادیر عددی از مشاهداتLOG (1/IC50) ، پیش بینی جک نایف و Ө∆ برای لایه 3-1 و همبستگی با هدف 0.483
جدول53. مقادیر عددی از مشاهداتLOG (1/IC50) ، پیش بینی جک نایف و Ө∆ برای لایه 4-1و همبستگی با هدف 0.483
جدول54. مقادیر عددی از مشاهداتLOG (1/IC50) ، پیش بینی جک نایف و Ө∆ برای لایه 5-1 و همبستگی با هدف 0.484
جدول55. مقادیر عددی از مشاهداتLOG (1/IC50) ، پیش بینی جک نایف و Ө∆ برای لایه 6-1 و همبستگی با هدف 0.484
جدول56. مقادیر عددی از مشاهداتLOG (1/IC50) ، پیش بینی جک نایف و Ө∆ برای لایه 7-1 و همبستگی با هدف 0.485
جدول57. مقادیر عددی از مشاهداتLOG (1/IC50) ، پیش بینی جک نایف و Ө∆ برای لایه 8-1 و همبستگی با هدف 0.485
جدول58. مقادیر عددی از مشاهداتLOG (1/IC50) ، پیش بینی جک نایف و Ө∆ برای لایه 9-1 و همبستگی با هدف 0.486
جدول59. مقادیر عددی از مشاهداتLOG (1/IC50) ، پیش بینی جک نایف و Ө∆ برای لایه 10-1 و همبستگی با هدف 0.486

جدول60. مقادیر عددی از مشاهداتLOG (1/IC50) ، پیش بینی جک نایف و Ө∆ برای لایه 11-1 و همبستگی با هدف 0.487
جدول61. مقادیر عددی مشاهدات، پیش بینی با روش PLS، Ө∆ و انحراف برای همبستگی با هدف 0.387
جدول62. مقادیر عددی مشاهدات، پیش بینی با روش GA-PLS، Ө∆ و انحراف برای همبستگی با هدف 0.3 برای لایه 288
جدول63. مقادیر عددی مشاهدات، پیش بینی با روش GA-PLS، Ө∆ و انحراف برای همبستگی با هدف 0.3 برای لایه 388
جدول64. مقادیر عددی مشاهدات، پیش بینی با روش GA-PLS، Ө∆ و انحراف برای همبستگی با هدف 0.3 برای لایه 489
جدول65. مقادیر عددی مشاهدات، پیش بینی با روش GA-PLS، Ө∆ و انحراف برای همبستگی با هدف 0.3 برای لایه 589
جدول66. مقادیر عددی مشاهدات، پیش بینی با روش GA-PLS، Ө∆ و انحراف برای همبستگی با هدف 0.3 برای لایه 690
جدول67. مقادیر عددی مشاهدات، پیش بینی با روش GA-PLS، Ө∆ و انحراف برای همبستگی با هدف 0.3 برای لایه 790
جدول68. مقادیر عددی مشاهدات، پیش بینی با روش GA-PLS، Ө∆ و انحراف برای همبستگی با هدف 0.3 برای لایه 891
جدول69. مقادیر عددی مشاهدات، پیش بینی با روش GA-PLS، Ө∆ و انحراف برای همبستگی با هدف 0.3 برای لایه 991
جدول70. مقادیر عددی مشاهدات، پیش بینی با روش GA-PLS، Ө∆ و انحراف برای همبستگی با هدف 0.3 برای لایه 1092
جدول71. مقادیر عددی مشاهدات، پیش بینی با روش GA-PLS، Ө∆ و انحراف برای همبستگی با هدف 0.3 برای لایه 1192
جدول72. مقادیر عددی مشاهدات، پیش بینی با روش PLS، Ө∆ و انحراف برای همبستگی با هدف 0.493
جدول73. مقادیر عددی مشاهدات، پیش بینی با روش GA-PLS، Ө∆ و انحراف برای همبستگی با هدف 0.4 برای لایه 293
جدول74. مقادیر عددی مشاهدات، پیش بینی با روش GA-PLS، Ө∆ و انحراف برای همبستگی با هدف 0.4 برای لایه 394
جدول75. مقادیر عددی مشاهدات، پیش بینی با روش GA-PLS، Ө∆ و انحراف برای همبستگی با هدف 0.4 برای لایه 494
جدول76. مقادیر عددی مشاهدات، پیش بینی با روش GA-PLS، Ө∆ و انحراف برای همبستگی با هدف 0.4 برای لایه 595
جدول77. مقادیر عددی مشاهدات، پیش بینی با روش GA-PLS، Ө∆ و انحراف برای همبستگی با هدف 0.4 برای لایه 695
جدول78. مقادیر عددی مشاهدات، پیش بینی با روش GA-PLS، Ө∆ و انحراف برای همبستگی با هدف 0.4 برای لایه 796
جدول79. مقادیر عددی مشاهدات، پیش بینی با روش GA-PLS، Ө∆ و انحراف برای همبستگی با هدف 0.4 برای لایه 896
جدول80. مقادیر عددی مشاهدات، پیش بینی با روش GA-PLS، Ө∆ و انحراف برای همبستگی با هدف 0.4 برای لایه997
جدول81. مقادیر عددی مشاهدات، پیش بینی با روش GA-PLS، Ө∆ و انحراف برای همبستگی با هدف 0.4 برای لایه1097
جدول82. مقادیر عددی مشاهدات، پیش بینی با روش GA-PLS، Ө∆ و انحراف برای همبستگی با هدف 0.4 برای لایه1198
جدول83. مقادیر عددی مشاهدات، پیش بینی با روشPCR ، Ө∆ و انحراف برای همبستگی با هدف 0.398
جدول84. مقادیر عددی مشاهدات، پیش بینی با روش GA-PCR، Ө∆ و انحراف برای همبستگی با هدف 0.3 برای لایه 299
جدول85. مقادیر عددی مشاهدات، پیش بینی با روش GA-PCR، Ө∆ و انحراف برای همبستگی با هدف 0.3برای لایه 399
جدول86. مقادیر عددی مشاهدات، پیش بینی با روش GA-PCR، Ө∆ و انحراف برای همبستگی با هدف 0.3 برای لایه 4100
جدول87. مقادیر عددی مشاهدات، پیش بینی با روش GA-PCR، Ө∆ و انحراف برای همبستگی با هدف 0.3 برای لایه 5100
جدول88. مقادیر عددی مشاهدات، پیش بینی با روش GA-PCR، Ө∆ و انحراف برای همبستگی با هدف 0.3 برای لایه 6101
جدول89. مقادیر عددی مشاهدات، پیش بینی با روش GA-PCR، Ө∆ و انحراف برای همبستگی با هدف 0.3 برای لایه 7101
جدول90. مقادیر عددی مشاهدات، پیش بینی با روش GA-PCR، Ө∆ و انحراف برای همبستگی با هدف 0.3برای لایه 8102
جدول91. مقادیر عددی مشاهدات، پیش بینی با روش GA-PCR، Ө∆ و انحراف برای همبستگی با هدف 0.3 برای لایه 9102
جدول92. مقادیر عددی مشاهدات، پیش بینی با روش GA-PCR، Ө∆ و انحراف برای همبستگی با هدف 0.3 برای لایه 10103
جدول93. مقادیر عددی مشاهدات، پیش بینی با روش GA-PCR، Ө∆ و انحراف برای همبستگی با هدف 0.3 برای لایه 11103
جدول94. مقادیرعددی مشاهدات،پیش‎بینی با روشPCR ، Ө∆ و انحراف برای همبستگی با هدف0.4104
جدول95. مقادیر عددی مشاهدات، پیش بینی با روش GA-PCR، Ө∆ و انحراف برای همبستگی با هدف 0.4 برای لایه 2104
جدول96. مقادیر عددی مشاهدات، پیش بینی با روش GA-PCR، Ө∆ و انحراف برای همبستگی با هدف 0.4 برای لایه 3105
جدول97. مقادیر عددی مشاهدات، پیش بینی با روش GA-PCR، Ө∆ و انحراف برای همبستگی با هدف 0.4برای لایه 4105
جدول98. مقادیر عددی مشاهدات، پیش بینی با روش GA-PCR، Ө∆ و انحراف برای همبستگی با هدف 0.4 برای لایه 5106
جدول99. مقادیر عددی مشاهدات، پیش بینی با روش GA-PCR، Ө∆ و انحراف برای همبستگی با هدف 0.4 برای لایه 6106
جدول100. مقادیر عددی مشاهدات، پیش بینی با روش GA-PCR، Ө∆ و انحراف برای همبستگی با هدف 0.4 برای لایه 7107
جدول101. مقادیر عددی مشاهدات، پیش بینی با روش GA-PCR، Ө∆ و انحراف برای همبستگی با هدف 0.4 برای لایه 8107
جدول102. مقادیر عددی مشاهدات، پیش بینی با روش GA-PCR، Ө∆ و انحراف برای همبستگی با هدف 0.4 برای لایه 9108
جدول103. مقادیر عددی مشاهدات، پیش بینی با روش GA-PCR، Ө∆ و انحراف برای همبستگی با هدف 0.4 برای لایه 10108
جدول104. مقادیر عددی مشاهدات، پیش بینی با روش GA-PCR، Ө∆ و انحراف برای همبستگی با هدف 0.4 برای لایه 11109
فهرست نمودارها
عنوان صفحه
نمودار1. نمودارهای بدست آمده از روش GA برای همبستگی با هدف 0.3 برای لایه 2111
نمودار2. نمودار های بدست آمده از روش GA برای همبستگی با هدف 0.4 برای لایه 2112
نمودار3. نمودار بدست آمده از روش GA-ANN برای همبستگی با هدف 0.3112
نمودار4. نمودار بدست آمده از روش GA-ANN برای همبستگی با هدف 0.4113
نمودار5. نمودار بدست آمده از روش STEPWISE MLR برای همبستگی با هدف 0.3 در لایه 2113
نمودار6. نمودار بدست آمده از روش STEPWISE MLR برای همبستگی با هدف 0.3 در لایه 3114
نمودار7. نمودار بدست آمده از روش STEPWISE MLR برای همبستگی با هدف 0.3 در لایه 4114
نمودار8. نمودار بدست آمده از روش STEPWISE MLR برای همبستگی با هدف 0.3 در لایه 5115
نمودار9. نمودار بدست آمده از روش STEPWISE MLR برای همبستگی با هدف 0.3 در لایه 6115
نمودار10. نمودار بدست آمده از روش STEPWISE MLR برای همبستگی با هدف 0.3 در لایه 7116
نمودار11. نمودار بدست آمده از روش STEPWISE MLR برای همبستگی با هدف 0.3 در لایه 8116
نمودار12. نمودار بدست آمده از روش STEPWISE MLR برای همبستگی با هدف 0.3 در لایه 9117
نمودار13. نمودار بدست آمده از روش STEPWISE MLR برای همبستگی با هدف 0.3 در لایه 10117
نمودار14. نمودار بدست آمده از روش STEPWISE MLR برای همبستگی با هدف 0.3 در لایه 11118
نمودار15. نمودار بدست آمده از روش STEPWISE MLR برای همبستگی با هدف 0.4 در لایه 2118
نمودار16. نمودار بدست آمده از روش STEPWISE MLR برای همبستگی با هدف 0.4 در لایه 3119
نمودار17. نمودار بدست آمده از روش STEPWISE MLR برای همبستگی با هدف 0.4 در لایه 4119
نمودار18. نمودار بدست آمده از روش STEPWISE MLR برای همبستگی با هدف 0.4 در لایه 5120
نمودار19. نمودار بدست آمده از روش STEPWISE MLR برای همبستگی با هدف 0.4 در لایه 6120
نمودار20. نمودار بدست آمده از روش STEPWISE MLR برای همبستگی با هدف 0.4 در لایه 7121
نمودار21. نمودار بدست آمده از روش STEPWISE MLR برای همبستگی با هدف 0.4 در لایه 8121
نمودار22. نمودار بدست آمده از روش STEPWISE MLR برای همبستگی با هدف 0.4 در لایه 9122
نمودار23. نمودار بدست آمده از روش STEPWISE MLR برای همبستگی با هدف 0.4 در لایه 10122
نمودار24. نمودار بدست آمده از روش STEPWISE MLR برای همبستگی با هدف 0.4 در لایه 11123
فهرست اشکال
عنوان صفحه
شکل (1- 1) شمای کلی یک شبکه عصبی مصنوعی15
شکل (2-1):جهش کروموزوم19
شکل (2-1)38
پیشگفتار
شیمی محاسباتی رویکرد نوینی به پدیده های شناخته شده و آشنای فیزیکی و شیمیایی است که می تواند منجر به درک بهتر جهان پیرامون ما گردد. امروزه با پیشرفت روز افزون کامپیوترها قادر هستیم پدیده های گوناگون را در ماتریس های بسیار پیچیده نظیر سیستم های بیولوژیکی و نانوتکنولوژی مورد مطالعه قرار دهیم و بدیهی است که انجام چنین مطالعاتی در درجه اول نیازمند درک وسیعی از پدیده های فیزیکی و شیمیایی، ابداع و نوآوری روش های نوین مطالعاتی وتجزیه و تحلیل مستند و هدفدار هستند.
هدف از انجام این پژوهش، استفاده از شیمی محاسباتی در تجزیه و تحلیل آماری برای پیش بینی ساختارهای مناسب دارویی می باشد و همچنین با این روش نتایج آزمایشات مختلفی را که به صورت تجربی انجام می شود تا حدود زیادی پیش گویی و تا حد زیادی در هزینه و زمان صرفه جویی نمود.
در این پایان نامه با استفاده از مطالعات QSAR بر روی مشتقات ساختارهای مناسب برای درمان دیابت انتخاب و ساخت دارو از روی مناسب ترین ساختار ها به دارو ساز محترم پیشنهاد می شود. لازم به ذکر است که در این پژوهش روش های نوین و ترکیبی آماری، برای تجزیه و تحلیل و پیش بینی ساختارها به کار برده شده است.
چکیده
در این تحقیق، ارتباط کمی ساختار و فعالیت (QSAR) در مشتقات pyrrolo[3,2-d]pyrimidine-7-carbonitrile مطالعه شده است. الگوریتم ژنتیک (GA)، شبکه های عصبی مصنوعی (ANN) و روش گام به گام رگرسیون خطی چندگانه (stepwise MLR) برای مدل های خطی و غیر خطی QSAR ایجاد و مورد استفاده قرار گرفت. با استفاده روش DFT (B3LYP)و سری پایه 6-31G ساختار های بهینه از این مشتقات را بدست آوردیم. از نرم افزار های Hyperchem، ChemOffice و Gaussian 03W و Dragon برای بهینه‎سازی مولکول ها و محاسبات توصیفگرهای شیمی کوانتومی استفاده شده است. در نهایت برای آنالیز داده ها از نرم افزار Unscrambler استفاده گردید. RMSE train و test RMSE با مدل GA-ANN به ترتیب 0.1406 و 0.3519 و پارامتر R2، 0.81 بدست آمد. همچنین مقادیر R و R2با مدل GA-stepwise MLR به ترتیب 0.79 و 0.58 بدست آمد. مدل GA-ANN مطلوب ترین روش نسبت به سایر روش های آماری شناخته شد.
به طور کلی با برسی های انجام شده با روشهای GA-PLS, GA-PCR و روش جک نایف در لایه‎های مختلف و اهداف مختلف ترکیبات زیر کمترین انحراف ممکن را دارند و به عنوان بهترین ترکیبات برای ساخت دارو پیش بینی می‎شوند:
5، 10، 18 و 38
همچنین بهترین توصیف گرها عبارتند :
در همبستگی 0.3:
MeaningDescriptor groupDescriptor symbol3D-MoRSE – signal 23 / weighted by atomic masses3D-MoRSE (3D)Mor23meverage-weighted autocorrelation of lag 5 / weighted by atomic massesGETAWAY (3D)HATS5m
در همبستگی 0.4:
MeaningDescriptor groupDescriptor symbol
G total symmetry index / weighted by atomic masses
WHIM (3D)

Gmleverage-weighted autocorrelation of lag 5 / weighted by atomic massesGETAWAY (3D)HATS5m
.کلمات کلیدی: دیابت نوع 2، مدل QSAR، ژنتیک الگوریتم (GA)، شبکه عصبی مصنوعی (ANN)،
GA-MLR،GA-PCR ،GA-PLS
1-1- مقدمه
شیمی محاسباتی شاخه ای از دانش شیمی است که سعی در حل مسائل شیمی با کمک رایانه ها دارد. در این رشته، از رایانه ها برای پیش بینی ساختار مولکولی، خواص مولکولی و واکنش های شیمیایی استفاده می شود. در این رشته از نتایج شیمی محض که در قالب برنامه های موثر کامپیوتری درآمده اند برای محاسبه ساختار و خواص مولکول ها استفاده می شود، در حالی که نتایج آنها معمولا کامل کننده اطلاعات بدست آمده از آزمایش های شیمیایی هستند، اما در برخی موارد می تواند منجر به پیش بینی پدیده های مشاهده نشده شیمیایی شود.
بنابراین شیمی محاسباتی می تواند به شیمی آزمایشگاهی کمک کرده و در یافتن موضوعات جدید شیمیایی با شیمی تجربی رقابت نماید سیمای شیمی محاسباتی شامل مدل سازی مولکولی، روش های محاسباتی و طراحی مولکول به کمک کامپیوتر و همچنین داده های شیمیایی و طراحی سنتزهای آلی می باشد، همچنین از این رشته به گستردگی برای طراحی داروها، کاتالیست ها و مواد نو استفاده می شود ]1[.
1-2- کمومتریکس1
برای درک مکانیسم فرآیندهای مختلف شیمیایی، کشف و توسعه مواد جدید، حفظ محیط زیست و زمینه‎های دیگر شیمی، هنوز توانایی حل مسائل به طور کامل وجود ندارد و برای عملی کردن بعضی از مسائل، نیاز به سیستم های بسیار پیچیده ای است که انجام آنها در گرو صرف هزینه های بسیار و مطالعات گسترده است. درجهت حل این مشکل، روش های محاسباتی کمومتریکس می توانند مفید باشند. تجزیه و تحلیل آماری و ریاضی داده های شیمیایی معمولاً تحت عنوان کمومتریکس یاد می شود. به عبارتی دیگر کمومتریکس یک روش کارآمد برای خلاصه کردن اطلاعات مفید از یک سری داده مشخص و پیش بینی سری دیگر داده هاست. در حقیقت هدف کمومتریکس، بهبود بخشیدن فرآیندهای اندازه گیری و استخراج اطلاعات شیمیایی مفیدتر از داده های اندازه گیری شده فیزیکی و شیمیایی است. کمومتریکس اولین بار توسط دانشمنـد سوئـدی به نام ولـد2 در ســال 1972 به کـار گــرفته شد و توسط کووالسکی3 توسعه داده شد و درسال 1974 انجمن بین المللی کمومتریکس4 تأسیس گردید. درسال 1974 در ایتالیا، دو گروه از دانشمندان به نام های فورینا5 و کلمنتی6 شروع به فعالیت در این زمینه کردند و از سال 1980 دانش کمومتریکس خیلی سریع توسعه یافت ]2[. چندیــن تعریف بــرای کمومتــریکس بیــان شده است کـه غالبــاً درمتــن های تجزیــه ای بــه کار می روند. یکی از جامع ترین تعاریف به صورت زیر است:
کمومتریکس شاخه ای از شیمی است که از ریاضی، آمار و منطق برای دستیابی به نتایج زیر استفاده می کند:
الف ) فرآیندهای تجربی بهینه را طراحی و انتخاب کند.
ب ) حداکثر اطلاعات شیمیایی قابل حصول را از تحلیل اطلاعات شیمیایی فراهم کند.
ج ) اطلاعات بیشتری درمورد سیستم های شیمیایی بدست آورد.
1-2-1- کاربردهای کمومتریکس
کمومتریکس درشاخه های مختلف شیمی مورد استفاده قرارمی گیـرد که بـرخی از این کاربردها شامل کنترل فرآیندها، تجزیه و تحلیل و شناخت الگوها، پردازش علائم و بهینه کردن شرایط می باشد. یکی از زمینه های مهم کاربرد کمومتریکس در مطالعاتی است که خواص مولکول ها را به ویژگی های ساختاری آنها نسبت می دهد. یکی از مهمترین کاربردهای کمومتریکس ارتباط کمی ساختارـ فعالیت7 است که با آن می توان مدل های ریاضی، ساختار شیمیایی، فعالیت بیولوژیکی، الکترونیکی و… را با این روش محاسبه و تعیین کرد. هدف QSAR، ایجاد رابطه ای منطقی بین کمیت ها و یا خواص ترکیبات (فعالیت) و ساختار شیمیایی آنها است و این قانون برای مولکول های جدید مورد استفاده قرار می گیرد. نتایج این مطالعات علاوه بر شفاف سازی نحوه ارتباط بین خواص مولکول ها و ویژگی های ساختمانی آنها به پژوهشگران در پیش بینی رفتار مولکول های جدید براساس رفتار مولکول های مشابـه کمک می کند.
1-3- مزایای روش های محاسباتی نسبت به روش های آزمایشگاهی
استفاده از روش های محاسباتی به جای استفاده از روش های آزمایشگاهی حاوی مزایای زیر است:
➢ می توان مدل های مناسبی از ساختار به وجود آورد. (ساختار بهینه)
➢ می توان ساختار های جدید از این طریق طراحی کرد.
➢ می توان سنتزهایی که تنها با افزایش صورت می گیرد به دست آورد.
➢ ویژگی طرح آزمایشی که با استفاده از نمایش ساختار مطلوب به دست می آید به محقق این امکان را می‎دهد تا بتواند ساختارهای جدید را در فضای مجازی امتحان کند وهمین امر کار آزمایشگاهی را با بیشترین بازده برای شیمیدان فراهم می کند.
1-4- QSAR8
نتایج مطالعات QSAR علاوه بر شفاف سازی نحوه ارتباط بین خواص مولکول‌ ها و ویژگی‌ های ساختمانی آنها به پژوهشگران در پیش‌بینی رفتار مولکول ‌های جدید براساس رفتار مولکول ‌های مشابه کمک می‌کند. به تمامی ابــزارها و روش هایـی که به این منظـور مـورد استفـاده قرار می گیرند، روش های پارامتری گویند. در روش‌ های پارامتری سعی می‌شود بین یک سری توصیف کننده ‌های مولکولی9 با فعالیت یا خاصیت مورد نظر ارتباط منطقی برقرار نمایند. توصیف‌کننده ‌های مولکولی که به این منظور استفاده می‌شوند، حاوی مقادیر عددی می‌باشند که جنبه‌ های مختلف ساختاری مولکول را به طور کمی نشان می‌دهند. وقتی خصوصیات ساختاری گونه‌ها و فعالیت آنها توسط اعداد و ارقام بیان می‌شود می‌توان رابطه ریاضی یا کمی بین ساختار و فعالیت گونه ایجاد کرد، این رابطه می‌تواند برای پیش بینی پاسخ بیولوژیکی یا شیمیایی دیگر ساختارها مورد استفاده قرار گیرد ]3[.

شما می توانید تکه های دیگری از این مطلب را با جستجو در همین سایت بخوانید

1-5- رگرسیون10
اگر بخواهیم واژه رگرسیون را از لحاظ لغوی تعریف نماییم، این واژه در فرهنگ لغت به معنی پسروی، برگشت و بازگشت است. اما اگرآن را از دید آمار و ریاضیات تعریف کنیم اغلب جهت رساندن مفهوم “بازگشت به یک مقدار متوسط یا میانگین” به کار می رود، بدین معنی که برخی پدیده ها به مرور زمان از نظر کمی به طرف یک مقدار متوسط میل می کنند. در حقیقت تحلیل رگرسیونی فن و تکنیکی آماری برای بررسی و مدل سازی ارتباط بین متغیرهاست. رگرسیون تقریباً در هر زمینه ای از جمله مهندسی، فیزیک، اقتصاد، مدیریت، علوم زیستی، بیولوژی و علوم اجتماعی برای برآورد و پیش بینی مورد نیاز است. می توان گفت تحلیل رگرسیونی، پرکاربردترین روش در بین تکنیک های آماری است. برای انجام یک تحلیل رگرسیونی ابتدا تحلیلگر حدس می زند که بین دو متغیر، نوعی ارتباط وجود دارد، در حقیقت حدس می‎زند که یک رابطه به شکل یک خط بین دو متغیر وجود دارد و سپس به جمع آوری اطلاعات کمی از دو متغیر می پردازد و این داده ها را به صورت نقاطی در یک نمودار دو بعدی رسم می کند. همانطور که بیان گردید رگرسیون یکی از مهمترین تکنیک ها برای تحلیل داده ها و استخراج اطلاعات است، اما نکته ای که باعث گردیده این تکنیک از جایگاه مهمی در تحلیل ها برخوردار باشد شیوه های مختلف تحلیل های رگرسیونی است که این تنوع باعث شده که بتوان به راحتی هر نوع داده ای (اغلب از نوع داده های پیوسته) را تحلیل کرد و به راحتی نتیجه گیری نمود، در ادامه هریک از این روش ها به طور کامل تبیین خواهد گردید. علت دیگری که باعث شده این روش علاقه مندان بیشتری پیدا کنند، نرم افزارهای متنوعی است که قابلیت انجام این تحلیل ها را دارند، به عنوان مثال می توان نرم افزار اکسل11 و اس پی اس اس12 ، اس- پلاس13 ، اس ای اس14 و … نام برد ]4[.
1-6- روش های پارامتری
امروزه درکمومتریکس از روش های مختلف ریاضی و آماری مانند کالیبراسیون یک متغیره، کالیبراسیون چند متغیره، رگرسیون خطی چندگانه(MLR) 15، حداقل مربعات کلاسیک16 (CLS)، حداقل مربعات معکوس17 (ILS)، حداقل مربعات جزئی18 (PLS)، آنالیز اجزاء اصلی19 (PCA)، رگرسیون اجزاء اصلی20 (PCR) و رگرسیون چند متغیره غیر خطی21 (MNR) استفاده شده است. همچنین در پیشرفت های دو دهه اخیر از شبکه عصبی مصنوعی22 (ANN)، منطق فازی23 و الگوریتم ژنتیکی24 (GA) نیز استفاده شده است. این روش‎ها جزء دسته ای از علوم کامپیوتر به نام هوش مصنوعی25 (AI) قـرار می گیرند که تفاوت اساسی با سایر روش های محاسباتی و همچنین با یکدیگر دارند. در سیستم های ریاضی متداول، دانسته ها به صورت قواعد روشن و از پیش مشخص شده ای در سیستـم وجود دارد، در حالی که این سیستم ها قواعد را توسط آموزش از مثال هایی که به آنها داده می شوند فرا می گیرند. از میان روش های فوق استفاده از شبکه های عصبی مصنوعی در شیمی نقش برجسته ای پیدا کرده و کاربرد آن در شیمی به سرعت درحال افزایش است. از شبکه های عصبی مصنوعی به خوبی می توان در شناخت الگوها و طبقه بندی داده ها استفاده کرد. همچنین از این شبکه ها در مطالعات QSAR، هنگامی که ارتباط بین توصیف کننده ها و کمیت مورد مدل سازی پیچیده و غیرخطی بوده و یا اینکه پردازش سریع حجم وسیعی از اطلاعات مورد نیاز می باشد می‎توان به خوبی استفاده کرد ]5[. توضیحاتی راجع به انواع رگرسیون ها در زیر آماده است:
1-6-1- کالیبراسیون یک متغیره و چند متغیره
مراحل کالیبراسیون معمولا شامل طراحی آزمایش، انتخاب مدل، تخمین پارامترها و پیش‌بینی مجهولات می‌باشد. در کالیبراسیون یک متغیره، امکان تصحیح مزاحم‌ها بدون وارد کردن اطلاعات اضافی وجود ندارد، در حالی که در روش‌های چند متغیره قادر به جدا کردن اطلاعات مفید از اطلاعات نامناسب مانند خطا می‌باشند، بدون این که اطلاعات اضافی دیگری برای این کار لازم می‌باشد ]6[.
1-6-2- حداقل مربعات کلاسیک(CLS)26
روش بسیار محبوب برای محاسبه برآورد پارامترها و تناسب داده هاست. این روش یکی از قدیمی ترین تکنیک های آماریست که در داده های چند متغیره و در مدل های طیف سنجی مورد استفاده قرار می گیرد ]7[.
1-6-3- حداقل مربعات معکوس(ILS)27
واژه حداقل مربعات توصیفی از یک رویکرد برای حل معادلات از روی عدم دقت در مفهوم تقریبی است. به جای حل دقیق معادلات، به دنبال به حداقل رساندن مجموع مربعات باقیمانده می باشد. حداقل معیار مربع دارای تفسیرهای مهم آماری است. یکی از این تفسیرهای مهم زمانی است که مفروضات مناسب، احتمالاتی در مورد توزیع خطا زمینه ای ایجاد نمایند که در این حالت حداقل مربعات، برآورد حداکثر احتمال از پارامترهای شناخته شده را بدست می دهد ]8[.
1-6-4- رگرسیون خطی چندگانه (MLR)28
با روش های مطالعاتی چند متغیره، می توان همزمان به بررسی و تحلیل چندین متغیر مختلف پرداخت. برای دسترسی به نتایج مطلوب تر و درست تر از این روش ها، نیازمند به نمونه های فراوان و در عین حال درست است زیرا این روش ها در مقابل اطلاعات نادرست، حساسیت بالایی دارند و ورود چنین داده هایی ممکن است منجر به بروز خطاهای بزرگی در نتایج به دست آمده شود. افزون بر این برای استفاده از این روش ها، متغیرها باید توزیع نرمال داشته باشند و تغییر آنها از یک رابطه خطی پیروی کند ]9[.
رگرسیون چند متغیره در حقیقت، ارتباط بین یک سری از متغیرهای مستقل را با یک متغیر مورد نظر بیان می کنند. در صورت وجود متغیرهای مستقل x1, x2, …, xnاگر بخواهیم ارتباط خطی بین آنها و متغییر yکه وابسته به آنهاست ایجاد کنیم، رابطه زیر باید بین آنها برقرار باشد:
(2-1) y = a0 + a1x1 + a2x2 + … + anxn + e
که در این رابطه از مقادیر a1, a2, …, anبا عنوان ضرایب رگرسیون یاد می شود. این ضرایب، ضرایب نامشخصی بوده که در حقیقت، مسئول برآورد پارامتر وابسته هستند. در صورتی که از طرفین رابطه فوق امید ریاضی29 گرفته شود، به دلیل اینکه امید ریاضی مقدار خطای e برابر با صفر است، می توان نوشت:
(3-1) E(y) = a0 + a1x1 + a2x2 + … + anxn
که E(y)در حقیقت مقدار مورد انتظار تابع، تحت تأثیر و ورود مقادیرمتغیرهای x1, x2, …, xn است.
1-6-5- حداقل مربعات جزئی(PLS)30
به منظور اشتقاق یک تابع انتقالی بر اساس متغیرهای مستقل و وابسته مورد نظر، از روش رگرسیون حداقل مربعات جزئی استفاده می گردد. این روش یکی از روش های چند متغیره است که در هنگام بروز هم خطی بین متغیرهای مستقل استفاده می شود. در این روش برای تشکیل رابطه بین متغیر وابسته و متغیرهای مستقل، متغیرهای جدیدی ساخته می شود که آنها را مؤلفه یا فاکتور می نامند. هر یک از این مؤلفه ها یک ترکیب خطی از متغیرهای مستقل اولیه می باشد. سپس از روش های رگرسیونی استاندارد برای تعیین معادلاتی که این مؤلفه ها را به متغیر وابسته ارتباط دهند استفاده می شود. شایان ذکر است که تعداد این مؤلفه‎ها از تعداد متغیرهای مستقل اولیه کمتر بوده و همچنین بین آنها رابطه خطی وجود ندارد. در واقع روش حداقل مربعات جزئی با بکار بردن مؤلفه هایی با قدرت پیش بینی بالا که تعداد آنها از متغیرهای اولیه کمتر است، بعد مسأله را نیز کاهش می دهد. یکی از مزایای این روش به روش رگرسیون خطی چندگانه این است که می توان از متغیرهایی که از توزیع نرمال تبعیت نمی کند نیز استفاده کرد ]10[.
1-6-6- آنالیز اجزاء اصلی(PCA)31
این روش یکی از الگوهای تشخیص و شناسایی (تشخیص هویت) در یک مجموعه اطلاعات است. در این روش اطلاعات را براساس شباهت ها و تفاوت هایشان بیان می کنند. از آن جا که در اطلاعات از ابعاد بالا، نقشه و طرح خاصی را به سختی می توان در داده ها پیدا کرد. در حقیقت آنالیز اجزای اصلی ارتباط بین داده ها را کشف می کند و در جایی که نعمت نمایش گرافیکی در دسترس نیست، آنالیز اجزای اصلی یک ابزار نیرومند برای آنالیز اطلاعات است. دیگر مزیت اصلی آنالیز اجزای اصلی این است که شما یک بار این الگو را در داده ها پیدا می کنید و با کاهش تعداد ابعاد، بدون آن که مقدار زیادی از اطلاعات را از دست دهید این اطلاعات را فشرده می کنید. هدف آنالیز اجزای اصلی خلاصه کردن داده هاست و به عنوان یک وسیله دسته بندی کننده اطلاعات مورد توجه نیست، از این تکنیک در فشرده سازی تصاویر استفاده می‎شود. یکی از کاربردهای مطلوب آنالیز اجزای اصلی، استفاده از آن به عنوان ابزاری کمکی، در آموزش شبکه های عصبی است. معمولا قبل از آغاز آموزش شبکه های عصبی یکسری پیش پردازش برروی داده ها انجام می شود که باعث افزایش کارایی شبکه های عصبی می شود مانند: نرمال کردن داده ها و قراردادن آن‎ها در یک فاصله مشخص مثلا بین -1 و 1 ]11[.
1-6-7- رگرسیون اجزاء اصلی (PCR)32
عبارتست از تجزیه و تحلیل رگرسیونی با آنالیز اجزای اصلی زمانی که ضرایب رگرسیون برآورد شده باشد. این روش برای غلبه بر مشکلاتی که متغیر های بدست امده نزدیک به راستا بودن هستند، مورد استفاده قرار می گیرد همچنین در این روش به جای استفاده از الگوهای متغیر وابسته و متغیرهای مستقل به طور مستقیم، از متغیرهای مستقل استفاده می شود. به طور معمول با استفاده از یک زیر مجموعه از اجزای اصلی در رگرسیون ساخته شده و منظم می گردد. اغلب اجزای اصلی با بالاترین واریانس انتخاب می شود، با این حال ممکن است که کمترین واریانس اجزای اصلی نیز مهم باشد حتی در برخی موارد از اهمیت بیشتری برخوردار است و بعد محاسبات پیش بینی حاصل می شود.
این روش رگراسیونی را به سه مرحله تقسیم می کنند که عبارتند از:
1. گام اول اجزای تجزیه و تحلیل در جدول متغیر های توزیعی باشد.
2. گام دوم برای اجرای عادی رگرسیون حداقل مربعات (رگرسیون خطی) بر روی اجزای انتخاب شده این است که عواملی که در ارتباط با متغیر وابسته هستند انتخاب شوند.
3. در نهایت پارامترهای مدل را برای انتخاب متغیرهای توزیعی محاسبه کند ]12[.
1-6-8- رگرسیون چند متغیره غیر خطی(MNR)33
این روش یکی از تکنیک های یادگیری نظارتی و در حالتی که نتایج خروجی به صورت دوتایی34 هستند،
مورد توجه قرار می گیرد، در کل زمانی که نتایج خروجی به صورت دوتایی هستند رگرسیون خطی خیلی
کارا نیست، دراین حالت استفاده از این تکنیک مناسب تر است. نکته دیگر اینکه این روش یک تکنیک رگرسیون غیر خطی است و لزومی ندارد که داده ها حالت خطی داشته باشند. اگر بخواهیم دلیل استفاده رگرسیون لجستیک35 را بیان کنیم باید این گونه بحث کنیم در رگرسیون خطی علاوه بر اینکه نتایج خروجی باید به صورت عددی باشد، متغیرها هم باید به صورت عددی باشد بنابراین حالت هایی که به صورت مقایسه ایی هستند باید به حالت عددی تغییر شکل پیدا کنند، مثلا جنسیت افراد از حالت زن و مرد به ترتیب به حالت های 0 و 1 تغییر پیدا می کند. به علت اینکه خروجی متغیر بصورت دوتایی می باشد اساس رگرسیون خطی در این حالت ایراد پیدا می کند و ارزش قیدی که بر روی متغیر وابسته قرار می گیرد توسط معادله رگرسیون در نظر گرفته نمی شود. در واقع چون رگرسیون خطی معادله یک خط را ترسیم می کند نمی تواند حالت مثبت و منفی یا به عبارتی صفر و یک را در نظر بگیرد به همین دلیل برای اینکه بتوان حالت های دوتایی را هم در نظر گرفت باید شکل معادله را تغییر داد با این تغییر شکل معادله رگرسیون، احتمال اتفاق افتادن یا اتفاق نیفتادن یک واقعه را بدست می دهد. با تغییر شکل رگرسیون خطی به حالت رگرسیون لجستیک این مشکل حل می شود، با توجه به لگاریتمی بودن معادله نمودارش غیر خطی خواهد بود ]9[.
.
1-6-9- منطق فازی
فازی به معنای گنگ و مبهم و تار است. منطق فازی یک منطق ریاضی است که خیلی ها دوست دارند آن را مقابل منطق صفر و یک ریاضی قرار دهند. این منطق در سال 1965 توسط یک ریاضیدان ایرانی بنام دکتر لطفی زاده در آمریکا عرضه شد و در حال حاضر بعنوان روشی فوق العاده برای شناسایی و کنترل سیستم‎هایی که اطلاعاتی دقیقی از درون آنها در اختیار نیست، بکار می رود. در واقع امتیاز منطق و روش‎های فازی زمانی مشخص می گردد که با سیستم های نسبتا فوق العاده پیچیده و با دینامیک بالا درگیر باشیم. در واقع بیان کننده این واقعیت است که لزومی ندارد که یک گزینه درست یا غلط باشد (به عبارتی صفر یا یک باشد) مثلا ممکن است گزینه 0.7 درست باشد ]13[.
1-6-9-1-کاربرد های منطق فازی
احتمالا راجع به یخچال های فازی یا دوربین های فیلمبرداری فازی و یا ماشین لباسشویی فازی مطالبی شنیده اید. چند کاربرد دیگر ]14[ این منطق عبارتند از:
• ترمز های ABS و سیستم کروز
• دوربین ها
• ماشین ظرف شویی
• آسانسور ها
• ماشین لباسشویی
• بازی های رایانه ای

دسته بندی : پایان نامه

پاسخ دهید