خوشه بندی داده های محیطی
- 1393/03/15
- بدون دیدگاه
خوشه بندی و طبقه بندی از جمله روشهای پر کاربرد در تجزیه و تحلیل دادهها است. استخراج الگوهای موجود در دادهها از طریق گروه بندی افراد و متغیر ها، هدف اصلی این روشها عنوان شده است. خوشه بندی و طبقهبندی شامل روشهای بسیار متنوعی است که در بسیاری از علوم مورد استفاده قرار می گیرد. این روشها از نظر هدف کار، الگوریتم مورد استفاده و نمایش نتایج با یکدیگر متفاوت هستند. اگرچه مقالات و کتابهای زیادی در علوم مختلف در ارتباط با روشهای خوشه بندی و طبقهبندی نوشته شده است، کتابی که این روشها را در علوم محیطی و به ویژه بومشناسی ارائه کند وجود ندارد. علاوه بر این، اکثر محققان و دانشحویان در انتخاب صحیح روش خوشه بندی مشکل دارند، چرا که عدم انتخاب صحیح یک روش از میان روشهای متنوعی که وجود دارد موجب گمراهی و استخراج ناصحیح الگوها، به ویژه در دادههای بومشناسی میشود.
خوشه بندی و طبقه بندی
مقدمه
انسان به طور ذاتی با مشاهده پدیدههای طبیعی به دنبال مقایسه و تقسیمبندی آنها به گروههای مختلف است. در حقیقت ذهن انسان با مواجهشدن با مسائل پیچیده شروع به طبقهبندی مشاهدات با استفاده از ویژگیهای آنها میکند. این موضوع در علوم مختلف مانند پزشکی، زیستشناسی (دستهبندی حیوانات و گیاهان از روی ویژگی آنها)، مدیریت، برنامهریزی و نقشهبرداری شهری(City-Planning)، مطالعات زلزلهنگاری (تشخیص مناطق حادثهخیز بر اساس مشاهدات قبلی)، داده کاوی (Data Mining)،کشف اطلاعات و ساختار جدید از دادههای موجود در تشخیص گفتارSpeech Recognition)) در تفسیر و تقسیمبندی تصاویر((Image Segmentation and processing و علوم محیطی و منابع طبیعی کاربرد دارد. در این علوم وقتی محقق به دنبال شناخت سیستم مورد بررسی خود است متغیرهای زیادی را جمعآوری میکند. وی به این موضوع فکر میکند که چگونه میتواند به پاسخ سیستم خود به شرایط بیرونی سیستم و همچنین چگونگیتأثیر سیستم خود بر شرایط بیرونی پی ببرد. برای رسیدن به این منظور، اولین کاری که به نظر وی میرسد طبقهبندی متغیرهایی است که جمعآوری کرده است و بر این اساس به دنبال استخراج گروههایی است که هر گروه خود نمایانگر خصوصیتی از سیستم مورد مطالعه است.
بوم شناسان اغلب علاقمند به استفاده از روشهایی هستند که روابط موجود در سیستمهای اکولوژیکی پیچیده را نمایش دهند. در بیشتر موارد این امر مستلزم قرار دادن گونهها در دو یا چند گروه است که بر اساس آن بتوانند ابعاد پیچیدگی سیستم خود را کاهش دهند. به عبارت دیگر نمایش روابط موجود در سیستم اکولوژیکی با داشتن چندین گونه و چندین ویژگی از آنها بسیار سخت است. آنها از تعداد زیاد گونه دو یا چند گروه استخراج میکنند که از این طریق، استخراج روابط موجود در سیستم آنها آسانتر میشود. اگرچه در روشهای درج بندی نیز یکی از اهداف مهم کاهش تعداد متغیرها (ابعاد) برای رسیدن به درك مناسبی از الگوهای موجود در سیستم است ولی در نهایت طبقات مشخصی استخراج نمیشوند.
در مطالعات بومشناسی، دادهها دارای اطلاعات اضافی هستند که همه آنها در تحلیل به کار نمیرود. دلیل این امر این است که برای مثال گونههای زیادی هستند که دارای رفتارهای منحصربهفرد در طول یک شیب تغییرات محیطی یا فعالیتهای مدیریتی هستند. لحاظ کردن پاسخ تکتک این گو نهها احتمال گمراه کردن محقق در استخراج الگوی پاسخ اصلی را افزایش میدهد. از طرف دیگر این امکان وجود دارد که تحلیل بر اساس پاسخ تکتک گونهها بسیار مبهم و گیج کننده باشد. بوم شناسان در بسیاری از موارد به دنبال راهی هستند که بتوانند به طور همزمان صدها گونه را در یک اکوسیستم مدیریت کنند. اگر در این شرایط هر گونه یک پاسخ مشخص و متفاوت از بقیه گونه ها داشته باشد رسیدن به یک الگوی مدیریتی برای همه گونه ها بسیار سخت است. ولی اگر بتوان گونهها را بر اساس شباهت هایی که با یکدیگر دارند در گروه های خاصی قرار داد می توان بر اساس پاسخ هر گروه، به الگوی مدیریتی آسانتری دست یافت.
هدف از طبقهبندی استخراج گروه هایی از افراد یا گونه ها است که افراد هر گروه از لحاظ یک یا چند متغیر شبیه به هم بوده و افراد بین گروهها از این نظر با یکدیگر متفاوت باشند.
روشهای طبقهبندی نوعی از تحلیل داد هها به شمار می آیند که مناطق مختلف، گونههای گیاهی و حیوانی مختلف، ویژگی های مربوط به آنها و یا متغیرهای محیطی را طبقهبندی می کند. در حقیقت افراد و یا گونههای درون هر گروه همگن هستند. این همگنی یا شباهت به عنوان رفتارهای اکولوژیکی یکسان تفسیر میشود و تفاوت بین گروه ها نیز اختلافات اکولوژیکی بین گروه ها تفسیر می شود. به طورکلی روشهای تشخیص و تیپ بندی جوامع گیاهی همان روش های طبقهبندی هستند که هدف آنها قرار دادن گونه های گیاهی بر اساس ترکیب فلورستیکی آنها است که حاصل آن گروههایی است که گونه های درون هر گروه شباهت زیادی به یکدیگر دارند.
موارد فوق ضرروت اکولوژیکی استفاده از روشهای طبقهبندی را نشان می ده د. این ضرورت وقتی بیشتر نمایان می شود که یک فرد از چندین ویژگی برای طبقهبندی افراد خود استفاده میکند. با یک مثال ساده به این موضوع می پردازیم. فرض کنید از یک فرد خواسته می شود کهافراد را بر اساس نوع جنس طبقهبندی کند. برای این کار وی افراد را به دو گروه جنس مذکر وجنس مونث تقسیم میکند. در این شرایط وی افراد را تنها با در نظر گرفتن یک متغیر طبقهبندیکرده است. حال فرض کنید از وی خواسته میشود طبقهبندی افراد را علاوه بر جنس، همزمان براساس متغیرهای سن، وزن، قد و سطح تحصیلات انجام دهد. در این شرایط طبقهبندی افراد بهراحتی قبل نیست و وی باید از روشهایی استفاده کند که همه متغیرها را در جداسازی طبقات لحاظ کند. این موضوع در ارتباط با طبقهبندی متغیرهای محیطی نیز صحت دارد. برای مثال اگراز یک اکولوژیست بخواهد که گو نههای گیاهی خود را تنها بر اساس شکل رویشی طبقهبندی کند چندین گروه شامل گروه گیاهان درختی، گروه درختچه ای و بوته ای، گروه گندمیان و پهن برگان تقسیم میکند. حال فرض کنید که از وی بخواهند علاوه بر شکل رویشی، ویژگی های دیگری نظیر طول دوره رویش، فنولوژی، خصوصیات تاج پوشش، خصوصیات بذر و غیره را در طبقهبندی لحاظ کند. مشخص است که وی در این شرایط به راحتی نمیتواند گونههای شبیه به هم را استخراج کند و در یک گروه قرار دهد و از گونههای دیگر متمایز نماید. در نتیجه استفادهاز روشهایی که بتواند با در نظر گرفتن همه ویژگی ها گو نهها مشابه را استخراج کرد و در یک گروه قرار داد مورد نیاز است. در بسیاری از موارد افرادی وجود دارند که به هیچکدام از طبقات استخراجی تعلق ندارند و از آنها میتوان به عنوان افراد پرت یاد کرد (شکل 1 ب). چگونگی برخورد محقق با این نوع دادهها بستگی به اهداف وی از تحقیق، روش مورد استفاده در طبقهبندیو ارزش اکولوژیکی این دادههای پرت دارد. در بسیاری از موارد نیز الگوی مشخصی در ارتباطات بین افراد نمونه برداری برای انجام عمل طبقهبندی وجود ندارد. در این شرایط نیز محقق برای استخراج طبقات باید احتیاط لازم هم از نظر روش مورد استفاده و هم از نظر چگونگی استخراج الگوهای موجود در دادهها باید داشته باشد.
شکل فوق سه الگوی متفاوت در طبقهبندی افراد را نشان می دهد. در شکل (الف) تعریف طب قهبندی (همگنی افراد درون طبقات) کاملاً لحاظ شده است. در شکل (ب) وجود افراد پرت از قدرت طبقه بندی کاسته است، اکثر دادههای محیطی چنین شکلی را دارند. در شکل (ج) طبقهبندی بسیار سخت بوده و بسته به هدف محقق روش طبقهبندی مناسبی برای استخراج الگوهای محیطی باید انتخاب شود.
مطالب مرتبط
برچسب ها : Data Mining, Data Mining in matlab, Data Mining در متلب, آموزش Data Mining, خوشه بندی, خوشه بندی داده ها, خوشه بندی داده های محیطی
دیدگاهتان را بنویسید
نشانی ایمیل منتشر نخواهد شد
مطالب جدید
- دیتابیس جامع مواد اپتیکی
- نرم افزار Milestone XProtect 2024 R2 نظارت بر دوربین امنیتی
- نرم افزار LightTools 2024.09 طراحی سیستمهای نوری
- نرم افزار Rsoft 2024.09 شبیه سازی فوتونیکی و اپتیک
- نرم افزار CODE V 2024.09 طراحی و شبیه سازی اپتیکی
- نرم افزار ImSym 2024.09 شبیهسازی سیستم تصویربرداری
- نرم افزار INSUL v10 2024 تحلیل عملکرد عایق صوتی
- نرم افزار SPACE GASS v14.2 2024 طراحی و تحلیل سازه
- نرم افزار CHECKWIND v8.1.6 2024 تحلیل بار باد
- نرم افزار CHECKSTEEL v4.1.6 2024 طراحی و تحلیل سازههای فولادی
مطالب پربازدید
مطالب تصادفی
- نرم افزار PRO_SAP 23.6 طراحی و تحلیل سازهها
- نرم افزار طراحی پمپ SubPUMP 2022
- نرم افزار ThermoFlow تحلیل و بهینهسازی سیستمهای حرارتی
- دانلود پکر MoleBox Ultra 4.1900
- نرم افزار حل معادلات ODE
- فیلم آموزش تراشکاری
- نرم افزار Enerplot تحلیل دادههای شبیهسازی شده و اندازهگیری شده
- نرمافزار Xitron Navigator GPS v13 2023 پیش چاپ با تکنولوژی Harlequin RIP
- نرم افزار CHECKWIND v8.1.6 2024 تحلیل بار باد
- نرم افزار Polysun 2024.8 شبیهسازی و تحلیل و بهینه سازی سیستمهای تولید انرژی