خوشه بندی داده های محیطی

3702 بازدید

خوشه بندی و طبقه بندی از جمله روشهای پر کاربرد در تجزیه و تحلیل داده‌ها است. استخراج الگوهای موجود در داده‌ها از طریق گروه بندی افراد و متغیر ها، هدف اصلی این روشها عنوان شده است. خوشه بندی و طبقه‌بندی شامل روشهای بسیار متنوعی است که در بسیاری از علوم مورد استفاده قرار می گیرد. این روشها از نظر هدف کار، الگوریتم مورد استفاده و نمایش نتایج با یکدیگر متفاوت هستند. اگرچه مقالات و کتاب‌های زیادی در علوم مختلف در ارتباط با روش‌های خوشه بندی و طبقه‌بندی نوشته شده است، کتابی که این روش‌ها را در علوم محیطی و به ویژه بوم‌شناسی ارائه کند وجود ندارد. علاوه بر این، اکثر محققان و دانشحویان در انتخاب صحیح روش خوشه بندی مشکل دارند، چرا که عدم انتخاب صحیح یک روش از میان روش‌های متنوعی که وجود دارد موجب گمراهی و استخراج ناصحیح الگوها، به ویژه در داده‌های بوم‌شناسی می‌شود.

خوشه بندی و طبقه بندی

مقدمه

انسان به طور ذاتی با مشاهده پدیده‌های طبیعی به دنبال مقایسه و تقسیم‌بندی آن‌ها به گروه‌های مختلف است. در حقیقت ذهن انسان با مواجه‌شدن با مسائل پیچیده شروع به طبقه‌بندی مشاهدات با استفاده از ویژگی‌های آن‌ها می‌کند. این موضوع در علوم مختلف مانند پزشکی، زیست‌شناسی (دسته‌بندی حیوانات و گیاهان از روی ویژگی آن‌ها)، مدیریت، برنامه‌ریزی و نقشه‌برداری شهری(City-Planning)، مطالعات زلزله‌نگاری (تشخیص مناطق حادثه‌خیز بر اساس مشاهدات قبلی)، داده کاوی (Data Mining)،کشف اطلاعات و ساختار جدید از داده‌های موجود در تشخیص گفتارSpeech Recognition)) در تفسیر و تقسیم‌بندی تصاویر((Image Segmentation and processing و علوم محیطی و منابع طبیعی کاربرد دارد. در این علوم وقتی محقق به دنبال شناخت سیستم مورد بررسی خود است متغیرهای زیادی را جمع‌آوری می‌کند. وی به این موضوع فکر می‌کند که چگونه می‌تواند به پاسخ سیستم خود به شرایط بیرونی سیستم و همچنین چگونگیتأثیر سیستم خود بر شرایط بیرونی پی ببرد. برای رسیدن به این منظور، اولین کاری که به نظر وی می‌رسد طبقه‌بندی متغیرهایی است که جمع‌آوری کرده است و بر این اساس به دنبال استخراج گروه‌هایی است که هر گروه خود نمایانگر خصوصیتی از سیستم مورد مطالعه است.

بوم شناسان اغلب علاقمند به استفاده از روش‌هایی هستند که روابط موجود در سیستم‌‌های اکولوژیکی پیچیده را نمایش دهند. در بیشتر موارد این امر مستلزم قرار دادن گونه‌ها در دو یا چند گروه است که بر اساس آن بتوانند ابعاد پیچیدگی سیستم خود را کاهش دهند. به عبارت دیگر نمایش روابط موجود در سیستم اکولوژیکی با داشتن چندین گونه و چندین ویژگی از آن‌ها بسیار سخت است. آن‌ها از تعداد زیاد گونه دو یا چند گروه استخراج می‌کنند که از این طریق، استخراج روابط موجود در سیستم آن‌ها آسان‌تر می‌شود. اگرچه در روش‌های درج بندی نیز یکی از اهداف مهم کاهش تعداد متغیرها (ابعاد) برای رسیدن به درك مناسبی از الگوهای موجود در سیستم است ولی در نهایت طبقات مشخصی استخراج نمی‌شوند.

در مطالعات بوم‌شناسی، داده‌ها دارای اطلاعات اضافی هستند که همه آن‌ها در تحلیل به کار نمی‌رود. دلیل این امر این است که برای مثال گونه‌های زیادی هستند که دارای رفتارهای منحصربه‌فرد در طول یک شیب تغییرات محیطی یا فعالیت‌های مدیریتی هستند. لحاظ کردن پاسخ تک‌تک این گو نه‌ها احتمال گمراه کردن محقق در استخراج الگوی پاسخ اصلی را افزایش می‌دهد. از طرف دیگر این امکان وجود دارد که تحلیل بر اساس پاسخ تک‌تک گونه‌ها بسیار مبهم و گیج کننده باشد. بوم شناسان در بسیاری از موارد به دنبال راهی هستند که بتوانند به طور همزمان صدها گونه را در یک اکوسیستم مدیریت کنند. اگر در این شرایط هر گونه یک پاسخ مشخص و متفاوت از بقیه گونه ها داشته باشد رسیدن به یک الگوی مدیریتی برای همه گونه ها بسیار سخت است. ولی اگر بتوان گونه‌ها را بر اساس شباهت هایی که با یکدیگر دارند در گروه های خاصی قرار داد می توان بر اساس پاسخ هر گروه، به الگوی مدیریتی آسانتری دست یافت.

هدف از طبقه‌بندی استخراج گروه هایی از افراد یا گونه ها است که افراد هر گروه از لحاظ یک یا چند متغیر شبیه به هم بوده و افراد بین گروهها از این نظر با یکدیگر متفاوت باشند.

روشهای طبقه‌بندی نوعی از تحلیل داد هها به شمار می آیند که مناطق مختلف، گونه‌های گیاهی و حیوانی مختلف، ویژگی های مربوط به آنها و یا متغیرهای محیطی را طبقه‌بندی می کند. در حقیقت افراد و یا گونه‌های درون هر گروه همگن هستند. این همگنی یا شباهت به عنوان رفتارهای اکولوژیکی یکسان تفسیر می‌شود و تفاوت بین گروه ها نیز اختلافات اکولوژیکی بین گروه ها تفسیر می شود. به طورکلی روشهای تشخیص و تیپ بندی جوامع گیاهی همان روش های طبقه‌بندی هستند که هدف آن‌ها قرار دادن گونه های گیاهی بر اساس ترکیب فلورستیکی آن‌ها است که حاصل آن گروههایی است که گونه های درون هر گروه شباهت زیادی به یکدیگر دارند.

موارد فوق ضرروت اکولوژیکی استفاده از روشهای طبقه‌بندی را نشان می ده د. این ضرورت وقتی بیشتر نمایان می شود که یک فرد از چندین ویژگی برای طبقه‌بندی افراد خود استفاده می‌کند. با یک مثال ساده به این موضوع می پردازیم. فرض کنید از یک فرد خواسته می شود کهافراد را بر اساس نوع جنس طبقه‌بندی کند. برای این کار وی افراد را به دو گروه جنس مذکر وجنس مونث تقسیم می‌کند. در این شرایط وی افراد را تنها با در نظر گرفتن یک متغیر طبقه‌بندیکرده است. حال فرض کنید از وی خواسته می‌شود طبقه‌بندی افراد را علاوه بر جنس، همزمان براساس متغیرهای سن، وزن، قد و سطح تحصیلات انجام دهد. در این شرایط طبقه‌بندی افراد بهراحتی قبل نیست و وی باید از روشهایی استفاده کند که همه متغیرها را در جداسازی طبقات لحاظ کند. این موضوع در ارتباط با طبقه‌بندی متغیرهای محیطی نیز صحت دارد. برای مثال اگراز یک اکولوژیست بخواهد که گو نههای گیاهی خود را تنها بر اساس شکل رویشی طبقه‌بندی کند چندین گروه شامل گروه گیاهان درختی، گروه درختچه ای و بوته ای، گروه گندمیان و پهن برگان تقسیم می‌کند. حال فرض کنید که از وی بخواهند علاوه بر شکل رویشی، ویژگی های دیگری نظیر طول دوره رویش، فنولوژی، خصوصیات تاج پوشش، خصوصیات بذر و غیره را در طبقه‌بندی لحاظ کند. مشخص است که وی در این شرایط به راحتی نمی‌تواند گونه‌های شبیه به هم را استخراج کند و در یک گروه قرار دهد و از گونه‌های دیگر متمایز نماید. در نتیجه استفادهاز روشهایی که بتواند با در نظر گرفتن همه ویژگی ها گو نه‌ها مشابه را استخراج کرد و در یک گروه قرار داد مورد نیاز است. در بسیاری از موارد افرادی وجود دارند که به هیچکدام از طبقات استخراجی تعلق ندارند و از آن‌ها میتوان به عنوان افراد پرت یاد کرد (شکل 1 ب). چگونگی برخورد محقق با این نوع داده‌ها بستگی به اهداف وی از تحقیق، روش مورد استفاده در طبقه‌بندیو ارزش اکولوژیکی این داده‌های پرت دارد. در بسیاری از موارد نیز الگوی مشخصی در ارتباطات بین افراد نمونه برداری برای انجام عمل طبقه‌بندی وجود ندارد. در این شرایط نیز محقق برای استخراج طبقات باید احتیاط لازم هم از نظر روش مورد استفاده و هم از نظر چگونگی استخراج الگوهای موجود در داده‌ها باید داشته باشد.

khoshe bandi

شکل فوق سه الگوی متفاوت در طبقه‌بندی افراد را نشان می دهد. در شکل (الف) تعریف طب قهبندی (همگنی افراد درون طبقات) کاملاً لحاظ شده است. در شکل (ب) وجود افراد پرت از قدرت طبقه بندی کاسته است، اکثر داده‌های محیطی چنین شکلی را دارند. در شکل (ج) طبقه‌بندی بسیار سخت بوده و بسته به هدف محقق روش طبقه‌بندی مناسبی برای استخراج الگوهای محیطی باید انتخاب شود.

 

مطالب مرتبط

دیدگاهتان را بنویسید

بخش های مورد نیاز علامت گذاری شده اند

نشانی ایمیل منتشر نخواهد شد

نویسنده : آدرس سایت : ایمیل :
کد روبرو را وارد نمایید
captcha


0

شبکه های اجتماعی

دانشنامه تخصصی مهندسی ایران را در شبکه های اجتماعی دنبال کنید

0 0

همکاران ما

گروه مپنا
گروه مپنا
دانشگاه تهران
دانشگاه تهران
سایپا
سایپا
ایران خودرو
ایران خودرو
شرکت ملی نفت ایران
شرکت ملی نفت ایران
ذوب‌آهن اصفهان
ذوب‌آهن اصفهان
فولاد خوزستان
فولاد خوزستان
درخواست نرم افزار
در صورتی که نیاز به نرم افزار خاصی دارید، با ما تماس بگیرید.
    همکاران ما در سریع ترین زمان ممکن پاسخگو شما خواهند بود.