خوشه بندی داده های محیطی
- 1393/03/15
- دیدگاهها برای خوشه بندی داده های محیطی بسته هستند
خوشه بندی و طبقه بندی از جمله روشهای پر کاربرد در تجزیه و تحلیل دادهها است. استخراج الگوهای موجود در دادهها از طریق گروه بندی افراد و متغیر ها، هدف اصلی این روشها عنوان شده است. خوشه بندی و طبقهبندی شامل روشهای بسیار متنوعی است که در بسیاری از علوم مورد استفاده قرار می گیرد. این روشها از نظر هدف کار، الگوریتم مورد استفاده و نمایش نتایج با یکدیگر متفاوت هستند. اگرچه مقالات و کتابهای زیادی در علوم مختلف در ارتباط با روشهای خوشه بندی و طبقهبندی نوشته شده است، کتابی که این روشها را در علوم محیطی و به ویژه بومشناسی ارائه کند وجود ندارد. علاوه بر این، اکثر محققان و دانشحویان در انتخاب صحیح روش خوشه بندی مشکل دارند، چرا که عدم انتخاب صحیح یک روش از میان روشهای متنوعی که وجود دارد موجب گمراهی و استخراج ناصحیح الگوها، به ویژه در دادههای بومشناسی میشود.
خوشه بندی و طبقه بندی
مقدمه
انسان به طور ذاتی با مشاهده پدیدههای طبیعی به دنبال مقایسه و تقسیمبندی آنها به گروههای مختلف است. در حقیقت ذهن انسان با مواجهشدن با مسائل پیچیده شروع به طبقهبندی مشاهدات با استفاده از ویژگیهای آنها میکند. این موضوع در علوم مختلف مانند پزشکی، زیستشناسی (دستهبندی حیوانات و گیاهان از روی ویژگی آنها)، مدیریت، برنامهریزی و نقشهبرداری شهری(City-Planning)، مطالعات زلزلهنگاری (تشخیص مناطق حادثهخیز بر اساس مشاهدات قبلی)، داده کاوی (Data Mining)،کشف اطلاعات و ساختار جدید از دادههای موجود در تشخیص گفتارSpeech Recognition)) در تفسیر و تقسیمبندی تصاویر((Image Segmentation and processing و علوم محیطی و منابع طبیعی کاربرد دارد. در این علوم وقتی محقق به دنبال شناخت سیستم مورد بررسی خود است متغیرهای زیادی را جمعآوری میکند. وی به این موضوع فکر میکند که چگونه میتواند به پاسخ سیستم خود به شرایط بیرونی سیستم و همچنین چگونگیتأثیر سیستم خود بر شرایط بیرونی پی ببرد. برای رسیدن به این منظور، اولین کاری که به نظر وی میرسد طبقهبندی متغیرهایی است که جمعآوری کرده است و بر این اساس به دنبال استخراج گروههایی است که هر گروه خود نمایانگر خصوصیتی از سیستم مورد مطالعه است.
بوم شناسان اغلب علاقمند به استفاده از روشهایی هستند که روابط موجود در سیستمهای اکولوژیکی پیچیده را نمایش دهند. در بیشتر موارد این امر مستلزم قرار دادن گونهها در دو یا چند گروه است که بر اساس آن بتوانند ابعاد پیچیدگی سیستم خود را کاهش دهند. به عبارت دیگر نمایش روابط موجود در سیستم اکولوژیکی با داشتن چندین گونه و چندین ویژگی از آنها بسیار سخت است. آنها از تعداد زیاد گونه دو یا چند گروه استخراج میکنند که از این طریق، استخراج روابط موجود در سیستم آنها آسانتر میشود. اگرچه در روشهای درج بندی نیز یکی از اهداف مهم کاهش تعداد متغیرها (ابعاد) برای رسیدن به درك مناسبی از الگوهای موجود در سیستم است ولی در نهایت طبقات مشخصی استخراج نمیشوند.
در مطالعات بومشناسی، دادهها دارای اطلاعات اضافی هستند که همه آنها در تحلیل به کار نمیرود. دلیل این امر این است که برای مثال گونههای زیادی هستند که دارای رفتارهای منحصربهفرد در طول یک شیب تغییرات محیطی یا فعالیتهای مدیریتی هستند. لحاظ کردن پاسخ تکتک این گو نهها احتمال گمراه کردن محقق در استخراج الگوی پاسخ اصلی را افزایش میدهد. از طرف دیگر این امکان وجود دارد که تحلیل بر اساس پاسخ تکتک گونهها بسیار مبهم و گیج کننده باشد. بوم شناسان در بسیاری از موارد به دنبال راهی هستند که بتوانند به طور همزمان صدها گونه را در یک اکوسیستم مدیریت کنند. اگر در این شرایط هر گونه یک پاسخ مشخص و متفاوت از بقیه گونه ها داشته باشد رسیدن به یک الگوی مدیریتی برای همه گونه ها بسیار سخت است. ولی اگر بتوان گونهها را بر اساس شباهت هایی که با یکدیگر دارند در گروه های خاصی قرار داد می توان بر اساس پاسخ هر گروه، به الگوی مدیریتی آسانتری دست یافت.
هدف از طبقهبندی استخراج گروه هایی از افراد یا گونه ها است که افراد هر گروه از لحاظ یک یا چند متغیر شبیه به هم بوده و افراد بین گروهها از این نظر با یکدیگر متفاوت باشند.
روشهای طبقهبندی نوعی از تحلیل داد هها به شمار می آیند که مناطق مختلف، گونههای گیاهی و حیوانی مختلف، ویژگی های مربوط به آنها و یا متغیرهای محیطی را طبقهبندی می کند. در حقیقت افراد و یا گونههای درون هر گروه همگن هستند. این همگنی یا شباهت به عنوان رفتارهای اکولوژیکی یکسان تفسیر میشود و تفاوت بین گروه ها نیز اختلافات اکولوژیکی بین گروه ها تفسیر می شود. به طورکلی روشهای تشخیص و تیپ بندی جوامع گیاهی همان روش های طبقهبندی هستند که هدف آنها قرار دادن گونه های گیاهی بر اساس ترکیب فلورستیکی آنها است که حاصل آن گروههایی است که گونه های درون هر گروه شباهت زیادی به یکدیگر دارند.
موارد فوق ضرروت اکولوژیکی استفاده از روشهای طبقهبندی را نشان می ده د. این ضرورت وقتی بیشتر نمایان می شود که یک فرد از چندین ویژگی برای طبقهبندی افراد خود استفاده میکند. با یک مثال ساده به این موضوع می پردازیم. فرض کنید از یک فرد خواسته می شود کهافراد را بر اساس نوع جنس طبقهبندی کند. برای این کار وی افراد را به دو گروه جنس مذکر وجنس مونث تقسیم میکند. در این شرایط وی افراد را تنها با در نظر گرفتن یک متغیر طبقهبندیکرده است. حال فرض کنید از وی خواسته میشود طبقهبندی افراد را علاوه بر جنس، همزمان براساس متغیرهای سن، وزن، قد و سطح تحصیلات انجام دهد. در این شرایط طبقهبندی افراد بهراحتی قبل نیست و وی باید از روشهایی استفاده کند که همه متغیرها را در جداسازی طبقات لحاظ کند. این موضوع در ارتباط با طبقهبندی متغیرهای محیطی نیز صحت دارد. برای مثال اگراز یک اکولوژیست بخواهد که گو نههای گیاهی خود را تنها بر اساس شکل رویشی طبقهبندی کند چندین گروه شامل گروه گیاهان درختی، گروه درختچه ای و بوته ای، گروه گندمیان و پهن برگان تقسیم میکند. حال فرض کنید که از وی بخواهند علاوه بر شکل رویشی، ویژگی های دیگری نظیر طول دوره رویش، فنولوژی، خصوصیات تاج پوشش، خصوصیات بذر و غیره را در طبقهبندی لحاظ کند. مشخص است که وی در این شرایط به راحتی نمیتواند گونههای شبیه به هم را استخراج کند و در یک گروه قرار دهد و از گونههای دیگر متمایز نماید. در نتیجه استفادهاز روشهایی که بتواند با در نظر گرفتن همه ویژگی ها گو نهها مشابه را استخراج کرد و در یک گروه قرار داد مورد نیاز است. در بسیاری از موارد افرادی وجود دارند که به هیچکدام از طبقات استخراجی تعلق ندارند و از آنها میتوان به عنوان افراد پرت یاد کرد (شکل 1 ب). چگونگی برخورد محقق با این نوع دادهها بستگی به اهداف وی از تحقیق، روش مورد استفاده در طبقهبندیو ارزش اکولوژیکی این دادههای پرت دارد. در بسیاری از موارد نیز الگوی مشخصی در ارتباطات بین افراد نمونه برداری برای انجام عمل طبقهبندی وجود ندارد. در این شرایط نیز محقق برای استخراج طبقات باید احتیاط لازم هم از نظر روش مورد استفاده و هم از نظر چگونگی استخراج الگوهای موجود در دادهها باید داشته باشد.
شکل فوق سه الگوی متفاوت در طبقهبندی افراد را نشان می دهد. در شکل (الف) تعریف طب قهبندی (همگنی افراد درون طبقات) کاملاً لحاظ شده است. در شکل (ب) وجود افراد پرت از قدرت طبقه بندی کاسته است، اکثر دادههای محیطی چنین شکلی را دارند. در شکل (ج) طبقهبندی بسیار سخت بوده و بسته به هدف محقق روش طبقهبندی مناسبی برای استخراج الگوهای محیطی باید انتخاب شود.
مطالب مرتبط
برچسب ها : Data Mining, Data Mining in matlab, Data Mining در متلب, خوشه بندی, خوشه بندی داده ها, خوشه بندی داده های محیطی
دیدگاهتان را بنویسید
نشانی ایمیل منتشر نخواهد شد
مطالب جدید
- eRCM Thermo 1.11.4 تحلیل عملکرد و ترمودینامیک کمپرسور
- eRCM Pro 1.29.2 تحلیل کمپرسور در صنایع گاز و پتروشیمی
- EdgeWise 5.9 بازسازی و مستندسازی تاسیسات صنعتی
- JMP 19.0.1 تحلیل آماری و مدلسازی پیشرفته
- ATIR STRAP 15 طراحی و تحلیل سازه های فولادی و بتن
- OmicsBox 3.5.3 پلتفرم پیشرفته بیوانفورماتیک
- Datamine Studio RM 3 ارزیابی ذخایر معدنی
- woodLAB 24.1 طراحی و تولید مبلمان سفارشی
- Synopsys VCS Verilog Simulator 2025.06 شبیهساز پیشرفته Verilog
- Gurobi 13 شتابدهنده محاسبات ریاضی
مطالب پربازدید
- دانلود کتاب هیدرولیک و پنوماتیک فستو Festo فارسی
- دانلود استاندارد
- دانلود نرم افزار کلید فولاد (Key to Steel) پرتابل
- دانلود فول استاندارد ASTM بصورت رایگان
- آموزش میکروکنترلر AVR
- دانلود آنتی ویروس شورتکات (Back 2 Normal)
- دانلود جدول استاندارد DIN
- دانلود کتاب آموزش Abaqus (فارسی)
- دانلود نرم افزار MATLAB برای آندروید(MATLAB Android)
- فول استاندارد ASME (بروز)
مطالب تصادفی
- فیلم آموزشی ABAQUS (فارسی) محیط Sketch قسمت دوم
- Silvaco IC Design 2024 طراحی مدار مجتمع آنالوگ و دیجیتال
- Keysight Genesys 2025 طراحی مدار RF و مایکروویو
- Symmetry 2025.3 شبیهسازی فرآیندها در نفت و گاز
- PASS EQUIP v3.07 2025 نرم افزار طراحی تجهیزات تحت فشار
- Liquid Filtration 2nd Edition هندبوک فیلتراسیون
- نرم افزار Arena Simulation v16.20 2024 مدلسازی و شبیهسازی فرآیندها
- PROKON 5.3 2025 نرم افزار طراحی و تحلیل سازه
- Typhoon HIL Control Center 2025.4 توسعه سامانههای هوشمند
- نرم افزار CLiq 2025 تحلیل پدیده روانگرایی خاک


