خوشه بندی داده های محیطی
- 1393/03/15
- دیدگاهها برای خوشه بندی داده های محیطی بسته هستند
خوشه بندی و طبقه بندی از جمله روشهای پر کاربرد در تجزیه و تحلیل دادهها است. استخراج الگوهای موجود در دادهها از طریق گروه بندی افراد و متغیر ها، هدف اصلی این روشها عنوان شده است. خوشه بندی و طبقهبندی شامل روشهای بسیار متنوعی است که در بسیاری از علوم مورد استفاده قرار می گیرد. این روشها از نظر هدف کار، الگوریتم مورد استفاده و نمایش نتایج با یکدیگر متفاوت هستند. اگرچه مقالات و کتابهای زیادی در علوم مختلف در ارتباط با روشهای خوشه بندی و طبقهبندی نوشته شده است، کتابی که این روشها را در علوم محیطی و به ویژه بومشناسی ارائه کند وجود ندارد. علاوه بر این، اکثر محققان و دانشحویان در انتخاب صحیح روش خوشه بندی مشکل دارند، چرا که عدم انتخاب صحیح یک روش از میان روشهای متنوعی که وجود دارد موجب گمراهی و استخراج ناصحیح الگوها، به ویژه در دادههای بومشناسی میشود.
خوشه بندی و طبقه بندی
مقدمه
انسان به طور ذاتی با مشاهده پدیدههای طبیعی به دنبال مقایسه و تقسیمبندی آنها به گروههای مختلف است. در حقیقت ذهن انسان با مواجهشدن با مسائل پیچیده شروع به طبقهبندی مشاهدات با استفاده از ویژگیهای آنها میکند. این موضوع در علوم مختلف مانند پزشکی، زیستشناسی (دستهبندی حیوانات و گیاهان از روی ویژگی آنها)، مدیریت، برنامهریزی و نقشهبرداری شهری(City-Planning)، مطالعات زلزلهنگاری (تشخیص مناطق حادثهخیز بر اساس مشاهدات قبلی)، داده کاوی (Data Mining)،کشف اطلاعات و ساختار جدید از دادههای موجود در تشخیص گفتارSpeech Recognition)) در تفسیر و تقسیمبندی تصاویر((Image Segmentation and processing و علوم محیطی و منابع طبیعی کاربرد دارد. در این علوم وقتی محقق به دنبال شناخت سیستم مورد بررسی خود است متغیرهای زیادی را جمعآوری میکند. وی به این موضوع فکر میکند که چگونه میتواند به پاسخ سیستم خود به شرایط بیرونی سیستم و همچنین چگونگیتأثیر سیستم خود بر شرایط بیرونی پی ببرد. برای رسیدن به این منظور، اولین کاری که به نظر وی میرسد طبقهبندی متغیرهایی است که جمعآوری کرده است و بر این اساس به دنبال استخراج گروههایی است که هر گروه خود نمایانگر خصوصیتی از سیستم مورد مطالعه است.
بوم شناسان اغلب علاقمند به استفاده از روشهایی هستند که روابط موجود در سیستمهای اکولوژیکی پیچیده را نمایش دهند. در بیشتر موارد این امر مستلزم قرار دادن گونهها در دو یا چند گروه است که بر اساس آن بتوانند ابعاد پیچیدگی سیستم خود را کاهش دهند. به عبارت دیگر نمایش روابط موجود در سیستم اکولوژیکی با داشتن چندین گونه و چندین ویژگی از آنها بسیار سخت است. آنها از تعداد زیاد گونه دو یا چند گروه استخراج میکنند که از این طریق، استخراج روابط موجود در سیستم آنها آسانتر میشود. اگرچه در روشهای درج بندی نیز یکی از اهداف مهم کاهش تعداد متغیرها (ابعاد) برای رسیدن به درك مناسبی از الگوهای موجود در سیستم است ولی در نهایت طبقات مشخصی استخراج نمیشوند.
در مطالعات بومشناسی، دادهها دارای اطلاعات اضافی هستند که همه آنها در تحلیل به کار نمیرود. دلیل این امر این است که برای مثال گونههای زیادی هستند که دارای رفتارهای منحصربهفرد در طول یک شیب تغییرات محیطی یا فعالیتهای مدیریتی هستند. لحاظ کردن پاسخ تکتک این گو نهها احتمال گمراه کردن محقق در استخراج الگوی پاسخ اصلی را افزایش میدهد. از طرف دیگر این امکان وجود دارد که تحلیل بر اساس پاسخ تکتک گونهها بسیار مبهم و گیج کننده باشد. بوم شناسان در بسیاری از موارد به دنبال راهی هستند که بتوانند به طور همزمان صدها گونه را در یک اکوسیستم مدیریت کنند. اگر در این شرایط هر گونه یک پاسخ مشخص و متفاوت از بقیه گونه ها داشته باشد رسیدن به یک الگوی مدیریتی برای همه گونه ها بسیار سخت است. ولی اگر بتوان گونهها را بر اساس شباهت هایی که با یکدیگر دارند در گروه های خاصی قرار داد می توان بر اساس پاسخ هر گروه، به الگوی مدیریتی آسانتری دست یافت.
هدف از طبقهبندی استخراج گروه هایی از افراد یا گونه ها است که افراد هر گروه از لحاظ یک یا چند متغیر شبیه به هم بوده و افراد بین گروهها از این نظر با یکدیگر متفاوت باشند.
روشهای طبقهبندی نوعی از تحلیل داد هها به شمار می آیند که مناطق مختلف، گونههای گیاهی و حیوانی مختلف، ویژگی های مربوط به آنها و یا متغیرهای محیطی را طبقهبندی می کند. در حقیقت افراد و یا گونههای درون هر گروه همگن هستند. این همگنی یا شباهت به عنوان رفتارهای اکولوژیکی یکسان تفسیر میشود و تفاوت بین گروه ها نیز اختلافات اکولوژیکی بین گروه ها تفسیر می شود. به طورکلی روشهای تشخیص و تیپ بندی جوامع گیاهی همان روش های طبقهبندی هستند که هدف آنها قرار دادن گونه های گیاهی بر اساس ترکیب فلورستیکی آنها است که حاصل آن گروههایی است که گونه های درون هر گروه شباهت زیادی به یکدیگر دارند.
موارد فوق ضرروت اکولوژیکی استفاده از روشهای طبقهبندی را نشان می ده د. این ضرورت وقتی بیشتر نمایان می شود که یک فرد از چندین ویژگی برای طبقهبندی افراد خود استفاده میکند. با یک مثال ساده به این موضوع می پردازیم. فرض کنید از یک فرد خواسته می شود کهافراد را بر اساس نوع جنس طبقهبندی کند. برای این کار وی افراد را به دو گروه جنس مذکر وجنس مونث تقسیم میکند. در این شرایط وی افراد را تنها با در نظر گرفتن یک متغیر طبقهبندیکرده است. حال فرض کنید از وی خواسته میشود طبقهبندی افراد را علاوه بر جنس، همزمان براساس متغیرهای سن، وزن، قد و سطح تحصیلات انجام دهد. در این شرایط طبقهبندی افراد بهراحتی قبل نیست و وی باید از روشهایی استفاده کند که همه متغیرها را در جداسازی طبقات لحاظ کند. این موضوع در ارتباط با طبقهبندی متغیرهای محیطی نیز صحت دارد. برای مثال اگراز یک اکولوژیست بخواهد که گو نههای گیاهی خود را تنها بر اساس شکل رویشی طبقهبندی کند چندین گروه شامل گروه گیاهان درختی، گروه درختچه ای و بوته ای، گروه گندمیان و پهن برگان تقسیم میکند. حال فرض کنید که از وی بخواهند علاوه بر شکل رویشی، ویژگی های دیگری نظیر طول دوره رویش، فنولوژی، خصوصیات تاج پوشش، خصوصیات بذر و غیره را در طبقهبندی لحاظ کند. مشخص است که وی در این شرایط به راحتی نمیتواند گونههای شبیه به هم را استخراج کند و در یک گروه قرار دهد و از گونههای دیگر متمایز نماید. در نتیجه استفادهاز روشهایی که بتواند با در نظر گرفتن همه ویژگی ها گو نهها مشابه را استخراج کرد و در یک گروه قرار داد مورد نیاز است. در بسیاری از موارد افرادی وجود دارند که به هیچکدام از طبقات استخراجی تعلق ندارند و از آنها میتوان به عنوان افراد پرت یاد کرد (شکل 1 ب). چگونگی برخورد محقق با این نوع دادهها بستگی به اهداف وی از تحقیق، روش مورد استفاده در طبقهبندیو ارزش اکولوژیکی این دادههای پرت دارد. در بسیاری از موارد نیز الگوی مشخصی در ارتباطات بین افراد نمونه برداری برای انجام عمل طبقهبندی وجود ندارد. در این شرایط نیز محقق برای استخراج طبقات باید احتیاط لازم هم از نظر روش مورد استفاده و هم از نظر چگونگی استخراج الگوهای موجود در دادهها باید داشته باشد.
شکل فوق سه الگوی متفاوت در طبقهبندی افراد را نشان می دهد. در شکل (الف) تعریف طب قهبندی (همگنی افراد درون طبقات) کاملاً لحاظ شده است. در شکل (ب) وجود افراد پرت از قدرت طبقه بندی کاسته است، اکثر دادههای محیطی چنین شکلی را دارند. در شکل (ج) طبقهبندی بسیار سخت بوده و بسته به هدف محقق روش طبقهبندی مناسبی برای استخراج الگوهای محیطی باید انتخاب شود.
مطالب مرتبط
برچسب ها : Data Mining, Data Mining in matlab, Data Mining در متلب, خوشه بندی, خوشه بندی داده ها, خوشه بندی داده های محیطی
دیدگاهتان را بنویسید
نشانی ایمیل منتشر نخواهد شد

مطالب جدید
- PEL Safety HRA 25 تحلیل قابلیت اطمینان انسانی
- PEL Suite 25 تحلیل مهندسی فرآیند و ایمنی صنعتی
- FlexSim Enterprise 2026 مدیریت سناریوهای پیچیده
- GE Operations Hub 2025 پلتفرم یکپارچه IoT صنعتی
- Ansys Rocky 2026 تحلیل رفتار ذرات در صنعت
- Midas NFX 2026 R1 شبیه سازی چندفیزیکی پیشرفته
- Autodesk Vehicle Tracking 2027 طراحی شهری و برنامه ریزی ترافیک
- MUDPRO 4.7.14 بهینه سازی عملیات حفاری نفت و گاز
- ANSYS SimAI Pro 2026 R1 شبیه سازی با هوش مصنوعی
- Enterprise Dynamics 10.6.1 شبیه سازی سیستم های صنعتی

مطالب پربازدید
- دانلود کتاب هیدرولیک و پنوماتیک فستو Festo فارسی
- دانلود استاندارد
- دانلود نرم افزار کلید فولاد (Key to Steel) پرتابل
- دانلود فول استاندارد ASTM بصورت رایگان
- آموزش میکروکنترلر AVR
- دانلود آنتی ویروس شورتکات (Back 2 Normal)
- دانلود جدول استاندارد DIN
- دانلود کتاب آموزش Abaqus (فارسی)
- فول استاندارد ASME (بروز)
- دانلود نرم افزار MATLAB برای آندروید(MATLAB Android)

مطالب تصادفی
- EasyPower 2025 طراحی سیستم های قدرت
- ChairsideCAD 3.1 طراحی و تولید پروتز ایمپلنت
- نرم افزار ThermoFlow تحلیل و بهینهسازی سیستمهای حرارتی
- Machinery’s Handbook هندبوک ماشینکاری
- CopperCAM 2025 راهکار حرفهای ماشینکاری PCB
- CADSIM Plus 3.4.15 شبیهسازی فرآیندهای پتروشیمی و پالایشگاه
- نرم افزار Omnivue 3.1 درمان و تشخیص به کمک تصاویر DICOM
- نکات کلیدی و حساس در ساخت به روش لوح زنی دقیق
- مجموعه نرم افزارهای مهندسی شماره چهار
- FEMFAT 2025 تحلیل خستگی و اعتبارسنجی قطعات صنعتی





