پایان نامه ارائه روشی جدید در خوشه بندی اطلاعات با استفاده ازترکیب الگوریتم خفاش و Fuzzy c- means

word 2 MB 30894 102
1391 کارشناسی ارشد مهندسی صنایع

قیمت قدیم:۶۶,۰۰۰ تومان

قیمت: ۳۶,۰۰۰ تومان

دانلود فایل

بخشی از محتوا
وضعیت فهرست و منابع

پایان نامه کارشناسی ارشد در رشته مهندسی اتوماسیون و ابزار دقیق

چکیده

ارائه روشی جدید در خوشهبندی اطلاعات با استفاده ازترکیب الگوریتم خفاش و Fuzzy c-means

خوشهبندی قرار دادن دادهها در گروههایی است که اعضای هر گروه از زاویه خاصی به هم شباهت دارند . شباهت بین دادههای درون هر خوشه حداکثر و شباهت بین دادههای درون خوشههای متفاوت حداقل میباشد.

Fuzzy c-means نیز یک تکنیک خوشهبندی فازی است که علیرغم حساس بودن به مقدار دهی اولیه و همگرائی به نقاط بهینه محلی ، به دلیل کارآمد بودن و پیاده سازی آسان، یکی از متداولترین روشها میباشد. در این رساله جهت رفع مشکلات موجود از روش ترکیبی مبتنی بر الگوریتم خفاش و Fuzzy c-means بهره گرفته خواهد شد. به منظور اعتبارسنجی، روش پیشنهادی بر روی چندین داده متفاوت مشهور پیادهسازی میگردد و نتایج با روشهای الگوریتم جستجوی ممنوع، مورچگان، اجتماع ذرات، آبکاری فولاد و k-means مقایسه خواهدگردید. توانایی بالا و مقاوم بودن این روش بر اساس نتایج مشهود خواهد بود.

مقدمه

داده و الگو یکی از شاخصهای بسیار مهم در دنیای اطلاعات هستند و خوشهبندی یکی از بهترین روشهایی است که برای کار با دادهها ارائه شده است. قابلیت آن در ورود به فضای داده و تشخیص ساختار آنها باعث گردیده که خوشه بندی یکی از ایدهآلترین مکانیزمها برای کار با دنیای عظیم دادهها باشد.

در خوشهبندی، نمونهها به دستههایی تقسیم میشوند که از قبل معلوم نیستند. بنابراین، خوشهبندی یک روش یادگیری است که بدون دانش پیشین و مشاهده نمونههای از قبل تعریف شده، دادهها را به صورت خود مختار و مستقل دسته بندی میکند.

خوشه بندی در واقع یافتن ساختار در مجموعه دادههایی است که طبقه بندی نشدهاند. به بیان دیگر خوشهبندی قراردادن دادهها در گروههایی است که اعضای هر گروه از زاویهی خاصی به هم شباهت دارند. در نتیجه شباهت بین دادههای درون هر خوشه حداکثر و شباهت بین دادههای درون خوشههای متفاوت حداقل میباشد. معیار شباهت در اینجا، فاصله بوده یعنی نمونههایی که به یکدیگر نزدیکترهستند، در یک خوشه قرار میگیرند. لذا محاسبهی فاصلهی بین دو داده در خوشهبندی بسیار مهم میباشد؛ زیرا کیفیت نتایج نهایی را دستخوش تغییر قرار خواهد داد.

فاصله که همان معرف عدم تجانس است حرکت در فضای دادهها را میسر میسازد و سبب ایجاد خوشهها میگردد. با محاسبهی فاصلهی بین دو داده، میتوان فهمید که چقدر این دو داده به هم نزدیک هستند و در یک خوشه قرار می گیرند یا نه؟ توابع ریاضی مختلفی برای محاسبهی فاصله وجود دارند؛ فاصله اقلیدسی، فاصله همینگ و ....

1-1-بیان مسأله

خوشهبندی یافتن ساختار، درون مجموعهای از دادههای بدون برچسب است و میتوان آن را به عنوان مهمترین مسأله در یادگیری بدون نظارت در نظر گرفت. ایدهی خوشهبندی اولین بار در دههی 1935 مطرح شد و امروزه با پیشرفتها و جهشهای عظیمی که در آن بهوجود آمده در کاربردها و جنبههای مختلفی حضور یافته است. یک جستجوی ساده در وب یا حتی در پایگاه داده یک کتابخانه، کاربرد شگفت انگیز آن را برای ما آشکار میسازد. الگوریتمهای خوشهبندی در زمینههای مختلفی کاربرد دارد که به عنوان نمونه میتوان موارد زیر را برشمرد:

داده کاوی[1]: کشف اطلاعات و ساختار جدید از داده‌های موجود

تشخیص گفتار[2]: در ساخت کتاب کد از بردارهای ویژگی، در تقسیم کردن گفتار بر حسب گویندگان آن یا فشرده‌سازی گفتار

تقسیم‌بندی تصاویر[3]: تقسیم‌بندی تصاویر پزشکی یا ماهواره‌ای

وب (WWW): دسته‌بندی اسناد و یا دسته‌بندی سایتها و ...

زیست‌‌‌شناسی[4]: دسته‌بندی حیوانات و گیاهان از روی ویژگی‌های آنها

برنامه ریزی شهری[5]: دسته‌بندی خانه‌ها بر اساس نوع و موقعیت جغرافیایی آنها

مطالعات زلزله‌نگاری[6]: تشخیص مناطق حادثه‌خیز بر اساس مشاهدات قبلی

کتابداری: دسته‌بندی کتابها

بیمه: تشخیص افراد متقلب

بازاریابی[7]: دسته‌‌بندی مشتریان به دسته‌هایی بر حسب نیاز آنها از طریق مجموعه آخرین خرید‌های آنان.

با توجه به کاربرد روزافزون خوشهبندی، امروزه شاهد ارائهی روشهای جدید و کارآمدتری هستیم که هر یک برای کاربردی خاص ارائه میشود. ولی با همه این تلاشها هنوز خوشهبندی در بسیاری از علوم آنچنان که باید مورد استفاده قرار نگرفته است و قابلیت گسترش بسیار زیادی برای آن وجود دارد.

1-2-پیشینه تحقیق

ما در جهانی پر از داده زندگی میکنیم و هر روز با حجم وسیعی از ذخیره یا نمایش اطلاعات روبهرو هستیم. یکی از روشهای حیاتی کنترل و مدیریت این دادهها، خوشهبندی میباشد. در این روش دادههایی که دارای خواص مشابه میباشند، درون یک دسته یا یک خوشه قرار میگیرند. اولین بار ایدهی خوشهبندی در دههی 1935 ارائه شد و امروزه با پیشرفتها و جهشهای عظیمی که در آن پدید آمده مورد توجه بسیاری از محققان قرار گرفته است. لذا در کاربردها و جنبههای مختلفی حضور یافته و روشهای مختلفی برای بهرهبرداری از آن مطرح گردیده است [1]. از یک نظر، الگوریتمهای خوشه بندی می تواند در دو دسته کلی تقسیمبندی شوند: خوشه بندی سخت و خوشه بندی فازی. در خوشهبندی سخت یک داده به یک و فقط یک خوشه تعلق میگیرد، درحالیکه در خوشهبندی فازی یک داده ممکن است بطور همزمان به دو خوشه یا بیشتر تعلق داشته باشد [2]، [3]، [4]. الگوریتم Fuzzy c-means یکی از روشهای معروف خوشهبندی فازی محسوب میگردد که به سادگی قابل پیادهسازی میباشد. متأسفانه نسخهی اصل آن دارای محدودیتهایی از جمله وابستگی به مقادیر اولیه و همگرایی به پاسخ بهینه محلی میباشد [5]، [6]. در الگوریتم ژنتیک این محدودیتها از بین رفته است. در عین حال با ترکیب این دو الگوریتم نتایج قابل توجهی حاصل شده است که سرعت همگرایی آن نیز به مراتب از نمونههای قبل بیشتر گردیده است [7]. Kao و همکارانش با ترکیب دو الگوریتم ژنتیک و PSO روشی را ابداع نمود که در آن از عملگر جهش و تقاطع برای ژنتیک بهره گرفته است. این روش توانست مشکلات مختلف توابع پیوسته را رفع نماید. همچنین در یافتن جواب بهینهی سراسری و نسبت همگرایی تغییرات چشمگیری حاصل شده است [8]. با استفاده از ترکیب الگوریتم ژنتیک و روش فازی، روشی توسط عسگریان در سال 1386 مطرح شد. در این روش مشکل وابستگی به تعداد اولیه خوشهها و مکان اولیه مراکز آنها مرتفع و با عدم توانایی خوشهبندی دادههایی که فاصلهی آنها از مراکز چند خوشه به یک اندازه میباشد؛ مقابله گردید. از مزایای دیگر این ترکیب کاهش پیچیدگی محاسبات میباشد [9]. یکی دیگر از روشهای ترکیبی که در مسائل دادهکاوی کاربرد دارد استفاده از ترکیب Fuzzy c-means و PSO میباشد که توانست مشکل همگرایی به بهینهی محلی و سرعت همگرایی را بهبود بخشد [10] ،[11]. از دیگر روشهای ترکیبی جدید ترکیب الگوریتمFCM و الگوریتم مِمتیک فازی است. در راستای بهبود عملکرد خوشهبندی، نتایج حاصل از این تکنیک نشان میدهد که جوابهای بهتری داشته و پایداری آن نیز بالاتر میباشد [12]. ترکیب FCM و SA نمونهای دیگر از روشهای ترکیبی است که در تشخیص سرطان استفاده میشود [13]،[14]،[15]،[16]. در راستای تلاشهای ذکر شده، در این پایاننامه سعی بر آن است تا با استفاده از ترکیب الگوریتمFCM و الگوریتم خفاش از مزایای دو الگوریتم در حل مسائل خوشهبندی بهره گرفته شود.

1-3-هدف تحقیق

هدف در این تحقیق این است که با بررسی الگوریتمهای موجود در زمینه خوشهبندی، الگوریتمی ارائه گردد که تا حد قابل قبولی بتواند محدودیتهای موجود را پوشش دهد. برخی از محدودیتهای موجود را میتوان به شرح ذیل برشمرد:

× کارایی برای پایگاه دادهها با حجم بالا

× کشف خوشهها با اشکال مختلف

× عدم حساسیت به ترتیب دادههای ورودی

× قابلیت تفسیر و استفاده

1-4-اهمیت تحقیق

همزمان با افزایش سیستمهای پایگاه داده و ابزارهای متعدد برای ذخیرهی حجم بالای دادهها نیاز به روشهای خودکار برای کشف دانش از درون دادهها کاملاً احساس میشد. علاوه بر آن به دلیل هزینهی بالای نیروی انسانی و مادی جهت انجام عملیات روی حجم انبوه دادهها ارائه روشهایی با کمترین دخالت کاربر ضروری بود. استخراج اطلاعات مناسب از میان انبوه داده‏ها و تبدیل آنها به دانش مورد نیاز سازمانها - بهویژه در تصمیم‌گیری‏های سازمانی - نیازمند استفاده از روش‏های نوین در این حوزه بود. دادهکاوی[8] یکی از این ابزارهاست که به کشف دانش از پایگاه دادهها کمک می‏کند. میتوان گفت دادهکاوی استخراج اطلاعات معتبر، قابل فهم و قابل اعتماد از پایگاه دادههای بسیار بزرگ است که به کشف الگوهای پنهان و روابط مطمئن بین دادهها و استفاده از آن در تصمیمگیری کمک مینماید. در حقیقت شناخت و دستوپنجه نرم کردن با دادهها یکی از اهداف مهم در دادهکاوی است.

این فرآیند از اواخر دهه 90 مطرح شد و از سال 1995 به صورت جدی وارد مباحث آماری گشت و در حال حاضر جزء مهمترین ابزار بهرهبرداری مؤثر از انبوه دادهها میباشد و اهمیت وجود آن هر روز افزایش مییابد. به عبارت دیگر دادهکاوی، علمی نسبتاً جدید است که از انجام تحقیقات در رشتههای آمار، یادگیری ماشین و علوم کامپیوتر مخصوصاً مدیریت پایگاه دادهها شکل گرفته است.

داده کاوی در سه حوزه مستقل از علوم مورد استفاده قرار میگیرد:

× آمار کلاسیک و الگوهای آماری

× هوش مصنوعی

× یادگیری خودکار و شبکه های عصبی

برای انجام دادهکاوی از ابزار مختلف نظیر تفکیک کردن، دستهبندی، درخت تصمیمگیری، تحلیل قواعد وابستگی، تحلیل خوشهها و الگوریتمهای عمومی استفاده میشود. در ادامه چند نمونه از کاربردهای این فرایند ذکر میگردد که در صورت عدم حضور دادهکاوی، دستیابی به اهداف غیر ممکن میگردید.

×× با استفاده از داده کاوی میتوان کاربرد نمودارهای کنترلی را بهبود بخشید. فرض کنید 4 پارامتر در یک مشخصهی کیفیِ مرتبط با یک قطعهی تولید شده در یک کارخانه، تأثیرگذار باشند و هدف، بهبود کیفیت آن مشخصه باشد. با استفاده از اطلاعات موجود که از حجم بالایی برخوردار می باشد، در صورتیکه کیفیت مشخصهی مذکور از محدوده قابل قبول خارج گردد طبق اصول مرتبط با کنترل کیفیت آماری، لازم است علل مربوط به انحرافات که باعث خروج مشخصهی کیفی از محدودهی کنترلی شده است را شناسایی نموده، و پس از رفع آن، وضعیت دوباره بررسی گردد. عملاً زمان بسیار زیادی در این راه صرف خواهد شد. تکنیک دادهکاوی میتواند با بررسی اطلاعات موجود در مورد 4 پارامتر مذکور به جای استفاده از روشهای قبلی، با رسم نمودار میلهای پارامتری که بیشترین انحراف را نسبت به میانگین خود دارد مورد بررسی قرار داده و با کنترل آن عملاً دامنه را محدود نماید.

کاربرد اصلی دادهکاوی آن است که به جای بررسی حجم بالایی از پارامترهای تأثیر گذار، با خوشه بندی اطلاعات بر اساس اهمیت آنها و تأثیرگذاری آنها بر پارامتر کیفیِ موردنظر، بتوان دامنهی عمل را محدود نموده و در کمترین زمان و با حداقل هزینه به هدف رسید.

×× در موارد پزشکی ارائهی روشهای جدید جهت پیشبینی ابتلای شخص به بیماریهای واگیردار خطرناک با استفاده از اطلاعات اولیهی موجود بسیار ضروری میباشد. پزشکان جهت تشخیص دقیق و مطمئن ابتلای یک شخص به بیماری سل به مدت زمان طولانی احتیاج دارند. اما در این مدت ممکن است شخص مبتلا بیماری ر ا به 10 تا 15 نفر منتقل نماید. بنابراین با بهکارگیری روشهای دادهکاوی میتوان بر اساس اطلاعات به دست آمده از آزمایشات، در ساعات اولیهی مراجعه بیمار احتمال ابتلای وی را تشخیص دهیم. همچنین، از این تکنیکها، در بهدست آوردن روابط مفید جهت جلوگیری از مرگ و میر افراد مبتلا به بیماریهای قلب و عروق، میتوان بهره گرفت [17].

×× در مسائل اقتصادی نیز کاربردهای دادهکاوی به وضوح قابل رؤیت میباشد. با توجه به روند تغییرات در صنعت بانکداری، (رواج بانکداری الکترونیکی) حجم اطلاعات در حال رشد است. با بهرهگیری از این اطلاعات، میتوان عملکردهایی را اتخاذ نمود که در این راستا رضایتمندی دوجانبه از طرف مشتری و بانک بهدست آید. مواردی مانند بازاریابی، حفظ مشتری، تشخیص تقلب، مدیریت ریسک و ... را میتوان برشمرد. به طور نمونه، با توجه به اطلاعات موجود و استفاده از تکنیکهای خوشهبندی میتوان مشتریان خوشحسابتر و سودآورتر را برگزید و با اعطای تسهیلات، آنها را مورد تشویق قرار داد. همچنین مدیران بانک میتوانند احتمال این را که کدام مشتری دارای ریسک بیشتر برای عدم پرداخت وام و بدهی میباشد تشخیص دهند [18].

دادهکاوی الگوهای حاوی اطلاعات را در دادههای موجود جستجو میکند. این الگوها و الگوریتمها میتوانند توصیفی[9] باشند؛ یعنی دادهها را توصیف کنند یا جنبهی پیشبینی[10] داشته باشند. دادهکاوی توصیفی به دنبال یافتن اگرها در فعالیتها و اقدامات گذشته است و دادهکاوی پیش بینانه با نگاه به سابقه، رفتار آینده را پیش بینی میکند.

خوشهبندی دادهها یکی از تکنیکهای دادهکاوی است که در گروه اول (توصیف کننده) قرار میگیرد و برای استخراج مدل از دادهها بهکار گرفته میشود. الگوریتم Fuzzy c-means یکی از روشهای خوشهبندی اطلاعات میباشد که از آن میتوان بهره گرفت. با توجه به اهمیت دادهکاوی در دنیای امروز، ارائهی روشهای جدید که بهوسیلهی آن دادهها مورد استفاده مفید قرار گیرد ضروری است. دراین تحقیق با ترکیب الگوریتم Fuzzy c-means و الگوریتم خفاش به این مهم دست خواهیم یافت.

1-5-گفتارهای پایان نامه

این پایان نامه بصورت زیر تنظیم شده است.

در فصل دوم، روشهای موجود جهت خوشهبندی معرفی خواهد گردید. محاسن و معایب آن بررسی میگردد و در نهایت الگوریتم که در این رساله از آن بهره خواهیم گرفت شرح داده خواهد شد.

در فصل سوم، با تکنیکهای بهینهسازی آشنا شده و کلیهی روشهای تکاملی که در این رساله مورد مقایسه قرار گرفتهاند به طور اجمالی تشریح میگردد. در نهایت الگوریتم رقابت خفاش که اساس این پایاننامه میباشد به تفصیل توضیح داده خواهد شد.

در فصل چهارم، الگوریتم پیشنهادی که مبتنی بر ترکیب الگوریتم Fuzzy c-means و خفاش میباشد، توصیف میگردد.

در فصل پنجم، نتیجهگیری و پیشنهادات برای کارهای آینده آورده خواهد شد.

[1]- Data mining

[2]- Speech Recognition

[3]- Image Segmentation

[4] -Biology

[5] -City-Planning

[6] -Earthquake studies

[7] -Marketing

[8]- Data mining

Descriptive -[9]

Predictive -[10]

ABSTRACT

A new hybrid algorithm for data clustering based on Bat Algorithm and Fuzzy c-means

BY

Clustering is a division of data into groups of similar objects. Each cluster consist of objects that are similar between themselves and dissimilar to objects of other groups. Fuzzy c-means (FCM) algorithm is one of the most popular fuzzy clustering techniques because it is efficient, straightforward and easy to implement. However, FCM is sensitive to initialization and is easily trapped in local optima.

In this thesis, a hybrid fuzzy clustering method based on FCM and Bat algorithm is proposed which make use of the merits of both algorithms.

The new hybrid algorithm is tested on several data sets and its performance is compared with those of ACO, PSO, SA, TS, K-means. Experimental results show that our proposed method is efficient and can reveal encouraging results.
فهرست:

عنوان                                                                                                                صفحه

1- فصل اول: مقدمه ....................................................................................................................................... 2

1-1- بیان مسأله .......................................................................................................................................... 3

1-2- پیشینه تحقیق ..................................................................................................................................... 4

1-3- هدف تحقیق ........................................................................................................................................5

1-4- اهمیت تحقیق .......................................................................................................................................5

1-5- گفتارهای پایان نامه ..............................................................................................................................8

2- فصل دوم: خوشه بندی بر مبنای الگوریتم Fuzzy c-means ...............................................................10

2-1- مقدمه .................................................................................................................................................11

2-2- خوشه بندی اطلاعات ........................................................................................................................11

    2-2-1- تفاوت خوشهبندی و طبفهبندی ..................................................................................................13

    2-2-2-کاربردهای خوشهبندی............................................................................................................... 13

    2-2-3- انواع خوشهها..............................................................................................................................15

    2-2-4- مراحل خوشه بندی ....................................................................................................................15

    2-2-5- انواع روش های خوشه بندی .................................................................................................. 18

    2-2-6- خوشه بندی سلسله مراتبی ...................................................................................................... 18

      2-2-6-1- خوشه بندی سلسله مراتبی تقسیم شونده ............................................................................19

      2-2-6-2- خوشه بندی سلسله مراتبی متراکم شونده ......................................................................... 19

عنوان                                                                                                                   صفحه

    2-2-7- خوشه بندی افرازبندی یا پارتیشنی .............................................................................................22

      2-2-7-1- الگوریتم k-means ...........................................................................................................23

    2-2-8- خوشه بندی همپوشانی................................................................................................................26

      2-2-8-1- خوشه بندی فازی.................................................................................................................27

3- فصل سوم: بهینه سازی بر مبنای الگوریتم خفاش .................................................................................. 33

3-1- مقدمه .............................................................................................................................................. 34

3-2- شرح مسئله بهینه سازی .................................................................................................................. 35

3-3- روش های حل مسائل بهینه سازی ................................................................................................. 39

    3-3-1- الگوریتم بهینهسازی توده ذرات ............................................................................................. 43

    3-3-2- الگوریتم جفت گیری زنبور عسل ........................................................................................... 45

    3-3-3- الگوریتم مورچگان .................................................................................................................. 46

    3-3-4- الگوریتم الگوی جستجوی ممنوع ........................................................................................... 48

    3-3-5-الگوریتم آبکاری فولاد .............................................................................................................. 49

    3-3-6- الگوریتم خفاش ....................................................................................................................... 51

    3-3-7-راهحلهای پیشنهادی برای بهبود عملکرد الگوریتم خفاش ......................................................... 54

   3-3-7-1-انتخاب جمعیت اولیه بر اساس قاعده نولید عدد متضاد ...................................................... 54

     3-3-7-2-استراتژی جهش خود تطبیق ................................................................................................ 55

3-4- معیارهای مقایسه الگوریتمهای بهینهسازی ...................................................................................... 58

      3-4-1- کارایی.................................................................................................................................... 58

      3-4-2- انحراف استاندارد................................................................................................................... 58

      3-4-3- قابلیت اعتماد.......................................................................................................................... 59

      3-4-4- سرعت همگرایی.................................................................................................................... 59



     عنوان                                                                                                            صفحه



3-5-تعریف مسایل عددی گوناگون.......................................................................................................... 60

    3-5-1-تابع Rosenbrock.................................................................................................................. 61

    3-5-2- تابع Schewefel ....................................................................................................................62

    3-5-3- تابع Rastragin ......................................................................................................................63

    3-5-4- تابعAchley .............................................................................................................................64

    3-5-5- تابع Greiwank .......................................................................................................................65

4- فصل چهارم: الگوریتم پیشنهادی ..............................................................................................................66

4-1- مقدمه .............................................................................................................................................. 67

4-2- خوشه بندی اطلاعات به روش ترکیبی پیشنهادی ........................................................................... 68

4-3- تنظیم پارامترهای الگوریتم پیشنهادی .............................................................................................. 71

4-4- بررسی نتایج حاصل از الگوریتم پیشنهادی و مقایسه آن با دیگر الگوریتم ها.................................. 71

    4-4-1- معرفی داده های استفاده شده و نتایج شبیه سازی مربوط به آن ..................................................72

      4-4-1-1- مجموعه داده Iris ............................................................................................................ 72

      4-4-1-2- مجموعه داده Wine ........................................................................................................ 75

      4-4-1-3- مجموعه داده CMC ....................................................................................................... 77

      4-4-1-4- مجموعه داده Vowel ..................................................................................................... 80

5- فصل پنجم: نتیجه گیری و پیشنهادات ......................................................................................................82

5-1- نتیجه ............................................................................................................................................... 83

5-2- پیشنهاد کارهای آینده ...................................................................................................................... 84

فهرست جدولها

عنوان و شماره                                                                           صفحه

جدول2‑1 مزایا و معایب الگوریتم k-means ...............................................................................................................26

جدول2‑2 معایب و محاسن الگوریتم c میانگین فازی ................................................................................................ 31

جدول2‑3 معیارهای تشابه بر اساس توابع فاصله مختلف..............................................................................................32

جدول3-1 توابع عددی مورد استفاده برای تست الگوریتم‌ها ....................................................................................60

جدول4‑1 پارامترهای مربوط به الگوریتم های پیشنهادی ...........................................................................................71 جدول4‑2مراکز خوشه به دست آمده با اجرای الگوریتم FCM-BA روی مجموعه دادهIris ......................73

جدول4‑3پاسخ الگوریتم های موجود بر روی مجموعه دادهIris ...............................................................................74

جدول4‑4 پاسخ الگوریتم FCM-BA بازاء مقادیر مختلف پارامترها بر روی مجموعه داده Iris ................... 74

جدول4‑5 پاسخ الگوریتم های موجود بر روی مجموعه داده Wine........................................................................75

جدول4‑6 مراکز خوشه به دست آمده بااجرای الگوریتم FCM-BA روی مجموعه داده Wine....................76

جدول4‑7پاسخ الگوریتمFCM-BA بازاء مقادیر مختلف پارامترها برروی مجموعه دادهWine ................. 77

جدول 4‑8 مراکز خوشه به دست آمده با اجرای الگوریتم پیشنهادی روی مجموعه داده CMC ................... 78

جدول 4‑9پاسخ الگوریتم های موجود بر روی مجموعه داده CMC .......................................................................79

جدول4‑10پاسخ الگوریتم   FCM-BAبازاء مقادیر مختلف پارامترها بر روی مجموعه داده CMC ............79

جدول 4‑11 مراکز خوشه به دست آمده با اجرای الگوریتم پیشنهادی روی مجموعه داده Vowel ...............80

جدول 4-12 پاسخ الگوریتم های موجود بر روی مجموعه داده Vowel ................................................................80

جدول 4‑13 پاسخ الگوریتمFCM-BA بازاء مقادیر مختلف پارامترهابرروی مجموعه داده Vowel .......... 81

منبع:

مراجع

[1]M.R. Anderberg, 'Cluster Analysis for Application.', New Yourk Academic Press, 1973.

[2]J.A. Hartigan, “Statistical theory in clustering.”, Journal of Classification, 1985, Vol.2, pp.63-76.

[3]Jon R Kettering, “The Practice of Cluster Analysis.”, Journal of Classification, 2006, Vol.23, pp.3-30.

[4]J.J. H.Ward, “Hierarchical Grouping to Optimize an Objective Function.”, Journal of the American Statistical Association, 1963, Vol.58, pp.236-244.

[5]J. MacQueen, “Some Methods for Classification and Analysis of MultivariateObservations.”, Fifth Berkeley Symp. Math.Statistics and Probability, 1967, Vol.2. pp.281-297.

[6] Bezdek, J. “Fuzzy mathematics in pattern classification”, Ph.D. thesis. Ithaca, NY: Cornell University, 1794

[7] I. Karen, A.R. Yildiz, N. Kaya, N. Ozturk, F. Ozturk, Hybrid approach

       for genetic algorithm and Taguchi’s method based design

      optimization in the automotive industry, International Journal of

       Production Research 4 (2006) 4897–4914.

[8] Yi-Tung Kao, Erwie Zahara, I-Wei Kao,“A hybridized approach to data clustering.”, Expert Systems with Applications, 2008, Vol.34. pp.1754-1762.

[9] احسان عسگریان ، حسین معین زاده ، محسن سریانی ، جعفر حبیبی ”رویکرد جدید برای خوشه بندی فازی بوسیله الگوریتم ژنتیک.“.,سیزدهمین کنفرانس سالانه انجمن کامپیوتر ایران.1386.

[10] Hesam Izakian, Ajith Abraham, “Fuzzy C - means and fuzzy swarm            for fuzzy clustering problem”, Expert Systems with

      Applications 38, 1835–1838, 2011.

[11] K.S.F. Shu, Z. Erwie, A hybrid simplex search and particle swarm                optimization for unconstrained optimization, European Journal            of Operational Research 181 (2007) 527–548.

[12] Fatemeh Golichenari, Mohammad Saniee Abadeh, A new Method For         Fuzzy Clustering Besed - on Fuzzy C - means Algorithm and

       Memetic Algorithm,2007

[13] S. Kirkpatrick, C. D. Gelatt Jr., and M. P. Vecchi,

        “Optimization by Simulated Annealing”, Science, 220, 4598, pp. 671-680, 1983.

[14] Saeed parsa, Hamid saadi, Hamid mohamadi , Scheduling jobs on                computational grid using imulated annealings,2007

[15] Suman, B. (2004) "Study of simulated annealing based algorithms for multi objective optimization of a constrained problem", Computers and Chemical Engineering, Volume 28, Issue 9, pp. 1849-1871.

[16] Zhang, R. and Wu, C. (2010) "A hybrid immune simulated annealing         algorithm for the job shop scheduling problem", Applied Soft              Computing, 10, pp. 79–89.

[17]آیدا خیابانی، جمال شهرابی، رسول علیان نژاد، آرش صباغی،”کاربرد داده کاوی در تشخیص بیماری سل.“،سومین کنفرانس داده کاوی ایران، 1388.

[18]محمدرضا تقوا، لعیا الفت،”بکارگیری تکنیک های داده کاوی جهت مدیریت ارتباط با مشتری در صنعت بانکداری.“،سومین کنفرانس داده کاوی ایران، 1388.

[19] J. C. Bezdek, "Feature selection for binary data-Medical diagnosis

        with fuzzy sets," in Proc. Nat. Comput. Conf. AFIPS Press, 1972,

         pp. 1057-1068.

[20]مسعود یقینی، مریم رنجپور، فرید یوسفی، ”مروری بر الگوریتم های خوشه بندی فازی.“، سوین کنفرانس داده کاوی ایران، 1388.

[21]Jiawei Han, MichelineKamber,. 'Data Mining consepts and techniques.',Diane Cerra, 2006.

[22]Gabriela Czibula, Grigreta Sofia Cojocar, Istvan Gergely Czibula,

   “A Partitional Clustering Algorithm for Crosscutting Concerns

       Identification.”,proceedings of the 8th wseas int. conference on

       software engineering, parallel and distributed systems, 2010,

       pp.111-116.



[23]Jiahai Wang, Yalan Zhou, “Stochastic optimal competitive Hopfield network for partitional clustering”,. Expert Systems with Applications, 2009, Vol.36. pp.2072-2080.

[24]A.K.Jain, M.N. Murty, P.J. Flynn,“Data Clustering: A Review.”,ACM Computing Surveys, 1999, Vol.31. pp.264-323.

[25]Georgios P. Papamichail, Dimitrios P. Papamichail,“The k-means range algorithm for personalized data clustering in e-commerce.”,European Journal of Operational Research, 2007, Vol.177. pp.1400-1408.

[26]Ohn Mar San, Van-Nam Huynh,Yoshiteru Nakamori, “An alternative extension of the k-means algorithm for clustering.”,Int. J. Appl. Math. Comput, 2004, Vol.14. pp.241-247.

[27]Tarsitano Agostino, “A computational studyof several relocation methods for k-means algorithms.”,Pattern Recognition, 2003, Vol.36. pp.2955-2966.

[28]H. Ralambondrainy,“A conceptual version of the K-means algorithm. ”, Pattern Recognition Letters, 1995, Vol.16. pp.1147-1157.

[29]Dingxi Qiu, Ajit C. Tamhane,“A comparative study of the K-means algorithm and the normal mixture model for clustering: Univariate case.”,Journal of Statistical Planning and Inference, 2007, Vol.137. pp.3722-3740.

[30]Stephen J. Redmond, Conor Heneghan,“A method for initialising the K-means clustering algorithm using kd-trees.”,Pattern Recognition Letters, 2007, Vol.28. pp.965-973.

[31] Yiu-Ming Cheung, “k*-Means: A new generalized k-means clustering algorithm.”,Pattern Recognition Letters, 2003, Vol. 24. 2883-2893.

[32]K. S. Al-Sultan and S. Z. Selim, “A Global Algorithm for the Fuzzy

      Clustering Problem”, Pattern Recognition, vol. 26, no. 9, pp. 1357-

       1361, 1993.

[33] George E. Tsekouras, Haralambos Sarimveis, " A newapproach for

       measurin g the validity of the fuzzy c-means algorithm", Advances in

Engineering Software, vol. 35, pp. 567–575, July 2004.

[34] Li-Xin Wang,"A Course in Fuzzy Systems and Control" , Prentice-

   Hall International, Inc. 1997

[35]Sadaaki Miyamoto," An Overview and New Methods in Fuzzy

      Clustering" , 2nd Inter. Conf. on Knowledge-Based Intelligent

      Electronic Systems, 21-23 April 1998

[36]Beightler, C.S., D.T. Phillips, and D. J. Wilde.1979. Foundations of

       Optimization (2nd ed.). Englewood Cliffs, NJ: Printice-Hall.

[37] مسعود یقینی، محمد رحیم اخوان کاظم ‌زاده. "الگوریتم‌های بهینه‌سازی فراابتکاری"، جهاد دانشگاهی واحد صنعتی امیر کبیر ‫

[38]M. Murugan, V. Selladurai,“Optimization and implementation of cellular manufacturing system in a pump industry using three cell formation algorithms.”,Int J Adv Manuf Technol, 2007, Vol.35. pp.135-149.

[39]Tushar Jain, M.J. Nigam,“Synergy of evolutionary algorithm and socio-political process for global optimization.”,Expert Systems with Applications, 2010, Vol.37. pp.3706–3713.

[40]Yaghini, Masoud; Akhavan, Rahim, DIMMA: "A Design and

        Implementation Methodology for Metaheuristic Algorithms"،1993

[41]A.R. Yildiz, "A novel particle swarm optimization approach for product

       design and manufacturing", International Journal of Advanced

Manufacturing Technology 40 (2009) 617–628.

[42]Chui-Yu Chiu, I-Ting Kuo,“Applying particle swarm optimization and honey bee mating optimization in developing an intelligent market segmentation system.”,Journal of Systems Science and Systems Engineering, 2010, Vol.19. pp.182-191.

[43]Xin Zhang, Hong Peng, Qilun Zheng. Beijing,“A Novel Ant Colony Optimization Algorithm for Clustering.”,8th International Conference on Signal Processing, 2006.

[44]P.S. Shelokar, V.K. Jayaraman, B.D. Kulkarni,“An ant colony approach for clustering.”, Analytica Chimica Acta, 2004, Vol.509. pp.187–195.

[45] A. Fanni, A. Manunza, M. Marchesi, and F. Pilo, “Tabu search

       metaheuristics for electromagnetic problems optimization continuous

       domains,” IEEE Trans. Magn., vol. 35, no. 3, pp. 1694–1697, 1999.

[46]Xiao Ying Wang, Glenn Whitwell, Jonathan M Garibaldi,“Simulated Annealing Fuzzy Clustering in Cancer Diagnosis.”,Informatica, 2005, Vol.29. pp.61-70.

[47]D. Janaki Ram, T. H. Sreenivas, K. Ganapathy Subramaniam, “Parallel Simulated Annealing Algorithms.”,Journal of Parallel and Distributed Computing, 1996, Vol.37. pp.207-212.

[48]X. S. Yang, “A new bat-inspired algorithm,” Nature Inspired

      Cooperative Strategies for Optimization (NICSO 2010), vol. 284,

      Springer, Studies Computational Intelligence, pp. 65–74, 2010.

[49]K. Deb, Multi-Objective Optimization Using Evolutionary Algorithms.

       New York:Wiley-Interscience Series Systems and Optimization, 2001.

[50] Rosenbrock, H. H. (1960), "An automatic method for finding the greatest or least value of a function", The Computer Journal 3: 175–184 [52]G.W. Gates,“The Reduced Nearest Neighbor Rule”,. IEEE Transactions on Information Theory, 1972. pp.431-433.

[51]A. Törn and A. Zilinskas. "Global Optimization". Lecture Notes in Computer Science, Nº 350, Springer-Verlag, Berlin, 1989.

[52] Cho, H.; Olivera, F.; and Guikema, S. D. "A Derivation of the Number of Minima of the Griewank Function." Appl. Math. Comput. 204, 694-701, 2008. [54]T.S. Lim, W.Y Loh, Y.S Shih,“A Comparison of Prediction Accuracy, Complexity, and Training Time of Thirty-three Old and New Classification Algorithms.”,Machine Learning, 2000, Vol.40. pp.203-229.

[53]M. Kudo, J. Toyama, M. Shimbo,“Multidimensional Curve

      Classification Using Passing-Through Regions.”,Pattern Recognition

      Letters, 1999, Vol.20. pp.1103-1111.

[54] B.V. Dasarathy,Nosing Around the Neighborhood: “A New System Structure and Classification Rule for Recognition in Partially Exposed Environments.”,IEEE Transactions on Pattern Analysis and Machine Intelligence, 1980, Vol.PAMI-2. pp.67-71.

[55] P. Cortez, A. Cerdeira, F. Almeida, T. Matos, J. Reis,“Modeling wine preferences by data mining from physicochemical properties.”,In Decision Support Systems, Elsevier, 2009, Vol.47. pp.547-553.

[56] T.S. Lim, W.Y Loh, Y.S Shih,“A Comparison of Prediction Accuracy, Complexity, and Training Time of Thirty-three Old and New Classification Algorithms.”,Machine Learning, 2000, Vol.40. pp.203-229.

[57] M. Kudo, J. Toyama, M. Shimbo,“Multidimensional Curve

        Classification Using Passing-Through Regions.”,Pattern

        Letters, 1999, Vol.20. pp.1103-1111.

کلمات کلیدی: Fuzzy c- means - الگوریتم خفاش - خوشه بندی - خوشه بندی اطلاعات

دانلود پایان نامه ارائه روشی جدید در خوشه بندی اطلاعات با استفاده ازترکیب الگوریتم خفاش و Fuzzy c- means, پروژه دانشجویی برای پایان نامه ارائه روشی جدید در خوشه بندی اطلاعات با استفاده ازترکیب الگوریتم خفاش و Fuzzy c- means, پروپوزال برای موضوع پایان نامه ارائه روشی جدید در خوشه بندی اطلاعات با استفاده ازترکیب الگوریتم خفاش و Fuzzy c- means, تحقیق در مورد پایان نامه ارائه روشی جدید در خوشه بندی اطلاعات با استفاده ازترکیب الگوریتم خفاش و Fuzzy c- means, مقاله پیرامون پایان نامه ارائه روشی جدید در خوشه بندی اطلاعات با استفاده ازترکیب الگوریتم خفاش و Fuzzy c- means, رساله و تز دکترا با موضوع پایان نامه ارائه روشی جدید در خوشه بندی اطلاعات با استفاده ازترکیب الگوریتم خفاش و Fuzzy c- means, گزارش سمینار پایان نامه ارائه روشی جدید در خوشه بندی اطلاعات با استفاده ازترکیب الگوریتم خفاش و Fuzzy c- means

پایان نامه ارائه روشی جدید در خوشه بندی اطلاعات با استفاده ازترکیب الگوریتم خفاش و Fuzzy c- means

مهندسی صنایع ۱۰۳

پایان نامه کارشناسی ارشد در رشته مهندسی اتوماسیون و ابزار دقیق چکیده ارائه روشی جدید در خوشهبندی اطلاعات با استفاده ازترکیب الگوریتم خفاش و Fuzzy c-means خوشهبندی قرار دادن داده ها در گروههایی است که اعضای هر گروه از زاویه خاصی به هم شباهت دارند . شباهت بین دادههای درون هر خوشه حداکثر و شباهت بین دادههای درون خوشههای متفاوت حداقل میباشد. Fuzzy c-means نیز یک تکنیک خوشه ...

پایان نامه خوشه بندی فازی داده ها بر اساس منطق فازی

مهندسی کامپیوتر ۴۶

پایان ‌نامه برای دریافت درجه کارشناسی ارشد رشته مهندسی کامپیوتر - هوش مصنوعی چکیده خوشه‌بندی داده‌ها روشی برای دسته‌بندی داده‌های مشابه می باشد که این روش سال‌ها در علوم مختلف به کار رفته و الگوریتم‌های زیادی در این زمینه طراحی شده است . تحقیقات اخیر خوشه‌بندی به سمت روش های ترکیبی که دارای قابلیت استحکام و دقت بیشتر هستند، هدایت می‌کند. خوشه‌بندی ترکیبی سعی می‌کند ابتدا ...

پایان نامه استفاده از الگوریتم رقابت استعماری بهبود یافته برای بخش بندی تصویر

مهندسی کامپیوتر ۸۹

پایاننامه برای دریافت درجه کارشناسی ارشد رشته مهندسی کامپیوتر – هوش مصنوعی چکیده بخشبندی تصویر یک فرآیند اساسی در بسیاری از کاربردهای پردازش تصویر و بینایی ماشین است که میتواند به عنوان اولین مرحله پردازش سطح پایین در پردازش تصاویر دیجیتالی در نظر گرفته شود. بخشبندی تصویر کاربردهای گوناگونی مانند پردازش تصاویر پزشکی، شناسایی چهره، سیستمهای کنترل ترافیک و غیره دارد. با توجه ...

پایان نامه بهینه سازی خوشه ها با استفاده از الگوریتم های تکاملی برای شخصی سازی وب

مهندسی کامپیوتر ۷۹

پایان نامه کارشناسی ارشد رشته: مهندسی کامپیوتر گرایش: نرم‌افزار چکیده گرانبار شدن اطلاعات یک مشکل عمده در وب کنونی به شمار میرود. برای مقابله با این مشکل، سیستم‌های شخصیسازی وب ارائه شدهاند که محتوا و سرویسهای یک وبسایت را با افراد براساس علایق و رفتار گردشی آنها سازگار میکنند. یک مؤلفهی اساسی در هر سیستم شخصیسازی وب، مدل کاربر آن است. هدف از شخصی سازی وب، مهیا ساختن ...

پایان نامه ارائه و مقایسه سه مدل دو مرحله‌ای برای بخش‌ بندی مشتریان براساس ارزششان با استفاده از ابزارهای داده‌ کاوی K-Means، SOM و RFM (مطالعه موردی: فروشگاه‌ های زنجیره‌ ای مرکز اپل ایران)

مهندسی صنایع ۱۲۴

پايان نامه جهت اخذ درجه کارشناسي ارشد رشته مهندسي صنايع مهر 1391 شناسايي ارزش[1] مشتريان، از مولفه‌هاي اصلي موفقيت در فروشگاه‌ هاي مختلف مي‌باشد که امروزه مورد توجه بيش از پيش قر

پایان نامه بخش‌ بندی اتوماتیک دندان‌ ها با استفاده از تصاویر X-ray

مهندسی کامپیوتر ۸۰

پایان نامه برای دریافت درجه کارشناسی ارشد رشته هوش مصنوعی چکیده یکی از پیچیده‌ترین کار‌ها در پردازش تصاویر دیجیتال، بخش‌ بندی تصاویر است. به‌دلیل افزایش توجه به این تکنیک توسط محققان و تبدیل آن به یک نقش حیاتی در بسیاری از زمینه‌های کاربردی مثل کاربرد‌های پزشکی مورد استفاده قرار می‌گیرد. امروزه در دندان‌پزشکی مدرن، تکنیک‌های مبتنی بر استفاده از کامپیوتر مانند طرح‌ریزی و ...

پایان نامه بهبود میزان تخمین هزینه پروژه‌ های نرم‌ افزاری در مدل COCOMO II مبتنی بر الگوریتم‌ های منطق‌ فازی

مهندسی کامپیوتر ۱۲۶

پایان نامه جهت اخذ مدرک کارشناسی ارشد در رشته مهندسی کامپیوتر – گرایش نرم‌افزار چکیده در تمامی پروژه هایی که امروزه انجام میشوند بحث مدیریت مسألهای بسیار تعیین کننده است. پروژههای نرمافزاری نیز از این قاعده مستثنی نیستند. از مهم‌ترین جنبههای فعالیت توسعه نرمافزاری بحث مدیریت زمان و هزینه است. با توجه به اینکه در مراحل ابتدایی توسعه نرمافزار اطلاعات دقیقی نسبت به جنبههای ...

پایان نامه پیش بینی بهره کشی و خوشه بندی آسیب پذیری ها به وسیله ی متن کاوی

مهندسی کامپیوتر ۱۰۵

پایان نامهی کارشناسی ارشد در رشتهی مهندسی کامپیوتر- نرمافزار چکیده آسیب پذیری های نرم افزار میتواند منجر به تلفات مالی و اطلاعاتی شود. به علت محدود بودن منابع مالی و انسانی، اولویت دهی به آسیبها بسیار مورد توجه میباشد. پیش از این پژوهش، تعداد زیادی از محققان آسیب پذیریها را براساس دانشهای تجربی و آماری، رده بندی کردهاند. اماگاهی طبیعت متغییر آسیب پذیر یها، فراهم کردن ...

پایان نامه خوشه ‏بندی توافقی بر روی داده‏ های توزیع شده ناهمگن

مهندسی کامپیوتر ۱۲۰

پایان‏نامه کارشناسی ارشد رشته مهندسی کامپیوتر – گرایش نرم ‏افزار چکیده خوشه‏بندی را می‏توان یکی از مهمترین مراحل در تحلیل داده‏ها برشمرد. روش‏های خوشه‏بندی بسیاری تاکنون توسعه و ارائه داده شده‏اند. یکی از این روش‏ها که در مطالعات اخیر مورد توجه و بررسی قرار گرفته است، روش خوشه‏بندی توافقی می‏باشد. هدف خوشه‏بندی توافقی ترکیب چند خوشه‏بندی اولیه و بدست آوردن یک خوشه‏بندی نهایی است ...

پایان نامه ارائه الگوریتم زمانبندی مهاجرت ماشین های مجازی جهت بهینه سازی همزمان مصرف انرژی و تولید آلاینده ها در شبکه محاسباتی ابر

مهندسی کامپیوتر ۸۵

پایان نامه کارشناسی ارشد رشته مهندسی کامپیوتر چکیده: در سال های اخیر با توجه به رشد روز افزون درخواستها و پیوستن مشتریان جدید به دنیای محاسبات، سیستم های محاسباتی نیز باید تغییر کنند و قدرتمندتر وانعطاف پذیرتر از قبل عمل نمایند. در این میان محاسبات ابری به عنوان مدلی فراتر از یک سیستم ارائه شد که در حال حاضر توانایی پاسخگویی به اکثر درخواست ها و نیازمندی ها را دارد. راه حل های ...

ثبت سفارش