پایان نامه داده کاوی (Data Mining)

مشخص نشده 4 MB 26667 91
مشخص نشده مشخص نشده مهندسی کامپیوتر
قیمت قبل:۷۳,۲۰۰ تومان
قیمت با تخفیف: ۳۳,۸۰۰ تومان
دانلود فایل
  • بخشی از محتوا
  • وضعیت فهرست و منابع
  • پایان نامه مقطع کارشناسی ناپیوسته

    رشته کامپیوتر

    سال 1387

    چکیده:

    در دو دهه قبل توانايي­های فنی بشر برای توليد و جمع­ آوری داده‌ها به سرعت افزايش يافته است. عواملی نظير استفاده گسترده از بارکد برای توليدات تجاری، به خدمت گرفتن کامپيوتر در کسب­ و­کار، علوم، خدمات­ دولتی و پيشرفت در وسائل جمع­ آوری داده، از اسکن کردن متون و تصاوير تا سيستمهای سنجش از دور ماهواره­ای، در اين تغييرات نقش مهمی دارند.

                  بطور کلی استفاده همگانی از وب و اينترنت به عنوان يک سيستم اطلاع رسانی جهانی ما را مواجه با حجم زیادی از داده و اطلاعات می‌کند. اين رشد انفجاری در داده‌های ذخيره شده، نياز مبرم وجود تکنولوژی­های جديد و ابزارهای خودکاری را ايجاد کرده که به صورت هوشمند به انسان ياری رسانند تا اين حجم زياد داده را به اطلاعات و دانش تبديل کند. داده­ کاوی به عنوان يک راه حل برای اين مسائل مطرح مي باشد. در يک تعريف غير رسمی داده ­کاوی فرآيندی است، خودکار برای استخراج الگوهايی که دانش را بازنمايی مي­کنند، که اين دانش به صورت ضمنی در پايگاه داده­ های عظيم، انباره­ داده[1] و ديگر مخازن بزرگ اطلاعات، ذخيره شده است.

                    به لحاظ اینکه در چند سال اخیر مبحث داده­ کاوی و اکتشاف دانش موضوع بسیاری از مقالات و کنفرانسها قرار گرفته و نرم­افزار­های آن در بازار به شدت مورد توجه قرار گرفته، از اینرو در مقاله سعی بر آن شده تا گذری بر آن داشته باشیم.

                    در این مقاله درفصل مروری بر داده­ کاوی خواهیم داشت . که به طور عمده به تاریخچه ، تعاریف، کاربردها وارتباط آن با انبار داده و OLAP خواهیم پرداخت. در پایان فصل مراحل فرایند کشف دانش از پایگاه داده­ها را ذکر کردیم که داده­ کاوی یکی از مراحل آن است.

                    در فصل 2 یکی از شیوه­های داده ­کاوی که از سبد خرید گرفته شده­ است توضیح داده شده است . در این فصل به شرح قوانین ارتباطی خواهیم پرداخت که در آن بعد از دسته­ بندی الگوریتمها ، الگوریتم Apriori ( که یک الگوریتم پایه در این زمینه است ) و الگوریتم FP-Growth ( یک الگوریتم جدید میباشد) را با شرح یک مثال توضیح می­دهیم و در آخر آن دو را با هم مقایسه می­کنیم .

                    در فصل 3 مباحث وب­کاوی و متن­کاوی را که در بسیاری از مراجع جزء کاربردهای داده­ کاوی به حساب می­آید شرح داده خواهد شد.

     

    [1] Data  warehouses

     

    فصل 1

     

    مروری بر داده­کاوی

     

    امروزه با گسترش سیستم‌های پایگاهی و حجم بالای داده‌های ذخیره شده در این سیستم‌ها، نیاز به ابزاری است تا بتوان داده‌های ذخیره شده را پردازش کرد و اطلاعات حاصل از این پردازش را در اختیار کاربران قرار داد.

    با استفاده از پرسش‌های ساده در SQL و ابزارهای گوناگون گزارش‌گیری معمولی، می‌توان اطلاعاتی را در اختیار کاربران قرار داد تا بتوانند به نتیجه‌گیری در مورد داده‌ها و روابط منطقی میان آنها بپردازند. امّا وقتی که حجم داده‌ها بالا باشد، کاربران هرچند زبر­دست و با­تجربه باشند نمی‌توانند الگوها مفید را در میان حجم انبوه داده‌ها تشخیص دهند و یا اگر قادر به این کار هم باشند، هزینه عملیات از نظر نیروی انسانی و مادی بسیار بالا است. از سوی دیگر، کاربران معمولاً فرضیه‌ای را مطرح می‌کنند و سپس بر­اساس گزارشات مشاهده شده به اثبات یا رد فرضیه می‌پردازند، در حالی که امروزه نیاز به روشهایی است که اصطلاحاً به کشف دانش [1] بپردازند یعنی با کمترین دخالت کاربر و بصورت خودکار الگوها و رابطه‌های منطقی را بیان نمایند.

    داده کاوی[2] یکی از مهمترین این روشها است که به الگوهای مفید در داده‌ها با حداقل دخالت کاربران شناخته می‌شوند واطلاعاتی را در اختیار کاربران و تحلیل گران قرار می‌دهند تا براساس آن تصمیمات مهم و حیاتی در سازمانها اتخاذ شوند.

    اصطلاح داده­ کاوی زمانی بکار برده می‌شود که با حجم بزرگی از داده‌ها، در حد مگا یا ترابایت، مواجه باشیم. در تمامی منابع داده­کاوی بر این مطلب تأکید شده است. هرچه حجم داده‌ها بیشتر و روابط آنها پیچیده­تر باشد دسترسی به اطلاعات نهفته در میان داده­ها مشکل­تر می‌شود و نقش داده ­کاوی بعنوان یکی از روش­های کشف دانش، روشن‌تر می‌گردد.

    داده­ کاوی بطور همزمان از چندین رشته علمی بهره می‌برد نظیر: تکنولوژی پایگاه داده، هوش مصنوعی، یادگیری ماشین، شبکه‌های عصبی، آمار، الگو، سیستم‌های مبتنی بر دانش[3]، حصول دانش[4]، بازیابی اطلاعات[5]، محاسبات سرعت بالا[6] و بازنمایی بصری داده[7].

    1-1: تعریف داده­کاوی:

    اصطلاح Data Mining همانطور که از ترجمه آن به داده­ کاوی مشخص می­شود، به مفهوم استخراج اطلاعات نهان و یا الگوها و روابط مشخص در حجم زیادی از داده‌های یک یا چند بانک اطلاعاتی بزرگ است. اطلاعات استخراج شده در تعریف Data Mining بطور ضمنی به معنی اطلاعاتی است که بر اساس آن بتوان به نتایجی دست یافت که بطور معمول ملموس نیستند. در این تعریف بر بزرگ بودن بانکهای اطلاعاتی و یا حجم زیاد داده‌های مورد پردازش تاکید می‌شود. علت این است که از نظر آماری و تئوری اطلاعات، تجزیه و تحلیل داده‌ها و یا آنطور که در این اصطلاح تعبیر می‌شود، کاوش در حجم کم داده­های یک بانک به نتایج قابل قبولی منجر نمی‌شود. به کمک ابزارهای Data Mining می‌توان مقادیر متغیرهای را پیش­بینی و توصیف نمود. این ابزارها در فرایندهای تصمیم‌گیری متکی بر اطلاعات و دانش [8] کاربر فراوان دارند و فعالیت­های تجاری نوین و مدرن امروزه به شدت بر آن متکی است. فرایند Data Mining را نباید با روش‌های متداول آنالیز داده و اطلاعات و سیستم­های تصمیم‌گیری معمولی یکی دانست. به کمک روش‌های Data Mining می‌توان به پرسش­هایی (عمدتاً تجاری) پاسخ گفت که بطور سنتی عملاً امکان وجود ندارد.

    در متون آکادمیک تعاریف گوناگونی برای داده کاوی ارائه شده‌اند. در برخی از این تعاریف داده­کاوی در حد ابزاری که کاربران را قادر به ارتباط مستقیم با حجم عظیم داده­ها می‌سازد معرفی گردیده است و در برخی دیگر، تعاریف دقیقتر که در آنها به کاوش در داده­ها توجه می‌شود موجود است. برخی از این تعاریف عبارتند از:

    ·        داده ­کاوی عبارت است از فرایند استخراج اطلاعات معتبر، از پیش ناشناخته، قابل فهم و قابل اعتماد از پایگاه داده­های بزرگ و استفاده از آن در تصمیم‌گیری در فعالیت­های تجاری مهم.

    ·        اصطلاح داده­ کاوی به فرایند نیم خودکار تجزیه و تحلیل پایگاه داده­های بزرگ به منظور یافتن الگوهای مفید اطلاق می‌شود.

    ·        داده­کاوی یعنی جستجو در یک پایگاه داده ­ها برای یافتن الگوهایی میان داده­ها.

    ·        داده­کاوی عبارتست از فرایند یافتن دانش از مقادیر عظیم داده­های ذخیره شده در پایگاه داده، انباره داده و یا دیگر مخازن اطلاعات.

    ·        داده­کاوی یعنی استخراج دانش کلان، قابل استناد و جدید از پایگاه داده­های بزرگ.

    ·        داده­کاوی یعنی تجزیه و تحلیل مجموعه داده­های قابل مشاهده برای یافتن روابط مطمئن بین داده­ها.

    همانگونه که در تعاریف گوناگون داده­کاوی مشاهده می­شود، تقریباً در تمامی تعاریف به مفاهیمی چون استخراج دانش، تحلیل و یافتن بین داده­ها اشاره شده است.

    واژه های «داده ­کاوی» و «کشف دانش در پایگاه داده»[9] اغلب بصورت مترادف یکدیگر مورد استفاده قرار می‌گیرد. کشف دانش در پایگاه داده فرایند شناسایی درست، ساده، مفید و  نهایتا الگوها و مدلهای قابل فهم در داده­ها می‌باشد. داده­کاوی، مرحله‌ای از فرایند کشف دانش می‌باشد و شامل الگوریتم­های مخصوص داده­ کاوی است، بطوریکه تحت محدودیت­های مؤثر محاسباتی قابل قبول، الگوها و یا مدلها را در داده کشف می‌کند.

    داده­ها اغلب حجیم امّا بدون ارزش می‌باشند، داده به تنهایی قابل استفاده نیست، بلکه دانش نهفته در داده­ها قابل استفاده می‌باشد. به این دلیل به داده­کاوی، تحلیل داده‌ای ثانویه[10] گفته می‌شود.

    2-1: تاریخچه داده­کاوی

    اخیرا داده­کاوی موضوع بسیاری از مقالات، کنفرانس‌ها و رساله‌های عملی شده است، امّا این واژه تا اوایل دهه نود مفهومی نداشت و به کاربرده نمی‌شد.

    در دهه شصت و پیش از آن زمینه‌هایی برای ایجاد سیستم‌های جمع‌آوری و مدیریت داده­ها ایجاد شد و تحقیقاتی در این زمینه انجام پذیرفت که منجر به معرفی و ایجاد سیستم­های مدیریت پایگاه داده ­ها گردید.

    ایجاد و توسعه مدلهای داده‌ای برای پایگاه سلسله مراتبی، شبکه‌ای و بخصوص رابطه‌ای در دهه هفتاد، منجر به معرفی مفاهیمی همچون شاخص­گذاری و سازمادهی داده‌ها و در نهایت ایجاد زبان پرسش SQL در اوایل دهه هشتاد گردید تا کاربران بتوانند گزارشات و فرم­های اطلاعاتی موردنظر خود را ، از این طریق ایجاد نمایند.

    توسعه سیستم‌های پایگاهی پیشرفته در دهه هشتاد و ایجاد پایگاه­ها شی‌گرا، کاربرد گرا[11] و فعال[12] باعث توسعه همه جانبه و کاربردی شدن این سیستم‌ها در سراسر جهان گردید. بدین ترتیب DBMS­هایی همچون Oracle, DB2,­ Sybase, ... ایجاد شدند و حجم زیادی از اطلاعات با استفاده از این سیستم‌ها مورد پردازش قرار گرفتند. شاید بتوان مهمترین جنبه در معرفی داده­کاوی را مبحث کشف دانش از پایگاه داده‌ها (KDD)[13] دانست بطوریکه در بسیاری موارد DM [14]  و KDD بصورت مترادف مورد استفاده قرار می‌گیرند.

    همانطور که در تعریف داده­کاوی ذکر شد، هدف جستجو و کشف الگوهایی در پایگاه داده ها و استفاده از آنها در اخذ تصمیمات حیاتی است، بنابراین می‌توان گفت که DM بخشی از فرایند KDD است که در نهایت به ایجاد سیستم‌های DSS [15] می‌شود. شکل 1-1 نقش داده کاوی در فرایند کشف دانش از پایگاه داده ها را نشان می‌دهد.

    برای اولین بار مفهوم داده­کاوی در کارگاه IJCAI[16] در زمینه KDD توسّط Shapir مطرح گردید. به دنبال آن در سالهای 1991 تا 1994 ، کارگاههای KDD مفاهیم جدیدی را در این شاخه علم ارائه کردند بطوریکه بسیاری از علوم و مفاهیم با آن مرتبط گردیدند.

     

    3-1- چه چیزی سبب پیدایش داده­کاوی شده است؟

    اصلی­ترین دلیلی که باعث شد داده­کاوی کانون توجهات در صنعت اطلاعات قرار بگیرد، مساله در دسترس بودن حجم وسیعی از داده­ها و نیاز شدید به اینکه از این داده­ها  اطلاعات و دانش سودمند استخراج کنیم. اطلاعات و دانش بدست آمده در کاربردهای وسیعی از مدیریت کسب و کار و کنترل تولید و تحلیل بازار تا طراحی مهندسی و تحقیقات علمی مورد استفاده قرار می‌گیرد.

     

    [1] - Knowledge Discovery

    [2] - Data Mining

    [3] - Knowledge-based system

    [4] - Knowledge- acquisition

    [5] - information retrieval

    [6] - High-performance computing

    [7] - Data visualization

    [8] - Data and Knowledge driven

    [9] - Knowledge Discovery in Database

    [10] - Secondary Data Analysis

    [11] - Application Oriented

    [12] - Active DBMS

    [13] - Knowledge Discovery From Database

    [14] - Data Mining

    [15] - Decision Support System

    [16] - Workshop

    داده کاوی را می‌توان حاصل سیر تکاملی طبیعی تکنولوژی اطلاعات دانست، که این سیر تکاملی ناشی از یک سیر تکاملی در صنعت پایگاه داده می‌باشد، نظیر عملیات: جمع‌آوری داده­ها و ایجاد پایگاه داده، مدیریت داده و تحلیل و فهم داده‌ها. در شکل 2-1 این روند تکاملی در پایگاه‌های داده نشان داده شده است.

    تکاملی تکنولوژی پایگاه داده و استفاده فراوان آن در کاربردهای مختلف سبب جمع‌آوری حجم فراوانی داده شده است. این داده­های فراوان باعث ایجاد نیاز ابزارهای قدرتمند برای تحلیل داده­ها گشته، زیرا در حال حاضر به لحاظ داده ثروتمند هستیم ولی دچار کمبود اطلاعات می‌باشیم.

    ابزارهای داده­کاوی داده ها را آنالیز می‌کنند و الگوهای داده‌ای را کشف می‌کنند که می‌توان از آن در کاربردهایی نظیر: تعیین استراتژی برای کسب و کار، پایگاه دانش[1] و تحقیقات علمی و پزشکی، استفاده کرد. شکاف موجود بین داده­ها و اطلاعات سبب ایجاد نیاز برای ابزارهای داده­کاوی شده است تا داده‌های بی‌ارزش را به دانشی ارزشمند تبدیل کنیم.

    بطور ساده داده­کاوی به معنای استخراج یا «معدن­کاری»[2] دانش از مقدار زیادی داده خام است. البته این نامگذاری برای این فرایند تا حدی نامناسب است، زیرا بطور مثال عملیات معدن­کاری برای استخراج طلا از صخره و ماسه را طلا­کاوی می­نامیم، نه ماسه­کاوی یا صخره­کاوی. بنابراین بهتر بود به این فرایند نامی شبیه به «استخراج دانش از داده» می‌دادیم که متأسفانه بسیار طولانی است. «دانش­کاوی» بعنوان یک عبارت کوتاهتر بعنوان جایگزین، نمی‌تواند بیانگر تأکید و اهمیت بر معدن­کاری مقدار زیاد داده باشد. معدن­کاری عبارتی است که بلافاصله انسان را به یاد فرایندی می‌اندازد که به دنبال یافتن مجموعه‌ کوچکی از قطعات ارزشمند از حجم بسیار زیادی از مواد خام هستیم.

    با اینکه این فرایند تا حدی دارای نامگذاری ناقص است ولی این نامگذاری یعنی داده­کاوی بسیار عمومیت پیدا کرده است. البته اسامی دیگر نیز برای این فرایند پیشنهاد شده که بعضا بسیار متفاوت با واژه داده­کاوی است، نظیر: استخراج دانش از پایگاه داده، استخراج دانش[3]، آنالیز داده/ الگو، باستان شناسی داده[4]، و لایروبی داده‌ها[5].

     

     

     

     

    شکل 2-1 سیر تکاملی صنعت پایگاه داده

     

    4-1- اجزای سیستم داده­کاوی:

    با توجه به مطالب عنوان شده،  یکی از تعاریف عنوان شده برای داده­کاوی چنین بود:

    «داده­کاوی عبارت است از فرایند یافتن دانش از مقادیر عظیم داده‌های ذخیره شده در پایگاه داده، انباره داده و یا دیگر مخازن اطلاعات»

    بر­اساس این دیدگاه یک سیستم داده­کاوی بطور نمونه دارای اجزای اصلی زیر است که شکل   3-1 بیانگر معماری سیستم است.

    شکل 3-1 معماری یک نمونه سیستم داده­کاوی

     

    1- پایگاه داده، انباره­ داده (Data warehouse) یا دیگر مخازن اطلاعات:

    که مجموعه‌ای از پایگاه داده‌ها، انبار داده، صفحه گسترده[6]، یا دیگر انواع مخازن اطلاعات.

    2- سرویس دهنده پایگاه داده یا انبار داده:

    که مسئول بازیابی داده‌های مرتبط براساس نوع درخواست داده­کاوی کاربر می‌باشد.

    3- پایگاه دانش:

    این پایگاه از دانش زمینه[7] تشکیل شده تا به جستجو کمک کند، یا برای ارزیابی الگوهای یافته شده از آن استفاده می‌شود.

    4- موتور داده­کاوی[8]

    این موتور جزء اصلی از سیستم داده­کاوی است و بطور ایدآل شامل مجموعه‌ای از پیمانه[9] هایی نظیر توصیف[10] ، ارتباط[11]، کلاسبندی[12]، آنالیز خوشه‌ها[13] و آنالیز تکامل و انحراف[14] است.

    5- پیمانه ارزیابی الگو[15]

    این جزء معیارهای جذابیت[16]  را بکار می‌بندد و با پیمانه‌ی داده­کاوی تعامل می‌کند، بدینصورت که تمرکز آن بر جستجو بین الگوهای جذاب می‌باشد، و از یک حد آستانه جذابیت استفاده می‌کند تا الگوهای کشف شده را ارزیابی کند.

    6- واسط کاربر گرافیکی[17]: این پیمانه بین کاربر و سیستم داده­کاوی ارتباط برقرار می‌کند، به کاربر اجازه می‌دهد تا با سیستم داده­کاوی از طریق پرس وجو[18] ارتباط برقرار کند، این جزء به کاربر اجازه می‌دهد تا شمای پایگاه داده یا انبار داده را مرور کرده، الگوهای یافته شده را ارزیابی کرده و الگوها را در فرمهای بصری گوناگون بازنمایی کند.

    با انجام فرایند داده­کاوی، دانش، ارتباط یا اطلاعات سطح بالا از پایگاه داده استخراج می‌شود و قابل مرور از دیدگاههای مختلف خواهد بود. دانش کشف شده در سیستم‌های تصمیم­یار، کنترل فرایند، مدیریت اطلاعات پردازش پرس و جو[19] قابل استفاده خواهد بود.

     

     

    [1] - Knowledge base

    [2] - Mining

    [3] - Knowledge extraction

    [4] - Data archaeology

    [5] - Data dredging

    [6] - Spread sheets

    [7] - Domain knowledge

    [8] - Data mining engine

    [9] - Module

    [10] - Characterization

    [11] - Association

    [12] - Classification

    [13] -Cluster analysis

    [14] - Evolution and deviation analysis

    [15] - Pattern evaluation module

    [16] - Interesting measures

    [17] - Graphical User Interface

    [18] - Query

    [19] - Query processing

    مراجع

     

    [1] داده­کاوی (Data Mining)، تالیف مهمد کانتاردزیک، ترجمه امیر علیخانزاده، 1385، ویرایش اول

    [2] Introduction to Data Mining and Knowledge Discovery، Two Crows Corporation، 1999

    [3] Data Mining: Concepts and Techniques، M.Kamber and J.Han، 2001

    [4] مقاله Algorithms for Association Rule Mining – A General Survey and comparison نوشته Jochen Hipp و Gholamreza Nakhaeizadeh ، در کنفرانس ACM SIGKDD July 2000

    [5] مقاله Comparative Study of Association Rules Mining Algorithms نوشته Stefan Holban (http://www.bmf.hu/conferences/saci04/Gyorodi.pdf)

    [6]

    http://ece.ut.ac.ir/DBRG/seminars/Keykhah/Data Mining/Data mining.doc

           

    http://ece.ut.ac.ir/DBRG/seminars/Ghadimi-Abbasi-Pashaei/Document/datamining_Introduction.doc

     

  • فهرست اشکال ............................................................................................................................................... 10
    فهرست جداول .............................................................................................................................................. 11
    فصل1: مقدمه¬ای بر داده¬کاوی ............................................................................ 13
    1-1 تعریف داده¬کاوی ................................................................................................................................... 15
    2-1 تاریخچه داده¬کاوی ................................................................................................................................ 16
    3-1 چه چیزی سبب پیدایش داده¬کاوی شده است؟ ........................................................................................ 17
    4-1 اجزای سیستم داده¬کاوی ......................................................................................................................... 19
    5-1 جایگاه داده¬کاوی در میان علوم مختلف .................................................................................................. 21
    6-1 قابلیتهای داده¬کاوی ................................................................................................................................. 22
    7-1 چرا به داده¬کاوی نیاز داریم؟ ................................................................................................................... 23
    8-1 داده¬کاوی چه کارهایی نمی¬تواند انجام دهد؟ .......................................................................................... 25
    9-1 کاربردهای داده¬کاوی ............................................................................................................................. 25
    1-9-1 کاربردهای پیش¬بینی¬کننده ................................................................................................... 27
    2-9-1 کاربردهای توصیف¬کننده .................................................................................................... 27
    10-1 ابزارهای تجاری داده¬کاوی ................................................................................................................... 28
    11-1 داده¬کاوی و انبار¬داده¬ها ......................................................................................................................... 29
    1-11-1 تعاریف انبار¬داده ................................................................................................................ 29
    2-11-1 چهار خصوصیت اصلی انبار¬داده ......................................................................................... 30
    3-11-1 موارد تفاوت انبار¬داده و پایگاه¬ داده .................................................................................... 31
    12-1 داده¬کاوی و OLAP ........................................................................................................................... 33
    1-12-1 OLAP ........................................................................................................................... 33
    2-12-1 انواع OLAP ................................................................................................................... 34
    13-1 مراحل فرایند کشف دانش از پایگاه داده¬ها ........................................................................................... 34
    1-13-1 انبارش داده¬ها .................................................................................................................... 35
    2-13-1 انتخاب داده¬ها .................................................................................................................... 36
    3-13-1 پاکسازی- پیش¬پردازش- آماده¬سازی ................................................................................ 36
    4-13-1 تبدیل داده¬ها ...................................................................................................................... 36
    5-13-1 کاوش در داده¬ها (Data Mining) ................................................................................. 37
    6-13-1 تفسیر نتیجه ........................................................................................................................ 38
    فصل 2: قوانین ارتباطی ........................................................................... 39
    1-2 قوانین ارتباطی ........................................................................................................................................ 40
    2-2 اصول پایه ............................................................................................................................................... 41
    1-2-2 شرح مشکل جدی ............................................................................................................... 41
    2-2-2 پیمایش فضای جستجو ......................................................................................................... 43
    3-2-2 مشخص کردن درجه حمایت مجموعه اقلام ......................................................................... 45
    3-2 الگوریتمهای عمومی .............................................................................................................................. 45
    1-3-2 دسته¬بندی ............................................................................................................................ 45
    2-3-2 BFS و شمارش رویداد¬ها ................................................................................................... 46
    3-3-2 BFS و دونیم¬سازی TID-list ........................................................................................... 47
    4-3-2 DFS و شمارش رویداد ...................................................................................................... 47
    5-3-2 DFS و دو نیم¬سازی TID-list .......................................................................................... 48
    4-2 الگوریتم Apriori ................................................................................................................................ 48
    1-4-2 مفاهیم کلیدی ..................................................................................................................... 48
    2-4-2 پیاده¬سازی الگوریتم Apriori ............................................................................................ 49
    3-4-2 معایب Apriori و رفع آنها ................................................................................................. 54
    5-2 الگوریتم رشد الگوی تکرارشونده .......................................................................................................... 55
    1-5-2 چرا رشد الگوی تکرار سریع است؟ ..................................................................................... 58
    6-2 مقایسه دو الگوریتم Apriori و FP-growth ...................................................................................... 59
    7-2 تحلیل ارتباطات ...................................................................................................................................... 63
    فصل 3: وب¬کاوی و متن¬کاوی ................................................................. 65
    1-3 وب¬کاوی ............................................................................................................................................... 66
    1-1-3 الگوریتمهای هیتس و لاگسام ............................................................................................... 69
    2-1-3 کاوش الگوهای پیمایش مسیر .............................................................................................. 76
    2-3 متن¬کاوی ............................................................................................................................................... 80
    1-2-3 کاربردهای متن¬کاوی ........................................................................................................... 82
    1-1-2-3 جستجو و بازیابی .............................................................................................. 83
    2-1-2-3 گروه¬بندی و طبقه¬بندی ...................................................................................... 83
    3-1-2-3 خلاصه¬سازی .................................................................................................... 84
    4-1-2-3 روابط میان مفاهیم ............................................................................................. 84
    5-1-2-3 یافتن و تحلیل گرایشات .................................................................................... 84
    6-1-2-3 برچسب زدن نحوی (pos) ............................................................................... 85
    7-1-2-3 ایجاد Thesaurus و آنتولوژی به صورت اتوماتیک ......................................... 85
    2-2-3 فرایند متن¬کاوی ................................................................................................................... 86
    3-2-3 روشهای متن¬کاوی ............................................................................................................... 87
    مراجع ..................................................................................................... 89
     

کلمات کلیدی: data mining - داده - داده کاوی

موضوع پایان نامه داده کاوی (Data Mining), نمونه پایان نامه داده کاوی (Data Mining), جستجوی پایان نامه داده کاوی (Data Mining), فایل Word پایان نامه داده کاوی (Data Mining), دانلود پایان نامه داده کاوی (Data Mining), فایل PDF پایان نامه داده کاوی (Data Mining), تحقیق در مورد پایان نامه داده کاوی (Data Mining), مقاله در مورد پایان نامه داده کاوی (Data Mining), پروژه در مورد پایان نامه داده کاوی (Data Mining), پروپوزال در مورد پایان نامه داده کاوی (Data Mining), تز دکترا در مورد پایان نامه داده کاوی (Data Mining), تحقیقات دانشجویی درباره پایان نامه داده کاوی (Data Mining), مقالات دانشجویی درباره پایان نامه داده کاوی (Data Mining), پروژه درباره پایان نامه داده کاوی (Data Mining), گزارش سمینار در مورد پایان نامه داده کاوی (Data Mining), پروژه دانشجویی در مورد پایان نامه داده کاوی (Data Mining), تحقیق دانش آموزی در مورد پایان نامه داده کاوی (Data Mining), مقاله دانش آموزی در مورد پایان نامه داده کاوی (Data Mining), رساله دکترا در مورد پایان نامه داده کاوی (Data Mining)

پايان نامه دوره کارشناسي کامپيوتر گرايش نرم افزار اسفند 86 چکيده بررسي ومطالعه ي کامل داده کاوي و داده کاوي با SQL SERVER2005 پياده سازي آن روي بانک اطلاعاتي دانشگاه آزاد قوچان &nbs

پايان­نامه براي دريافت درجه کارشناسي ارشد در رشته مهندسي عمران گرايش مکانيک خاک و پي شهريور    1393  چکيده سدها همواره از سازه ­هاي زير بنايي شمرده مي‌شون

پايان نامه جهت اخذ درجه کارشناسي ارشد رشته مهندسي صنايع مهر 1391 شناسايي ارزش[1] مشتريان، از مولفه‌هاي اصلي موفقيت در فروشگاه‌ هاي مختلف مي‌باشد که امروزه مورد توجه بيش از پيش قر

پایان نامه کارشناسی ارشد رشته مدیریت امور شهری چکیده شهرداری یکی از کلیدی ترین سازمان هایی است که در ارائه ی خدمات شهری به شهروندان نقش مهمی ایفا می کند. این سازمان با به کار بستن دانش فن آوری اطلاعات و سیستم های مخابراتی و نیز توان متخصصان داخلی و مجرب در مدیریت شهری، سامانه ای را ایجاد نموده است که شهروندان را نسبت به محیط زندگی خویش وارد عرصه مدیریت می نماید و تلاش نموده امور ...

پایان‌نامه کارشناسی ارشد در رشته‌ی کامپیوتر - مهندسی نرم افزار چکیده بررسی اطلاعات بیمه های اتومبیل نشان داده عواملی چون نوع استفاده خودرو، داشتن گواهینامه رانندگی، نوع گواهینامه و تطابق یا عدم تطابق آن با وسیله نقلیه، مبلغ حق بیمه، میزان تعهدات بیمه نامه، کیفیت خودروی خودرو سازان، سن راننده، سواد راننده، عدم تطابق حق بیمه با مورد بیمه، تاخیردرتمدید بیمه نامه، در سود و زیان شرکت ...

پایان نامه کارشناسی ارشد(M.sc) چکیده: امروزه هرزنامه[1] ها یکی از مشکلات اصلی موتور های جستجو هستند، به این دلیل که کیفیت نتایج جستجو را نامطلوب می سازند. در طول سالهای اخیر پیشرفتهای بسیاری در تشخیص صفحات جعلی وجود داشته است اما در پاسخ تکنیک های هرزنامه جدید نیز پدیدار شده اند. لازم است برای پیشی گرفتن به این حملات، تکنیک های ضد هرزنامه بهبود یابد. یک مساله عادی که ما با آن در ...

پایان­نامه برای دریافت درجه کارشناسی ارشد در رشته مهندسی عمران گرایش مکانیک خاک و پی چکیده سدها همواره از سازه­ های زیر بنایی شمرده می‌شوند و دارای ارزش حیاتی می­باشند. در گذشته ایجاد سد عمدتاً با اهداف تأمین آب آشامیدنی و آبیاری مزارع کشاورزی بوده ولی امروز به دلیل نیاز به انرژی برق آبی و اهداف دیگر توسعه بیشتری یافته است. برآورد میزان ۲۰ میلیارد متر مکعب برداشت از آب‌های شیرین ...

پایان نامه­ی کارشناسی ارشد در رشته­ی مهندسی کامپیوتر- نرم­افزار چکیده آسیب پذیری­ های نرم افزار می­تواند منجر به تلفات مالی و اطلاعاتی شود. به علت محدود بودن منابع مالی و انسانی، اولویت دهی به آسیب­ها بسیار مورد توجه می­باشد. پیش از این پژوهش، تعداد زیادی از محققان آسیب پذیری­ها را براساس دانش­های تجربی و آماری، رده بندی کرده­اند. اماگاهی طبیعت متغییر آسیب پذیر ی­ها، فراهم کردن ...

پایان نامه تحصیلی برای دریافت درجه کارشناسی ارشد رشته مهندسی عمران گرایش سازه های هیدرولیکی چکیده: بدیهی است منابع آب برای حیات موجودات زنده و بخصوص زندگی بشر امری ضروری است.. تخلیه کننده‌ها مجموعه‌ای از سازه‌ ها هستند که برای انتقال آب از دریاچه سد به نقطه تخلیه در پایین دست به‌کار می‌روند. از اینرو به دلیل اهمیت موضوع این بخش از سد، تحلیل عملکرد تخلیه کننده شامل مجرا، دریچه‌ها ...

پايان نامه براي دريافت درجه کارشناسي ارشد رشته روانشناسي تربيتي بهار 93 چکيده نقشه مفهومي يکي از راهبردهاي ياددهي- يادگيري است که مي تواند يادگيري معنادار را در دانش آموزان تسهيل کند و روابط

ثبت سفارش