پایاننامه کارشناسیارشد مهندسی برق
گرایش کنترل
چکیده
روشهای نوین شناسایی خطا در سیستمها همچون استفاده از تحلیل کیفیوقایع میتواند منجر به نتایج ملموس و قابل فهمیبرای همگان باشد. سیستم توربین گازی جزو سیستمهایی است که احتمال وقوع خطاهای زیادی در آن وجود دارد. و حتی گاهی مدلسازی آنها با روشهای ریاضی به سختی قابل انجام میباشد. روش تحلیل کیفیوقایع به زبانی ساده و گویا درپی راهحل این موضوع است. این روش برای اولین بار توسط اوربان در سال 1972 برای شناسایی خطا در توربین گازی پیادهسازی شد. ولی بهدلیل ضعف در شناسایی خطا مسکوت ماند.
اساس روش تحلیلکیفیوقایع نشاندادن زبانی برای رویدادهایی است که در سلسله فرآیندهای بهم تنیده و مرتبط بهم انجام میپذیرد .در این روش، استخراج، تکهتکه کردن و مرتبسازی رویدادهای بههم پیوسته، بر پایه هفت شکل هندسی استوار شده است. وجه تمایز و خصوصیات منحصر بفرد این اشکال در مشتقات اول و دوم آنها است. که با استفاده از روش حداقل مجموع مربعات خطا برای شناسایی و اندازهگیری همسانی بین آنها صورت میپذیرد. بدین ترتیب که تابع چندجملهای (حداکثر تا مرتبه 2) بر روی کل داده، برآزش میشود. با نتیجه برآزش نامناسب، مجموعه داده، به دو قسمت مساوی تقسیمشده و فرآیند دو نیمهسازی تا جایی که برآزش مناسب حاصل شود، ادامه مییابد. در این میان، معیار سنجش مقبولیت خطا، به روش تست F صورتمیپذیرد. و در نهایت، نظیر متناظر با منحنی برازش شده از اشکال هندسی با اختصاص نام مربوط به شکل هندسی بعنوان یکی از قطعههای شناساییشده از رویداد در کتابخانهای ذخیرهمیشود. قطعههای بعدی نیز به همین منوال به ترتیب فواصل زمانی، در کنار یکدیگر قرارمیگیرند. که حاصل این فرایند شکلگیری یک سیگنال زمانی بهزبان کاراکتراست (تبدیل به زبان مبتنی بر اشکال هندسی اولیه). با این روش سیگنال خطا به عنوان یک الگو، کاراکترسازی میشود. و با استفاده از منطق فازی، شباهتهای بین الگوهای ذخیره شده با دادههای جدید از سنسورها که ناشناخته میباشند؛ مورد ارزیابی، قرار میگیرند. و در صورت مشاهده همسانی با الگوهای خطایی، فرآیند شناسایی خطا انجام میپذیرد.
کلمات کلیدی: دونیمهسازی فواصل، تحلیل کیفی وقایع ، توربینگازی ، منطق فازی
فصل اول
1-1 مقدمه:
پیشرفت دانش و ظهور فناوریهای نوین در زمینه اتوماسیون صنعتی و تجهیزات ابزار دقیق عرصه را بطور موثری برای حضور انسان در جهت کنترل و نظارت بر فرآیندها تنگتر نمودهاست. بهنحویکه رشد بیسابقه مدارات الکترونیکی در سالهای اخیر، موجب شدهاست؛ زمینه برای بسیاری از امکانات در ارتباط با مدیریت و تفسیر دادهها افزایشیابد. سیستمهای پیشرفته میکروپروسسوری یکی از مواردی هستند. که با سریعترشدن سرعت آنها حجم قابل توجهی ازدادهها در مقیاس بزرگ بصورت همزمان در دسترس کاربران قرارگرفته است. که این خود بستر را برای استفاده ازهوش مصنوعی برای امور نظارتی، کنترلی و تشخیصی در طیف وسیعی از فرایندها بیشتر نمایانمیسازد. در صنایع مهمیچون صنعت نیروگاه وجود سیستم توربینگاز بعنوان یک سیستم پیچیده چندبعدی که متشکل از زیر سیستمهای مختلف با پارامترهای غیرخطی است وجود دادههایی با تعداد و مقیاسهای متنوع احتمال اشتباه در تصمیمگیری اپراتورها را در بسیاری از موارد با خطا مواجهمیسازد. به همین منظور تلاشمیشود برای بهرهبرداری بهینه و به حداقل رساندن خطاهای اپراتوری از فناوریهای نوینی که بتوان بصورت خودکار با ذخیرهسازی و تفسیر دادهها خطای بوجودآمده را تشخیص و شناسایی نمود؛ بکارگماشت. ازجمله این روشها استفاده از روش تحلیل کیفی وقایع[1] است. در این روش، وقایع یا سیگنالهای یک فرآیند در فواصل زمانی مختلف که ترکیبی از چند رویداد متوالی است. با تکهتکه و ذخیرهسازی تکتک آنها در قالب مشخصههای ریاضی که به صورت کیفی و کمی طبقهبندی شدهاند. شرایطی را جهت مقایسه با الگوهای اصلی ذخیرهشده، از یک سیگنال واقعی فراهممیآورد.
1-2 تعریف مساله
استفاده از معادلات پیچیده دیفرانسیلی برای شناسایی سیستم و مدلسازی آن همواره با مشکلاتی همراه بوده است. و گاها به دلیل استفاده از فرضیههای سادهکننده یا خطاهای محاسباتی، از مدلسازی دقیقی برخوردار نخواهد بود [۳]. بهمینمنظور، امروزه استفاده از روشهایی که دور از معادلات و محاسبات پیچیده ریاضی باشد. بیشتر مورد توجه قرار گرفتهاست. تحلیل کیفی یکی از روشهایی است که این امکان را به صورت فراگیر در زمینههای مختلف بوجود آورده است.
اساس تحلیل وقایع مشتمل بر دو جزء مهم است:
زبانی برای نشاندادن رویدادها
روشی برای شناسایی رویداد[2]
نحوه نگاشت رویدادها به شرایط و محیط عملیاتی در شکل (1-1) نشان داده شده است.در این شکل زبان وقایع با استفاده از هفت الگوی هندسی که با مشتقات اول و دوم واقعه درارتباط است؛ درنظر گرفته میشود شکل (1-2). برای استخراج این هفت شکل ابتدا نیاز است. کل داده با یک چندجملهای طی یک فرآیند تکراری از درجه صفر تا دو برآزششود. سپس با استفاده از روش تست F معیاری برای سنجش ساختار یا معادله برآزششده به دستمیآید و این روال با تکنیک دونیمهسازی فاصله تا جایی که کل داده با معیار مقبولیت درجه، در معرض تحلیل کیفی یا همان شناسایی واقعه قرارمیگیرد. دادههای به دست آمده پس از عملیات دو نیمهسازی، برآزش و سنجش معیار در کتابخانهای به نام الگوهای اولیه حاصل از تحلیل کیفی بعنوان پایگاه دادهای اصلی، استخراج و ذخیرهمیشوند. سپس به کمک منطق فازی و با استفاده از ماتریس شباهت، الگوهای ذخیرهشده با دادههای ناشناختهای که از سنسورها بدست آمدهاست. و با انجام فرآیند استخراج و کلیه مراحلی که برای سیگنالهای نمونه مورد
زبان ترند
مشخصه استخراج
ویژگی ها
کمی
کیفی
مشخصه نگاشت
شناسایی ترندها
الگو های اولیه
ب
پایگاه داده و قوانین
ب
فرآیندها(حالت/رفتار)
دو نیمه سازی فاصله
ب
شکل (۱-1): نگاشت رویداد به شرایط عملیاتی از نظر کیفیت و کمیت [9]
استفادهقرارمیگیرد، شروع به مقایسه با الگوهای پایگاه که منطبق بر قوانین فازی (آنگاه - اگر) میباشد و از قبل برای رویدادهای این سیستم در نظر گرفتهشده؛ اجرا میشود. و در نهایت غالبترین شرط از حیث کمیت و کیفیت شناسایی خواهدشد [9].
تبدیل یک سیگنال متغیر با زمان به فرمت کاراکتر یا تعیین زبان واقعه در سال ۱۹۹۵ به صورت کاملا جزئی مطرحگردید. ولی از سال ۲۰۰۱ این موضوع بطور جد پیگیریشد تا حدی که مسئله دشوار الگوهایی که در فرآیندهای نویزی استخراج[3] که باعث فقدان شناسایی صحیح در تشخیص میشدند را مورد بازنگری و بهبود قرارداد. مشخصههای نویزی سطح نویز و تغییر یافتن اشکال الگوها با تغییر سرعت نمونه برداری و مقیاسها را شاملمیشدند. برای استخراج
خودکار رویدادها و رسیدن به برآزش[4]مناسب در فرآیند نویزی، روش دونیمهسازی فواصل[5] پبشنهادگردید[6] [8]. در این رویکرد پارامترىکردن دادهها، به صورت دنبالهای از الگو و شکلهای با تکرار آن منجر به بهترین برازش نسبت به نویز خواهدشد [9].
روش دونیمهسازی فواصل یک روش بازگشتی است که در آن، ابتدا یک الگو اولیه به کل دادهها، نسبت داده میشود (برآزش) و در صورتی که شرط لازم در شناسایی مدل احرازنگردید. شروع به نصفکردن فاصله دادهها از همدیگر و تکرار فرآیند نصف کردن، تا جایی که موفقیت در مدل به دستآید. روش استنتاج فازی برای روند[7] در این پایاننامه متکی بر استفاده از استخراج روند به صورت خودکار در فرآیندهای نویزی است [9].
1-3 مروری بر روشهای تحلیل Trend
مقدمه
یک سامانه خوب در زمینه آشکارسازی خطا[8] باید بتواند. در دو فضای ایمن و ناایمن قابلیت تفکیک و جداسازی داشته باشد. و حتی با پیچیده شدن شرایط، سیستم با صرف کمترین هزینه در وقت و زمان و با سرعت بالا بتواند مرز بین حالت امن و ناامن را با فرض شرایط پر نویز درحالتهای مختلفی همچون گذرا و ماندگار تشخیص بدهد و از دادهی استخراج شده این دو بعد را جداسازی نماید. در چنین سیستمهایی میتوان از علوم هوش مصنوعی برای رسیدن به این اهداف بهره جست. در این روشها اساس کار تعریف و ساماندهی دادههای پایگاه است[9]. که ازجمله آنها میتوان به نرمالایزکردن و تبدیل آنها به بردار اشاره کرد. و یا شبکه را تحت آموزشقرارداد یعنی از روشهای مختلفی مجموعههای در دسترس را بصورت تصادفی برای آموزش و مجموعه دیگری را برای تست انتخاب نمود .ضمن اینکه در شرایط نویزی شبکه خود را مورد ارزیابی قرار میدهد. تا با دیتایی که تا بحال دیده نشده هم عکس العمل مناسبی داشته باشد. از آنجایی که در بیشتر صنایع دادهها بصورت رشتههای ادامهدار ومتغیر با زمان به مرکز کنترل ارسال میشوند. استراتژیی شناسایی خطا انجام پردازشهایی بر روی این رشتهها یا بعبارت دیگر روندهاست (سریهای زمانی). که با انتخاب شبکه مناسب و آموزش آن سعی در تفکیک دو کمیت مطرح شدهی امن و ناامن خواهد بود. که در ادامه به آن خواهیم پرداخت .
1-3-1 روش سه گوشهسازی یا مثلثبندی
در سیستمهای هوشمند، برتری اصلی در حل مساله تشخیص و شناسایی، میتوان به سهولت در تعمیم، برهان شفاف و گویای آن اشاره نمود. یکی از این روشها که اخیرا در بیشتر موارد تحقیقاتی مورد توجه قرار گرفته است روشCheung میباشد. که در غالب یک چهارچوب اصلی و پایهای بعنوان اساس کار برروی روندهایی از فرآیند[10] در سال 1992ایجاد و ارائه گردید. که به روش مثلثبندی ضمنی[11] فرموله شده، برای بررسی روندها مطرح گردید. و اساس کار این روش مبتنی بر اصول هندسی مدل شده میباشد.
Triangulation یا سه گوشهسازی روشی است؛ که در آن بخشهایی از روند توسط شیب ابتدا و انتهای منحنی با یک خطی بر روی قطعهای از روند[12]، مابین دو نقطه متصل میگردد، تعریف میشود. الگوهایی در شکل(1-3) منطبق بر این روش نشان داده شده است.
شکل(1-3): روش سه گوشهسازی یا مثلثبندی
یکی از مزایای استفاده از این تکنیک کاربردهای فراگیر آن در هر نوع سیگنالی است. به نحوی که میتوان آنرا بر روی هر سیگنالی پیادهسازی نمود. و الگوریتم سه گوشهسازی را در اجزا مختلف سیگنال اجرا و طبقه بندی نمود؛ بعبارتی میتوان در هر نوع از سیگنال با استفاده از اشکال هدسی بدست آمده؛ به هر واقعهای از فرآیند تعمیم داد (شکل (1-4)).
شکل(1-4): الگوهای تعمیم یافته برای هر نوع روند از روش سه گوشهسازی
این روش مشابه با روشهای دیگر کار بر روی روندها بوده و نقطه اشتراکها با سایر روشها دقیقا در جایی متمایز میشود که علامت مشتقات اول و دوم به عنوان عوامل تعیین کننده برای جداسازی و طبقهبندی قطعات کاربرد عینی داشته باشند (شکل(1-2)).
در روشهای مشابه دیگر که هدف این مقاله حول این موضوع قرار دارد؛ بصورت اجزاء پایهای و اصلی از روند و به عنوان الگوهای اولیه محسوب شده و به شکلهای زیر نشان داده میشوند.
A(0,0), B(+,+), C(+,0), D(+,-), E(-,+), F(-,0), G(-,-)
1-3-2 روش موجک[13]
تئوری موجک[14]، که بر مبنای سیستم تطبیقی غیرخطی بود در سال 1997برای شناسایی روندها از اطلاعات استخراج شده از سنسورها با نام W-ASTRA ارائه گردید. و بعدها به B-Splines پایهگذاری و برای کاربردهای روندها پیشنهاد گردید. در این تکنیک از مفهوم آنالیز multiresolution در ورودی شبکه عصبی استفاده شد. و پیش از هر کاری اطلاعات سنسورها بر روی توابع سنجشی[15] در سطوح مختلف طرحریزی میشدند؛ صورت پذیرفت. و ضرایب از سطوح بالاتر برای شناسایی الگوهای اولیه استفاده میگردید. و زمانیکه یک الگو یکتا و منحصربفرد شناسایی میشد. آنرا در مجموعه از نمونهها، جمعآوری میکرد. و در غیر اینصورت ضرائب از سطوح پایین مورد استفاده قرار میگرفت. و در نهایت W-ASTRA رویداد یا داده سنسور را با اثر خطایی[16]، که قطعهای از خود روند بود و از قبل بهمین روش در پایگاه دادهای ذخیره شده بود مقایسه میشد. و بدین ترتیب الگوریتم شناسایی خطا انجام میپذیرفت.
1-3-3 روش جداسازی دو بعدی
در روش جداسازی یک بعدی برای آشکارسازی خطا، با تعیین مرزهایی از هدف، زمانی که داده، توزیع غیر محدبی داشت. صراحتا در جداسازی دادهی نامعلوم و ناشناخته، با اطمینان خاطر صورت نمیپذیرفت. ولی با فرض استفاده از روش جداسازی به شیوه دوبعدی میتوان برای تعیین محدوده نرمال و خطا، دو فضای متفاوتی تعریف کرد. که براحتی قابل تفکیک باشند مطابق شکل(1-5) به نحوه ساخت مرزهای تصمیمگیری بین دو بعد از دیتاها، دیتای نرمال و دیتای فالتی با این فرض که دیتای فالتی در دسترس و قابل اندازهگیری باشد. انجام پذیرفت.
شکل(1-5): مرزهای تصمیمگیری بین دو بعد
تابع جداکننده دو بعدی را که خروجی آن با +1 و -1 علامت گذاری شده را در نطر بگیرید:
(۱-1)
اگر جداکننده از هر روش شناخته شدهای نتواند روش جداسازی را انجام بدهد. آزمونی را برای پیبردن به قانونی که از مجموعه نمونههای آموزشی محدود، بدست میآورد؛ بکار میبرد. البته در این مورد ریسکهای ذاتی نیز وجود دارند. مثل زمانی که نمونههای آموزشی ممکن است خیلی نهادینه و مشخص نباشند. واریانس ذاتی، نویز در اندازهگیری میتواند قانون جداسازی بدست آمده را خیلی بزرگ نماید. همچنین نمونههای آموزشی کوچکتر، بیشترین قطعیت را برای مساله بوجود میآورند [13].
زمانی که یک نمونه آموزشی خوب در دسترس قرار میگیرد. تعداد توابعی که برای تخمین دقیق و fit آن انجام میشود؛ خیلی زیاد است. بهمین دلیل در اکثر موارد نوع تابع f و تعدادی از پارامترهای w قبلا انتخاب میشوند.
برای فهم مطلب مجموعه دادههای آموزشی را بفرم زیر تعریف میکنیم:
X := {x , x ,..., xm}⊆ با m=Nو Y:={ , }
این دادههای بهم attach شده را در نظر بگیرید. تابع f باید بردار x را برای تخمین y= اجرا نماید. پارامترهای بهینه w برای تابع f روی مجموعه دادههای آموزشی بصورت زیر تعریف میشوند:
(۱-2) w= argmin ( f,w, X )
( f,w, X ) این عبارت امید خطای آزمون برای تابع در محاسبه به تابع چگالی احتمال برای همه xها و yها است .
رابطه تخمین خطای صحیح:P(x,y)dxdy در بیشتر مسالههای جداسازی عبارت P(x,y) نامعلوم است که فرض براین است نمونههای آموزشی توزیع مستقل و غیروابستهای از هم دارند. بنابراین فرمول تابع خطا برروی تابع f بفرم زیر تعریف میشود.
(۱-3)
که عدد ثابت برای انتخاب خاصی از w روی مجموعه خاص آموزشی است. کمیت بین صفر و یک متغیر میباشد. بهترین جداسازیها زمانی رخ خواهد داد. که در بین داده
های دیده نشده و جدید، بتوان جداسازی را بخوبی انجام داد. البته با این شرط که آموزش از حد معینی فراتر نرود.
در شکل (1-6) که یک مثال مفهومی است. در این شکل آموزش بیش از حد[17] به الگوریتم رخ داده است. اگر چه خوشهها بدرستی جداسازی شدهاند. ولی در عوض هزینه و زمان زیادی
شکل(1-6): یک نمونه از آموزش بیش از حد به الگوریتم
برای آموزش و اجرای الگوریتم لازم بوده است. که این مساله با تعمیم شبکه و الگوریتم دچار مشکل خواهد شد. در الگوریتم تفکیک سازی سیگنالهای غیرنرمال از نرمال هدف اصلی یافتن جداکنندهای است که ضمن داشتن تعمیم خوب بتواند موارد دیده نشده و ناشناخته را هم به خوبی جدا نماید[13].
1-3-4 روش ماشین بردار پشتیبان[18]
ماشین بردار پشتیبانها (SVM) از الگوریتم آموزشی نظارتی استفاده میکنند. که برای اولین بار توسط vapink در سال 1963 برای تشخیص الگو استفاده گردید. مجموعه بردارهای آموزشی معین (مثالهای ورودی مثبت و منفی) به ازای هر با برچسب که علامتگذاری شده را شامل میشد. ماشین بردار پشتیبان با تشکیل یک مرز تصمیمگیری خطی بین دو بعد، آنها را ازهم متمایز میکند. اخیرا از ماشین بردار پشتیبانها در بیشتر مقالات و تحقیقات برای توسعه تکنیکها و تئوریهای مرتبط با رگرسیون و تخمین چگالی استفاده میشود. در دستهبندی و جداسازی دودویی (تفکیک) از مجموعه بردارهایی که بصورت زیر نشاندار میشوند؛ از قالب زیر استفاده میشود:
:={ ,
در اینجا کاری که باید انجام داد. آموزش یک ماشین بردار پشتیبان جداکننده برای یادگیری ارتباط بین داده و نشانههای مربوطه میباشد.
اساسا خود ماشین بردار پشتیبان یک جداکننده غیرخطی است. که با تکنیکهای خطی که منتج به تابع نگاشت غیرخطی میشود؛ تعریف میگردد. تفسیر هندسی ماشین بردار پشتیبان الگوریتم جستجو برای دو سطح (یا سطوح جداکننده) بصورت بهینه است و این سطوح یا ابر صفحهها[19] بیشترین فاصله از دو بعد را دارند. در ادامه قابلیت تفکیکپذیری خطی ماشین بردار پشتیبان و قابلیت جداسازی غیرخطی مطرح میشود [13].
قابلیت تفکیک پذیری:
درماشین بردار پشتیبان ،ابر صفحههای خطی یاد میگیرند چگونه بین دو بعد را تمییز دهند (شکل(1-7)).
شکل(1-7): قابلیت تفکیک پذیری در SVM
فاصله ابر صفحه با نزدیکترین نمونه مثبت (یا منفی) را حد یا حاشیه[20] ابر صفحه مینامند. ماکزیمم حاشیه ابر صفحه برابر بافاصله بین مرزهای بعدهاست.
یک ابر صفحه خطی بصورت f (x) = [w, x] + b تعریف میشود.b بایاس وw بردار نرمال وزن برای ابر صفحه است. بدست آوردن f (x) = ( x + b) با بیشترین حاشیه (حد) که عبارت استاز :
f( ) = [w, x ]+ b ≥ 1 , for =1
f( ) = [w, x ]+ b ≤ −1, for = −1
معادله فوق را میتوان بصورت نامعادله زیر نشان داد:
(۱-4) ( .w+ b) -1≥ 0,
در ماشین بردار پشتیبان وظیفه اصلی آموزش دو پارامتر w و b در f (x) = ( x + b) و به دنبال آن حل بهینه معادله است. یعنی یافتن w و b کمینه داریم:
(۱-5)
( .w+ b) -1≥ 0, i
برای این منطور تابع لاگراژین را بصورت زیر تعریف مینماییم:
L(w,b,α)= w- [ +b)-1] ≥ 0,
شرط لازم در نقطه زینی عبارت استاز:
=0,
=0,
حل معادله برای شرایط بحرانی :
W=
باجایگزین کردن W= در تابع لاگراژین و با استفاده از بعنوان قید جدید مساله بهینه را میتوان به شکل زیر بیان کرد:
یافتن ماکزیمم مقدار
(۱-6)
در مورد رابطه:
برای هر نمونه آموزشی در ضرب کننده لاگرانژ یک وجود دارد. که این نمونهها به ازای هر مثبت به بردارهای پشتیبان موسوم هستند. در نهایت با داشتن مقادیر و حل مساله، رابطه پیشبینگر، ماشین بردار پشتیبان بصورت زیر بیان میشود:
(۱-1)f(x) = ( +b)=
که مقدار b برابر است با:
(۱-7) b =
مجموعه بردارهای پشتیبان است.
تفکیک ناپذیری :
تکنیک جداسازی داده در یک فضای ویژه با تابع نگاشت غیرخطی که این قابلیت جداسازی بصورت خطی بود؛ بیان گردید. برای شرایطی که تفکیک ناپذیری در داده وجود داشته باشد. در نظر گرفتن متغیری بنام لقی( ) ضروری است (شکل(1-8)).
معادلاتی که در بخش تفکیک پذیری بیان شد. با در نظر گرفتن متغیر لقی بصورت زیر بیان میشود:
f( ) = [w, ]+ b ≥ 1- , for =1
f( ) = [w, ]+ b ≤ −1+ , for = −1:
[1] - Qualititative Trend Analysis(QTA)
۱- الگو ها بتوانند بعنوان تابع متعارف پیوسته مورد استفاده قرار بگیرند
[3] - Extraction
[4] - Fit
[5] - Interval-Halving
[6] -Dash, Rengaswamy, and Venkatasubramanian
۳- رویداد
[8] - Detection
[9] - Preprocessing
[10] - process trends
[11] - triangular episodic
[12] - segment
[13] - Wavelet
[14] - Vedam
[15] - scaling function
[16] - fault signature
[17] - overtarinig
[18] - Support Vector Machine(SVM)
[19] -Hyperplanes
[20] - margin