6-سیستم تشخیص و شناسایی محیط یک ربات متحرک برای بازرسی مجاری و لوله های سیستم تهویه
1- مقدمه
وظیفه ی یک سیستم تشخیص و شناسایی (سیستم بیناییVS) یک ربات بازرسی اتوماتیک که برای اولین بار در مرکز اصلی طراحی ماشین آلات دانشگاه سیلسیان تکنولوژی ساخته شده بود، بازرسی لوله ها و مجاری سیستم تهویه می باشد. سیستم بینایی (VS) اطلاعات مربوط به محیط ربات را جمع آوری کرده، آنها را پردازش و در نهایت تجزیه و تحلیل می نماید. نتایج به دست آمده به شکل یک پیام بسیار ساده، به سیستم کنترل (CS) منتقل می گردد. مهمترین وظیفه ی سیستم بینایی شناسایی موانع و اشکال آنها می باشد. این ربات مجهز به یک دوربین کوچک دیجیتالی است که در قسمت جلویی ربات قرار گرفته است (شکل1). در این ربات دو گروه از پردازنده ها ساخته شده اند:
- پردازنده هایی که بر روی برد کامپیوتر نصب می شوند (ثبت، تعیین جدول زمانبندی، انتخاب، تشخیص و انتقال).
پردازنده هایی که بر روی کامپیوتر اپراتور نصب می گردند (تجسم، ثبت مستندسازی فیلم).
شکل 1 یک دوربین در جلوی ربات
تمامی پردازندههای سیستم بینایی (VS) تحت برنامههای Matlab و C++ ساخته شدهاند و در محیط سیستم عامل قوی و پر سرعت linux کار میکنند. سه حالت کاری برای سیستم بینایی (VS) وجود دارد:
- دستی: تصاویر (فیلمها) بر روی مانیتور اپراتور دیده میشوند و فرایند مستندسازی فیلم، ثبت گردیده و ربات توسط یک اپراتور کنترل میگردد. تشخیص و پردازش تصاویر غیر فعال است.
- اتوماتیک: تصاویر ثبت شده به عنوان یک تصویر واحد به کامپیوتر ارسال میگردند. ( این تصاویر بعد از فرایند معکوس فشردهسازی (decompression) بر روی برد کامپیوتر انتخاب میشوند). در این حالت تشخیص و پردازش تصویر فعال است.
- تمرینی (همراه با معلم) : فیلمهای موجود به کامپیوتر اپراتور ارسال میگردند. ربات توسط یک اپراتور کنترل میگردد. تشخیص فرامین اپراتور با فعالسازی پردازندههای سیستم تشخیص و تصویر مطابقت داده میشوند (همگامسازی میشوند) . هدف از به کارگیری این حالت، یکپارچه کردن اطلاعات موجود در سیستم کنترل ربات است. این اطلاعات در یک فرایند خودآموزشی (self-learning) و در اواسط فرایند ساخت، مورد استفاده قرار میگیرند.
2- ثبت، انتقال و تجسم تصویر
زمانی که محیط درونی لوله تاریک یا براق باشد، روش نورپردازی معنی و مفهوم خاص خود را پیدا میکند. ثبت تصویر با استفاده از آزمایش نورپردازیهای مختلف، اولویتبندی میگردد. مهمترین نیازهای این کار، اندازهی کوچک تصاویر و مصرف انرژی کم میباشد. چندین منبع (انواع دیودها و لامپهای سفید) در این فرایند مورد آزمایش قرار گرفت (شکل 2).
در نتیجه برای نورپردازی 12 دیود انتخاب شدهاست. (یک سیستم در چراغ جلویی ماشین نیز به کار گرفته شده است). ثبت تصویر به وسیلهی مجموعهای که شامل یک دوربین دیجیتالی (زاویهی دید 96 2.8mm,,0.3Lux,خطوط(520TVو یک مبدل فریم CTR-1472 صورت میگیرد. شفافیت فیلم 720×570 پیکسل میباشد که در فرمت MPEG-4 فشرده شده است.فرایند انتقال در حالت دستی فعال است. در حالت اتوماتیک انتخاب و فرایند معکوس فشردهسازی انجام میگیرد. پردازش تصویر تنها زمانی صورت میگیرد که در اطراف ربات تغییراتی رخ دهد.
شکل 2 مثالهای انتخابی از منابع نور الف- LEDسفید، ب-LEDآبی، ج- LEDلامپ سقفی، د-چراغ جلوی ماشین
تنها تصاویر انتقال داده شده به مانیتور اپراتور قابل رویت هستند. با توجه به حالت کاری، اپراتور فیلمهای انتقال داده شده را مشاهده میکند. (حالت دستی و تمرینی)
تصاویر انتقال داده شده به عنوان یک سند فیلمی ذخیره میگردد. جمعآوری این چنین اسنادی یکی از اصلیترین وظایف ربات میباشد.
3- تجزیه و تحلیل و پردازش تصاویر
دو حالت و روش اصلی در تجزیه و تحلیل تصویر ساخته شده است. هدف از اجرای اولین حالت، استخراج برخی از ویژگیهای تصویر میباشد. تغییر شکل تک فام، برطرفسازی انعکاس، اجرای فرایند باینری، تساویسازی پیشین نما (هیستوگرام) و فیلترسازی، در این پروسه به کار گرفته شده است. نتایج به دست آمده از این روند در شکل 3 نمایش داده شده است
شکل 3 مثالهایی از تصاویر و نتایج فرایند آنها
فرایند تجزیه و تحلیل به کار گرفته شده برای تصاویر در شکل 3 نمایش داده شده است. نتایج تجزیه و تحلیل پنج ویژگی میباشد که برای شناسایی موضوعات، محاسبه میگردند(فاکتورهای شکل و زمان). این ویژگیها دارای معیارهای متفاوتی برای اشکال مختلف لولهها و موانع هستند که این امکان را برای شناسایی آنها فراهم میکنند. به هر حال تحقیقات انجام گرفته نشان میدهند که تشخیص تصویر بر اساس این معیارها و در حالت وجود اشکال فشرده شده، نمیتواند نتایج مورد نظر را ارائه کند (تغییرات اندازه و منحنی).
علاوه بر آن این پروسه نیازمند این است که یک روش پیشرفته مصرف زمان پردازش تصویر، به کارگیری شود. با توجه به این نتایج بود که دیگر روشهای کار ساخته شد. به منظور دستیابی به یک شفافیت بسیار پایین که برای تشخیص اشیاء واحد قابل رؤیت در تصویر کافی باشد، تصاویر مجدداً نمونهبرداری گردیدهاند (شکل 4). این تصاویر وارد شبکهی عصبی به کار گرفته شده در مرحلهی تشخیص میگردند
شکل 4 مثال دیگر شفافیت الف-و ج-720*576 ب-و د-30*30
4- تشخیص تصویر
سیستم تشخیص تصویر بر اساس برنامه شبکههای عصبی که با استفاده از تصاویر ثبت شده در لولهها و مجاری دارای پیکربندیهای مختلف، مورد آزمایش قرار گرفته، طراحی گردیده است. (شکل 5)
شکل 5 تهویهی غبار استفاده شده به عنوان مرحلهی تست
یک مجموعه برنامه از تصاویر و الگوها ساخته شده است. بر اساس نتایج به دست آمده از آزمایشات صورت گرفته بر روی شبکههای عصبی، یک ساختار شامل چندین لایهی سه گانهی پرسپترون (ادراکی-حسی) به کار گرفته شده میباشد. هر شبکهی واحد با یک مانع متمایز شده مطابقت دارد (شکل یا منحنی).
با توجه به شفافیت تصویر، یک شبکهی واحد دارای تعداد مختلفی از ورودیها میباشد. پایینترین عدد 30×30pixel میباشد. تمامی شبکهها دارای ساختاری مشابه میباشند. این کار همراه با فرایند آزمون و خطا بوده و به ترتیب زیر میباشد: لایهی ورودی دارای 10 رشتهی عصبی میباشد (فرایند فعالسازی (tangensoidal، لایهی پنهان دارای سه رشتهی عصبی (فرایند فعالسازی (targensoidal و لایهی خروجی دارای دو رشتهی عصبی است (فرایند فعالسازی منطقی).
با توجه به روش آموزشی، الگوریتم متحرک ترکیبی مدرج مورد استفاده قرار میگیرد. برای هر شبکه، هر مثالی به ترتیب زیر انتخاب میگردد: در نیمهی نخست مثال اشکال باید تشخیص داده شوند و در نیمهی دوم مثال تصاویر انتخاب شدهی (به صورت تصادفی) دیگر اشکال را ارائه میدهند. این شیوه از نتایج تستهای متعدد به دست آمده است و بهترین تأثیر را ارائه میدهد.
این مسئله باید مورد توجه قرار گیرد که نتایج مربوط به تست شبکهی عصبی به شدت به نحوهی نورپردازی و اهداف دوربین بستگی دارد. البته به تعداد مثالها و اولین میزان شفافیت تصویر نیز بستگی دارد. نتایج تستهای موجود این امکان را فراهم میکند تا میزان مؤثر بودن طبقهبندیها در حدود 88 درصد باشد. این چنین شفافیت پایین تصویر و تعدادی رشتههای عصبی در یک شبکهی واحد، در طول انجام تمرین شبکهای، نیازمند استفاده از 4500 مثال میباشند. به منظور افزایش تعداد تصاویر آزمایش تعداد کمی پارازیت متفاوت به تصویر ارائه میگردد.
5- خلاصه
مهمترین فاکتوری که بر میزان صحت تشخیص تأثیرگذار است، شفافیت بسیار پایین میباشد. به هر حال، افزایش این حالت باعث کاهش غیرخطی یک تعداد از مثالهای مورد نیاز برای آموزش شبکهای میشود. در مرحلهی جاری تحقیقات، برنامهی شبکهی سلولی آزمایش میشود. یکی از حالتهای مورد نظر این است که خروجی این شبکهها میتواند به عنوان ورودی به تصویرشناس(perceptron) سه لایهای مورد استفاده قرار گیرد. مهمتر از همه اینکه به نظر میرسد این خروجیها نسبت به فاکتورهای اشکال دقیقتر بتوانند این اشکال را شرح بدهند و همزمان تعداد آنها کمتر از تعداد پیکسلهای تصاویر باشد و شفافیت آنها نیز افزایش پیدا کرده باشد.