1-     مقدمه

وظیفه‏ ی یک سیستم تشخیص و شناسایی (سیستم بیناییVS) یک ربات بازرسی اتوماتیک که برای اولین بار در مرکز اصلی طراحی ماشین‏ آلات دانشگاه سیلسیان تکنولوژی ساخته شده بود، بازرسی لوله‏ ها و مجاری سیستم تهویه می‏ باشد. سیستم بینایی (VS) اطلاعات مربوط به محیط ربات را جمع‏ آوری کرده، آن‏ها را پردازش و در نهایت تجزیه و تحلیل می‏ نماید. نتایج به دست آمده به شکل یک پیام بسیار ساده، به سیستم کنترل (CS) منتقل می‏ گردد. مهم‏ترین وظیفه ‏ی سیستم بینایی شناسایی موانع و اشکال آن‏ها می ‏باشد. این ربات مجهز به یک دوربین کوچک دیجیتالی است که در قسمت جلویی ربات قرار گرفته است (شکل1). در این ربات دو گروه از پردازنده‏ ها ساخته شده ‏اند:

-         پردازنده‏ هایی که بر روی برد کامپیوتر نصب می ‏شوند (ثبت، تعیین جدول زمان‏بندی، انتخاب، تشخیص و انتقال).

پردازنده‏ هایی که بر روی کامپیوتر اپراتور نصب می ‏گردند (تجسم، ثبت مستندسازی فیلم).

شکل 1  یک دوربین در جلوی ربات

تمامی پردازنده‏های سیستم بینایی (VS) تحت برنامه‏های Matlab و C++ ساخته شده‏اند و در محیط سیستم عامل قوی و پر سرعت linux کار می‏کنند. سه حالت کاری برای سیستم بینایی (VS) وجود دارد:

-         دستی: تصاویر (فیلم‏ها) بر روی مانیتور اپراتور دیده می‏شوند و فرایند مستند‏سازی فیلم، ثبت گردیده و ربات توسط یک اپراتور کنترل می‏گردد. تشخیص و پردازش تصاویر غیر فعال است.

-         اتوماتیک: تصاویر ثبت شده به عنوان یک تصویر واحد به کامپیوتر ارسال می‏گردند. ( این تصاویر بعد از فرایند معکوس فشرده‏سازی (decompression) بر روی برد کامپیوتر انتخاب می‏شوند). در این حالت تشخیص و پردازش تصویر فعال است.

-         تمرینی (همراه با معلم) : فیلم‏های موجود به کامپیوتر اپراتور ارسال می‏گردند. ربات توسط یک اپراتور کنترل می‏گردد. تشخیص فرامین اپراتور با فعال‏سازی پردازنده‏های سیستم تشخیص و تصویر مطابقت داده می‏شوند (همگام‏سازی می‏شوند) . هدف از به کارگیری این حالت، یکپارچه کردن اطلاعات موجود در سیستم کنترل ربات است. این اطلاعات در یک فرایند خودآموزشی (self-learning) و در اواسط فرایند ساخت، مورد استفاده قرار می‏گیرند.

2-     ثبت، انتقال و تجسم تصویر

زمانی که محیط درونی لوله تاریک یا براق باشد، روش نورپردازی معنی و مفهوم خاص خود را پیدا می‏کند. ثبت تصویر با استفاده از آزمایش نورپردازی‏های مختلف، اولویت‏بندی می‏گردد. مهم‏ترین نیازهای این کار، اندازه‏ی کوچک تصاویر و مصرف انرژی کم می‏باشد. چندین منبع (انواع دیودها و لامپ‏های سفید) در این فرایند مورد آزمایش قرار گرفت (شکل 2).

در نتیجه برای نورپردازی 12 دیود انتخاب شده‏است. (یک سیستم در چراغ جلویی ماشین نیز به کار گرفته شده است). ثبت تصویر به وسیله‏ی مجموعه‏ای که شامل یک دوربین دیجیتالی (زاویه‏ی دید 96 2.8mm,,0.3Lux,خطوط(520TVو یک مبدل فریم CTR-1472 صورت می‏گیرد. شفافیت فیلم 720×570 پیکسل می‏باشد که در فرمت MPEG-4 فشرده شده است.فرایند انتقال در حالت دستی فعال است. در حالت اتوماتیک انتخاب و فرایند معکوس فشرده‏سازی انجام می‏گیرد. پردازش تصویر تنها زمانی صورت می‏گیرد که در اطراف ربات تغییراتی رخ دهد.

شکل 2  مثال‏های انتخابی از منابع نور الف- LEDسفید، ب-LEDآبی، ج- LEDلامپ سقفی، د-چراغ جلوی ماشین

 

تنها تصاویر انتقال داده شده به مانیتور اپراتور قابل رویت هستند. با توجه به حالت کاری، اپراتور فیلم‏های انتقال داده شده را مشاهده می‏کند. (حالت دستی و تمرینی)

تصاویر انتقال داده شده به عنوان یک سند فیلمی ذخیره می‏گردد. جمع‏آوری این چنین اسنادی یکی از اصلی‏ترین وظایف ربات می‏باشد.

 

3-     تجزیه و تحلیل و پردازش تصاویر

دو حالت و روش اصلی در تجزیه و تحلیل تصویر ساخته شده است. هدف از اجرای اولین حالت، استخراج برخی از ویژگی‏های تصویر می‏باشد. تغییر شکل تک فام، برطرف‏سازی انعکاس، اجرای فرایند باینری، تساوی‏سازی پیشین نما (هیستوگرام) و فیلترسازی، در این پروسه به کار گرفته شده است. نتایج به دست آمده از این روند در شکل 3 نمایش داده شده است

شکل 3 مثال‏هایی از تصاویر و نتایج فرایند آن‏ها

فرایند تجزیه و تحلیل به کار گرفته شده برای تصاویر در شکل 3 نمایش داده شده است. نتایج تجزیه و تحلیل پنج ویژگی می‏باشد که برای شناسایی موضوعات، محاسبه می‏گردند(فاکتورهای شکل و زمان). این ویژگی‏ها دارای معیارهای متفاوتی برای اشکال مختلف لوله‏ها و موانع هستند که این امکان را برای شناسایی آن‏ها فراهم می‏کنند. به هر حال تحقیقات انجام گرفته نشان می‏دهند که تشخیص تصویر بر اساس این معیارها و در حالت وجود اشکال فشرده شده، نمی‏تواند نتایج مورد نظر را ارائه کند (تغییرات اندازه و منحنی).

علاوه بر آن این پروسه نیازمند این است که یک روش پیشرفته مصرف زمان پردازش تصویر، به کارگیری شود. با توجه به این نتایج بود که دیگر روش‏های کار ساخته شد. به منظور دستیابی به یک شفافیت بسیار پایین که برای تشخیص اشیاء واحد قابل رؤیت در تصویر کافی باشد، تصاویر مجدداً نمونه‏برداری گردیده‏اند (شکل 4). این تصاویر وارد شبکه‏ی عصبی به کار گرفته شده در مرحله‏ی تشخیص می‏گردند

شکل 4 مثال دیگر شفافیت الف-و ج-720*576 ب-و د-30*30

4-     تشخیص تصویر

سیستم تشخیص تصویر بر اساس برنامه شبکه‏های عصبی که با استفاده از تصاویر ثبت شده در لوله‏ها و مجاری دارای پیکربندی‏های مختلف، مورد آزمایش قرار گرفته، طراحی گردیده است. (شکل 5)

شکل 5  تهویه‏ی غبار استفاده شده به عنوان مرحله‏ی تست

 

یک مجموعه برنامه از تصاویر و الگوها ساخته شده است. بر اساس نتایج به دست آمده از آزمایشات صورت گرفته بر روی شبکه‏های عصبی، یک ساختار شامل چندین لایه‏ی سه گانه‏ی پرسپترون (ادراکی-حسی) به کار گرفته شده می‏باشد. هر شبکه‏ی واحد با یک مانع متمایز شده مطابقت دارد (شکل یا منحنی).

با توجه به شفافیت تصویر، یک شبکه‏ی واحد دارای تعداد مختلفی از ورودی‏ها می‏باشد. پایین‏ترین عدد 30×30pixel می‏باشد. تمامی شبکه‏ها دارای ساختاری مشابه می‏باشند. این کار همراه با فرایند آزمون و خطا بوده و به ترتیب زیر می‏باشد: لایه‏ی ورودی دارای 10 رشته‏ی عصبی می‏باشد (فرایند فعال‏سازی (tangensoidal، لایه‏ی پنهان دارای سه رشته‏ی عصبی (فرایند فعال‏سازی (targensoidal و لایه‏ی خروجی دارای دو رشته‏ی عصبی است (فرایند فعال‏سازی منطقی).

با توجه به روش آموزشی، الگوریتم متحرک ترکیبی مدرج مورد استفاده قرار می‏گیرد. برای هر شبکه، هر مثالی به ترتیب زیر انتخاب می‏گردد: در نیمه‏ی نخست مثال اشکال باید تشخیص داده شوند و در نیمه‏ی دوم مثال تصاویر انتخاب شده‏ی (به صورت تصادفی) دیگر اشکال را ارائه می‏دهند. این شیوه از نتایج تست‏های متعدد به دست آمده است و بهترین تأثیر را ارائه می‏دهد.

 

 

این مسئله باید مورد توجه قرار گیرد که نتایج مربوط به تست شبکه‏ی عصبی به شدت به نحوه‏ی نورپردازی و اهداف دوربین بستگی دارد. البته به تعداد مثال‏ها و اولین میزان شفافیت تصویر نیز بستگی دارد. نتایج تست‏های موجود این امکان را فراهم می‏کند تا میزان مؤثر بودن طبقه‏بندی‏ها در حدود 88 درصد باشد. این چنین شفافیت پایین تصویر و تعدادی رشته‏های عصبی در یک شبکه‏ی واحد، در طول انجام تمرین شبکه‏ای، نیازمند استفاده از 4500 مثال می‏باشند. به منظور افزایش تعداد تصاویر آزمایش تعداد کمی پارازیت متفاوت به تصویر ارائه می‏گردد.

5-     خلاصه

مهم‏ترین فاکتوری که بر میزان صحت تشخیص تأثیرگذار است، شفافیت بسیار پایین می‏باشد. به هر حال، افزایش این حالت باعث کاهش غیرخطی یک تعداد از مثال‏های مورد نیاز برای آموزش شبکه‏ای می‏شود. در مرحله‏ی جاری تحقیقات، برنامه‏ی شبکه‏ی سلولی آزمایش می‏شود. یکی از حالت‏های مورد نظر این است که خروجی این شبکه‏ها می‏تواند به عنوان ورودی به تصویرشناس(perceptron) سه لایه‏ای مورد استفاده قرار گیرد. مهم‏تر از همه اینکه به نظر می‏رسد این خروجی‏ها نسبت به فاکتورهای اشکال دقیق‏تر بتوانند این اشکال را شرح بدهند و همزمان تعداد آن‏ها کم‏تر از تعداد پیکسل‏های تصاویر باشد و شفافیت آن‏ها نیز افزایش پیدا کرده باشد.