چکیده: در این تحقیقات چندین روش همراه با بعضی معایب و محاسن آن مورد بررسی واقع شده است از جمله: شناسایی خودرو در تصاویر هوایی شناسایی خودرو مبتنی بر جزئیات در تصاویر خیابانی، شناسایی خودرو در الگوریتم Icm و در نهایت Vision bqased ACC در پایان پروژه توضیحاتی در باب سیستم حمل و نقل هوشمند و چگونگی و کاربرد شناسایی خودرو ارائه شده است.
حال به صورت کلی به بیان برخی از این یافتهها میپردازیم.
درشناسایی خودرو در عکسهای هوایی، یک سیستم برای شناسایی خودروها در تصاویر هوایی در طول جاده عرضه میشود و شروع کار ازتستهای روانشناسی میباشد تا ویژگیهای مهمی برای شناسایی (همانند مرز بدنه ماشین، مرز جلوی شیشه جلو و...)پیدا شود.
که در ساختار Baysian نشان داده شده است.
شناسایی وسیله نقلیه بوسیله VIEW POINT و RESOLUTION انجام میشود.
و وسیله نقلیه به عنوان مستطیل مدل میشود از میانگین gray level و سطحهای شیبدار درونی، بیرونی و میانی وسایل برای تشخیص استفاده میشود.
در یک تشخیص دوربین ایستا، اشیای در حال حرکت بوسیله back ground subtraction شناسایی میشود.
در دیاگرام سیستم تشخیص، ماشین هندسی و دوربین تا وقتی که توزیع کننده ویژگیها بیشتر تعلیم داده شوند بدون یادگیری مدل میشود.
جهت جادهها بوسیله لاینهای انبوه در تصویر تخمین زده میشود و از چهار قسمت از جلوی شیشه جلویی دو قسمت از مرز بیرونی سایه و شدت منطقه سایه هنگامی که وجود دارد به عنوان ویژگی استفاده میشود.
در تست روانشناختی یک مجموعه داده متفاوت با ماشینهای در شرایط آشکار سازی و تراکم مختلف در محیط متفاوت استفاده میشود.
نتایج بدست آمده شامل شکل مستطیلی، طرح wind shield، سایه ماشین تشخیص را آسانتر میکند و همچنین محیط که روی تشخیص اثر میگذارد میباشد.
در دستهای از مسیرهای جاده، مسیرهای مورد نظر (DOI) میتواند بوسیله عکسها تخمین زده شود ویژگیهای استفاده شده در این روش اغلب ویژگیهای گردایان خطی میباشند.
وازجوابهای گرادیان فیلترهای شکل اصلی استفاده میشود.
برای شناسایی ماشینها با ویژگیهای قید شده باید شکل محل وابسته به مرکز را بشناسیم و از یک مدل عمومی شامل یک frame geometrical wire model و یک surface reflectance model استفاده میشود.
در بحث یکپارچگی ویژگیهای چندگانه به ترکیب خصوصیات نیاز داریم و از شبکه Baysian استفاده میکنیم.
در پارامترهای handcraft BN به دستگاههایی با مقادیر CPT نیاز داریم انجام دادن شناسایی با پارامترهای دستی کارایی قابل قبولی را نشان میدهد.
سپس بحث یادگیری پارامترها بیان میشود که به عنوان مثال یادگیری CPT فقط به محاسبات هیستوگرام نیاز دارد پس از آن شناسایی و سپس پردازش بیان خواهد شد.
ضمنا بحث ROC که منحنیهایی هستند که کارایی سیستم ما را روی دو database نشان میدهد مطرح میشود.
بحث بعدی ذکر شده شناسایی ماشین مبتنی بر جزئیات میباشد.
که باعث kay هاکه از تصاویر ماشینها که از مجموعه یادگیری بدست میآید ذکر میشود و به دستهبندیها میپردازد.
یک مخصوص میتواند بیش از یک دسته kay point آمیخته شود.
در پایگاه داده زیرمجموعه منظره خیابان همه عکسها به gray scale از نتایج آزمایشات مختلف استفاده میشود سیستم بنزین SVM های سراسری را اجرا میکند.
آخرین مرحله در شناسایی اشیا در عکسها بکار بستن دسته کنندههای دانا به همه پنجرههای پنهانی در عکسها میباشد.
بحثهایی در مورد شناساییهای چندگانه و روشهای حل آن بیان میگردد.
کاربرد این روش شناسایی ماشین با بکارگیری حد آستانه در آن صورت میگیرد همچنین میتوان از روش برچسبگذاری در ماشینها استفاده کرد که معایب آن هم ذکر خواهد شد.
بحثهایی در مورد شناساگر اجزا و اینکه جهت ارزیابی هر جزء شناساگر، هر شناساگر به صورت زیرمجموعهای از مجموعه تست بیان میشود، ذکر میگردد.
و نیز بحث ترکیب اجزا بیان میشود که در آن سه دیدگاه بیان میشود.
بطورکلی قابل بحث است که آیا دستههای kay point ماشین میتواند به عنوان قسمتهای ماشینی مطرح شوند، یک مقایسه با سیستم کلینگر فراهم میشود که برای نشان دادن دیدگاه مبتنی بر جزئیات از آن استفاده میشود.
مشاهده میشود که سیستم مبتنی بر جزئیات در برابر شرایط غیر عادی همانند درآمیختگی و روشنایی قوی مقاومت بیشتری دارد.
در این ساختار منابع محاسباتی بیشتری نیاز داریم.
در نهایت این روش با کارهای اولیه در شناسایی خودرو مقایسه میشود.
در الگوریتم ICM در ابتدا مقایسهای بین PCNN صورت گرفته است، و مطالب جزئی در مورد ICM و شامل اینکه ویژگیهای تصویر نمیتوانند بعد از پروسهICM به آسانی بهبود یابند.
الگوریتم ICM چند pulse image را میسازد و شناسایی تغییرات از مقایسه این تصاویر مشابه بوجود میآید.
بحث شناسایی ماشین در حال حرکت روی جاده با استفاده از این ICM بیان میگردد ICM عکسهای تصاویر را معکوس میکند.
در روش آخر vision based Acc میباشد، بحث علامتهای مسیر جاده بیان میگردد که هر علامت مسسیر شناسایی میشود و یک ناحیه interest به جای پوشاندن قسمت جلوی ego- vehicle استفاده میگردد.
سیستم پیگیری خط توصیف میشود که به سه زیر سیستم تقسیم میگردد.
سرانجام بحث شناخت و ردیابی ماشین با استفاده از وسایل نقلیه کاندید شده در طول مسیر که هر کدام به 5 منطقه فرعی و مستقل تقسیم میشود بیان میگردد.
مقدمه داستان cartell با یک فرد به نام Dr William M Flook شروع میشود.
علاقهی او در علم با یک خواسته (میل) جرقه زده شد تا آن را به طور عملی در خانه و شغلش اجرا کند بعد از چندین سال مطالعه و کسب تجربه Dr.Flook سیستم شناسایی ماشین مبتنی بر تکنولوژی مغناطیس سنج، توسعه داد و آن را Cartell نامید.
در سال 1969 ، آن را ساخت و اولین سیستم را در خانهاش بکار انداخت.
چندین سال بعد او بیشتر از 40 سیستم را برای خانواده و دوستانش بهکار انداخت.
با آگاهی از اهمیت این کشف، Dr.
Flook، این تکنولوژی را در سال 1975 به نام خودش کرد.
فروش Cartell در سال 1979، آغاز شد مهمترین چالش آن فیلترکردن فرکانس راذیویی تولید شده بوسیلهی برق بود.
Cartell، قادر است تا یک آرایه بزرگ از نیازهای drive way را معرفی کند.
مقدمهای بر روشهای شناسایی خودرو: مقدمهای بر شناسایی خودرو در عکسهای هوایی: شناسایی وسایل نقلیه در تصاویر هوایی، استفادههای مهم شخصی و نظامی دارد به عنوان مثال پائیدن و تحت نظرگیری ترافیک و همچنین میتواند نشانه قوی برای شناسایی جاده تولید کند و نیزهمچنین یک دامنه آزمون خوب برای روشهای شناسایی اشیا در موقعیتهای شکل را توسعه میدهد.
تصاویر هوایی تصاویر gray scale هستند که اغلب از یک دیدگاه مورب گرفته شدهاند.
طول یک نوع ماشین در مجموعه دادهها در تصاویر 26-13، پیکسل میباشد.
و دوربین کالیبره به خوبی هدایتگر نور خورشید شناخته شده است.
شناسایی از طریق عکسهای هوایی از شناسایی از طریق دیدگاه دلخواه و خودسرانه آسانتر است.
با وجود آنکه هنوز آنطور که به نظر میرسد سهل و راحت نیست به عنوان مثال تصاویر نشان داده شده در fig1 .
مقدمهای بر شناسایی خودرو مبتنی بر جزئیات در تصاویر منظره خیابان: هدف ساختن یک شناساگر خودرو مرتبهای بوسیله یادگیری خودرو اتوماتیک ویژگیهای carspecific و یادگیری یک مجموعه طبقهبندی شده میباشد تمرکز ویژگیهای روی keypoint detection انتخاب میشود.
به این علت که آنها به طور محاسباتی در یک تعداد عکسهای تبدیل شده مشابه مؤثر و یکسان هستند.
مقدمهای بر مدل قشایی متقاطع در شناسایی خودرو ICM یک مدل مبتنی بر تکنیکهای شبکه عصبی مخصوصا طراحی شده برای پردازش تصویرها میباشد.که ویژگیها را بدون لبههای تیز و یا خطای مستقیم در تصاویر بهبود میدهد.
مقدمهای بر روش Acc (A Monocular Solution to vision –based Acc in Rood vehicle ) در این الگوریتم، از سیستم پیگیری خط استفاده میشود.
و برای ردیابی ماشینها، کاندیداهایی بر اساس ویژگیهای تصویر سایز و موقعیت در میان دیگران انتخاب میگردد.
Car detection in Aerial Images (شناسایی ماشین در عکسهای هوایی) 1- Ralated work : تشخیص وسایل نقلیه اهمیت و توجه بسیار زیادی در بینش کامپیوتری پیدا کرده است.
علت آن این است که وسایل نقلیه به عنوان یک قسمت مهم زندگی هستند.
Popageorgiou و Poggio یک مدل عمومی برای تشخیص شیء کاربردی شده برای تشخیص ماشین عرضه کردند.
یک مجموعهی بسیار کامل از ضریبهای Haar wavelet و scaleهای اصلی ترکیب شدهاند و یک (support vector Machine ) SVM تعلیم داده شده است تا ماشینها و غیر ماشینها را دستهبندی کند.
مدلهای Chellappa , Brlina , Rajogopalan مدلهای توزیع تصاویر ماشین به وسیلهی یادگیری دستورات آماری بالاتر هستند.
(Hos) نمونههای یادگیری بر طبق Hos دستهبندی شدهاند.
یادگیری background پویا اجرا میشود، و Hos هر تصویر test و هر گروه از توزیع ماشین و توزیع background محاسبه میشود.
و بعد به ماشین و background دستهبندی میشود.
Fig b Fig: دو قطعه از تصاویر و نتایج آنها: (a روشن است اما بعضی لبههای آن قابل دریافت نمیباشد.
b) به سختی به وسیله درخت پنهان شده است و ماشینها به سختی در لبهی نقشه قابل رویت هستند.
شناساگر، برای هر یک viewpoint ساخته میشود.
از هیستوگرامهای بعضی ویژگیهای تجربی انتخاب شده و محلهای نسبی آنها استفاده میکند، تا ماشین و غیر ماشین را مدل کند.
هسیتوگرامها به طور استاتیکی غیر وابسته هستند.
شناسائی وسایل نقلیه در تصاویر هوائی به وسیلهی resolution , viewpoint انجام میگیرد .
عموما دوربین کالیبره و خورشید برای این موضوع شناخته شدهاند.
بر طبق کار Rosenfeld , Chellappa , Moon, Chellappa, Paramesuwaran و Burlina یک وسیله نقلیه به عنوان مستطیل با رنجی از سایزها مدل شده است و canny مثل شناساگر به کار برده میشود.
(Generalized Hough Tranform) GHT یا هم تابیدگی با maskهای لبه استفاده میشود تا 4 قسمت از مرز مستطیل شکل را انتخاب کند.
Liu, Haralick , Gong از میانگین grag level و میانگین سطحهای شیبدار درونی، نقلیه و میانی وسایل نقلیه به عنوان ویژگیهائی برای تشخیص، استفاده میکنند.
وسایل نقلیه به عنوان اشیا دو بعدی فرض میشود.
و نشانهی اولیه آنها مرز ماشین است.
این دسترسی ممکن است برای دادههای آنها جائی که وسایل نقلیه اغلب تیرهرنگ هستند مناسب باشد.
اما ممکن است وقتی که روی مناظر شهری که ماشینها اغلب متفاوت به کار برده میشود مشکلاتی داشته باشد.
جاذبههای در حال افزایشی از video treamها در شناسائی ماشین وجود دارد.
در یک Static camera configuration، اشیاء در حال حرکت، میتوانند به وسیلهی back ground subtraction شناسایی شوند.
Lipton و Fujiyoshi و Patil، وسیله نقلیه، background clutter بر بعضی شکلهای اندازه گیری شده منطبق شده است.
در اشیاء در حال حرکت متراکم، یک bbb درحال حرکت با یک شیء تکی ممکن نیست همخوانی داشته باشد.
بنابراین یک آنالیز با جزئیات بیشتر، مشابه با شیوهی آن در تصاویر تشخیص ماشین باید به کار برده شود.
2- our apprack دیاگرام سیستم تشخیص مشکل به عنوان یک شکل تشخیص شیء 3 بعدی فرموله میشود تا تغییر view point را سازگار کند.
ماشین هندسی، دوربین، تا وقتی که توزیع کنندههای ویژگیها برای سازگاری بهتر و کارائی بیشتر تعلیم داده شوند، بدون یادگیری مدل میشوند.
این یک تعادل خوب بین استفادهی از دانش بشر و یادگیری آماری میباشد.
در این روش (fig 2) فقط، ردیابی ماشینهای هم صف شده با جهت جاده، آدرسدهی میشود.
ابتدا جهت جادهها فقط به وسیلهی lineهای انبوه در یک تصویر تخمین زده میشود.
از چهار قسمت از مرز ماشین، 4 قسمت از جلوی شیشهی جلوئی، 2 قسمت از مرز بیرونی Shodow (سایه) و شدت منطقه Shodow (وقتی وجود دارد) به عنوان ویژگیها استفاده میشود.
با یک مدل عمومی و کلی از یک ماشین، ویژگیهای مورد انتظار پیشبینی میشوند.
ویژگیهای تصویر در هر pixel محاسبه شده است.
مشاهده میشود که بعضی از توزیعات ویژگیها به وسیلهی intensity ماشین تاثیرگذاشته شده که آیا Shodow (سایه) در طول آن وجود دارد یا خیر.
3- تست روانشناختی (A Psychophysical test) ابتدا بعضی قطعههای کوچک تصویر که یک یا ماشینهای بیشتری را در بر دارد در تصاویر هوائی بزرگ جمعبندی میشود.
یک مجموعه دادهای متفاوت، در بردارندههای ماشینهایی در شرایط آشکارسازی مختلف با تراکم متفاوت و همچنین در محیطهای متفاوت استفاده میشود.
بعضی از مجموعه دادهها در fig 3 نشان داده شده است.
بعد از یک تعداد از افراد خواسته میشود تا این تصاویر را ببینند و دربارهی فاکتورهائی که به آنها کمک میکنند تا در مورد وجود یک ماشین تصمیم بگیرند، بازنگری کنند.
فاکتورهائی که بیشتر مردم اشاره میکنند عبارتاستاز: Fig 3 شکل مستطیلی و سایز ماشین در برابر اشیای دیگر در تصویر میزان آشکار بودن و وضوح تصویر قسمتهای قابل مشاهدهی ماشین هنگامی که به صورت اریب میباشد.
جاده، پارکینگ و دیگر نشانههای محیطی Fig 4 یک مثال از دادههای استفاده شده در تست روان شناختی: تصویر اریجینال یک ماشین قسمتهای مرئی پاک شده Shodow (سایه) پاک شده Winds shield پاک شده هر دوی Shodow و قسمتهای پاک شده هر دوی Shodow و Winds shield پاک شده I-g) در حال تکرار سپس بعضی از تصاویر در مجموعه داده انتخاب میشود و بعضی از فاکتورها، تغییر داده میشود.
تغییرات شامل پاک کردن Winds shield پاک کردن کنارههای ماشین، پاک کردن Shodow cast روی زمین گذاشتن ماشین داخل یک محیط طبیعی میباشد.
در بعضی موارد، همچنین ماشین با ویژگیهای تغییر داده شده را داخل یک خیابان با ماشینهای غیر تغییر داده شده قرار میدهیم .
یک مثال در fig 4 نشان داده شده است.
نتایج به دست آمده عبارت است از: شکل مستطیلی، مهمتر علامت یک ماشین است.
طرح Winds shield یک فاکتور مهم برای تشخیص بیشتر میباشد.
سایهی ماشین ممکن است تشخیص را آسانتر کند.
محیط روی تشخیص اثر میگذارد.
پارکینگ جاده یا یک تجمع ماشینها، یک نشانهی قوی است.
4- Feature Extraction (استخراج ویژگی) 1-4 clustering of road direction منظرهی عمومی عکسهای هوائی یک منطقه شهری به طور عمومی مقدار کمی از مسیرهای اصلی را نشان میدهد.
این جهتها و مسیرها به وسیلهی جادههای موازی و ساختارهای هم راستا با آنها ساخته شده است.
مسیرهای مورد نظر (DOI) میتواند به وسیلهی عکسها تخمین زده شود .
DOI یک قسمت محلی از یک شهر به وسیلهی محاسبهی هیستوگرام مسیرهای خط مستقیم با درازای آنها، به دست میآید.
وقتی دیدگاه (view point) یک تصویر اریب است، تصویر با یک سطح صاف موازی دوباره طراحی میشود تا اثر پرسپکتیو را روی خطهای موازی، قبل از تخمین DOI، داشته باشد، به شکل تصاویر چندگانه چرخانده میشود و سپس نتایج به آن اضافه میشود در حقیقت تصویر را به دو جفت عدد از DOI میچرخانیم.
2-4- ویژگیهای به کار برده شده برای ردیابی: مرز ماشین : مرز ماشین اغلب مستطیل شکل است، اما دو کنارهی بلند ممکن است حول نیم دایرهها یا قوسها در بعضی دیدگاهها (view point) بچرخد.
مرز جلوئی Winds shield از مرز جلوئی شیشهی جلوئی استفاده میشود به خاطر این که شکل، سایز و محل آن در ماشین ثابت است.
مرز بیرونیتر Shodow area هنگامی که وجود دارد.
اطلاعات مرز درونی Shodow در ویژگی مرز بدنه ماشین به کار برده میشود.
(اختیاری) شدت Shodow area هنگامی که وجود دارد، اختیاری است، به این علت که محاسبهی آن هنگامی که منطقه بزرگ است گران میباشد.
ویژگیهایی که استفاده شد، اغلب ویژگیهای گرادیان ( شیب ) خطی یا شکل خطی میباشد.
دو روش میتواند استفاده شود: لبههای نمادین یا جوابهای گرادیان فیلترهای شکل اصلی.
مورد دوم انتخاب میشود، ابتدا علت سایز کوچک یک ماشین و لبههای ماشین ممکن است از دست برودیا بریده شود.
ثانیا: بعضی ویژگیها ( دو کناره از مرز ماشین) خطی نیست.
ثالثا: شیب فیلتر (gradient Filter) تجزیهسازی بهینهتری نسبت به روش اول دارد.
بنابراین ویژگی مجددا به عنوان Maskهای شیب عرضه میشوند.
این maskها با تصاویر به هم پیچیده میشوند تا ارزش ویژگیهای مشابه را به دست آورند.
Fig 5 مدل wire – frane ماشین .
همهی ویژگیها شامل مرز بدنه ماشین ( در خط تیره)، مرز جلوئی شیشه جلوئی ( در خط روشن) مرز بیرونی منطقهی Shodow و شدت منطقهی Shodow برای ردیابی و شناسائی استفاده میشوند.
ویژگیهای پیشبینی شده روی تصویر.
3-4 model – based Feature Prediction : برای ردیابی و شناسائی ماشینها با ویژگیهای قید شده باید شکل (برای کنارههای چپ ، راست مرز بدنه)، محل وابسته به مرکز را بشناسیم.
بنابراین از یک مدل عمومی برای شناسایی اطلاعات بالا استفاده میشود تا تصویر داخل را متفاوت کند.
مدل عمومی شامل یک wirefrome geometrical model و یک surface reflectance model میباشد.
از یک wire- frome carmodel که در fig5 نشان داده شده استفاده میشود تا حمل دو بعدی لبههای ماشین را شناسایی کند.
ماشینها از دوربینها دور هستند بنابراین از یک مدل دوربین درجهبندی شده، استفاده میشود مدل wire frome بصورت پارامتر یک میباشد تا 4 نوع از ماشینها را عرضه کند: کوچک و متراکم و full- size و تجملی .
این 4 نوع ماشین باید قادر باشند تا تشابه مناسب از هندسهی اغلب ماشینها را بدهند.
برای بررسی اثر آماری، قالب ویژگیهای انواع مختلف ماشین ، یکسان فرض شده است و فقط موقعیتهای نسبی مختلف هستند.
فقط یک زیر مجموعه از لبهها در مدل wire frame به عنوان ویژگیها استفاده میشود.
مرز جلوئی شیشه جلو و shadow مسطح هستند.
بنابراین هیچ ابهامی در مورد مرز آنها وجود ندارد.
اما برای مرز بدنه ماشین، برای هر چهار کناره، دو لبه وجود دارد که ممکن است در تصویر ظاهر شود.فرض میشود که فقط یک لبه با اهمیت در هرکناره تصویر ظاهر شود جائی که لبه پایینی مسدود میشود، لبه بالایی مورد استفاده قرار میگیرد.
اما جائیکه هر دولبه، فرضی است ، لبه ای که میان دو intensity ، اختلاف بزرگتری دارد، انتخاب میشود.
به عنوان مثال اگر شدت اختلاف کاپوت و جلوی ماشین کمتر از شدت اختلاف جلو و زمین باشد، لبه جلوی پایینتر انتخاب خواهد شد.
به این منظور یک مدل بازتابشی (reflected model) ماشین و جاده مورد نیاز است تا شدت صافی بدنه ماشین را با آشکار سازی شناخته شده معین کند.
I=Iamb+Ispec جائی که ، واحد نرمال سطحی است، D ، واحد نرمال مسیر خورشید است.
D شدت نور خورشید ، ، شدت نور فراگیر از زمین و دیگر مکانها هستند.
Kd ، بازتابش کننده نور جهت دار است.
و بازتابش کننده به نورفراگیر است.
پارامترهای به طور مستقیم بوسیلهی اندازهگیری تصاویر برای هر شدت ماشین، کسب شده است، d و به وسیلهی مثالها، تخمین زده شدهاند.
به علت اینکه مقادیر خیلی دقیق را نیاز نداریم، مدل به خوبی کار میکند.
5.Multi –feature integration 1-5 : پارامتریزه کردن خصوصیات: مشاهده کردیم که ارزش بعضی خصوصیات تحت تاثیر کثرت ماشینها و سایههای در امتداد آن قرار دارد دو پارامتر i s را مشخص میکنیم که در تصویر 6 دیده میشوند.
مقادیر چهار خط مرز لبههای بدنه ماشین تحت تاثیر i و s قرار میگیرددو لبه کوتاه قائم شیشهی جلوی ماشین تحت تاثیر i و s قرار میگیرد.
فقط تحت تاثیر i قرار میگیرد.
خصوصیات سایه تحت تاثیر هیچکدام (i و s ) قرار نمیگیرد.
این عوامل برای سادگی با مقادیر قابل ملاحظهای اندازهگیری میشوند s با سه مقدار: بدون سایه، سایه باریک و سایه پهن i هم با سه مقدار: رنگ تیره، رنگ خاکستری و رنگ روشن اندازهگیری میشوند.
Fig6 یک تکه عکس و نقشههای گرادیانی X/Y است ( در نقشه گرادیانی : خاکستری کمرنگ، سفید، + سیاه منفی) مقادیر مورد انتظار وابسته به کثرت ماشینها و سایه آن متفاوتند در مقایسه سه ماشین زیر تمام خصوصیات ماشین سفید و واضح است خط مرز بالا و راست ماشینهای سیاه قابل رؤیت است.
خط مرز چپ ماشینهای خاکستری کمرنگ است.
شیشه جلوی ماشینهای سفید علائم مختلف ماشینهای گرادیانی را ارائه میدهد.
2-5 یکپارچگی در بررسی تمام شواهد موجود، ممکن است بیش از 11 خصوصیت برای استفاده داشته باشیم ما به ترکیب این خصوصیات برای بدست آوردن تقسیم نهایی از وجود ماشین نیاز داریم.
شبکه Baysian(BN) (Baysian Network) یک راه بهینه برای یکپارچهسازی چندین نشانه برای یک تصمیم اگر شرایط توزیع شناخته شود را بوجود میآورد.
]10[ که این راهحل در تحقیقات مختلف مبنای کامپیوتر (computer vision) استفاده میشوند و کارایی امید بخشی را نشان میدهد.
ما از یک BN برای یکپارچهسازی همه شواهد موجود با ساختار نشانداده شده در Fig7 استفاده میکنیم.
فاکتور i و s پدر تحت تاثیر نود شاهد طبق پارامتر یزیشن بالاست.
احتمال قبلی نود کار (وقتی تمام خصوصیاتش موجود است)، اینگونه ارزشیابی میشود: P(car/F,i,s) مقادیر نودهای شاهد، از عکسهای یک محل که با خصوصیات مدلهای قبلی محاسبه شده، اندازهگیری میشود.
نود پارامترs از مدل زاویه دید و زاویه نور محاسبه میشود و نود پارامتر i با گرفتن میانه کثرت ناحیه کوچک اطراف یک pixel به عنوان نخستین قوی از فزونی (کثرت) ماشین بدست میآید.
هر نود شاهد با یک جدول (cpt) مرتبط میشود که با ترکیب مقدار نود پدرش نشانهگذاری میشود.
برای مثال cpt نود Bu به فرم (fbulcar,i,s) است.
باید مورد ملاحظه قرار بگیرد که BN مستقل مشروط فرض شود.
مقادیر نودهای خصیصه (طرح) هنگامی که همه نودهای پدر ثابت شده مستقل فرض میشود.
در Fig7 2 پارامتر مستقل مشروط نود شاهد را معرفی میکنیم.
Fig7 شبکه Baysion که برای ردیابی خطچینها استفاده میشود نشان میدهد که همیشه قابل دسترس نیست B = خط مرز بدنه ، W= شیشه جلو، s=سایه، U= عقب ، D= جلو، R= راست، I= شدت شواهد (اسنادی) در نقطهچینهای مرور، فقط هنگامی که در دسترساند استفاده میشود.
3-5 : پارامترهای BN : handcraft ما به دستگاهی با مقادیر cpt برای شبکه نیاز داریم ابتدا این مقادیر دستی را بر اساس مشاهدات اجرا میکنیم.
در مثال نشان داده شده در tab1 ، مقادیر خصوصیات فرموله شده به صورت دودوئی (در صورت وجود یا عدم وجود) در حد آستانه استفاده میشود نظر به اینکه رسیدگی پی در پی مقادیر به طور مستقیم سخت است پارامترها بر اساس دنباله رهنمودهای تجربی همچنین مقادیر اندازهگیری شده برخی نمونهها در عکسها طراحی شدهاند.
برای ماشینها با رنگ روشن و خاکستری رنگ، احتمال شناسایی یک لبه را در امتداد یک سایه پررنگتر از لبه بدون سایه راست (s فرموله شده نسبت به سایه و بدون سایه در handcraft BN.
برای ماشینها با رنگ تیره، احتمال شناسایی یک لبه در امتداد یک سایه خیلی پایینتر است نسبت به لبه بدون سایه برای ماشینهای با رنگ تیره احتمال شناسایی لبههای مرزی شیشه جلوی ماشین کم است.
ماشینها با رنگ روشن لبه مرزی شیشه جلو با احتمال بالاتری نسبت به ماشینهای خاکستری رنگ شناسایی میشود.
لبههای کوچک احتمال بالاتری دارد که نسبت به لبههای طولانی با noise ساخته میشود.
لبههای چپ و راست با احتمال بالاتری دارد که نسبت به لبههای پشت و جلو با noise ساخته میشود.
انجام دادن شناسایی با پارامترهای دستی کارایی قابل قبولی را نشان داد.
این پارامترها در جنبههایی که زیر در مورد آنها بحث شده محدود هستند.
پارامترها با فراگیری از نمونههای محاسبه شده که ما را به کارایی بهتر در آزمایشات راهنمایی میکند.
4-5: یادگیری پارامترها : دستی کردن پارامترها در جنبههای فوق محدود است: TABLE 1 تجارب کیفی بشر ممکن است هر قسمت از دامنه مشکلات را پوشش دهد.
تغییر شکل تجارب کیفی ذهنی بشر به کمیتهای عددی علمی برای محاسبات آسان نیست.
بشر در رسیدگی کردن به روابط عددی پیچیده از قبیل توزیع و تدریج از توزیع متوالی به مقادیر باینری اطلاعات از دست رفتهای که میتواند مورد استفاده قرار گیرد خوب نبوده است.
مطالعه مقادیر زیادی از نمونهها کارز خستهکنندهای است که نیاز به آشنایی با الگوریتمهای بینایی دارد.
بنابراین مطالعه پارامترهایی از BN از نمونههای گرفته شده بوسیله کامپیوتر ایدهال خواهد بود.
در این روش میتوان دادههای حسی را با وضوح بسیار عالی مدلسازی کنیم.
(ما از 64 quantizafion level استفاده میکنیم) یک روش مشترک برای نشان دادن یک توزیع، مناسب بودن آن با برخی فرمهای توزیع پارامتری معروف است.
ازجمله چگالی گوسی است که عموما استفاده زیادی دارد در اینجا برخی از توزیعها به چندین روش نشان داده شده است مثلا (non-Gussian) میتواند با ترکیبی از گوسها مدلسازی شود ولی در عوض برای سادگی از روشهای بدون پارامتر استفاده کردهایم.
ما knn (k –نزدیک همسایه) و پنجره parzen را با هسته گوسی مورد آزمایش قرار دادیم نتایج نشان داد که خoutperformed اخیرا با مقدار کوچکی تشکیل شده است.
از ایزو هیچ نود (گره) پنهانی در شبکه وجود ندارد یادگیری cpt فقط به محاسبات هیستو گرام نیاز دارد با شرط مستقل بودن فرض CPT هر گره شاهد میتواند مستقلانه یاد گرفته شود ما حدود 200 ماشین را بصورت دستی از 25 تکه از تصاویر آموزشی به عنوان نمونههای قطعی جمعآوری کردیم قسمتهای دیگر عکسها در نمونههای منفی بکار رفتهاند.
روی تصاویر فقط مرز ماشینها مشخص شده و موقعیت دیگر شواهد با ویژگیهای مدل پیشبینی شده محاسبه شده است.
Fig6 بعضی از دانستنیهای CPT را نشان میدهد.
این توزیع شامل رهنمودهایی از تجارب بشر و همچنین دیگر جنبههایی است که در مشاهدات بشری توجهی به آن نشده است.
در ابتدا این توزیع را به عنوان دانش بشری استفاده میکنیم که مقادیر ویژگیهای آن تحت تاثیر فاکتورهای i,s قرار گرفتهاند برای یادگرفتن توزیعها، فهمیدیم که پارامترکردن با نمایش انشعاب kullback-liebler و p(filcar) و(p(filfactor,car در جائی که factor= i,s بزرگتر است مؤثر میباشد.
FIG8 یاگیریCPT مرز جلوی بدنه ماشین وقتی هیچ سایهای در امتداد آن نیست P(frul car,i,s=noshadow) برای ماشینهای رنگ روشن، نقطه ماکزمیم توزیع روی جهت مثبت است برای اشیاء غیر مشین نقطه توزیع صفر است.
برای ماشینهای تیره رنگ نقطه ماکزیمیم توزیع در جهت منفی است و در ماشینهای خاکستری رنگ نقطه ماکزیمیم در دو جهت است مثبت و منفی.
6 .
شناسایی و پس پردازش 1-6 : شناسایی بعد از BN، ساختن و فهمیدن است ما میتوانیم در محاسبه احتمال وجود ماشین در نقاط داده شده از آنها استفاده کنیم.
در ابتدا ویژگی طرحهای FMn و محاسبه نمیشود، فرض کنیم میخواهیم p(car/f,I,s) را در موقعیت (x,y) تصویر ارزیابی کنیم.
جابه جایی ویژگیj (j=1,…..n) در موقعیت(x,y)) با ویژگی مدل مدل پیشبینی شده محاسبه میشود با عنوان (dxj ,dyi) و ویژگیهایی هستند که از ویژگیهای طرحهای مشابه بدست میآید بنابراین: برای هر خصوصیت pi یک جستجوی مکانی در مجاورت ( در پیادهسازیها Pixel + / -1 در امتداد راستای قائم خصوصیت است) موقعیت مورد نظر برای پیدا کردن ارزش ماکزیمم P(fi,car,I,s) برای تغییرات کوچک خصوصیات صحیح مکانی مدل ماشین انجام میدهیم.
احتمال وجود ماشین در (x, y) برای ماکزیمم شدن احتمال، در تمام سایزها در نظر گرفته میشود.
(luxury , full - size , compact , mini) مینیمم میزان خطای دستهبندی شده به جای کمترین دسته کننده خطاها، قرار دادن نتیجه نهایی است.
قرار دادن این مقدار بسیار مناسب تر است به خاطر این که این کار به راحتی میتواند اولویتهایش را روی هشدارهای غلط یا شناسههای اشتباه با ماتریس خطای c تعیین کند.
0 به معنای به معنای car است.
Co1 به معنای هزینه طبقهبندی نادرست یک car برای car شدن و همینطور ...
قانون نتیجه برای طبقهبندی یک ماشین در کمترین میزان خطای دستهبندی به صورت زیر است: در یک Baysian کمترین میزان خطای دستهبندی شده کانون نتیجه جایگزین میشود با : R خطای مورد انتظار است s , i در مشتقگیری زیر حذف میشوند.
مقایسه rule (2) , rule (1) با مرتب سازی احتمال پیشین و برابر است.
تذکر خواهیم داد.
P(F|car) و P'(car) همه pixelها به عنوان نقشه احتمال car است در جایی که احتمال قبلی بعد از مرتبسازی پیشین است.
در این مورد C11, C11, C00 set شده با o و C11 با 1 set شدهاند.
C10 تنها پارامتر آزاد است که کاربر معین میکند.
2-6 پس پردازش (Post – Processsing) به طور کلی تعداد pixelهای اطراف مرکز یک ماشین ارزش احتمالی بالاتری خواهد داشت و بنابراین تعداد زیادی از آنها در مرکز ماشینها طبقهبندی خواهد شد.
گذشته از این مسیر تصادفی خط مرزش و خط همسایه همچنین مسیر تصادفی خصوصیات ماشینهای همجوار ممکن است احتمالات کشف شده بالاتری را ایجاد کند که درست در مرکز ماشینها بسته شدهاند.
(fig 9) Overlap resolution به از بین بردن نتایج زاید نیاز دارد.
در ابتدا، ما به نواحی متصل شده در نقشه احتمالی نیاز داریم.
سپس برای هر جزء متصل، مجموع همه احتمالات را به عنوان یک امتیاز محاسبه میکنیم.
فرض میکنیم شناسایی صحیح امتیاز بالاتری نسبت به هشدارهای اشتباه اطراف آن دارد که این هم در آزمایشات ما بیشتر اوقات درست است.
اجزای متصل شونده، با مجموع احتمالات مرتبسازی میشوند.
شناساییهای معتبر از جلوی صف (front of queue) انتخاب میشوند.
برای هر ناحیه متصل، اگر با شناساییهای معتبر انتخاب شده قبلی یکپارچه نشود به عنوان ردیابی معتبر شناسایی میشود در غیر این صورت دور ریخته میشود.
احتمال مرکز ثقل وزن ماشین به عنوان یک حالت از شناسایی ماشین استفاده میشود.
Fig 9: Befare (a) and after (b) overlap resolution مثال نامبرده در [8] هشدارهای غلط ممکن است وقتی نورد خورشید با عرض یکسان از یک ماشین سایه میسازد ظاهر شود.
همچنین ممکن است در یک سیستم مخصوص وقتی خصوصیات ماشین کامل نیست برای متوقف کردن آن در حالت قبلی اتفاق بیافتد.
اگر یک ماشین تیره خیلی نزدیک به موقعیت سایه مورد نظر ماشین کنایر و ماشین تیرهای که سایه خوبی ندارد را detect کنیم، به سایه ماشین تیره توجه کردیم حتی اگر بالاترین مجموع احتمال را نسبت به ماشینی که کنار آن قرار گرفته داشته باشد.
یک نمونه نتیجه در fig 9.b نشان داده شده است.
7- نتایج و بحث (Result & Discussion) 1-7: نتایج ما نتایج بررسی شدهای که در بالا توصیف شد، در دو dataset معرفی کردهایم: dataset Vertical View Fort Hood dataset در Washington DC dataset ، ماشین نمونه طولی حدود26 pixel دارد .
ما این سیستم را روی 12 تکه عکس از خیابان و فضای اطراف آن که در کل شامل 320 ماشین است، آزمایش میکنیم.
تکه عکسهایی که انتخاب کردیم در زاویه دید، زاویه نور، کیفیت عکس و همچنین پس زمینه تفاوت دارد و همچنین با training data همپوشانی ندارد.
( Fig 11) بعضی از تصاویر با حالات مختلف ارائه شدند چون ماشینها زیر شاخههای درخت مخفی شدند.
(fig 11.c, h) و سایهای با عرض یکسا از یک ماشین (fig .11.a) و دیدگاه مورب از بعضی تصاویر (fig .
11.
i) .
با تمام این پیچیدگیها، ردیاب ما نتایج خوبی را نشان میدهد.
dataset بعضی از تفکیکپذیری dataset را دارد و ماشین نمونه در این dataset طولی حدود pixel 18 دارد.
به علاوه contrast تصویر پایینتر از Washington DC dataset است.
ما 12 تکه تصویر شامل به طور کلی 356 ماشین از ماشینهای یک خیابان را انتخاب کردهایم.
سیستم از پارامترهای یادگرفته شده در data training Washington DC dataset استفاده میکند.
برخی از نتایج در fig 12 نشان داده شده است.
همچنین ما نتیجه ای را روی پارکینگ در fig 12.
F نشان دادیم.
ما دریافتیم که بیشتر ماشینها با خصوصیات خوبی ردیابی شدند همچنین بعضی از نمونههای پیچیده با خصوصیات انتخابی C10 شناسایی شدند.
همینطور در جهت ردیابی ماشینهای مسافربری معین، بعضی از دیگر وسایل نقلیه شناسایی شدند.
شدت تغییرات mis – detection و شدت تغییرات هشدارهای غلط ماشینهای رنگ تیره بالاتر از ماشینها با دیگر رنگهاست زیرا در بیشتر موقعیتها خصوصیات برجستهای دارند، خواه رنگ روشن خواه رنگ خاکستری رنگ بیشتر هشدارهای غلط ار تنظیم تصادفی حالات مستطیلی و دیگر خطهای ساختارها در ساختمانها، شاخ و برگ درختان با خیابانهای علامتگذاری شده نتیجه شده است.
برای یک ردیاب همیشه بین شدت تغییرات هشدار غلط و شدت تغییرات ردیابی غلط، یک trade off وجود دارد.
(Recive Operation charactorstic) ROC منحنیهای هستند کارایی سیستم ما را روی دو dataset داده شده در fig 10 مشخص میکند.
شدت تغییرات ردیابی به صورت (تعداد کل ماشینهای / تعداد ردیابیهای درست) مشخص میشود و شدت تغییرات هشدار غلط به صورت (تعداد کل ماشینها/ تعداد هشدارهای غلط ) مشخص میشود.