Deprecated: Function get_magic_quotes_gpc() is deprecated in /home/ustmbir/domains/deeplearning.ir/public_html/qa/qa-include/qa-base.php on line 1177
را ه های دادن عکس های ورودی به شبکه های segmentation - پرسش و پاسخ یادگیری عمیق
به بخش پرسش و پاسخ یادگیری عمیق خوش آمدید,
این نسخه آزمایشی سایت است.
لطفا به نکات زیر توجه کنید:
  • برای ارتباط با مدیران میتوانید از صفحه مدیران اقدام کنید.
  • سوال و جواب ها باید به زبان فارسی باشند. استفاده از زبان انگلیسی یا فینگلیش برای پاسخ دادن مجاز نیست.
  • لطفا بعد از پرسش سوال لینک سوال خود را در گرو تلگرام (Iran Deep Learning Group) معرفی کنید تا سریعتر به جواب برسید. برای دسترسی به آخرین لینک از منابع یادگیری استفاده کنید
  • لطفا بجای عکس از متن استفاده کنید. اگر متون طولانی هستند از سایت pastebin.com برای اپلود استفاده کرده و لینک حاصل را در سوال خود قرار دهید. برای قرار دادن تصویر ، از بخش ارسال تصویر ادیتور سایت استفاده کنید.
  • بعد از دریافت پاسخ، بهترین پاسخ را از طریق کلیک بر روی علامت تیک انتخاب کنید
  • اگر با خطا و یا مشکلی مواجه شدید از بخش تماس با ما در انتهای صفحه و یا ایمیل Coderx7@gmail.com موضوع را اطلاع دهید.

با تشکر

دسته بندی ها

0 امتیاز

سلام دوستان
دارم روی fcn برای سگمنتیشن تصاویر رنگی کار می کنم اما می خوام ببینم چه راه هایی برای اماده کردن تصاویر برای دادنش به شبکه وجود داره. منظورم لیبل ها هست.
در یک قطعه کد دیدم لایه آخر شامل 21 کلاس بود آیا میشه لایه آخر فقط به ما تصویر بده یعنی لازم نباشه 21 کلاس بررسی کنیم چون این طوری باید لیبل ها رو هم جداسازی کنیم که نگه داری همچین آرایه ای در حافظه جای زیادی می بره اگه ابعاد تصویر کاهش بدیم هم کیفیت تصویر کاهش پیدا می کنه. اگه مثال یا مبحثی برای این موضوع وجود داره ممنون میشم راهنمایی کنید.

از کراس استفاده می کنم

توسط (112 امتیاز)

1 پاسخ

+1 امتیاز
 
بهترین پاسخ

سلام دوست عزیز.
لیبل به صورت یک عکس png هستش که مقادیر پیکسل همان عدد کلاس مورد نظر هستش. یعنی اگر در یک منطقه از تصویر یک صندلی هستش و در دیتاست صندلی کلاس شماره 7 هستش - آنگاه تمامی پیکسل هایی که صندلی رو تشکیل میدهند مقدارشون 7 هست.
در لایه آخر که 21 لایه داریم به این علت هستش که در دیتاست مورد نظرتون voc12 تعداد کلاس ها 21 هستش. برای تشکیل تصویر از این 21 لایه برای هر پیکسل از بین 21 مقداری که آن پیکسل را تشکیل میده ماکزیمم میگیریم - اگه ماکزیمم مربوط به مقدار لایه 7 بود این پیکسل را 7 قرار میدیم. به عبارت کلی اندیس مقدار ماکزییم در 21 لایه خروجی مقدار پیکسل رو تعیین میکنه.

بنده موضوع تزم قطعه بندی معنایی تصویر بوده - و تقریبا با تمامی شبکه های این حوزه کار کردم. اگه سوالی داشتید در خدمتم.
موفق باشید.

توسط (830 امتیاز)
انتخاب شده توسط
معمولا در تمامی معماری های قطعه بندی به تعداد کلاس ها لایه داریم.
فک کنم اگه بخواید به جای 21 لایه از سه لایه RGB استفاده کنید ترین شدن شبکه به سختی انجام میشه - چون یه مرحله بیشتر داره کد میشه -
softmax باید باشه - چون در ورودی تابع آنتروپی باید اعداد بین صفر و یک باشند.
باینری کراس آنتروپی جواب نمیده برای شما -  چون چندین کلاس دارید و خروجی شما به صورت اعداد صحیح (اندیس کلاس ماکریمم) هستند.
داداش cpu رو بیخیاش شو - به جایی نمیرسی
یا علی
...