به بخش پرسش و پاسخ یادگیری عمیق خوش آمدید,
این نسخه آزمایشی سایت است.
لطفا به نکات زیر توجه کنید:
  • برای ارتباط با مدیران میتوانید از صفحه مدیران اقدام کنید.
  • سوال و جواب ها باید به زبان فارسی باشند. استفاده از زبان انگلیسی یا فینگلیش برای پاسخ دادن مجاز نیست.
  • لطفا بعد از پرسش سوال لینک سوال خود را در گرو تلگرام (Iran Deep Learning Group) معرفی کنید تا سریعتر به جواب برسید. برای دسترسی به آخرین لینک از منابع یادگیری استفاده کنید
  • لطفا بجای عکس از متن استفاده کنید. اگر متون طولانی هستند از سایت pastebin.com برای اپلود استفاده کرده و لینک حاصل را در سوال خود قرار دهید. برای قرار دادن تصویر ، از بخش ارسال تصویر ادیتور سایت استفاده کنید.
  • بعد از دریافت پاسخ، بهترین پاسخ را از طریق کلیک بر روی علامت تیک انتخاب کنید
  • اگر با خطا و یا مشکلی مواجه شدید از بخش تماس با ما در انتهای صفحه و یا ایمیل Coderx7@gmail.com موضوع را اطلاع دهید.

با تشکر

دسته بندی ها

0 امتیاز

با سلام

درباره تبدیل مجموعه داده classification مثل mnist به فرمت lmdb آموزش کاملی داخل سایت گذاشتین. اما سوال من درباره تبدیل مجموعه داده detection به فرمت lmdb هست. این دیتاست ها معمولا تصاویر بزرگی دارن که داخل هر تصویر چند نمونه از object هاست و هر تصویر یک فایل text متناظر داره که شامل اطلاعات bounding box همون objectهای داخل تصویر هست. سوال من درباره این هست که چطور میشه با استفاده از caffe کار object detection رو انجام داد؟ آیا تابعی برای تبدیل این دیتاست ها به فرمت lmdb هست؟

با تشکر

توسط (127 امتیاز)

1 پاسخ

+1 امتیاز
 
بهترین پاسخ

سلام
شیوه کلی کار یکی هست اما اینجا یکم داستان فرق داره .
یکی از کارهایی که انجام میشه اینه که شما به ازای هر تصویر یه فایل متنی مثلا درست میکنید . مثلا اگه تصویر شما هست img0001.jpg شما یه فایل بنام img0001.txt باید بسازید که در هر سطرش اطلاعات یک bounding box مربوط به یک شی نوشته میشه . همین کار رو برای بقیه انجام میدید
بعدش هم میتونید به lmdb تبدیل کنید. منتها اگر اشتباه نکرده باشم برای خوندنش هم باید یه لایه خودتون درست کنید که میشه از اینجا ایده گرفت.
( اگر من فرصت کنم شاید یه اموزش در این باره هم بنویسم ولی فعلا سرم خیلی شلوغه)

توسط (4.3k امتیاز)
انتخاب شده توسط
خیلی ممنون از راهنمایی که کردین. من قسمت اولش یعنی ایجاد فایل متنی که هر سطر اطلاعات یک object هست رو انجام دادم. اما نمیدونم این فایل ها رو چطور به فرمت lmdb تبدیل کنم. مثلا یک تابعی شبیه به convert_imageset.exe در این مورد پیدا نکردم.
تو صفحه گیت هاب من اگه برید بخش gist ها من یکسری کد قبلا نوشتم که مربوط به خوندن/تبدیل به فرمت lmdb/leveldb هست به پایتون و میتونید ایده بگیرید. اگر سی++ مد نظر باشه باز میتونید تو برنچ کفی من به کد مربوط به cifar100 مراجعه کنید و ببینید من چطور تبدیل به Lmdb رو انجام میدم اونجا.
...