به بخش پرسش و پاسخ یادگیری عمیق خوش آمدید,
این نسخه آزمایشی سایت است.
لطفا به نکات زیر توجه کنید:
  • برای ارتباط با مدیران میتوانید از صفحه مدیران اقدام کنید.
  • سوال و جواب ها باید به زبان فارسی باشند. استفاده از زبان انگلیسی یا فینگلیش برای پاسخ دادن مجاز نیست.
  • لطفا بعد از پرسش سوال لینک سوال خود را در گرو تلگرام (Iran Deep Learning Group) معرفی کنید تا سریعتر به جواب برسید. برای دسترسی به آخرین لینک از منابع یادگیری استفاده کنید
  • لطفا بجای عکس از متن استفاده کنید. اگر متون طولانی هستند از سایت pastebin.com برای اپلود استفاده کرده و لینک حاصل را در سوال خود قرار دهید. برای قرار دادن تصویر ، از بخش ارسال تصویر ادیتور سایت استفاده کنید.
  • بعد از دریافت پاسخ، بهترین پاسخ را از طریق کلیک بر روی علامت تیک انتخاب کنید
  • اگر با خطا و یا مشکلی مواجه شدید از بخش تماس با ما در انتهای صفحه و یا ایمیل Coderx7@gmail.com موضوع را اطلاع دهید.

با تشکر

دسته بندی ها

0 امتیاز

سلام. اولین پروژه ای هست که دارم با یادگیری عمیق انجام میدم. احتمالا سوالم خیلی ابتدائیه. پیشاپیش عذرخواهی میکنم.
من یک پروژه برای تشخیص ارقام دست نویس دانلود کردم که CNN رو در متلب پباده سازی کرده و از دیتاست mnist استفاده کرده. حالا من میخوام دیتاست تصاویری که خودم دارم رو بهش بدم. ولی فرمت دیتاستش رو نمیشناسم. ممنون میشم اگر راهنمایی بفرمائید.
آموزش نحوه تبدیل یا ایجاد یک دیتاست ازتصاویر با فرمت lmdb‌ یا leveldb‌ در Caffe رو از لینک زیر مطالعه کردم ولی این پروژه از Caffe استفاده نکرده. , درواقع اصلا نمیدونم استفاده کرده یانه.
http://deeplearning.ir/آموزش-نحوه-تبدیل-یا-ایجاد-یک-دیتاست-ازت/
متشکرم

توسط (102 امتیاز)

پروژه ای که دانلود کردم این هست:
https://github.com/lhoang29/DigitRecognition

1 پاسخ

0 امتیاز
 
بهترین پاسخ

سلام
در کد که کاملا مشخص هست
شما cnnload.m رو که باز کنید مشخصه چه چیزهایی نیاز دارید . دیتاستی هم در کار نیست . فایل تصاویر و لیبل اونها در قالب بایت ذخیره شده اس که از سایت آقای یان لیکون دانلود و بعد خونده میشه . 4 تا بخش هم داره دیتای شما

trlblid = fopen('train-labels.idx1-ubyte');
trimgid = fopen('train-images.idx3-ubyte');
tslblid = fopen('t10k-labels.idx1-ubyte');
tsimgid = fopen('t10k-images.idx3-ubyte');

trlblid منظورش همون لیبل های مربوط به ترینینگ ست شماست
trimgid هم همون تصاویر ترینینگ ست شماست
tslblid همون لیبل های مربوط به تست ست شما هست
و در اخر هم tsimgid تصاویر تست ست شماست
شما کافیه مقادیر مناسب رو دراین متغییرها جایگزین کنید و بعد کاری که میخوایید رو انجام بدید .
برای راحتی کار هم میتونید منطق خوندن و بارگذاری از دیتاست رو در همین فایل پیاده کنید .

توسط (4.3k امتیاز)
انتخاب شده توسط
...