به بخش پرسش و پاسخ یادگیری عمیق خوش آمدید,
این نسخه آزمایشی سایت است.
لطفا به نکات زیر توجه کنید:
  • برای ارتباط با مدیران میتوانید از صفحه مدیران اقدام کنید.
  • سوال و جواب ها باید به زبان فارسی باشند. استفاده از زبان انگلیسی یا فینگلیش برای پاسخ دادن مجاز نیست.
  • لطفا بعد از پرسش سوال لینک سوال خود را در گرو تلگرام (Iran Deep Learning Group) معرفی کنید تا سریعتر به جواب برسید. برای دسترسی به آخرین لینک از منابع یادگیری استفاده کنید
  • لطفا بجای عکس از متن استفاده کنید. اگر متون طولانی هستند از سایت pastebin.com برای اپلود استفاده کرده و لینک حاصل را در سوال خود قرار دهید. برای قرار دادن تصویر ، از بخش ارسال تصویر ادیتور سایت استفاده کنید.
  • بعد از دریافت پاسخ، بهترین پاسخ را از طریق کلیک بر روی علامت تیک انتخاب کنید
  • اگر با خطا و یا مشکلی مواجه شدید از بخش تماس با ما در انتهای صفحه و یا ایمیل Coderx7@gmail.com موضوع را اطلاع دهید.

با تشکر

دسته بندی ها

0 امتیاز

با سلام. بنده میخوام یک شبکه ای برای ocr حروف انگلیسی پیاده کنم. ولی دیتاستم تعداد داده هاش کمه. از طرفی گستره تغییر هم زیاد نداره. پیشنهادی دارید برای این مسئله؟
اینکه از کجا باید شروع کنم؟
سرچ زدم ولی انقدر مباحثش گستره است که مثال ساده کوچک پیدا نمیکنم که با اون پیش برم. ممنون از راهنماییتون

توسط (102 امتیاز)

1 پاسخ

0 امتیاز
 
بهترین پاسخ

از شبکه های آماده استفاده کنید
معروفترینش که میشناسم EAST هست
با OCR سرچ کنید نتایج زیادی میاره
Tesseract هم نسخه 4 اش از دیپ استفاده کرده
هر دو هم کدهاش هست و قابل train هستند و میشه رو دیتاستی که دارین آموزش بدین

توسط (470 امتیاز)
انتخاب شده توسط
ممنونم. tesseract رو امتحان کردم. متاسفانه نسبت به شرایط خیلی حساسه. من نوشته هام کرو هستش. east هم خوبه ولی دیتکتوره، تبدیل به نوشته نمیکنه فقط مختصات نوشتهه رو میده.
بهرحال ممنون.
اینم من تست کردم خوب بود
https://github.com/qjadud1994/CRNN-Keras
ممنون.
من این رو کلون کردم و بدون اینکه داده ها رو تغییر بدم ران گرفتم ولی به این اررور برخوردم
http://s9.picofile.com/file/8357723550/error1.JPG
شمام به این مورد برخوردید؟
خودش چنتا عکس بیشتر تو پوشه ی DB نذاشته
اگه تو parameter.py رو نگاه کنید بچ سایزها خیلی بزرگتر تعداد عکساند شاید به خاطر همین باشه
به نظرم دیتای خودتون رو به شیوه ای که خواسته توش بریزید و تست کنید من خودم این کار رو کردم روی دیتای خودم دقت تست 93% گرفتم
اگه بازم نشد implement های دیگه از CRNN هست تو گیت هاب
ممنون مهندس. بنده با تغییر پارامترها بالاخره تونستم ران کنم کد رو. برای داده هم اومدم 1000 تا عکس ایجاد کردم که نمونش توی این لینک هست: http://s9.picofile.com/file/8357780042/error2.JPG
800 تا ترین و 200 تا تست گذاشتم ولی  دقت در حد صفر دراومد. خروجی ثابت میده.
ممنون میشم راهنمایی کنید
به نظرم 800 داده برای آموزش این مدل خیلی کمه
مثلا 8000 خوبه
بعد اون قسمت دقت گرفتن و دیکود خروجی شبکه ممکن نیاز به تغییر داشته باشه چون خودش بر اساس زبان کره ای هست به نظرم خودتون اون قسمت رو بازنویسی کنین
اگه نشد این لینک هم مفیده میتونید با مدلهای دیگه امتحان کنید
https://github.com/hwalsuklee/awesome-deep-text-detection-recognition
توی قسمت دیکود دو تا متد داره
یکی decode_label که خروجی رو به انگلیسی تبدیل میکنه و یکی هم label_to_hangul که انگلیسی رو به کره ای تبدیل میکند. من فقط خروجی decode_label رو میگیرم(چون همش انگلیسیه و نیازی به تبدیل به کره ای نیست) ولی همش خالی میده. برای استفاده از دیگر شبکه ها هم موردی ندارم. فقط مشکلم اینه که با 8000 تا ترین خروجی نباید صفر باشه(شما میگید که 93 درصد میگیرید، اگر همه چی درست باشه باید بجای 93 درصد، 20 درصد بده دیگه، مگه نه؟)، بیشتر دنبال اینم که از درست بودن صفر تا 100 کد و داده و ... مطمئن باشم که بعدش بتونم داده های اصلی رو وارد کنم. که هنوز مشکل رو پیدا نکردم از کجاست. اینم نمونه ای از لاس ترین است:
http://s8.picofile.com/file/8357813468/Loss.JPG
من چون لیبلم فقط عدد بوده دقیق نشدم رو این قسمت کدش
اگه loss میاد پایین پس داره دقتش میره بالا و احتمالا عیب از کد prediction هست که باید دیباگش کنین
loss نهایی من به 0/248 رسید
...