سلام
اگه نظرتون اینه که پردازش سمت سرور باشه، کاری که شما باید بکنید اینطوری میشه:
1- یه اپلیکیشن روی گوشی می نویسید که از طریق web service ، اطلاعات + عکس رو ارسال کنه سمت سرور و جوابش رو مثلا با فرمت json دریافت کنه
توی این json هم می تونه، اطلاعات bounding box ها، همراه با شی تشخیص داده شده باشه که بعدش می تونید روی تصویر نشونشون بدین
برای نوشتن این قسمت می تونید مثال های زیر رو ببیند. تنها کاری که بعدا باید انجام بدید اینه که بر اساس اینکه سرور چه چیزی می خواد و چه جوابی میده، کدها رو تغییر بدید
http://programmerguru.com/android-tutorial/android-webservice-example
http://sampleprogramz.com/android/singlewebservicecall.php
2 - برای سمت سرور هم حداقل 2 تا گزینه دارید
یا اینکه از web api هم آماده استفاده کنید. البته من زیاد سرچ نکردم ببینم مجانیش هم هست یا نه، اما پولی زیاد هست
لیست بعضی هاشون اینجا هست
http://blog.mashape.com/list-of-14-image-recognition-apis
راه دوم هم اینه که خودتون با هر زبانی که روی سرورتون پشتیبانی میشه (مثلا php یا پایتون)، از مدلهای آماده ای که هست استفاده کنید و درخواستهایی که از طرف اپلیکشن موبایلتون به سرور می رسه رو پردازش کنید و جواب رو برگردونید
برای قسمت وب سرویس، توی php خیلی وارد نیستم، اما با پایتون و django خیلی راحت می تونید کارا رو انجام بدید
خلاصه کاری که می خواید انجام بدید تا جایی که بیشتر به این فروم مربوطه، اینطوری که چه طوری یه مدل deep رو سمت سرور اجرا کنید که بعدا بتونید باهاش از طریق اپلیکیشن موبایل کار کنید
==================================================
به عنوان یه پیشنهاد جانبی، به عنوان یه کار خیلی ساده که خیلی درگیر نصب کتابخونه و اینا هم نشید، می تونید از ConvnetJS استفاده کنید(البته با این فرض که پردازش رو بخواید همین سمت کلاینت انجام بدید)
http://cs.stanford.edu/people/karpathy/convnetjs