سلام.
چند نکته مهم وجود داره. نخست اینکه شبکه مورد نظر شما از نظر ساختاری به مساله شما قابل تعمیم هست یا نه. برای مثال برای دسته بندی متن مورد نظر آیا شما می خواهید تکه هایی از متن را به صورت کانولوشنی برداشت کنید؟ (مانند کارهای مشابه در پردازش متن) یا استراتژی دیگه ای برای ورودی هستش؟ مساله بدی در مورد معماری شبکه میزان ژرف بودن شبکه هستش عموما شبکه های بینایی ماشین عمق زیادی دارند و این ممکنه برای ورودی از جنس متن مناسب نباشه. و در آخر بحث پیش آموزش شبکه ها هست که این شبکه ها بر روی تصاویر آموزش دیده اند و استفاده از شبکه پیش آموزش دیده در یک فضا (تصویر) در فضای دیگه (متن) کار درستی نیست. حتما مقاله های مرتبط با کارتون رو مطالعه کنید.