الوصف: MiniGPT-4 هو نموذج يُدرك الصور والنصوص، ويولد محتوى جديداً استناداً إليها. على سبيل المثال، يمكنه إنشاء موقع ويب من ملاحظات مكتوبة بخط اليد أو تعليم وصفة طبخ من صورة. كما يمكنه خلق قصص أو أشعار استناداً إلى الصور. يجمع هذا النموذج بين نموذج لغوي ذو مقياس كبير ومشفر بصري، ويتم تحسينه باستخدام مجموعات بيانات عالية الجودة وقوالب محادثة. لذلك، فإن الكلمات التي ينتجها هي متسقة وذات معنى.
آخر درجة الشعبية: - (UTC)
-