Categories: فناوری

علی‌بابا چین مدل هوش مصنوعی استدلالگر تصویری معرفی کرد

Alibaba، غول فناوری چینی، مدل جدید هوش مصنوعی از سری Qwen به نام QVQ-Max را معرفی کرد. این مدل استدلالگر تصویر است و می‌تواند محتوای عکس‌ها و فیلم‌ها را درک کند و با تحلیل و استدلال، اطلاعاتی درباره آنها ارائه دهد.

براساس گزارش Neowin، علی‌بابا می‌گوید با مدل QVQ-Max شکاف مدل‌های هوش مصنوعی مبتنی‌بر متن و اطلاعات دنیای واقعی در تصاویر را پر می‌کند. این هوش مصنوعی با قابلیت استدلال بصری می‌تواند واقعیت‌های جهان را ببیند، بفهمد و درباره آنها فکر کند. این شرکت چینی ادعا می‌کند این مدل در تجزیه‌وتحلیل تصاویر و شناسایی عناصر کلیدی عملکرد خیلی خوبی دارد و در مواردی می‌توان از آن برای تصویرسازی و تولید فیلم‌نامه نیز استفاده کرد.

هوش مصنوعی استدلالگر تصویری Alibaba

مانند سایر چت‌بات‌های هوش مصنوعی، QVQ-Max نیز می‌تواند در کارهای مختلف کمکتان کند و با اضافه شدن این قابلیت تصویری می‌توانید کارهای بیشتری را به آن بسپارید؛ برای مثال عکس مسائل ریاضی و فیزیک همراه نمودارها را برایش بفرستید.

علی‌بابا QVQ-Max را اولین نسخه از مدل استدلالگر تصویری خود نامیده است و به‌مرور می‌خواهد آن را در چندین مرحله بهبود دهد. ابتدا Alibaba می‌خواهد دقت تشخیص تصویر را بهبود ببخشد. سپس مدل را در حل مسائل چندمرحله‌ای و پیچیده بهتر کند. درنهایت قصد دارد این مدل را از تعاملات مبتنی‌بر متن فراتر برده و آن را به قابلیت‌هایی مثل تولید بصری مجهز کند.

برای استفاده از QVQ-Max، ابتدا باید به chat.qwen.ai بروید، روی منوی مدل‌ها در بالا سمت چپ کلیک کنید، گزینه «Expand more models» را بزنید و QVQ-Max را انتخاب کنید. برای آنکه بهتر از قابلیت‌های این مدل استفاده کنید، بهتر است تصویری را پیوست کنید سپس از مدل درباره آن سؤال کنید.

علی‌بابا چندی قبل نیز مدل Qwen2.5-Max را منتشر کرد که در بنچمارک‌های مختلف از مدل V3 دیپ‌‌سیک، GPT-4o و Llama-3.1-405B متا بهتر عمل می‌کند.

avalkhabar

Share
Published by
avalkhabar

Recent Posts

ستاره ایرانی در ژاپن مهندس شد!

کد خبر : 2116712 | 13 فروردين 1404 ساعت 16:33 | 23.4K بازدید | 34…

9 دقیقه ago

الکسا پلاس به‌صورت محدود عرضه شد؛ بدون برخی از قابلیت‌های پیشرفته

آمازون نسخه جدید دستیار صوتی خود، الکسا پلاس، را در حالت Early-Access منتشر کرده است.…

2 ساعت ago

انتقاد شدید از رئال پس از صعود به فینال کوپادل‌ری

کد خبر : 2116674 | 13 فروردين 1404 ساعت 12:38 | 42.9K بازدید | 87…

3 ساعت ago

گوگل احتمالاً نسخه مخصوص کودکان جمینای را توسعه می‌دهد؛ با تمرکز بر حل تکالیف

طبق بررسی‌های انجام‌شده روی نسخه جدید اپلیکیشن Google، این شرکت درحال توسعه نسخه‌ای از Gemini…

4 ساعت ago

استقلال در انتظار پرتماشاگرترین بازی سال!

کد خبر : 2116685 | 13 فروردين 1404 ساعت 13:37 | 9.2K بازدید | 109…

4 ساعت ago

جادوگری، مزخرفی که دوست داریم باورش کنیم!

کد خبر : 2116562 | 12 فروردين 1404 ساعت 15:44 | 50.1K بازدید | 161…

5 ساعت ago