هوش مصنوعی استدلال‌گر Gemini گوگل رسماً معرفی شد

شرکت گوگل دیپ‌مایند از نسخه جدید مدل هوش مصنوعی خود با نام Gemini 2.5 Deep Think رونمایی کرد. به گفته گوگل، این مدل پیشرفته‌ترین سامانه استدلالی مبتنی بر هوش مصنوعی این شرکت است که می‌تواند با بررسی و تحلیل هم‌زمان چندین ایده، پاسخ‌های دقیق‌تری ارائه دهد و در نهایت بهترین پاسخ را انتخاب کند. مشترکان

مدل Gemini 2.5 Deep Think نخستین‌بار در ماه مه و در رویداد Google I/O 2025 معرفی شد و اکنون به‌عنوان نخستین مدل چندعاملی (multi-agent) عمومی گوگل در دسترس قرار گرفته است. در این مدل، چند عامل هوش مصنوعی به‌طور هم‌زمان برای پاسخ به یک پرسش فعالیت می‌کنند؛ فرایندی که هرچند منابع محاسباتی بسیار بیشتری مصرف می‌کند، اما معمولاً منجر به ارائه پاسخ‌های بهتر و دقیق‌تر می‌شود.

گوگل اعلام کرد که با استفاده از نسخه‌ای ویژه از مدل Gemini 2.5 Deep Think موفق به کسب مدال طلا در المپیاد جهانی ریاضی (IMO) سال جاری شده است.

همزمان با عرضه عمومی Gemini 2.5 Deep Think، گوگل اعلام کرده که مدل استفاده‌شده در المپیاد ریاضی را نیز در اختیار گروه محدودی از ریاضی‌دانان و دانشگاهیان قرار خواهد داد. به گفته شرکت، این مدل هوش مصنوعی برخلاف بیشتر مدل‌های معمول که در عرض چند ثانیه یا دقیقه پاسخ می‌دهند، برای استدلال نیاز به چند ساعت زمان دارد. گوگل امیدوار است این مدل بتواند به ارتقای تحقیقات علمی کمک کند و بازخوردهایی برای بهبود سامانه چندعاملی در کاربردهای دانشگاهی دریافت کند.

گوگل همچنین اعلام کرده که نسخه فعلی Gemini 2.5 Deep Think نسبت به آنچه در رویداد Google I/O معرفی شد، بهبود قابل‌توجهی داشته است. این شرکت همچنین از توسعه «تکنیک‌های نوآورانه یادگیری تقویتی» برای بهبود عملکرد مدل در مسیرهای استدلالی خبر داده است. گوگل در یک پست وبلاگی که با رسانه TechCrunch به اشتراک گذاشته شده، نوشته است: «مدل Deep Think می‌تواند به افراد در حل مسائلی کمک کند که نیازمند خلاقیت، برنامه‌ریزی راهبردی و بهبود گام‌به‌گام هستند.»

گوگل اعلام کرده که مدل Gemini 2.5 Deep Think موفق به کسب عملکرد پیشرفته در آزمون Humanity’s Last Exam (HLE) شده است؛ این آزمون چالش‌برانگیز توانایی هوش مصنوعی را در پاسخ به هزاران سوال crowdsourced در زمینه‌های ریاضی، علوم انسانی و علوم طبیعی می‌سنجد. به گفته گوگل، این مدل در آزمون HLE بدون استفاده از ابزارهای اضافی، موفق به کسب امتیاز ۳۴.۸ درصد شده است. در مقایسه، مدل Grok 4 از xAI توانسته ۲۵.۴ درصد و مدل o3 از OpenAI تنها ۲۰.۳ درصد کسب کند.

علاوه بر این، گوگل مدعی است که مدل Gemini 2.5 Deep Think در آزمون LiveCodeBench 6 نیز برتری نسبت به مدل‌های هوش مصنوعی از OpenAI، xAI و Anthropic نشان داده است. این آزمون یک چالش در زمینه کدنویسی رقابتی است و مدل گوگل با کسب ۸۷.۶ درصد بالاتر از مدل Grok 4 با ۷۹ درصد و مدل o3 از OpenAI با ۷۲ درصد قرار گرفته است.

گوگل اعلام کرده که مدل Gemini 2.5 Deep Think به‌طور خودکار با ابزارهایی مانند اجرای کد و جستجوی گوگل کار می‌کند و قادر است پاسخ‌های بسیار طولانی‌تری نسبت به مدل‌های هوش مصنوعی سنتی تولید کند. در آزمایش‌های انجام‌شده توسط گوگل، این مدل توانسته وظایف توسعه وب را به‌طور دقیق‌تر و از نظر زیبایی‌شناسی جذاب‌تر از سایر مدل‌های هوش مصنوعی انجام دهد. گوگل معتقد است که این مدل می‌تواند به محققان کمک کند و امکان تسریع در مسیر کشف‌های علمی را فراهم کند.

xAI متعلق به ایلان ماسک به‌تازگی یک سیستم چندعاملی به نام Grok 4 Heavy منتشر کرده است که به گفته این شرکت، توانسته عملکردی پیشرو در چندین معیار صنعتی به دست آورد. نوم براون، محقق OpenAI، در یک پادکست اعلام کرده که مدل هوش مصنوعی که شرکت برای کسب مدال طلا در المپیاد جهانی ریاضی امسال استفاده کرده، نیز یک سیستم چندعاملی بوده است. در همین حال، Anthropic نیز با معرفی مدل Research agent که خلاصه‌های تحقیقاتی جامع تولید می‌کند، از یک سیستم چندعاملی بهره می‌برد.

با وجود عملکرد قوی این سیستم‌ها، به نظر می‌رسد که سیستم‌های چندعاملی هزینه‌های بیشتری نسبت به مدل‌های سنتی هوش مصنوعی دارند. این بدان معناست که شرکت‌های فناوری ممکن است این سیستم‌ها را پشت سر گران‌ترین طرح‌های اشتراکی خود نگه دارند، همانطور که xAI و اکنون گوگل این کار را انجام داده‌اند. در هفته‌های آینده، گوگل اعلام کرده که قصد دارد مدل Gemini 2.5 Deep Think را از طریق API Gemini با گروه محدودی از آزمایش‌کنندگان به اشتراک بگذارد. شرکت می‌گوید هدف آن این است که بفهمد توسعه‌دهندگان و کسب‌وکارها چگونه از سیستم چندعاملی خود استفاده خواهند کرد.

منبع خبر : techcrunch.com

لینک کوتاه

برچسب ها :

ناموجود

ارسال نظر شما

مجموع نظرات : 0 در انتظار بررسی : 0 انتشار یافته : 0

نظرات ارسال شده توسط شما، پس از تایید توسط مدیران سایت منتشر خواهد شد.
نظراتی که حاوی تهمت یا افترا باشد منتشر نخواهد شد.
نظراتی که به غیر از زبان فارسی یا غیر مرتبط با خبر باشد منتشر نخواهد شد.