هوش مصنوعی استدلالگر Gemini گوگل رسماً معرفی شد

شرکت گوگل دیپمایند از نسخه جدید مدل هوش مصنوعی خود با نام Gemini 2.5 Deep Think رونمایی کرد. به گفته گوگل، این مدل پیشرفتهترین سامانه استدلالی مبتنی بر هوش مصنوعی این شرکت است که میتواند با بررسی و تحلیل همزمان چندین ایده، پاسخهای دقیقتری ارائه دهد و در نهایت بهترین پاسخ را انتخاب کند. مشترکان
شرکت گوگل دیپمایند از نسخه جدید مدل هوش مصنوعی خود با نام Gemini 2.5 Deep Think رونمایی کرد. به گفته گوگل، این مدل پیشرفتهترین سامانه استدلالی مبتنی بر هوش مصنوعی این شرکت است که میتواند با بررسی و تحلیل همزمان چندین ایده، پاسخهای دقیقتری ارائه دهد و در نهایت بهترین پاسخ را انتخاب کند. مشترکان طرح Ultra گوگل که ماهانه ۲۵۰ دلار پرداخت میکنند، از روز جمعه به این مدل از طریق اپلیکیشن Gemini دسترسی خواهند داشت.
مدل Gemini 2.5 Deep Think نخستینبار در ماه مه و در رویداد Google I/O 2025 معرفی شد و اکنون بهعنوان نخستین مدل چندعاملی (multi-agent) عمومی گوگل در دسترس قرار گرفته است. در این مدل، چند عامل هوش مصنوعی بهطور همزمان برای پاسخ به یک پرسش فعالیت میکنند؛ فرایندی که هرچند منابع محاسباتی بسیار بیشتری مصرف میکند، اما معمولاً منجر به ارائه پاسخهای بهتر و دقیقتر میشود.
گوگل اعلام کرد که با استفاده از نسخهای ویژه از مدل Gemini 2.5 Deep Think موفق به کسب مدال طلا در المپیاد جهانی ریاضی (IMO) سال جاری شده است.
همزمان با عرضه عمومی Gemini 2.5 Deep Think، گوگل اعلام کرده که مدل استفادهشده در المپیاد ریاضی را نیز در اختیار گروه محدودی از ریاضیدانان و دانشگاهیان قرار خواهد داد. به گفته شرکت، این مدل هوش مصنوعی برخلاف بیشتر مدلهای معمول که در عرض چند ثانیه یا دقیقه پاسخ میدهند، برای استدلال نیاز به چند ساعت زمان دارد. گوگل امیدوار است این مدل بتواند به ارتقای تحقیقات علمی کمک کند و بازخوردهایی برای بهبود سامانه چندعاملی در کاربردهای دانشگاهی دریافت کند.
گوگل همچنین اعلام کرده که نسخه فعلی Gemini 2.5 Deep Think نسبت به آنچه در رویداد Google I/O معرفی شد، بهبود قابلتوجهی داشته است. این شرکت همچنین از توسعه «تکنیکهای نوآورانه یادگیری تقویتی» برای بهبود عملکرد مدل در مسیرهای استدلالی خبر داده است. گوگل در یک پست وبلاگی که با رسانه TechCrunch به اشتراک گذاشته شده، نوشته است: «مدل Deep Think میتواند به افراد در حل مسائلی کمک کند که نیازمند خلاقیت، برنامهریزی راهبردی و بهبود گامبهگام هستند.»
گوگل اعلام کرده که مدل Gemini 2.5 Deep Think موفق به کسب عملکرد پیشرفته در آزمون Humanity’s Last Exam (HLE) شده است؛ این آزمون چالشبرانگیز توانایی هوش مصنوعی را در پاسخ به هزاران سوال crowdsourced در زمینههای ریاضی، علوم انسانی و علوم طبیعی میسنجد. به گفته گوگل، این مدل در آزمون HLE بدون استفاده از ابزارهای اضافی، موفق به کسب امتیاز ۳۴.۸ درصد شده است. در مقایسه، مدل Grok 4 از xAI توانسته ۲۵.۴ درصد و مدل o3 از OpenAI تنها ۲۰.۳ درصد کسب کند.
علاوه بر این، گوگل مدعی است که مدل Gemini 2.5 Deep Think در آزمون LiveCodeBench 6 نیز برتری نسبت به مدلهای هوش مصنوعی از OpenAI، xAI و Anthropic نشان داده است. این آزمون یک چالش در زمینه کدنویسی رقابتی است و مدل گوگل با کسب ۸۷.۶ درصد بالاتر از مدل Grok 4 با ۷۹ درصد و مدل o3 از OpenAI با ۷۲ درصد قرار گرفته است.
گوگل اعلام کرده که مدل Gemini 2.5 Deep Think بهطور خودکار با ابزارهایی مانند اجرای کد و جستجوی گوگل کار میکند و قادر است پاسخهای بسیار طولانیتری نسبت به مدلهای هوش مصنوعی سنتی تولید کند. در آزمایشهای انجامشده توسط گوگل، این مدل توانسته وظایف توسعه وب را بهطور دقیقتر و از نظر زیباییشناسی جذابتر از سایر مدلهای هوش مصنوعی انجام دهد. گوگل معتقد است که این مدل میتواند به محققان کمک کند و امکان تسریع در مسیر کشفهای علمی را فراهم کند.
xAI متعلق به ایلان ماسک بهتازگی یک سیستم چندعاملی به نام Grok 4 Heavy منتشر کرده است که به گفته این شرکت، توانسته عملکردی پیشرو در چندین معیار صنعتی به دست آورد. نوم براون، محقق OpenAI، در یک پادکست اعلام کرده که مدل هوش مصنوعی که شرکت برای کسب مدال طلا در المپیاد جهانی ریاضی امسال استفاده کرده، نیز یک سیستم چندعاملی بوده است. در همین حال، Anthropic نیز با معرفی مدل Research agent که خلاصههای تحقیقاتی جامع تولید میکند، از یک سیستم چندعاملی بهره میبرد.
با وجود عملکرد قوی این سیستمها، به نظر میرسد که سیستمهای چندعاملی هزینههای بیشتری نسبت به مدلهای سنتی هوش مصنوعی دارند. این بدان معناست که شرکتهای فناوری ممکن است این سیستمها را پشت سر گرانترین طرحهای اشتراکی خود نگه دارند، همانطور که xAI و اکنون گوگل این کار را انجام دادهاند. در هفتههای آینده، گوگل اعلام کرده که قصد دارد مدل Gemini 2.5 Deep Think را از طریق API Gemini با گروه محدودی از آزمایشکنندگان به اشتراک بگذارد. شرکت میگوید هدف آن این است که بفهمد توسعهدهندگان و کسبوکارها چگونه از سیستم چندعاملی خود استفاده خواهند کرد.
منبع خبر : techcrunch.com
برچسب ها :
ناموجود- نظرات ارسال شده توسط شما، پس از تایید توسط مدیران سایت منتشر خواهد شد.
- نظراتی که حاوی تهمت یا افترا باشد منتشر نخواهد شد.
- نظراتی که به غیر از زبان فارسی یا غیر مرتبط با خبر باشد منتشر نخواهد شد.
ارسال نظر شما
مجموع نظرات : 0 در انتظار بررسی : 0 انتشار یافته : 0