تكنولوجيا

«غوغل» تُطلق نموذجها الذكي Gemini AI وتعد بتفوقه على ChatGPT

الشركة تزعم أن الإصدار الجديد يتفوق على GPT-3.5

كشفت شركة «غوغل» عن نموذجها الأحدث والأكثر تطوراً للذكاء الاصطناعي Gemini AI، والذي تؤكد أنه نجح في التفوق على نموذج شركة OpenAI GPT3.5 بـ«جدارة».

وبحسب بيان رسمي، أعلنت الشركة الأميركية أن النموذج الجديد سيزود روبوتها للدردشة Bard بقدرات أعلى عند إنجاز العديد من المهام، مثل الإدراك والتعامل المنطقي مع النصوص والتخطيط والعديد من القدرات الأخرى.

وسيصل Gemini في 3 إصدارات متفاوتة الإمكانيات، وهي Nano وPro وUltra، حيث تستهدف «غوغل» تشغيل نموذجها الذكي الجديد على جميع المنصات الذكية بداية من الهواتف وصولاً إلى مراكز البيانات.

وسيجري تضمين «جيميناي» في روبوت «غوغل» للدردشة «بارد» على مرحلتين، المرحلة الأولى ستبدأ بوصول «جيميناي برو» إلى بارد بداية من الخميس، بحيث يبدأ الأمر بدعم اللغة الإنجليزية على مستوى 170 دولة حول العالم، على أن يصل التحديث لمزيد من الدول، ويتسع الدعم ليشمل عدداً أكبر من اللغات الطبيعية خلال الفترة المقبلة.

أما المرحلة الثانية، فستكون بوصول إصدار أكثر تطوراً من بارد يحمل اسم Bard Advanced إلى روبوت الدردشة، وسيعتمد هذا الإصدار في البداية على نسخة Gemini Ultra الأعلى بين إصدارات جيميناي الثلاث.

جيميناي نانو Gemini Nano

تتنوع الإمكانيات التي تقدمها «غوغل» في إصدارات «جيميناي» الثلاثة، فالإصدار الأخف والأقل من حيث الإمكانيات هو «جيميناي نانو Gemini Nano»، وهو نموذج ذكاء اصطناعي مطور ليعمل على الهواتف الذكية، وستكون هواتف «غوغل» بيكسل 8 وبيكسل 8 برو أولى هواتف الشركة التي تشغل النموذج الجديد.

وسيعتمد «جيميناي نانو» على شريحة معالج «غوغل» الأحدث Tensor G3، وسيدعم النموذج الذكي تشغيل العديد من المزايا على هواتف «غوغل» التي أطلقتها أكتوبر الماضي، مثل ميزة Summarize in Recorder والتي تساعد على تلخيص المقاطع الصوتية المسجلة عبر تطبيق Recorder، ودعم إنشاء الردود على الرسائل بالذكاء الاصطناعي Smart Reply خلال استخدام تطبيق لوحة مفاتيح «غوغل» Gboard.

اعتماد “جيميناي نانو” على وحدة المعالجة العصبية المتوفرة في معالج «غوغل» «تينسور جي 3» ستتيح الحفاظ على معلومات مستخدمي هواتف بيكسل، إذ ستتم المعالجة بالكامل محلياً على هواتفهم، دون مغادرة أية معلومات إلى خوادم «غوغل»، إلى جانب ضمان سرعة أداء مزايا الذكاء الاصطناعي، والاستمتاع بها دون الحاجة إلى الاتصال بشبكة الإنترنت.

ميزة تلخيص المقاطع الصوتية ستسمح للمستخدم بتسجيل أي مقاطع لاجتماعات أو محاضرات أو حتى تسجيلات صوتية تقليدية للمستخدم نفسه، ومن ثم تحويل تلك التسجيلات إلى نصوص، وبعد ذلك يتم الضغط على زر معين داخل تطبيق التسجيل Recorder، ليتم الاستعانة بنموذج «غوغل» الذكي «جيميناي نانو» لتلخيص النصوص وتحويلها إلى نقاط رئيسية واضحة.

وبينما ستعتمد ميزة الردود الذكية على «جيميناي نانو» على هواتف بيكسل 8، وذلك سيكون مدعوماً داخل جميع تطبيقات التراسل الفوري، والبداية هذا العام ستكون بتطبيق واتساب، على أن تصل تلك الميزة للمزيد من تطبيقات التراسل بحلول العام المقبل.

وبحلول 2024، سيحصل مساعد «غوغل» الذكي Assistant على قدرات Bard الفائقة، وسيقتصر ذلك على هواتف «غوغل» بيكسل فقط.

جيميناي برو Gemini Pro

الإصدار البرو من «جيميناي» يدعم روبوت «غوغل» للدردشة Bard، ويزوده بعدد من الإمكانيات المتطورة في التعامل مع تحليل النصوص وإنشائها وكذلك كتابة الأكواد البرمجية والتخطيط، وكذلك التعامل مع أشكال المدخلات المختلفة من نصوص وصور وفيديوهات ومقاطع مسموعة في نفس الوقت.

ولكن البداية مع وصول «جيميناي برو» إلى بارد ستكون في صورة تطور تعامل بارد مع المدخلات النصية، وستبدأ بقية أوجه التطوير في الوصول إلى أيدي مستخدمي بارد خلال الأشهر المقبلة، بحسب مدونة بارد الرسمية.

وبحسب أبحاث أجراها قطاع «غوغل» Google Mind لأبحاث الذكاء الاصطناعي، فإن «جيميناي برو» استطاع التفوق على نموذج GPT3.5 في 6 اختبارات من أصل 8 اختبارات أجرتها «غوغل» قبل الكشف عن نموذجها الجديد، ومن بينها التفوق معيار MMLU، وهو يقيس قدرة نماذج الذكاء الاصطناعي على إنجاز العديد من المهام المعتمدة على تحليل النصوص في وقت واحد، بجانب تفوق “جيميناي برو” في معيار GSM8K، والخاص بقدرة النماذج الذكية على التعامل مع المعادلات الحسابية.

جيميناي ألترا Gemini Ultra

جيميناي ألترا هو النموذج الأكثر تطوراً من حيث قدراته على إنجاز المهام المعقدة، حيث أكدت «غوغل» أنه نجح في التفوق في 30 مقياساً من أصل 32 مقياس من مقاييس كفاءة النماذج اللغوية الضخمة، والتي تعتمد عليها الأوساط الأكاديمية في عمليات البحث والتطوير.

كذلك حقق جيميناي ألترا نسبة 90% على معيار MMLU، ليضاهي أداءه أفضل الخبراء البشر في التعامل مع خليط من 57 موضوعاً معرفياً معقداً، متنوعة بين الرياضيات والفيزياء والتاريخ والطب والقانون، على مستوى المعرفة العامة بالمعلومات وكذلك القدرة على حل المشكلات.

التركيز على معيار MMLU في تدريب وتطوير جيميناي ألترا، أسهم في تطوير قدراته على التأني قبل الإجابة عن الأسئلة الصعبة، مما أصقل احترافه لمهارات الإجابة على الأسئلة بمعلومات دقيقة، تبتعد عن فكرة تقديم إجابات قائمة على الانطباع الأول عن الأسئلة المطروحة.

كذلك سلطت «غوغل» الضوء على قدرات النموذج فائق الإمكانيات في التعامل مع المدخلات المختلفة، بعيداً عن النصوص، حيث أن جيميناي ألترا نجح في التعرف على محتوى الصور، بما في ذلك النصوص الموجودة عليها دون الاستعانة بإمكانيات تطبيق قراءة بصري OCR، وذلك يتخطى إمكانيات معظم النماذج الذكية الأخرى مثل GPT-4V من أوبن إيه آي، كما تفوق الإصدار الألترا في التعامل مع العمليات الحسابية من حيث حلها أو التعرف على صحة وخطأ الإجابات عليها من خلال تحليل صور لها.

وعلى مستوى الفيديوهات، أثبتت نتائج اختبارات «غوغل» أن جيميناي ألترا تمكن من تقديم أداء مميز على مستوى إنتاج نصوص للكلام المنطوق في الفيديوهات باللغة الإنجليزية، والإجابة على التساؤلات المطروحة حول محتوى فيديو معين.

وأعلنت «غوغل» أن جيميناي ألترا، لن يصبح متاحاً للجمهور قبل 2024، إلا أن الشركة ستتيحه لعينة محدودة من مستخدمي بارد على متن الإصدار القادم المتطور Bard Advanced، والتي ستطلقه الشركة العام المقبل لعموم المستخدمين.

زر الذهاب إلى الأعلى