تقنية

ما الذي يستطيع نموذج Gemini AI من Google فعله؟ استكشاف خمس حالات استخدام مثيرة للاهتمام


في السباق لنشر نموذج اللغة الأكثر تقدمًا القائم على الذكاء الاصطناعي، فإن OpenAI (وأكبر مستثمر فيها، Microsoft) وGoogle ليسا على استعداد للتباطؤ. في الآونة الأخيرة، قامت OpenAI بإسقاط تحديث GPT-4، الذي دمج العديد من القدرات الجديدة مثل تفسير البيانات والتعرف على الصور والمزيد. الآن، توصلت شركة التكنولوجيا العملاقة المملوكة لشركة Alphabet إلى برنامج LLM الأكثر تقدمًا، Gemini. ومع ذلك، إليك خمسة أشياء مثيرة يمكن أن يفعلها أحدث نموذج للذكاء الاصطناعي من Google.

ما هو الجوزاء قادر على؟

جوجل تؤجل إطلاق الجيل القادم من الذكاء الاصطناعي Gemini إلى يناير من العام المقبل

بفضل الوسائط المتعددة المتقدمة، يستطيع Gemini التعامل مع النصوص والصور والكلام والتعليمات البرمجية والفيديو والأنماط والمزيد. وتقول Google أيضًا إن Gemini هو نموذجها الأكثر مرونة حتى الآن، حيث يمكن تشغيله بكفاءة في مراكز البيانات ذات قوة المعالجة الهائلة للأجهزة المحمولة ذات الموارد المحدودة. تم تحسين الإصدار الأول من Gemini 1.0 لثلاث حالات استخدام مختلفة. وتشمل هذه الأجهزة Gemini Nano للمهام على الجهاز، وGemini Pro للتوسع عبر مجموعة واسعة من المهام على محطة العمل، وGemini Ultra للمهام المعقدة للغاية.

الجوزاء الترا مقابل. GPT-4: إليك ما تقوله المعايير

وفقًا لشركة Google، يعد Gemini النموذج الأول الذي يتفوق على الخبراء البشريين في فهم اللغة متعدد المهام بشكل كبير، حيث يفهم 57 موضوعًا مختلفًا، بما في ذلك الرياضيات والفيزياء والقانون والطب وغير ذلك الكثير. تتضمن بعض المعايير التي يتفوق فيها Gemini Ultra على GPT-4 الخاص بـ OpenAI، MMLU، وBig-Bench Hard، وDROP، وGSM8K، وAMTH، وHumanEval، وNatural2Code. وهذا يعني أن Gemini Ultra أفضل في التعامل مع المهام المتنوعة التي تتطلب التفكير متعدد الخطوات، وفهم القراءة، والتلاعب الحسابي الأساسي، ومشكلات المطابقة الصعبة، وإنشاء كود Python.

يمكن لمواليد برج الجوزاء اكتشاف أوجه التشابه والاختلاف بين الصورتين

يمكن لنموذج الذكاء الاصطناعي متعدد الوسائط من Google العثور على أوجه التشابه بين الصور. تعثر شركة Gemini على نقاط ربط بين صورتين معقدتين إلى حد ما في مقطع فيديو تجريبي تم تحميله على قناة الشركة على YouTube. ويمكنه تحديد أن كليهما لهما تركيبة منحنية وعضوية، مما يعني أنه يفهم ما هو مرسوم في الصورة ويمكنه إجراء إحالة مرجعية للاستدلال مع قاعدة البيانات الخاصة به لإنشاء استجابة، كل ذلك في غضون ثوانٍ.

يمكن لمواليد برج الجوزاء شرح المنطق والمطابقة في خطوات بسيطة

يعرض Google كيف يمكن لـ Gemini فهم الصيغ والخطوات المكتوبة على ورق مكتوب بخط اليد وتمييز الصيغ الصحيحة من الخاطئة. في العرض التوضيحي، يطلب المرء من الجوزاء التركيز على إحدى هذه المشكلات التي تم حلها على ورقة ومعرفة الخطأ في الحساب. يفهم الجوزاء هذا بشكل صحيح ويمكنه أيضًا شرح المفهوم الرياضي أو العلمي الكامن وراء الصيغة قبل إجراء الحساب الصحيح. بهذه الطريقة، يمكن أن يكون برنامج Gemini مفيدًا للطلاب الذين يكافحون من أجل حل المسائل العددية في الرياضيات أو الفيزياء الصعبة.

يدعم Gemini لغة Python وJava وC++ وGo

يشير مقطع فيديو تجريبي آخر على قناة Google على YouTube إلى كيفية حل Gemini باستمرار لـ 75 بالمائة من 200 برنامج قياس الأداء (في المحاولة الأولى) على Python، مقارنة بـ 45 بالمائة في PaLM 2. علاوة على ذلك، فإن السماح لـ Gemini بإعادة فحص وإصلاح رموزها، هو الحل يتجاوز المعدل 90 بالمائة، مما يشير إلى أن نموذج الذكاء الاصطناعي يمكن أن يساعد المبرمجين على إزالة الأخطاء من برامجهم وتشغيلها بسلاسة.

يستطيع برج الجوزاء التعرف على الملابس

وفي مثال آخر، يوضح جوجل كيف يستطيع الجوزاء فهم قطع الملابس المختلفة وتقديم الأسباب ذات الصلة. على الرغم من أن Google لم يغطي هذا الجزء، إلا أنه من المفترض أن يكون Gemini قادرًا أيضًا على تقديم أفكار للأزياء بناءً على مجموعات الألوان والمناخ. على سبيل المثال، إذا سأل شخص ما عن نوع الجينز أو البنطال الذي يتناسب مع السترة المنتفخة، فيجب أن يكون الجوزاء قادرًا على اقتراح بعض الأفكار. وبالمثل، يمكن لـ Gemini أيضًا التعرف على ما يحدث في مقطع الفيديو، سواء كان شخص ما يرسم رسمًا، أو يؤدي خدعة سحرية، أو يشغل فيلمًا.

يستطيع برج الجوزاء استخلاص البيانات من آلاف الأوراق البحثية في دقائق

بشكل عام، قد تستغرق الإشارة من مجموعة بيانات ضخمة شهورًا من القراءة اليدوية وتدوين الملاحظات. ومع ذلك، يعرض Google كيف تعرفت جيميني على الأوراق البحثية (من حوالي 200000) ذات الصلة بالدراسة. بعد ذلك، استخرج جيميني المعلومات المطلوبة من الأوراق ذات الصلة وقام بتحديث مجموعة بيانات معينة.

يستطيع الجوزاء أيضًا التفكير في الأرقام، مثل المخططات والرسوم البيانية، وإنشاء أرقام جديدة بأرقام محدثة. وبهذه الطريقة، يمكن لنموذج الذكاء الاصطناعي الجديد من Google مساعدة العلماء والباحثين في الحصول على المراجع والاستشهادات بشكل أسرع.

Pixel 8 Pro وBard للحصول على الطعم الأول

بينما تم عرض هذه العروض التوضيحية على واجهة مستخدم مخصصة، فإن هذا يعني أنه يمكن للمطورين الاستفادة من إمكانات Gemini المتقدمة لإنشاء أدواتهم المستندة إلى الذكاء الاصطناعي منها. أصدرت Google بالفعل Gemini Nano لجهاز Pixel 8 Pro، والذي حصل على ميزتين جديدتين، بما في ذلك Summarize In Recorder وSmart Response في Gboard. سيحصل برنامج الدردشة الآلي Bard من Google أيضًا على قدرات Gemini Pro في الأيام المقبلة.

يمكنك متابعة Smartprix على تويتروفيسبوك وإنستغرام وأخبار جوجل. قم بزيارة موقع Smartprix.com للحصول على أحدث الأخبار والمراجعات والأدلة التقنية.





Source link


اكتشاف المزيد من إشراق العالم

اشترك للحصول على أحدث التدوينات المرسلة إلى بريدك الإلكتروني.

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

زر الذهاب إلى الأعلى