Close Menu
    اختيارات المحرر

    رغم مخاوف العمر واللياقة.. ميسي يتحدث عن حلم الوداع الكبير

    أكتوبر 28, 2025

    الأمير أندرو يتخلى عن ألقابه ويخطط للانتقال بشروط معينة

    أكتوبر 28, 2025

    تحركات منفصلة في ألمانيا وإسبانيا تصون إرث بيكاسو

    أكتوبر 28, 2025
    فيسبوك الانستغرام يوتيوب تيكتوك
    الثلاثاء, أكتوبر 28, 2025
    • من نحن
    • اتصل بنا
    • الشروط والأحكام
    • سياسة الخصوصية
    فيسبوك الانستغرام يوتيوب تيكتوك
    NanamediaNanamedia
    English
    • الرئيسية
    • ثقافة وفن
    • منوعات
    • رياضة
    • سينما
    • موضة وازياء
    • اقتصاد
    • صحة
    • تكنولوجيا
    • تقارير و تحقيقات
    • آراء
    NanamediaNanamedia
    English
    أنت الآن تتصفح:الرئيسية»تكنولوجيا»OpenAI تطلق أول نماذج ذكية يمكنها “التفكير بالصور”
    تكنولوجيا

    OpenAI تطلق أول نماذج ذكية يمكنها “التفكير بالصور”

    Nana MediaNana Mediaأبريل 17, 2025لا توجد تعليقات4 دقائق
    فيسبوك تويتر بينتيريست لينكدإن Tumblr البريد الإلكتروني
    تقرير: OpenAI تعمل على إنشاء منصة على غرار "إكس"
    شاركها
    فيسبوك تويتر لينكدإن بينتيريست البريد الإلكتروني

    كشفت شركة OpenAI عن إصدارين جديدين من نماذجها المتقدمة

    كشفت شركة OpenAI عن إصدارين جديدين من نماذجها المتقدمة تحت اسم “o3” و”o4-mini”، واللذين يمثلان نقلة نوعية في قدرات التفكير المنطقي وتحليل البيانات عبر منصة ChatGPT.

    ووصفت الشركة في بيان رسمي هذه النماذج بأنها “الأذكى حتى الآن”، لما توفره من أداء متقدم على صعيد الاستخدامات الأكاديمية والتطبيقات الواقعية.

    وأضاف البيان أن نموذج o3 الأكثر تطوراً ضمن سلسلة “o” من OpenAI، إذ تم تدريبه على التفكير المتأني قبل إصدار الإجابات، مع تعزيز قدراته على استخدام الأدوات المختلفة داخل ChatGPT.

    ويشمل ذلك البحث على الإنترنت، وتحليل الملفات والبيانات عبر Python، بالإضافة إلى تفسير المحتوى البصري، وتوليد الصور عند الحاجة.

    ويتمتع النموذج بقدرة محسّنة على اتخاذ قرارات بشأن الأداة المناسبة للاستخدام بحسب نوع السؤال وتعقيده، ما يسمح له بتقديم إجابات دقيقة ومتعمقة خلال وقت لا يتجاوز الدقيقة الواحدة.

    ويأتي هذا التطوير في إطار سعي الشركة إلى تمكين ChatGPT من تنفيذ مهام متعددة بشكل مستقل.

    ويمتاز نموذج o3 بأدائه القوي في ميادين مثل البرمجة، والرياضيات، والعلوم، والتعرف البصري، إذ حقق نتائج قياسية على اختبارات مثل Codeforces وSWE-bench وMMMU.

    كما قلّص النموذج نسبة الأخطاء الكبرى بنسبة 20% مقارنة بنموذج o1 السابق، لا سيما في المهام المعقدة المرتبطة بمجالات الأعمال والاستشارات والهندسة.

    أما نموذج o4-mini، فقد صُمم ليكون نموذجاً مدمجاً يتميز بالكفاءة العالية من حيث التكلفة وسرعة التنفيذ، مع تقديم أداء مميز في الرياضيات والبرمجة والمهام البصرية.

    ويُعد النموذج الأفضل في اختبارات AIME لعامي 2024 و2025، كما تفوق على النسخة المصغّرة السابقة o3-mini، حتى في المهام غير المرتبطة بالتخصصات العلمية.

    تعزيز التعلّم وتوسيع التفكير “البصري”

    واصلت OpenAI توسيع نطاق استخدام التعلّم المعزز في تطوير نموذج o3، إذ لاحظت أن العلاقة بين زيادة القدرات الحسابية وتحسن الأداء التي شوهدت سابقاً في نماذج GPT ما زالت قائمة في هذا السياق.

    ومن خلال مضاعفة القدرة الحسابية أثناء التدريب والتفكير في وقت التنفيذ، نجح النموذج في تحقيق مكاسب أداء واضحة، ما يؤكد أن السماح للنموذج بالتفكير لفترات أطول ينعكس مباشرة على جودة النتائج.

    وتم تدريب كلا النموذجين أيضاً على استخدام الأدوات من خلال التعلّم المعزز، ليس فقط من ناحية “كيفية” استخدام الأداة، بل “متى ولماذا” يتم استخدامها.

    هذه القدرة الاستراتيجية في اختيار الأدوات بناءً على النتائج المرجوة، تمنح النماذج مرونة أكبر في التعامل مع السيناريوهات المعقدة، خاصة في مجالات التفكير البصري وسير العمل متعدد المراحل.

    ولأول مرة، بات بإمكان هذه النماذج دمج الصور بشكل مباشر في سلسلة تفكيرها، فهي لا “تشاهد” الصور فحسب، بل “تفكر بها”، ما…جة الصور التي يحمّلها المستخدم باستخدام أدوات مدمجة، ما يسمح لها بقص الصورة أو تكبيرها أو تدويرها، إلى جانب تنفيذ عمليات معالجة بصرية أخرى، دون الحاجة إلى نماذج متخصصة خارجية.

    وتُعد القدرة البصرية المعزّزة في ChatGPT عنصراً محورياً في حل المشكلات الأكثر تعقيداً، إذ تمكّنه من تحليل الصور بدقة وموثوقية أعلى من أي وقت مضى.

    كما يمكن للنموذج الدمج بسلاسة بين التفكير التحليلي المتقدم واستخدام أدوات مثل البحث عبر الإنترنت والتعديل البصري للصور- بما في ذلك التكبير، والقص، والتدوير، وتحسين جودة الصور- للوصول إلى استنتاجات حتى من الصور غير المثالية.

    على سبيل المثال، يمكن للمستخدم تحميل صورة تحتوي على مسألة اقتصادية للحصول على شرح مفصّل خطوة بخطوة، أو إرسال لقطة شاشة لخطأ برمجي ليقوم النموذج بتحديد السبب الجذري للمشكلة بسرعة.

    ويمثل هذا النهج محوراً جديداً في توسيع نطاق المعالجة الحاسوبية في وقت التنفيذ، من خلال الدمج المتناغم بين التحليل البصري والنصي، ما يُترجم إلى أداء متفوق في اختبارات متعددة الوسائط، ويُمهّد الطريق لتفكير متعدد الوسائط أكثر شمولاً.

    توفر النماذج الحديثة تجربة تفاعلية أكثر سهولة عبر الصور، إذ يمكن للمستخدم التقاط صورة وطرح سؤال عليها دون القلق بشأن موضع العناصر داخل الصورة، سواء كانت مقلوبة أو تحتوي على عدة مسائل في الوقت ذاته.

    حتى وإن بدت بعض العناصر غير واضحة للوهلة الأولى، فإن النموذج قادر على تكبير الصورة وتحديد التفاصيل بدقة أكبر.

    تحديات حاضرة

    رغم التقدّم اللافت، ما زالت هناك بعض التحديات التي تواجه “التفكير بالصور”، منها أن سلاسل التفكير الطويلة بشكل مفرط، نتيجة لاستدعاء أدوات أو عمليات بصرية غير ضرورية، كذلك مازالت توجد أخطاء في الإدراك البصري قد تؤدي إلى تفسيرات خاطئة رغم سير عملية التفكير بشكل سليم.

    كذلك اعترفت الشركة بوجود تذبذب في موثوقية النتائج عند تجربة نفس المهمة أكثر من مرة، بسبب اختلاف آليات التحليل البصري، ومع ذلك، تُعد نماذج o3 وo4-mini من OpenAI نقلة بارزة في تطوير القدرات البصرية للذكاء الاصطناعي، إذ تقدم دقة عالية في فهم الصور، وتمكن من حل مسائل كانت تعتبر خارج نطاق الإمكانات التقنية في السابق.

    تتوفر النماذج الجديدة للمشتركين في باقات استخدام ChatGPT Pro وChatGPT Plus وباقات الفرق ChatGPT Teams، بجانب توفر نموذج o4 mini الخفيف لمستخدمي النسخة المجانية من المنصة الذكية عبر تفعيل ميزة التفكيل Think في مربع الكتابة قبل إرسال استفساراتهم.

    شاركها. فيسبوك تويتر بينتيريست لينكدإن Tumblr البريد الإلكتروني
    السابقAdidas تبرز الحرفية العربية مع مجموعة Loomhood الفريدة
    التالي مصير الأكراد الغامض.. مخاوف من غدر الدولة الجارة وتوجس من تخلي الحلفاء
    Avatar photo
    Nana Media
    • موقع الويب

    المقالات ذات الصلة

    “أزمة صامتة” تقتل على الطرق.. تعادل القيادة تحت تأثير الخمر

    أكتوبر 28, 2025

    ميزة قادمة من Microsoft Teams تتيح لمديريك معرفة موقع عملك

    أكتوبر 27, 2025

    التسريبات عن مواصفات “آيفون 18” تبدأ بالظهور | تكنولوجيا

    أكتوبر 27, 2025
    الأخيرة

    رغم مخاوف العمر واللياقة.. ميسي يتحدث عن حلم الوداع الكبير

    أكتوبر 28, 2025

    الأمير أندرو يتخلى عن ألقابه ويخطط للانتقال بشروط معينة

    أكتوبر 28, 2025

    تحركات منفصلة في ألمانيا وإسبانيا تصون إرث بيكاسو

    أكتوبر 28, 2025

    نهى نبيل تتحول لعارضة أزياء بفستان ملكي فخم

    أكتوبر 28, 2025
    الأكثر قراءة
    منوعات أكتوبر 26, 2025

    مسؤول صحي بغزة: سوء التغذية يقتل 154 طفلا ويهدد حياة 51 ألفا آخرين | أخبار

    منوعات سبتمبر 24, 2025

    أم تعض ابنتها بعد رفضها الزواج من ابن عمها في أستراليا

    موضة وازياء يوليو 7, 2025

    مجوهرات صيف 2025 التي اختارتها نجمات العرب في ألبوم صور لأجمل القطع

    من نحن
    من نحن

    مرحبًا بكم في نانا ميديا، مصدر الأخبار الموثوق الذي يواكب كل ما يحدث في العالم لحظة بلحظة. نقدم لكم تغطية شاملة للأخبار المحلية والدولية، حيث نرصد تطورات العرب والعالم، ونحلل أبرز الأحداث الاقتصادية، ونسلط الضوء على آخر مستجدات الرياضة، السينما، والثقافة والفن. نهدف إلى تقديم محتوى دقيق ومتنوع يلبي اهتمامات قرائنا في مختلف المجالات.

    الأكثر مشاهدة

    مهرجان ميزوبوتاميا الدولي للشعر في لاهاي: أصوات العالم تتحد ضد العنصرية

    سبتمبر 4, 2025180 زيارة

    مهرجان أفلام الشرق الأوسط وشمال أفريقيا في لاهاي ينطلق عبر الإنترنت لتوسيع دائرة جمهوره

    سبتمبر 25, 202523 زيارة

    المهرجان الدولي للفيديوهات التوعوية: شباب العالم يلتقون على منصة الإبداع والمسؤولية

    أغسطس 18, 202522 زيارة

    نشرتنا الإخبارية

    اشترك معنا لتصلك آخر الأخبار مباشرة إلى بريدك الإلكتروني!!

    نحن لا نرسل رسائل غير مرغوب فيها! اقرأ سياسة الخصوصية الخاصة بنا لمزيد من المعلومات.

    Check your inbox or spam folder to confirm your subscription.

    © 2025 حقوق النشر. جميع الحقوق محفوظة لـ Nanamedia.org
    • من نحن
    • اتصل بنا
    • الشروط والأحكام
    • سياسة الخصوصية

    اكتب كلمة البحث ثم اضغط على زر Enter