وداعا للعشوائية، 'تشات جي بي تي' يفكّر قبل الرسم
باريس – عززت "OpenAI" حضورها في سباق الذكاء الاصطناعي التوليدي بإطلاق النسخة الأحدث من نظام توليد الصور "ChatGPT Images 2.0"، في تحديث يُنظر إليه على نطاق واسع بوصفه انتقالًا من أدوات إنتاج بصري تجريبية إلى منصات متكاملة للإبداع الرقمي، قادرة على الفهم والتخطيط قبل التنفيذ.
ويعتمد النظام على نموذج "GPT Image 2"، المرتبط بمنظومة "ChatGPT"، لكنه يتجاوز المفهوم التقليدي لمولدات الصور عبر إدماج طبقة "تفكير منطقي" تسبق عملية التوليد، ما يسمح بتحليل الطلبات وفهمها بدل تنفيذها بشكل آلي مباشر، وفق ما أوردته تقارير تقنية متخصصة.
وبحسب هذه المعطيات، يقوم النموذج أولًا بتفكيك الأمر إلى عناصره الأساسية، ثم يبني تصورًا داخليًا لتوزيع المكونات—من نصوص وألوان وعناصر بصرية—قبل الشروع في إنتاج الصورة، وهو ما يفسر التحسن اللافت في دقة النتائج، خصوصًا في المشاهد المعقدة التي تتطلب التزامًا صارمًا بالتعليمات.
وفي تطور لافت، أصبح النظام قادرًا على الاستعانة بالإنترنت أثناء عملية التوليد، للبحث عن أمثلة أو مراجع قريبة من طلب المستخدم، بما يساعده على تحسين الفهم والسياق، في قفزة نوعية مقارنة بالإصدارات السابقة التي كانت تعتمد على التنفيذ الفوري دون تحليل معمّق.
كما يتيح "ChatGPT Images 2.0" توليد عدة صور ضمن طلب واحد، مع الحفاظ على الاتساق البصري بينها، سواء من حيث الشخصيات أو الأسلوب الفني، وهي نقطة كانت تمثل تحديًا في الأجيال السابقة. ويصل الحد الأقصى لدقة الصور إلى ما يتجاوز 2048 بكسل، مع قدرة محسّنة على الحفاظ على تفاصيل العناصر وثباتها عبر عدة مخرجات.
ويبرز أحد أهم أوجه التطور في قدرة النموذج على التعامل مع النصوص داخل الصور، إذ بات بإمكانه إدراج نصوص واضحة ودقيقة ضمن التصميمات المختلفة—من قوائم الطعام إلى صفحات القصص المصورة—مع الحفاظ على جودة الصورة العامة. ويجعل ذلك الأداة مناسبة للاستخدامات اليومية والمهنية على حد سواء، بما في ذلك التصميم التجاري، والمواد التعليمية، والرسوم التوضيحية.
وتشير اختبارات مقارنة أجرتها منصات تقييم متخصصة إلى تفوق واضح للنظام الجديد على نسخته السابقة، بل وعلى بعض النماذج المنافسة، من حيث الالتزام بالتعليمات، ودقة النصوص، والقدرة على إنتاج صور واقعية أو فنية وفق أنماط متعددة، مع فارق ملحوظ في الأداء في بعض المقاييس.
وفي السياق نفسه، أفادت تقارير تقنية بصعوبة التمييز بين الصور الناتجة عن النظام الجديد وتلك التي يصممها البشر، في ظل الارتفاع الكبير في مستوى الواقعية والتفاصيل، ما يعزز مكانته كأداة إنتاج بصري احترافية، لكنه يفتح في الوقت ذاته بابًا واسعًا للنقاش حول مخاطر التضليل البصري وإمكانية إساءة الاستخدام.
وعلى مستوى الاستخدام، تسعى "OpenAI" إلى توسيع قاعدة المستخدمين عبر إتاحة عدد محدود من الصور مجانًا يوميًا، مع توفير إمكانيات موسعة ضمن الاشتراك المدفوع "ChatGPT Plus"، دون الحاجة إلى منصات خارجية، إذ يمكن الوصول إلى الأداة مباشرة من داخل واجهة المحادثة.
ويرى مراقبون أن هذا التحديث يعكس تحولًا أعمق في فلسفة تطوير أدوات الذكاء الاصطناعي، إذ لم يعد الهدف مجرد تسريع إنتاج الصور، بل بناء أنظمة قادرة على الفهم والتخطيط واتخاذ القرار، في اتجاه يجعلها أقرب إلى "مساعد إبداعي" متكامل، بدل كونها مجرد أداة تنفيذ بصري.