ChatGPT يقلّد غيبلي: فن مذهل أم انتهاك حقوق؟

في الآونة الأخيرة ، كانت وسائل التواصل الاجتماعي مليئة بالصور التي ظهرت من فيلم أنتجته Studio Gibli. صور سيلفي وصور عائلية وحتى الميم ، التي تورطت بألوان هادئة وباستيل لعمل الأعمال المتحركة اليابانية التي أسسها هايو ميازاكي.

يأتي ذلك بعد آخر تحديث Openai على ChatGpt ، حيث قام بتحسين قدرات الصور في الأداة بشكل كبير ، مما يسمح للمستخدمين بإنتاج صور في ملف تعريف في بضع ثوانٍ. كانت هذه الميزة شائعة جدًا أن النظام تعرض لخلط مؤقت بسبب ضغط المستخدمين ، وفقًا للموقع.المحادثة“.

يمكن فهم أنظمة الذكاء الاصطناعي مثل chatgpt على أنها “سيارات نمط”. ما نراه الآن هو أن هذه الأنظمة تسمح للمستخدمين بالتحكم بدقة والتحكم في المخرجات.

لكن هذا التطور يفتح الباب أيضًا للأسئلة الجديدة والمعقدة المتعلقة بحقوق النشر وملكية الإبداع.

كيف تصنع صور ChatGpt الجديدة؟

تعمل برامج الذكاء الاصطناعي من خلال إنتاج المحتوى استجابةً لأوامر المستخدم ، بما في ذلك طلبات إنشاء الصور.

في الإصدارات السابقة ، تهدف مولدات الصور التي تهدف إلى النماذج المعروفة باسم النماذج المنتشرة ، ويقومون بتحسين بيانات عشوائية وضوضاء تدريجياً حتى يتم تشكيل صورة واضحة ومتماسكة.

لكن آخر تحديث لـ ChatGPT يستخدم خوارزمية الانحدار التلقائي SO ، وهو نهج مختلف جذريًا.

تتعامل هذه الخوارزمية مع الصور بنفس الطريقة التي تتعامل بها مع اللغة ، لأنها تقسم الصورة إلى وحدات صغيرة تعرف باسم “الرموز” أو “العلامات”. نظرًا لأن ChatGPT يتنبأ بالكلمات الأكثر احتمالًا في الجملة ، يمكنها الآن التنبؤ بشكل مستقل عناصر بصرية مختلفة داخل الصورة.

تتيح طريقة “ترميز الصور” هذه الخوارزمية لفهم الخصائص المحددة بشكل أفضل داخل الصورة ، وعلاقتها بالكلمات الموجودة في النص. والنتيجة؟ القدرة على إنشاء صور دقيقة وفقًا لتعليمات المستخدم ، مقارنة بالجيل السابق من الأدوات الضوئية.

تسهل هذه التقنية أيضًا عملية استبدال أو تغيير أجزاء معينة من الصورة ، مع الحفاظ على بقية العناصر ، ويحسن دقة النصوص المدرجة في الصور ، وهي نقطة كانت دائمًا تحديًا في النماذج السابقة.

واحدة من أبرز الفوائد لتوليد الصور من نموذج لغوي كبير هو القدرة على الاستفادة من المعرفة المحددة سلفا في النموذج. هذا يعني أنه لا يتعين على المستخدم شرح كل التفاصيل الصغيرة في الصورة. يمكنه ببساطة أن يطلب صورة “بأسلوب استوديو جليدي” ، وسوف يفهم على الفور الذكاء الاصطناعي المرجعي.

بدأت أزياء “Studio Gibli” مؤخرًا من داخل Openai نفسها ، قبل الانتشار تحت مهندسي البرمجيات في وادي السيليكون ، ثم يجد طريقه إلى الحكومات والسياسيين.

من بين العادات المذهلة: استخدم البيت الأبيض هذه التقنية لإنتاج نمط بأسلوب يظهر امرأة تبكي أثناء ترحيلها. استخدمتها الحكومة الهندية لتعزيز رؤية رئيس الوزراء ناريندرا مودي للهند الجديد.

لفهم أنظمة الذكاء الاصطناعي كأنظمة “طرق توليد”

لأنظمة الذكاء الاصطناعي لا تخزن المعلومات بالطريقة التقليدية المعتادة. بدلاً من ذلك ، فإنه يرمز إلى النصوص والحقائق والقطع داخل الأنماط – أو المعروفة باسم “الأنماط” – داخل شبكات الأعصاب.

بفضل الكميات الهائلة من البيانات ، تتعلم هذه النماذج التعرف على الأنماط على مستويات مختلفة.
يمكن للطبقات السفلية لشبكة الأعصاب التقاط وظائف بسيطة مثل العلاقات بين الكلمات أو الصور -tissue.
فيما يتعلق بالطبقات العليا ، فهي مع مفاهيم أكثر تعقيدًا أو عناصر بصرية متكاملة.

هذا يعني أن كل شيء – الأشياء والخصائص والأنواع الأدبية وحتى نغمة الكتابة المهنية – يتم تحويلها إلى طريقة يمكن للنموذج أن يفهمها وتوليدها مرة أخرى.

على سبيل المثال ، بينما يتعلم الذكاء الاصطناعي عن أعمال Miazaki (مؤسس Studio Gibli) ، فإنه لا ينقذ لقطات معينة من أفلام الاستوديوهات (على الرغم من أن بعض الصور المنتجة تبدو قريبة جدًا من اللقطات الأصلية).

على العكس من ذلك ، هذه الرموز التي يمكن تسميتها “Ghibli Niche” في شكل نمط رياضي يمكن تطبيقه لاحقًا على صور جديدة.

الأمر نفسه ينطبق على مفاهيم مثل “Banana” أو “Cat” أو “رسالة البريد الإلكتروني الرسمية”. حيث يتعلم النموذج “جوهر الموز” ، أو “طبيعة القط” ، أو “نمط المراسلات المهنية” كما لو كان قابلاً للتطبيق.

كان ترميز ونقل الأساليب دائمًا هدفًا واضحًا في البحث عن الذكاء البصري. لدينا اليوم مولد صور يمكنه تحقيق هذا الهدف على مستوى غير مسبوق من الدقة والتحكم.

يفتح هذا النهج آفاقًا لا تصدق في الإبداع ، إما على مستوى النصوص أو الصور. نظرًا لأن كل شيء أصبح “نمطًا” ، يمكن الآن دمج وتبادل هذه الطرق بحرية. لهذا السبب ، نسمي هذه النماذج التي تصف “سيارات النمط”.

على سبيل المثال ، حاول أن تطلب الشكل لإنشاء صورة لـ “كرسي بذراعين في أسلوب القطط” أو “كرسي Elvish” – وستفاجأ النتيجة.

حقوق الناشر: عندما تصبح “الأساليب” هوية فنية

على الرغم من أن القدرة على التعامل مع الأساليب الفنية تمنح القوة الإبداعية للذكاء الاصطناعي من أخصائي التوليد ، إلا أنها تقع أيضًا في قلب الجدل المتزايد. بالنسبة للعديد من الفنانين ، من المزعج للغاية تقليل أسلوبهم الفني الفريد إلى “نمط” يمكن لأي شخص استخدامه من خلال نص بسيط.

حتى الآن ، لم يشير Hayao Miazaki ، المخرج الياباني الشهير ومؤسس استوديو Gibli ، إلى أي تعليق عام على هذه الظاهرة لإنشاء صور بأسلوبه الفني مع Chatgpt. لكنه انتقد في السابق تقنيات الذكاء الاصطناعي.
كل هذا يثير أسئلة جديدة تمامًا تتعلق بحقوق النشر والممتلكات الإبداعية.

بشكل عام ، لا تحمي قوانين حقوق النشر الأسلوب الفني نفسه ، ولكنها فقط تحمي التعبيرات المحددة.

على سبيل المثال ، لا يمكنك تسجيل الملكية الفكرية على نوع موسيقي مثل “SACCO” أو حركة فنية مثل “الانطباعية”.

هذا التقييد القانوني له مبرر ؛ نظرًا لأن أحد احتكارهم للأسلوب الفني بالكامل يمكن أن يؤدي إلى اختناق الإبداع في الآخرين.
ولكن هناك فرق بين الأساليب الشائعة وتلك التي أصبحت مميزة للغاية إلى الحد الذي يرتبط به الهوية الشخصية لفنان معين.


عندما يمكن للذكاء الاصطناعي توليد صور لـ “Greg Ratcovsky” – فنان بولندي تم ذكر اسمه في أكثر من 93000 طلب ضمن التوزيع المستقر – إنه تهديد مباشر لوجوده وتراثه الفني.

تقنين

لقد بدأ بعض المبدعين بالفعل في اتخاذ خطوات قانونية.


في نهاية عام 2022 ، رفع ثلاثة فنانين دعوى جماعية ضد مختلف شركات الذكاء الاصطناعي التي تزعم أن مصوريهم تم تدريبهم في أعمالهم الأصلية دون إذن ، ويسمحون الآن للمستخدمين بإنشاء أعمال مشتقة تحاكي أساليبهم الفنية الفريدة.

مع تسريع التنمية التكنولوجية مقارنة بتباطؤ القانون ، هناك حاليًا لإعداد تشريعات جديدة تحاول موازنة الابتكار الفني وحماية الهوية الإبداعية للفنانين.

بغض النظر عن نتيجة هذه القضايا ، يكشف هذا الجدل عن طبيعة الذكاء التحويلي ، ويسأل عن التأمل في جوانب مختلفة ، بما في ذلك القدرات الإبداعية الهائلة “للسيارات النمطية” ، والحاجة الملحة إلى تطوير ضوابط قانونية دقيقة تحمي الأساليب الفنية المميزة من الإساءة أو الاستخراج التجاري غير العاجلة.

اترك تعليقاً

تم إضافة تعليقك بنجاح!

Scroll to Top