إنشاء صور

تتيح واجهة برمجة التطبيقات Gemini API إنشاء الصور باستخدام Gemini 2.0 Flash Experimental و باستخدام Imagen 3. يساعدك هذا الدليل في بدء استخدام كلا النموذجَين.

للحصول على إرشادات حول طلبات الصور، يُرجى الاطّلاع على قسم دليل طلبات Imagen.

قبل البدء

قبل استدعاء واجهة برمجة التطبيقات Gemini API، تأكَّد من تثبيت حزمة تطوير البرامج (SDK) المفضّلة لديك ومفتاح Gemini API تم ضبطه وأصبح جاهزًا للاستخدام.

إنشاء صور باستخدام Gemini

يتيح الإصدار التجريبي من ‎Gemini 2.0 Flash إمكانية عرض النص والصور المضمّنة. يتيح لك ذلك استخدام Gemini لتعديل الصور من خلال المحادثة أو إنشاء نتائج تتضمّن نصًا متداخلًا (على سبيل المثال، إنشاء مشاركة مدونة تتضمّن نصًا و صورًا في خطوة واحدة). تتضمّن جميع الصور التي يتم إنشاؤها علامة مائية SynthID، وتتضمّن الصور في Google AI Studio علامة مائية مرئية أيضًا.

يوضّح المثال التالي كيفية استخدام Gemini 2.0 لإنشاء ناتج يتضمن نصًا وصورة:

Python

from google import genai
from google.genai import types
from PIL import Image
from io import BytesIO
import base64

client = genai.Client()

contents = ('Hi, can you create a 3d rendered image of a pig '
            'with wings and a top hat flying over a happy '
            'futuristic scifi city with lots of greenery?')

response = client.models.generate_content(
    model="gemini-2.0-flash-exp-image-generation",
    contents=contents,
    config=types.GenerateContentConfig(
      response_modalities=['TEXT', 'IMAGE']
    )
)

for part in response.candidates[0].content.parts:
  if part.text is not None:
    print(part.text)
  elif part.inline_data is not None:
    image = Image.open(BytesIO((part.inline_data.data)))
    image.save('gemini-native-image.png')
    image.show()

JavaScript

import { GoogleGenAI, Modality } from "@google/genai";
import * as fs from "node:fs";

async function main() {

  const ai = new GoogleGenAI({ apiKey: "GEMINI_API_KEY" });

  const contents =
    "Hi, can you create a 3d rendered image of a pig " +
    "with wings and a top hat flying over a happy " +
    "futuristic scifi city with lots of greenery?";

  // Set responseModalities to include "Image" so the model can generate  an image
  const response = await ai.models.generateContent({
    model: "gemini-2.0-flash-exp-image-generation",
    contents: contents,
    config: {
      responseModalities: [Modality.TEXT, Modality.IMAGE],
    },
  });
  for (const part of response.candidates[0].content.parts) {
    // Based on the part type, either show the text or save the image
    if (part.text) {
      console.log(part.text);
    } else if (part.inlineData) {
      const imageData = part.inlineData.data;
      const buffer = Buffer.from(imageData, "base64");
      fs.writeFileSync("gemini-native-image.png", buffer);
      console.log("Image saved as gemini-native-image.png");
    }
  }
}

main();

REST

curl -s -X POST \
  "https://generativelanguage.googleapis.com/v1beta/models/gemini-2.0-flash-exp-image-generation:generateContent?key=$GEMINI_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "contents": [{
      "parts": [
        {"text": "Hi, can you create a 3d rendered image of a pig with wings and a top hat flying over a happy futuristic scifi city with lots of greenery?"}
      ]
    }],
    "generationConfig":{"responseModalities":["TEXT","IMAGE"]}
  }' \
  | grep -o '"data": "[^"]*"' \
  | cut -d'"' -f4 \
  | base64 --decode > gemini-native-image.png
صورة من إنشاء الذكاء الاصطناعي لخنزير طائر خيالي
صورة من إنشاء الذكاء الاصطناعي لخنزير طائر خيالي

استنادًا إلى الطلب والسياق، سينشئ Gemini محتوى بتنسيقات مختلفة (تحويل النص إلى صورة، وتحويل النص إلى صورة ونص، وما إلى ذلك). وإليك بعض الأمثلة:

  • تحويل النص إلى صورة
    • مثال على طلب: "أريد إنشاء صورة لبرج إيفل مع عرض للألعاب النارية في الخلفية".
  • تحويل النص إلى صور ونص (مُدرَج)
    • مثال على طلب: "أريد إنشاء وصفة مُوضَّحة لطبق البايلا".
  • الصور والنصوص إلى صور ونصوص (متداخلة)
    • مثال على طلب: (مع صورة لغرفة مفروشة) "ما هي الألوان الأخرى التي تناسب أريكتي في المساحة؟ هل يمكنك تعديل الصورة؟"
  • تعديل الصور (النص والصورة إلى الصورة)
    • مثال على طلب: "تعديل هذه الصورة لتبدو وكأنها صورة كارتونية"
    • مثال على طلب: [صورة هرّة] + [صورة وسادة] + "أريد استخدام التطريز بالابر المتعدّدة لإنشاء صورة هرّتي على هذه الوسادة".
  • تعديل الصور المتعدّد الخطوات (المحادثة)
    • أمثلة على الطلبات: [تحميل صورة سيارة زرقاء] "أريد تحويل هذه السيارة إلى سيارة قابلة للتحويل". "الآن، غيِّر اللون إلى الأصفر".

تعديل الصور باستخدام Gemini

لإجراء تعديل على الصورة، أضِف صورة كمدخل. يوضّح المثال التالي تحميل صور بترميز Base64. بالنسبة إلى الصور المتعدّدة وحمولات العميل الأكبر حجمًا، راجِع قسم إدخال الصور.

Python

from google import genai
from google.genai import types
from PIL import Image
from io import BytesIO

import PIL.Image

image = PIL.Image.open('/path/to/image.png')

client = genai.Client()

text_input = ('Hi, This is a picture of me.'
            'Can you add a llama next to me?',)

response = client.models.generate_content(
    model="gemini-2.0-flash-exp-image-generation",
    contents=[text_input, image],
    config=types.GenerateContentConfig(
      response_modalities=['TEXT', 'IMAGE']
    )
)

for part in response.candidates[0].content.parts:
  if part.text is not None:
    print(part.text)
  elif part.inline_data is not None:
    image = Image.open(BytesIO(part.inline_data.data))
    image.show()

JavaScript

import { GoogleGenAI, Modality } from "@google/genai";
import * as fs from "node:fs";

async function main() {

  const ai = new GoogleGenAI({ apiKey: "GEMINI_API_KEY" });

  // Load the image from the local file system
  const imagePath = "path/to/image.png";
  const imageData = fs.readFileSync(imagePath);
  const base64Image = imageData.toString("base64");

  // Prepare the content parts
  const contents = [
    { text: "Can you add a llama next to the image?" },
    {
      inlineData: {
        mimeType: "image/png",
        data: base64Image,
      },
    },
  ];

  // Set responseModalities to include "Image" so the model can generate an image
  const response = await ai.models.generateContent({
    model: "gemini-2.0-flash-exp-image-generation",
    contents: contents,
    config: {
      responseModalities: [Modality.TEXT, Modality.IMAGE],
    },
  });
  for (const part of response.candidates[0].content.parts) {
    // Based on the part type, either show the text or save the image
    if (part.text) {
      console.log(part.text);
    } else if (part.inlineData) {
      const imageData = part.inlineData.data;
      const buffer = Buffer.from(imageData, "base64");
      fs.writeFileSync("gemini-native-image.png", buffer);
      console.log("Image saved as gemini-native-image.png");
    }
  }
}

main();

REST

IMG_PATH=/path/to/your/image1.jpeg

if [[ "$(base64 --version 2>&1)" = *"FreeBSD"* ]]; then
  B64FLAGS="--input"
else
  B64FLAGS="-w0"
fi

IMG_BASE64=$(base64 "$B64FLAGS" "$IMG_PATH" 2>&1)

curl -X POST \
  "https://generativelanguage.googleapis.com/v1beta/models/gemini-2.0-flash-exp-image-generation:generateContent?key=$GEMINI_API_KEY" \
    -H 'Content-Type: application/json' \
    -d "{
      \"contents\": [{
        \"parts\":[
            {\"text\": \"'Hi, This is a picture of me. Can you add a llama next to me\"},
            {
              \"inline_data\": {
                \"mime_type\":\"image/jpeg\",
                \"data\": \"$IMG_BASE64\"
              }
            }
        ]
      }],
      \"generationConfig\": {\"responseModalities\": [\"TEXT\", \"IMAGE\"]}
    }"  \
  | grep -o '"data": "[^"]*"' \
  | cut -d'"' -f4 \
  | base64 --decode > gemini-edited-image.png

القيود

  • للحصول على أفضل أداء، استخدِم اللغات التالية: EN وes-MX وja-JP وzh-CN و hi-IN.
  • لا تتيح ميزة إنشاء الصور إدخالات صوتية أو فيديوهات.
  • قد لا يتم إنشاء الصور في الحالات التالية:
    • قد يعرض النموذج نصًا فقط. جرِّب طلب نتائج الصور صراحةً (مثل "إنشاء صورة" أو "تقديم صور أثناء الإجراء" أو "تعديل الصورة").
    • قد يتوقف النموذج عن إنشاء المحتوى في منتصف العملية. يُرجى إعادة المحاولة أو استخدام طلب مختلف.
  • عند إنشاء نص لصورة، يعمل Gemini بشكل أفضل إذا أنشأت أولاً النص ثم طلبت صورة تتضمّن النص.

اختيار نموذج

ما هو النموذج الذي يجب استخدامه لإنشاء الصور؟ يعتمد ذلك على حالة الاستخدام.

إنّ Gemini 2.0 هو الخيار الأفضل لإنشاء صور ذات صلة بالسياق، ودمج النصوص والصور، واستخدام المعرفة العالمية، والاستدلال على الصور. يمكنك استخدامها لإنشاء عناصر مرئية دقيقة وذات صلة بالسياق تكون مضمّنة في تسلسلات نصية طويلة. يمكنك أيضًا تعديل الصور بشكل حواري باستخدام لغة طبيعية، مع الحفاظ على السياق طوال المحادثة.

إذا كانت جودة الصورة هي أهم أولوياتك، فإنّ Imagen 3 هو الخيار الأفضل. ي��برِز تطبيق Imagen 3 الصور الواقعية والتفاصيل الفنية والأنماط الفنية المحدّدة، مثل الانطباعية أو الأنمي. يُعدّ Imagen 3 أيضًا خيارًا جيدًا لأعمال تعديل الصور المتخصصة، مثل تعديل خلفيات المنتجات وزيادة كثافة بكسل الصور ودمج العلامة التجارية والأسلوب في المحتوى المرئي. يمكنك استخدام Imagen 3 لإنشاء الشعارات أو تصاميم المنتجات الأخرى التي تحمل علامة تجارية.

إنشاء صور باستخدام Imagen 3

تتيح واجهة برمجة التطبيقات Gemini API استخدام Imagen 3، وهو نموذج تحويل النص إلى صورة من Google يقدّم أفضل ميزات تحويل النص إلى صورة، ويضمّ عددًا من الإمكانات الجديدة والمحسّنة. يمكن لخدمة Imagen 3 تنفيذ ما يلي:

  • إنشاء صور بتفاصيل أفضل وإضاءة أكثر ثراءً وعناصر مزعجة أقل من النماذج السابقة
  • فهم الطلبات المكتوبة بلغة طبيعية
  • إنشاء صور بمجموعة كبيرة من التنسيقات والأنماط
  • عرض النص بفعالية أكبر من النماذج السابقة

Python

from google import genai
from google.genai import types
from PIL import Image
from io import BytesIO

client = genai.Client(api_key='GEMINI_API_KEY')

response = client.models.generate_images(
    model='imagen-3.0-generate-002',
    prompt='Robot holding a red skateboard',
    config=types.GenerateImagesConfig(
        number_of_images= 4,
    )
)
for generated_image in response.generated_images:
  image = Image.open(BytesIO(generated_image.image.image_bytes))
  image.show()

JavaScript

import { GoogleGenAI } from "@google/genai";
import * as fs from "node:fs";

async function main() {

  const ai = new GoogleGenAI({ apiKey: "GEMINI_API_KEY" });

  const response = await ai.models.generateImages({
    model: 'imagen-3.0-generate-002',
    prompt: 'Robot holding a red skateboard',
    config: {
      numberOfImages: 4,
    },
  });

  let idx = 1;
  for (const generatedImage of response.generatedImages) {
    let imgBytes = generatedImage.image.imageBytes;
    const buffer = Buffer.from(imgBytes, "base64");
    fs.writeFileSync(`imagen-${idx}.png`, buffer);
    idx++;
  }
}

main();

REST

curl -X POST \
    "https://generativelanguage.googleapis.com/v1beta/models/imagen-3.0-generate-002:predict?key=GEMINI_API_KEY" \
    -H "Content-Type: application/json" \
    -d '{
        "instances": [
          {
            "prompt": "Robot holding a red skateboard"
          }
        ],
        "parameters": {
          "sampleCount": 4
        }
      }'
صورة من إنشاء الذكاء الاصطناعي لخنزيرين صغيرين في المطبخ
صورة من إنشاء الذكاء الاصطناعي لاثنين من الأرانب في المطبخ

تتيح Imagen الطلبات باللغة الإنجليزية فقط في الوقت الحالي والمَعلمات التالية:

مَعلمات نموذج Imagen

(تختلف قواعد التسمية حسب لغة البرمجة).

  • numberOfImages: عدد الصور المطلوب إنشاؤها، من 1 إلى 4 (شاملة). القيمة التلقائية هي 4.
  • aspectRatio: لتغيير نسبة العرض إلى الارتفاع للصورة التي تم إنشاؤها القيم المتوافقة هي "1:1" و"3:4" و"4:3" و"9:16" و"16:9". القيمة التلقائية هي "1:1".
  • personGeneration: اسمح للنموذج بإنشاء صور لأشخاص. في ما يلي القيم المتوافقة:
    • "DONT_ALLOW": حظر إنشاء صور للأشخاص
    • "ALLOW_ADULT": إنشاء صور لأشخاص بالغين، ولكن ليس للأطفال هذا هو الخيار التلقائي.

دليل طلبات Imagen

يوضّح لك هذا القسم من دليل Imagen كيفية تعديل طلب تحويل النص إلى صورة لتحقيق نتائج مختلفة، بالإضافة إلى أمثلة على الصور التي يمكنك إنشاؤها.

أساسيات كتابة الطلبات

يكون الطلب الجيد وصفيًا وواضحًا، ويستخدم كلمات رئيسية و مُعدِّلات ذات مغزى. ابدأ بالتفكير في الموضوع والسياق والأسلوب.

طلب يُبرز الموضوع والسياق والأسلوب
نص الصورة: رسم (الأسلوب) لمبنى سكني حديث (الموضوع) محاط بناطحات سحاب (السياق والخلفية).
  1. الموضوع: أول ما يجب التفكير فيه عند استخدام أي طلب هو الموضوع: الكائن أو الشخص أو الحيوان أو المشهد الذي تريد الحصول على صورة له.

  2. السياق والخلفية: لا يقلّ الخلفية أو السياق الذي سيتم وضع الهدف فيه أهمية عن الهدف نفسه. جرِّب وضع الهدف في مجموعة متنوعة من الخلفيات. على سبيل المثال، استوديو بخلفية بيضاء أو أماكن خارجية أو أماكن داخلية

  3. النمط: أخيرًا، أضِف نمط الصورة الذي تريده. يمكن أن تكون الأنماط عامة (رسم أو صورة أو رسومات تخطيطية) أو محدّدة جدًا (رسم بالألوان المائية أو رسم بالفحم أو رسم ثلاثي الأبعاد إسقاطي). يمكنك أيضًا دمج الأنماط.

بعد كتابة نسخة أولى من الطلب، يمكنك تحسينه من خلال إضافة مزيد من التفاصيل إلى أن تصل إلى الصورة التي تريدها. التكرار مهم. ابدأ بتحديد الفكرة الأساسية، ثمّ حسِّنها ووسِّعها إلى أن تصبح الصورة التي تم إنشاؤها قريبة من رؤيتك.

صورة نموذجية واقعية 1
الطلب: حديقة في الربيع بجانب بحيرة
صورة نموذجية واقعية 2
الوصف: حديقة في الربيع بجانب بحيرة، تغرب الشمس على البحيرة، الساعة الذهبية
نموذج صورة واقعية 3
الوصف: حديقة في الربيع بجانب بحيرة، غروب الشمس على البحيرة، ساعة الذهبية، زهور برية حمراء

يمكن أن يحوّل تطبيق Imagen 3 أفكارك إلى صور مفصّلة، سواء كانت الطلبات قصيرة أو طويلة ومفصّلة. يمكنك تحسين رؤيتك من خلال طلبات متكرّرة، مع إضافة تفاصيل إلى أن تحصل على النتيجة المثالية.

تتيح لك الطلبات القصيرة إنشاء صورة بسرعة.

مثال على طلب قصير في Imagen 3
الطلب: صورة مقرّبة لامرأة في العشرينات من عمرها، تصوير شارع، لقطة من فيلم، ألوان دافئة برتقاليّة باهتة

تتيح لك الطلبات الأطول إضافة تفاصيل محدّدة وإنشاء صورتك.

مثال على طلب طويل في Imagen 3
الطلب: صورة آسرة لامرأة في العشرينات من عمرها تستخدم أسلوب تصوير في الشوارع يجب أن تبدو الصورة كصورة ثابتة من فيلم مع درجات برتقالي دافئ.

نصائح إضافية لكتابة طلبات Imagen:

  • استخدام لغة وصفية: استخدِم الصفات والظروف التفصيلية لشدّ انتباه المستخدمين و تقديم صورة واضحة لـ Imagen 3.
  • تقديم سياق: إذا لزم الأمر، يمكنك تضمين معلومات أساسية لمساعدة الذكاء الاصطناعي في الفهم.
  • الإشارة إلى فنانين أو أنماط معيّنة: إذا كان لديك أسلوب جمالي معيّن في ذهنك، قد يكون من المفيد الإشارة إلى فنانين أو حركات فنية معيّنة.
  • استخدام أدوات هندسة الطلبات: ننصحك باستكشاف أدوات أو موارد هندسة الطلبات لمساعدتك في تحسين طلباتك وتحقيق أفضل النتائج.
  • تحسين تفاصيل الوجه في صورك الشخصية والجماعية:
    • حدِّد تفاصيل الوجه كنقطة تركيز في الصورة (على سبيل المثال، استخدِم الكلمة "بورتريه" في الطلب).

إنشاء نص في الصور

يمكن لتطبيق Imagen إضافة نص إلى الصور، ما يفتح المزيد من possibilities لإنشاء صور مبتكرة. اتّبِع الإرشادات التالية للاستفادة إلى أقصى حدّ من هذه الميزة:

  • تكرار الخطوات بثقة: قد تحتاج إلى إعادة إنشاء الصور إلى أن تتمكّن من تحقيق المظهر الذي تريده. لا تزال عملية دمج النصوص في Imagen في مرحلة تطوير، وفي بعض الأحيان تؤدي المحاولات المتعدّدة إلى تحقيق أفضل النتائج.
  • اختصار النص: يجب أن يتألف النص من 25 حرفًا أو أقل لضمان OPTIMAL الإنشاء.
  • عبارات متعدّدة: جرِّب عبارةَين أو ثلاث عبارات مختلفة لتوفير معلومات إضافية. تجنَّب استخدام أكثر من ثلاث عبارات لإنشاء تركيبات تصاميم أنظف.

    مثال على إنشاء نص في Imagen 3
    الطلب: ملصق يتضمّن النص "Summerland" بخط عريض كه عنوان ، وتحت هذا النص يظهر الشعار "Summer never felt so good"
  • توجيه مواضع النص: على الرغم من أنّ Imagen يمكن أن تحاول وضع النص على النحو المُوجَّه، توقّع حدوث اختلافات من حين لآخر. نحن نعمل باستمرار على تحسين هذه الميزة.

  • نمط الخط المستوحى: حد��ّد نمط خط عام للتأثير بشكلٍ دقيق في خيارات Imagen. لا تعتمد على تكرار الخطوط بدقة، ولكن توقّع تفسيرات إبداعية.

  • حجم الخط: حدِّد حجم خط أو إشارة عامة إلى الحجم (مثل صغير أو متوسط أو كبير) للتأثير في عملية إنشاء حجم الخط.

تحديد مَعلمات الطلب

للتحكّم بشكل أفضل في نتائج الإخراج، قد يكون من المفيد وضع مَعلمات للمدخلات في Imagen. على سبيل المثال، لنفترض أنّك تريد أن يتمكّن عملاؤك من إنشاء شعارات لنشاطاتهم التجارية، و تريد التأكّد من إنشاء الشعارات دائمًا على خلفية بلون واحد. وبإمكانك أيضًا تحديد الخيارات التي يمكن للعميل اختيارها من القائمة.

في هذا المثال، يمكنك إنشاء طلب مُحدَّد بالمَعلمات مشابهًا للطلب التالي:

A {logo_style} logo for a {company_area} company on a solid color background. Include the text {company_name}.

في واجهة المستخدم المخصّصة، يمكن للعميل إدخال المَعلمات باستخدام قائمة، وتعبِّئ القيمة التي يختارها الطلب الذي تتلقّاه Imagen.

على سبيل المثال:

  1. الطلب: A minimalist logo for a health care company on a solid color background. Include the text Journey.

    المثال 1 على تحديد مَعلمات طلب Imagen 3

  2. الطلب: A modern logo for a software company on a solid color background. Include the text Silo.

    المثال 2 على تحديد مَعلمات طلب Imagen 3

  3. الطلب: A traditional logo for a baking company on a solid color background. Include the text Seed.

    المثال 3 على تحديد مَعلمات طلب Imagen 3

أساليب كتابة الطلبات المتقدّمة

استخدِم الأمثلة التالية لإنشاء طلبات أكثر تحديدًا استنادًا إلى السمات، مثل أوصاف الصور الفوتوغرافية والأشكال والمواد وحركات الفن التاريخي وعوامل تعديل جودة الصورة.

التصوير الفوتوغرافي

  • تتضمّن الرسالة المطالبة ما يلي: "صورة..."

لاستخدام هذا النمط، ابدأ باستخدام كلمات رئيسية تُعلم Imagen بوضوح أنّك تبحث عن صورة فوتوغرافية. ابدأ طلباتك بعبارة "صورة لـ . ‎.". على سبيل المثال:

صورة نموذجية واقعية 1
الطلب: صورة لحبوب قهوة في مطبخ على سطح خشبي
صورة نموذجية واقعية 2
الطلب: صورةلقطعة شوكولاتة على منضدة مطبخ
صورة نموذجية واقعية 3
الطلب: صورة لمبنى حديث مع الماء في الخلفية

مصدر الصورة: تم إنشاء كل صورة باستخدام الطلب النصي المقابل لها من خلال نموذج Imagen 3.

عناصر تعديل الصور

في الأمثلة التالية، يمكنك الاطّلاع على العديد من المُعدِّلات والمَعلمات المتعلّقة بالتصوير الفوتوغرافي. يمكنك الجمع بين عدّة عوامل تعديل للتحكّم بشكل أدق.

  1. قرب الكاميرا: صورة مقرّبة تم التقاطها من مسافة بعيدة

    نموذج صورة عن قرب من الكاميرا
    الطلب: صورة مقرّبة لحبوب القهوة
    صورة نموذجية للكاميرا بعد التصغير
    الطلب: صورة مكبّرة لحقيبة صغيرة من
    حبوب القهوة في مطبخ فوضوي

  2. موضع الكاميرا: من الجو، من الأسفل

    نموذج صورة جوية
    الطلب: صورة من الجو لمدينة حضرية بها ناطحات سحاب
    صورة نموذجية من الأسفل
    الطلب: صورة لظلة غابة مع سماء زرقاء من الأسفل
  3. الإضاءة: طبيعية، مميّزة، دافئة، باردة

    صورة نموذجية للإضاءة الطبيعية
    الطلب: صورة استوديو لكرسي بذراعَين حديث، بإضاءة طبيعية
    صورة نموذجية للإضاءة القوية
    الطلب: صورة استوديو لكرسي بذراعَين حديث، إضاءة درامية
  4. إعدادات الكاميرا - تمويه الحركة والتركيز الناعم والتأثير البؤري ووضع "بورتريه"

    نموذج صورة تمويه الصورة المتحركة
    الطلب: صورة لمدينة بها ناطحات سحاب من داخل سيارة مع تمويه متحرّك
    نموذج صورة بتركيز ضعيف
    الطلب: صورة بتركيز خفيف لجسر في مدينة حضرية ليلاً
  5. أنواع العدسات: 35 ملم و50 ملم وعدسة عين السمكة وعدسة بزاوية واسعة وعدسة الماكرو

    نموذج صورة تم التقاطها باستخدام عدسة الماكرو
    الطلب: صورة لورقة شجر، عدسة مقرّبة
    نموذج صورة عدسة عين السمكة
    الطلب: تصوير الشوارع، مدينة نيويورك، عدسة عين السمكة
  6. أنواع الأفلام: أبيض وأسود، بولارويد

    صورة نموذجية لصورة بولارويد
    الطلب: صورة بورتريه بالكاميرا الفورية لكلب يرتدي نظّارات شمسية
    نموذج صورة بالأبيض والأسود
    الطلب: صورة بالأبيض والأسود لكلب يرتدي نظّارات شمسية

مصدر الصورة: تم إنشاء كل صورة باستخدام الطلب النصي المقابل لها من خلال نموذج Imagen 3.

الرسوم التوضيحية والفنون

  • تتضمّن الرسالة المطالبة: "painting من..."، "sketch من..."

تتنوع أنماط الأعمال الفنية من الأنماط أحادية اللون، مثل الرسومات بالقلم الرصاص، إلى الفن الرقمي الفائق الواقعية. على سبيل المثال، تستخدم الصور التالية الطلب نفسه بأسلوبين مختلفين:

"[art style or creation technique] لسيارة كهربائية منحنية رياضية من فئة السيارات السيدان مع ناطحات سحاب في الخلفية"

صور عيّنات فنية
الطلب: رسم فني بقلم الرصاص لشكل...
صور عيّنات فنية
الطلب: رسم بالفحم لشكل...
صور عيّنات فنية
الطلب: رسم بقلم رصاص ملون لشكل...
صور عيّنات فنية
الطلب: لوحة بالألوان المائية لشكل...
صور عيّنات فنية
الطلب: فن رقمي لشكل...
صور عيّنات فنية
الطلب: فن آرت ديكو (ملصق) لشكل...

مصدر الصورة: تم إنشاء كل صورة باستخدام الطلب النصي المقابل لها من خلال نموذج Imagen 2.

الأشكال والمواد

  • تتضمّن الرسالة المطالبة: "...مصنوعة من..."، "...في شكل..."

من نقاط قوة هذه التكنولوجيا أنّه يمكنك إنشاء صور يصعب أو يستحيل الحصول عليها بغير هذه الطريقة. على سبيل المثال، يمكنك إعادة إنشاء شعار شركتك باستخدام مواد وملمسات مختلفة.

مثال 1 على الصور التي تعرض الأشكال والمواد
الطلب: حقيبة رياضية كبيرة مصنوعة من الجبن
مثال 2 على الصور التي تعرض الأشكال والمواد
الطلب: أنابيب نيون على شكل طائر
مثال على صورة الأشكال والمواد 3
الطلب: صورة استوديو لكرسي بذراعين مصنَّع من ال��رق ��أسلوب أوري��امي

مصدر الصورة: تم إنشاء كل صورة باستخدام الطلب النصي المقابل لها من خلال نموذج Imagen 3.

مراجع الفنون التاريخية

  • تتضمّن الرسالة المطالبة ما يلي: "...بأسلوب..."

وقد أصبحت بعض الأنماط رمزية على مرّ السنين. في ما يلي بعض الأفكار عن الرسم أو الأساليب الفنية التاريخية التي يمكنك تجربتها.

"إنشاء صورة بأسلوب [art period or movement] : مزرعة رياح"

مثال لصورة فنية بالأسلوب الانطباعي
الطلب: إنشاء صورة بأسلوب لوحة انطباعية: مزرعة رياح
مثال على صورة من عصر النهضة
الطلب: أنشئ صورة بأسلوب لوحة من عصر النهضة: مزرعة رياح
مثال على صورة فن البوب
الطلب: إنشاء صورة بأسلوب فن البوب: مزرعة رياح

مصدر الصورة: تم إنشاء كل صورة باستخدام الطلب النصي المقابل لها من خلال نموذج Imagen 3.

عوامل تعديل جودة الصورة

يمكن أن تُعلم كلمات رئيسية معيّنة النموذج بأنّك تبحث عن مادة عرض عالية الجودة. تشمل أمثلة عوامل تعديل الجودة ما يلي:

  • العناصر المعدِّلة العامة: عالية الجودة وجميلة وذات تصميم فني
  • الصور: 4K وHDR و"صور الاستوديو"
  • الأعمال الفنية والرسوم التوضيحية: من إعداد فنان محترف ومفصّل

في ما يلي بعض الأمثلة على طلبات البحث بدون عوامل تعديل الجودة والطلب نفسه مع عوامل تعديل الجودة.

مثال على صورة ذرة بدون عوامل تعديل
الطلب (بدون عوامل تعديل الجودة): صورة لساقه ذرة
مثال لصورة ذرة تتضمّن مُعدِّلات
الطلب (مع عوامل تعديل الجودة): صورة جميلة بدقة 4K بنطاق عالي الديناميكية
لساقه ذرة التقطها
مصور فوتوغرافي محترف

مصدر الصورة: تم إنشاء كل صورة باستخدام الطلب النصي المقابل لها من خلال نموذج Imagen 3.

نِسب العرض إلى الارتفاع

تتيح لك ميزة إنشاء الصور في Imagen 3 ضبط خمس نسب عرض إلى ارتفاع مختلفة للصور.

  1. مربّعة (1:1، الإعداد التلقائي) - صورة مربّعة عادية. تشمل الاستخدامات الشائعة لهذه التناسب المشاركات على وسائل التواصل الاجتماعي.
  2. ملء الشاشة (4:3): تُستخدَم نسبة العرض إلى الارتفاع هذه عادةً في الوسائط أو ال��فلام. وهي أيضًا أبعاد معظم أجهزة التلفزيون القديمة (غير ذات الشاشة العريضة) والكاميرات ذات التنسيق المتوسط. وتلتقط هذه النسبة المزيد من المشهد أفقيًا (مقارنةً بنسبة 1:1)، ما يجعلها نسبة العرض إلى الارتفاع المفضّلة للتصوير الفوتوغرافي.

    مثال على نسبة العرض إلى الارتفاع
    الطلب: لقطة مقرّبة لأصابع موسيقي وهو يعزف على البيانو، فيلم أبيض وأسود قديم (نسبة عرض إلى ارتفاع 4:3)
    مثال على نسبة العرض إلى الارتفاع
    الطلب: صورة احترافية في الاستوديو لوجبة من البطاطس المقلية في مطعم فاخر، بأسلوب مجلّة طعام (نسبة العرض إلى الارتفاع 4:3)
  3. ملء الشاشة في الوضع العمودي (3:4): هذه هي نسبة العرض إلى الارتفاع في وضع ملء الشاشة بعد تدويرها 90 درجة. يتيح لك ذلك التقاط المزيد من المشهد بشكل عمودي مقارنةً بنسبة العرض إلى الارتفاع التي تبلغ 1:1.

    مثال على نسبة العرض إلى الارتفاع
    الطلب: امرأة تمارس رياضة المشي لمسافات طويلة، لقطة مقرّبة من أحذيتها المنعكسة في بركة، جبال كبيرة في الخلفية، بأسلوب إعلاني، زوايا درامية (نسبة العرض إلى الارتفاع 3:4)
    مثال على نسبة العرض إلى الارتفاع
    الطلب: لقطة جوية لنهر يجري في وادٍ سحري (نسبة العرض إلى الارتفاع 3:4)
  4. شاشة عريضة (16:9): حلّت هذه النسبة محلّ نسبة 4:3، وهي الآن نسبة العرض إلى الارتفاع الأكثر شيوعًا لأجهزة التلفزيون والشاشات وشاشات الهواتف الجوّالة (أفقية). استخدِم نسبة العرض إلى الارتفاع هذه عندما تريد تصوير المزيد من الخلفية (مثلاً، المناظر الطبيعية).

    مثال على نسبة العرض إلى الارتفاع
    الطلب: رجل يرتدي ملابس بيضاء بالكامل ويجلس على الشاطئ، لقطة مقرّبة، إضاءة "ساعة الذهبية" (نسبة عرض إلى ارتفاع 16:9)
  5. عمودي (9:16): هذه نسبة شاشة عريضة ولكن تم تدويرها. هذه نسبة عرض إلى ارتفاع جديدة نسبيًا اشتهرت من خلال تطبيقات الفيديوهات القصيرة (مثل YouTube Shorts). استخدِم هذا الخيار للكائنات الطويلة ذات الاتجاهات العمودية القوية، مثل المباني أو الأشجار أو الشلالات أو غيرها من الكائنات المشابهة.

    مثال على نسبة العرض إلى الارتفاع
    المطلوب: صورة رقمية لساعة ناطحة سحاب ضخمة، حديثة، فخمة، ملحمية مع غروب جميل في الخلفية (نسبة العرض إلى الارتفاع 9:16)

الصور الواقعية

قد توفّر الإصدا��ات المختلفة من نموذج إنشاء الصور مزيجًا من النتائج الفنية والواقعية. استخدِم العبارة التالية في الطلبات لإنشاء نتائج أكثر واقعية، استنادًا إلى الموضوع الذي تريد إنشاؤه.

حالة الاستخدام نوع العدسة الأبعاد البؤرية تفاصيل إضافية
الأشخاص (صور الأشخاص) تحسين الصورة، التكبير/التصغير 24-35 مم فيلم بالأبيض والأسود، فيلم نوار، عمق الحقل، لونان (ذكر لونَين)
الطعام والحشرات والنباتات (العناصر والطبيعة الصامتة) وحدة الماكرو 60-105 مم تفاصيل عالية الدقة وتركيز دقيق وإضاءة خاضعة للتحكّم
الرياضة والحياة البرية (متحرك) التكبير/التصغير باستخدام عدسة مقرِّبة 100-400 مم سرعة غالق سريعة أو تتبُّع الحركة أو الحدث
صور فلكية، أفقية (بزاوية واسعة) زاوية عريضة 10-24 مم أوقات التعرّض الطويلة أو التركيز الحاد أو التعرّض الطويل أو المياه أو الغيوم السلسة

صور شخصية

حالة الاستخدام نوع العدسة الأبعاد البؤرية تفاصيل إضافية
الأشخاص (صور الأشخاص) تحسين الصورة، التكبير/التصغير 24-35 مم فيلم بالأبيض والأسود، فيلم نوار، عمق الحقل، لونان (ذكر لونَين)

باستخدام عدّة كلمات رئيسية من الجدول، يمكن لخدمة Imagen إنشاء ملفّات بورتريه التالية:

مثال على تصوير فوتوغرافي للوجه مثال على تصوير فوتوغرافي للوجه مثال على تصوير فوتوغرافي للوجه مثال على تصوير فوتوغرافي للوجه

الطلب: صورة امرأة بالوضع العمودي بتنسيق 35 مم بلونين أزرق ورمادي
الطراز: imagen-3.0-generate-002

مثال على تصوير فوتوغرافي للوجه مثال على تصوير فوتوغرافي للوجه مثال على تصوير فوتوغرافي للوجه مثال على تصوير فوتوغرافي للوجه

الطلب: صورة امرأة بالأبيض والأسود مقاس 35 مم، فيلم نوار
النموذج: imagen-3.0-generate-002

العناصر

حالة الاستخدام نوع العدسة الأبعاد البؤرية تفاصيل إضافية
الطعام والحشرات والنباتات (العناصر والطبيعة الصامتة) وحدة الماكرو 60-105 مم تفاصيل عالية الدقة وتركيز دقيق وإضاءة خاضعة للتحكّم

باستخدام عدة كلمات رئيسية من الجدول، يمكن لخدمة Imagen إنشاء صور الأجسام التالية:

مثال على تصوير الأجسام مثال على تصوير الأجسام مثال على تصوير الأجسام مثال على تصوير الأجسام

الطلب: ورقة نبات دعاء، عدسة مقرّبة، 60 مم
النموذج: imagen-3.0-generate-002

مثال على تصوير الأجسام مثال على تصوير الأجسام مثال على تصوير الأجسام مثال على تصوير الأجسام

الطلب: طبق معكرونة، عدسة ماكرو بدقة 100 مم
النموذج: imagen-3.0-generate-002

الحركة

حالة الاستخدام نوع العدسة الأبعاد البؤرية تفاصيل إضافية
الرياضة والحياة البرية (متحرك) التكبير/التصغير باستخدام عدسة مقرِّبة 100-400 مم سرعة غالق سريعة أو تتبُّع الحركة أو الحدث

باستخدام عدّة كلمات رئيسية من الجدول، يمكن لخدمة Imagen توليد الصور المتحركة التالية:

مثال على التصوير الحيّ مثال على التصوير الحيّ مثال على التصوير الحيّ مثال على التصوير الحيّ

الطلب: هدف الفوز، سرعة غالق سريعة، تتبُّع الحركة
الطراز: imagen-3.0-generate-002

مثال على التصوير الحيّ مثال على التصوير الحيّ مثال على التصوير الحيّ مثال على التصوير الحيّ

الطلب: غزال يركض في الغابة، سرعة التقاط سريعة، تتبُّع الحركة
الطراز: imagen-3.0-generate-002

زاوية عريضة

حالة الاستخدام نوع العدسة الأبعاد البؤرية تفاصيل إضافية
صور فلكية، أفقية (بزاوية واسعة) زاوية عريضة 10-24 مم أوقات التعرّض الطويلة أو التركيز الحاد أو التعرّض الطويل أو المياه أو الغيوم السلسة

باستخدام عدة كلمات رئيسية من الجدول، يمكن لخدمة Imagen توليد الصور التالية بزاوية واسعة:

مثال على تصوير بزاوية واسعة مثال على تصوير بزاوية واسعة مثال على تصوير بزاوية واسعة مثال على تصوير بزاوية واسعة

الطلب: سلسلة جبلية شاسعة، زاوية عريضة أفقية 10 مم
النموذج: imagen-3.0-generate-002

مثال على تصوير بزاوية واسعة مثال على تصوير بزاوية واسعة مثال على تصوير بزاوية واسعة مثال على تصوير بزاوية واسعة

الطلب: صورة للقمر، تصوير فلكي، زاوية واسعة 10 مم
النموذج: imagen-3.0-generate-002

الخطوات التالية