تتيح واجهة برمجة التطبيقات Gemini API إنشاء الصور باستخدام Gemini 2.0 Flash Experimental و باستخدام Imagen 3. يساعدك هذا الدليل في بدء استخدام كلا النموذجَين.
للحصول على إرشادات حول طلبات الصور، يُرجى الاطّلاع على قسم دليل طلبات Imagen.
قبل البدء
قبل استدعاء واجهة برمجة التطبيقات Gemini API، تأكَّد من تثبيت حزمة تطوير البرامج (SDK) المفضّلة لديك ومفتاح Gemini API تم ضبطه وأصبح جاهزًا للاستخدام.
إنشاء صور باستخدام Gemini
يتيح الإصدار التجريبي من Gemini 2.0 Flash إمكانية عرض النص والصور المضمّنة. يتيح لك ذلك استخدام Gemini لتعديل الصور من خلال المحادثة أو إنشاء نتائج تتضمّن نصًا متداخلًا (على سبيل المثال، إنشاء مشاركة مدونة تتضمّن نصًا و صورًا في خطوة واحدة). تتضمّن جميع الصور التي يتم إنشاؤها علامة مائية SynthID، وتتضمّن الصور في Google AI Studio علامة مائية مرئية أيضًا.
يوضّح المثال التالي كيفية استخدام Gemini 2.0 لإنشاء ناتج يتضمن نصًا وصورة:
Python
from google import genai
from google.genai import types
from PIL import Image
from io import BytesIO
import base64
client = genai.Client()
contents = ('Hi, can you create a 3d rendered image of a pig '
'with wings and a top hat flying over a happy '
'futuristic scifi city with lots of greenery?')
response = client.models.generate_content(
model="gemini-2.0-flash-exp-image-generation",
contents=contents,
config=types.GenerateContentConfig(
response_modalities=['TEXT', 'IMAGE']
)
)
for part in response.candidates[0].content.parts:
if part.text is not None:
print(part.text)
elif part.inline_data is not None:
image = Image.open(BytesIO((part.inline_data.data)))
image.save('gemini-native-image.png')
image.show()
JavaScript
import { GoogleGenAI, Modality } from "@google/genai";
import * as fs from "node:fs";
async function main() {
const ai = new GoogleGenAI({ apiKey: "GEMINI_API_KEY" });
const contents =
"Hi, can you create a 3d rendered image of a pig " +
"with wings and a top hat flying over a happy " +
"futuristic scifi city with lots of greenery?";
// Set responseModalities to include "Image" so the model can generate an image
const response = await ai.models.generateContent({
model: "gemini-2.0-flash-exp-image-generation",
contents: contents,
config: {
responseModalities: [Modality.TEXT, Modality.IMAGE],
},
});
for (const part of response.candidates[0].content.parts) {
// Based on the part type, either show the text or save the image
if (part.text) {
console.log(part.text);
} else if (part.inlineData) {
const imageData = part.inlineData.data;
const buffer = Buffer.from(imageData, "base64");
fs.writeFileSync("gemini-native-image.png", buffer);
console.log("Image saved as gemini-native-image.png");
}
}
}
main();
REST
curl -s -X POST \
"https://generativelanguage.googleapis.com/v1beta/models/gemini-2.0-flash-exp-image-generation:generateContent?key=$GEMINI_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"contents": [{
"parts": [
{"text": "Hi, can you create a 3d rendered image of a pig with wings and a top hat flying over a happy futuristic scifi city with lots of greenery?"}
]
}],
"generationConfig":{"responseModalities":["TEXT","IMAGE"]}
}' \
| grep -o '"data": "[^"]*"' \
| cut -d'"' -f4 \
| base64 --decode > gemini-native-image.png

استنادًا إلى الطلب والسياق، سينشئ Gemini محتوى بتنسيقات مختلفة (تحويل النص إلى صورة، وتحويل النص إلى صورة ونص، وما إلى ذلك). وإليك بعض الأمثلة:
- تحويل النص إلى صورة
- مثال على طلب: "أريد إنشاء صورة لبرج إيفل مع عرض للألعاب النارية في الخلفية".
- تحويل النص إلى صور ونص (مُدرَج)
- مثال على طلب: "أريد إنشاء وصفة مُوضَّحة لطبق البايلا".
- الصور والنصوص إلى صور ونصوص (متداخلة)
- مثال على طلب: (مع صورة لغرفة مفروشة) "ما هي الألوان الأخرى التي تناسب أريكتي في المساحة؟ هل يمكنك تعديل الصورة؟"
- تعديل الصور (النص والصورة إلى الصورة)
- مثال على طلب: "تعديل هذه الصورة لتبدو وكأنها صورة كارتونية"
- مثال على طلب: [صورة هرّة] + [صورة وسادة] + "أريد استخدام التطريز بالابر المتعدّدة لإنشاء صورة هرّتي على هذه الوسادة".
- تعديل الصور المتعدّد الخطوات (المحادثة)
- أمثلة على الطلبات: [تحميل صورة سيارة زرقاء] "أريد تحويل هذه السيارة إلى سيارة قابلة للتحويل". "الآن، غيِّر اللون إلى الأصفر".
تعديل الصور باستخدام Gemini
لإجراء تعديل على الصورة، أضِف صورة كمدخل. يوضّح المثال التالي تحميل صور بترميز Base64. بالنسبة إلى الصور المتعدّدة وحمولات العميل الأكبر حجمًا، راجِع قسم إدخال الصور.
Python
from google import genai
from google.genai import types
from PIL import Image
from io import BytesIO
import PIL.Image
image = PIL.Image.open('/path/to/image.png')
client = genai.Client()
text_input = ('Hi, This is a picture of me.'
'Can you add a llama next to me?',)
response = client.models.generate_content(
model="gemini-2.0-flash-exp-image-generation",
contents=[text_input, image],
config=types.GenerateContentConfig(
response_modalities=['TEXT', 'IMAGE']
)
)
for part in response.candidates[0].content.parts:
if part.text is not None:
print(part.text)
elif part.inline_data is not None:
image = Image.open(BytesIO(part.inline_data.data))
image.show()
JavaScript
import { GoogleGenAI, Modality } from "@google/genai";
import * as fs from "node:fs";
async function main() {
const ai = new GoogleGenAI({ apiKey: "GEMINI_API_KEY" });
// Load the image from the local file system
const imagePath = "path/to/image.png";
const imageData = fs.readFileSync(imagePath);
const base64Image = imageData.toString("base64");
// Prepare the content parts
const contents = [
{ text: "Can you add a llama next to the image?" },
{
inlineData: {
mimeType: "image/png",
data: base64Image,
},
},
];
// Set responseModalities to include "Image" so the model can generate an image
const response = await ai.models.generateContent({
model: "gemini-2.0-flash-exp-image-generation",
contents: contents,
config: {
responseModalities: [Modality.TEXT, Modality.IMAGE],
},
});
for (const part of response.candidates[0].content.parts) {
// Based on the part type, either show the text or save the image
if (part.text) {
console.log(part.text);
} else if (part.inlineData) {
const imageData = part.inlineData.data;
const buffer = Buffer.from(imageData, "base64");
fs.writeFileSync("gemini-native-image.png", buffer);
console.log("Image saved as gemini-native-image.png");
}
}
}
main();
REST
IMG_PATH=/path/to/your/image1.jpeg
if [[ "$(base64 --version 2>&1)" = *"FreeBSD"* ]]; then
B64FLAGS="--input"
else
B64FLAGS="-w0"
fi
IMG_BASE64=$(base64 "$B64FLAGS" "$IMG_PATH" 2>&1)
curl -X POST \
"https://generativelanguage.googleapis.com/v1beta/models/gemini-2.0-flash-exp-image-generation:generateContent?key=$GEMINI_API_KEY" \
-H 'Content-Type: application/json' \
-d "{
\"contents\": [{
\"parts\":[
{\"text\": \"'Hi, This is a picture of me. Can you add a llama next to me\"},
{
\"inline_data\": {
\"mime_type\":\"image/jpeg\",
\"data\": \"$IMG_BASE64\"
}
}
]
}],
\"generationConfig\": {\"responseModalities\": [\"TEXT\", \"IMAGE\"]}
}" \
| grep -o '"data": "[^"]*"' \
| cut -d'"' -f4 \
| base64 --decode > gemini-edited-image.png
القيود
- للحصول على أفضل أداء، استخدِم اللغات التالية: EN وes-MX وja-JP وzh-CN و hi-IN.
- لا تتيح ميزة إنشاء الصور إدخالات صوتية أو فيديوهات.
- قد لا يتم إنشاء الصور في الحالات التالية:
- قد يعرض النموذج نصًا فقط. جرِّب طلب نتائج الصور صراحةً (مثل "إنشاء صورة" أو "تقديم صور أثناء الإجراء" أو "تعديل الصورة").
- قد يتوقف النموذج عن إنشاء المحتوى في منتصف العملية. يُرجى إعادة المحاولة أو استخدام طلب مختلف.
- عند إنشاء نص لصورة، يعمل Gemini بشكل أفضل إذا أنشأت أولاً النص ثم طلبت صورة تتضمّن النص.
اختيار نموذج
ما هو النموذج الذي يجب استخدامه لإنشاء الصور؟ يعتمد ذلك على حالة الاستخدام.
إنّ Gemini 2.0 هو الخيار الأفضل لإنشاء صور ذات صلة بالسياق، ودمج النصوص والصور، واستخدام المعرفة العالمية، والاستدلال على الصور. يمكنك استخدامها لإنشاء عناصر مرئية دقيقة وذات صلة بالسياق تكون مضمّنة في تسلسلات نصية طويلة. يمكنك أيضًا تعديل الصور بشكل حواري باستخدام لغة طبيعية، مع الحفاظ على السياق طوال المحادثة.
إذا كانت جودة الصورة هي أهم أولوياتك، فإنّ Imagen 3 هو الخيار الأفضل. ي��برِز تطبيق Imagen 3 الصور الواقعية والتفاصيل الفنية والأنماط الفنية المحدّدة، مثل الانطباعية أو الأنمي. يُعدّ Imagen 3 أيضًا خيارًا جيدًا لأعمال تعديل الصور المتخصصة، مثل تعديل خلفيات المنتجات وزيادة كثافة بكسل الصور ودمج العلامة التجارية والأسلوب في المحتوى المرئي. يمكنك استخدام Imagen 3 لإنشاء الشعارات أو تصاميم المنتجات الأخرى التي تحمل علامة تجارية.
إنشاء صور باستخدام Imagen 3
تتيح واجهة برمجة التطبيقات Gemini API استخدام Imagen 3، وهو نموذج تحويل النص إلى صورة من Google يقدّم أفضل ميزات تحويل النص إلى صورة، ويضمّ عددًا من الإمكانات الجديدة والمحسّنة. يمكن لخدمة Imagen 3 تنفيذ ما يلي:
- إنشاء صور بتفاصيل أفضل وإضاءة أكثر ثراءً وعناصر مزعجة أقل من النماذج السابقة
- فهم الطلبات المكتوبة بلغة طبيعية
- إنشاء صور بمجموعة كبيرة من التنسيقات والأنماط
- عرض النص بفعالية أكبر من النماذج السابقة
Python
from google import genai
from google.genai import types
from PIL import Image
from io import BytesIO
client = genai.Client(api_key='GEMINI_API_KEY')
response = client.models.generate_images(
model='imagen-3.0-generate-002',
prompt='Robot holding a red skateboard',
config=types.GenerateImagesConfig(
number_of_images= 4,
)
)
for generated_image in response.generated_images:
image = Image.open(BytesIO(generated_image.image.image_bytes))
image.show()
JavaScript
import { GoogleGenAI } from "@google/genai";
import * as fs from "node:fs";
async function main() {
const ai = new GoogleGenAI({ apiKey: "GEMINI_API_KEY" });
const response = await ai.models.generateImages({
model: 'imagen-3.0-generate-002',
prompt: 'Robot holding a red skateboard',
config: {
numberOfImages: 4,
},
});
let idx = 1;
for (const generatedImage of response.generatedImages) {
let imgBytes = generatedImage.image.imageBytes;
const buffer = Buffer.from(imgBytes, "base64");
fs.writeFileSync(`imagen-${idx}.png`, buffer);
idx++;
}
}
main();
REST
curl -X POST \
"https://generativelanguage.googleapis.com/v1beta/models/imagen-3.0-generate-002:predict?key=GEMINI_API_KEY" \
-H "Content-Type: application/json" \
-d '{
"instances": [
{
"prompt": "Robot holding a red skateboard"
}
],
"parameters": {
"sampleCount": 4
}
}'

تتيح Imagen الطلبات باللغة الإنجليزية فقط في الوقت الحالي والمَعلمات التالية:
مَعلمات نموذج Imagen
(تختلف قواعد التسمية حسب لغة البرمجة).
-
numberOfImages
: عدد الصور المطلوب إنشاؤها، من 1 إلى 4 (شاملة). القيمة التلقائية هي 4. aspectRatio
: لتغيير نسبة العرض إلى الارتفاع للصورة التي تم إنشاؤها القيم المتوافقة هي"1:1"
و"3:4"
و"4:3"
و"9:16"
و"16:9"
. القيمة التلقائية هي"1:1"
.personGeneration
: اسمح للنموذج بإنشاء صور لأشخاص. في ما يلي القيم المتوافقة:"DONT_ALLOW"
: حظر إنشاء صور للأشخاص"ALLOW_ADULT"
: إنشاء صور لأشخاص بالغين، ولكن ليس للأطفال هذا هو الخيار التلقائي.
دليل طلبات Imagen
يوضّح لك هذا القسم من دليل Imagen كيفية تعديل طلب تحويل النص إلى صورة لتحقيق نتائج مختلفة، بالإضافة إلى أمثلة على الصور التي يمكنك إنشاؤها.
أساسيات كتابة الطلبات
يكون الطلب الجيد وصفيًا وواضحًا، ويستخدم كلمات رئيسية و مُعدِّلات ذات مغزى. ابدأ بالتفكير في الموضوع والسياق والأسلوب.

الموضوع: أول ما يجب التفكير فيه عند استخدام أي طلب هو الموضوع: الكائن أو الشخص أو الحيوان أو المشهد الذي تريد الحصول على صورة له.
السياق والخلفية: لا يقلّ الخلفية أو السياق الذي سيتم وضع الهدف فيه أهمية عن الهدف نفسه. جرِّب وضع الهدف في مجموعة متنوعة من الخلفيات. على سبيل المثال، استوديو بخلفية بيضاء أو أماكن خارجية أو أماكن داخلية
النمط: أخيرًا، أضِف نمط الصورة الذي تريده. يمكن أن تكون الأنماط عامة (رسم أو صورة أو رسومات تخطيطية) أو محدّدة جدًا (رسم بالألوان المائية أو رسم بالفحم أو رسم ثلاثي الأبعاد إسقاطي). يمكنك أيضًا دمج الأنماط.
بعد كتابة نسخة أولى من الطلب، يمكنك تحسينه من خلال إضافة مزيد من التفاصيل إلى أن تصل إلى الصورة التي تريدها. التكرار مهم. ابدأ بتحديد الفكرة الأساسية، ثمّ حسِّنها ووسِّعها إلى أن تصبح الصورة التي تم إنشاؤها قريبة من رؤيتك.
![]() |
![]() |
![]() |
يمكن أن يحوّل تطبيق Imagen 3 أفكارك إلى صور مفصّلة، سواء كانت الطلبات قصيرة أو طويلة ومفصّلة. يمكنك تحسين رؤيتك من خلال طلبات متكرّرة، مع إضافة تفاصيل إلى أن تحصل على النتيجة المثالية.
تتيح لك الطلبات القصيرة إنشاء صورة بسرعة. ![]() |
تتيح لك الطلبات الأطول إضافة تفاصيل محدّدة وإنشاء صورتك. ![]() |
نصائح إضافية لكتابة طلبات Imagen:
- استخدام لغة وصفية: استخدِم الصفات والظروف التفصيلية لشدّ انتباه المستخدمين و تقديم صورة واضحة لـ Imagen 3.
- تقديم سياق: إذا لزم الأمر، يمكنك تضمين معلومات أساسية لمساعدة الذكاء الاصطناعي في الفهم.
- الإشارة إلى فنانين أو أنماط معيّنة: إذا كان لديك أسلوب جمالي معيّن في ذهنك، قد يكون من المفيد الإشارة إلى فنانين أو حركات فنية معيّنة.
- استخدام أدوات هندسة الطلبات: ننصحك باستكشاف أدوات أو موارد هندسة الطلبات لمساعدتك في تحسين طلباتك وتحقيق أفضل النتائج.
- تحسين تفاصيل الوجه في صورك الشخصية والجماعية:
- حدِّد تفاصيل الوجه كنقطة تركيز في الصورة (على سبيل المثال، استخدِم الكلمة "بورتريه" في الطلب).
إنشاء نص في الصور
يمكن لتطبيق Imagen إضافة نص إلى الصور، ما يفتح المزيد من possibilities لإنشاء صور مبتكرة. اتّبِع الإرشادات التالية للاستفادة إلى أقصى حدّ من هذه الميزة:
- تكرار الخطوات بثقة: قد تحتاج إلى إعادة إنشاء الصور إلى أن تتمكّن من تحقيق المظهر الذي تريده. لا تزال عملية دمج النصوص في Imagen في مرحلة تطوير، وفي بعض الأحيان تؤدي المحاولات المتعدّدة إلى تحقيق أفضل النتائج.
- اختصار النص: يجب أن يتألف النص من 25 حرفًا أو أقل لضمان OPTIMAL الإنشاء.
عبارات متعدّدة: جرِّب عبارةَين أو ثلاث عبارات مختلفة لتوفير معلومات إضافية. تجنَّب استخدام أكثر من ثلاث عبارات لإنشاء تركيبات تصاميم أنظف.
الطلب: ملصق يتضمّن النص "Summerland" بخط عريض كه عنوان ، وتحت هذا النص يظهر الشعار "Summer never felt so good" توجيه مواضع النص: على الرغم من أنّ Imagen يمكن أن تحاول وضع النص على النحو المُوجَّه، توقّع حدوث اختلافات من حين لآخر. نحن نعمل باستمرار على تحسين هذه الميزة.
نمط الخط المستوحى: حد��ّد نمط خط عام للتأثير بشكلٍ دقيق في خيارات Imagen. لا تعتمد على تكرار الخطوط بدقة، ولكن توقّع تفسيرات إبداعية.
حجم الخط: حدِّد حجم خط أو إشارة عامة إلى الحجم (مثل صغير أو متوسط أو كبير) للتأثير في عملية إنشاء حجم الخط.
تحديد مَعلمات الطلب
للتحكّم بشكل أفضل في نتائج الإخراج، قد يكون من المفيد وضع مَعلمات للمدخلات في Imagen. على سبيل المثال، لنفترض أنّك تريد أن يتمكّن عملاؤك من إنشاء شعارات لنشاطاتهم التجارية، و تريد التأكّد من إنشاء الشعارات دائمًا على خلفية بلون واحد. وبإمكانك أيضًا تحديد الخيارات التي يمكن للعميل اختيارها من القائمة.
في هذا المثال، يمكنك إنشاء طلب مُحدَّد بالمَعلمات مشابهًا للطلب التالي:
A {logo_style} logo for a {company_area} company on a solid color background. Include the text {company_name}.
في واجهة المستخدم المخصّصة، يمكن للعميل إدخال المَعلمات باستخدام قائمة، وتعبِّئ القيمة التي يختارها الطلب الذي تتلقّاه Imagen.
على سبيل المثال:
الطلب:
A minimalist logo for a health care company on a solid color background. Include the text Journey.
الطلب:
A modern logo for a software company on a solid color background. Include the text Silo.
الطلب:
A traditional logo for a baking company on a solid color background. Include the text Seed.
أساليب كتابة الطلبات المتقدّمة
استخدِم الأمثلة التالية لإنشاء طلبات أكثر تحديدًا استنادًا إلى السمات، مثل أوصاف الصور الفوتوغرافية والأشكال والمواد وحركات الفن التاريخي وعوامل تعديل جودة الصورة.
التصوير الفوتوغرافي
- تتضمّن الرسالة المطالبة ما يلي: "صورة..."
لاستخدام هذا النمط، ابدأ باستخدام كلمات رئيسية تُعلم Imagen بوضوح أنّك تبحث عن صورة فوتوغرافية. ابدأ طلباتك بعبارة "صورة لـ . .". على سبيل المثال:
![]() |
![]() |
![]() |
مصدر الصورة: تم إنشاء كل صورة باستخدام الطلب النصي المقابل لها من خلال نموذج Imagen 3.
عناصر تعديل الصور
في الأمثلة التالية، يمكنك الاطّلاع على العديد من المُعدِّلات والمَعلمات المتعلّقة بالتصوير الفوتوغرافي. يمكنك الجمع بين عدّة عوامل تعديل للتحكّم بشكل أدق.
قرب الكاميرا: صورة مقرّبة تم التقاطها من مسافة بعيدة
الطلب: صورة مقرّبة لحبوب القهوة الطلب: صورة مكبّرة لحقيبة صغيرة من
حبوب القهوة في مطبخ فوضويموضع الكاميرا: من الجو، من الأسفل
الطلب: صورة من الجو لمدينة حضرية بها ناطحات سحاب الطلب: صورة لظلة غابة مع سماء زرقاء من الأسفل الإضاءة: طبيعية، مميّزة، دافئة، باردة
الطلب: صورة استوديو لكرسي بذراعَين حديث، بإضاءة طبيعية الطلب: صورة استوديو لكرسي بذراعَين حديث، إضاءة درامية إعدادات الكاميرا - تمويه الحركة والتركيز الناعم والتأثير البؤري ووضع "بورتريه"
الطلب: صورة لمدينة بها ناطحات سحاب من داخل سيارة مع تمويه متحرّك الطلب: صورة بتركيز خفيف لجسر في مدينة حضرية ليلاً أنواع العدسات: 35 ملم و50 ملم وعدسة عين السمكة وعدسة بزاوية واسعة وعدسة الماكرو
الطلب: صورة لورقة شجر، عدسة مقرّبة الطلب: تصوير الشوارع، مدينة نيويورك، عدسة عين السمكة أنواع الأفلام: أبيض وأسود، بولارويد
الطلب: صورة بورتريه بالكاميرا الفورية لكلب يرتدي نظّارات شمسية الطلب: صورة بالأبيض والأسود لكلب يرتدي نظّارات شمسية
مصدر الصورة: تم إنشاء كل صورة باستخدام الطلب النصي المقابل لها من خلال نموذج Imagen 3.
الرسوم التوضيحية والفنون
- تتضمّن الرسالة المطالبة: "painting من..."، "sketch من..."
تتنوع أنماط الأعمال الفنية من الأنماط أحادية اللون، مثل الرسومات بالقلم الرصاص، إلى الفن الرقمي الفائق الواقعية. على سبيل المثال، تستخدم الصور التالية الطلب نفسه بأسلوبين مختلفين:
"[art style or creation technique] لسيارة كهربائية منحنية رياضية من فئة السيارات السيدان مع ناطحات سحاب في الخلفية"
![]() |
![]() |
![]() |
![]() |
![]() |
![]() |
مصدر الصورة: تم إنشاء كل صورة باستخدام الطلب النصي المقابل لها من خلال نموذج Imagen 2.
الأشكال والمواد
- تتضمّن الرسالة المطالبة: "...مصنوعة من..."، "...في شكل..."
من نقاط قوة هذه التكنولوجيا أنّه يمكنك إنشاء صور يصعب أو يستحيل الحصول عليها بغير هذه الطريقة. على سبيل المثال، يمكنك إعادة إنشاء شعار شركتك باستخدام مواد وملمسات مختلفة.
![]() |
![]() |
![]() |
مصدر الصورة: تم إنشاء كل صورة باستخدام الطلب النصي المقابل لها من خلال نموذج Imagen 3.
مراجع الفنون التاريخية
- تتضمّن الرسالة المطالبة ما يلي: "...بأسلوب..."
وقد أصبحت بعض الأنماط رمزية على مرّ السنين. في ما يلي بعض الأفكار عن الرسم أو الأساليب الفنية التاريخية التي يمكنك تجربتها.
"إنشاء صورة بأسلوب [art period or movement] : مزرعة رياح"
![]() |
![]() |
![]() |
مصدر الصورة: تم إنشاء كل صورة باستخدام الطلب النصي المقابل لها من خلال نموذج Imagen 3.
عوامل تعديل جودة الصورة
يمكن أن تُعلم كلمات رئيسية معيّنة النموذج بأنّك تبحث عن مادة عرض عالية الجودة. تشمل أمثلة عوامل تعديل الجودة ما يلي:
- العناصر المعدِّلة العامة: عالية الجودة وجميلة وذات تصميم فني
- الصور: 4K وHDR و"صور الاستوديو"
- الأعمال الفنية والرسوم التوضيحية: من إعداد فنان محترف ومفصّل
في ما يلي بعض الأمثلة على طلبات البحث بدون عوامل تعديل الجودة والطلب نفسه مع عوامل تعديل الجودة.
![]() |
![]() لساقه ذرة التقطها مصور فوتوغرافي محترف |
مصدر الصورة: تم إنشاء كل صورة باستخدام الطلب النصي المقابل لها من خلال نموذج Imagen 3.
نِسب العرض إلى الارتفاع
تتيح لك ميزة إنشاء الصور في Imagen 3 ضبط خمس نسب عرض إلى ارتفاع مختلفة للصور.
- مربّعة (1:1، الإعداد التلقائي) - صورة مربّعة عادية. تشمل الاستخدامات الشائعة لهذه التناسب المشاركات على وسائل التواصل الاجتماعي.
ملء الشاشة (4:3): تُستخدَم نسبة العرض إلى الارتفاع هذه عادةً في الوسائط أو ال��فلام. وهي أيضًا أبعاد معظم أجهزة التلفزيون القديمة (غير ذات الشاشة العريضة) والكاميرات ذات التنسيق المتوسط. وتلتقط هذه النسبة المزيد من المشهد أفقيًا (مقارنةً بنسبة 1:1)، ما يجعلها نسبة العرض إلى الارتفاع المفضّلة للتصوير الفوتوغرافي.
الطلب: لقطة مقرّبة لأصابع موسيقي وهو يعزف على البيانو، فيلم أبيض وأسود قديم (نسبة عرض إلى ارتفاع 4:3) الطلب: صورة احترافية في الاستوديو لوجبة من البطاطس المقلية في مطعم فاخر، بأسلوب مجلّة طعام (نسبة العرض إلى الارتفاع 4:3) ملء الشاشة في الوضع العمودي (3:4): هذه هي نسبة العرض إلى الارتفاع في وضع ملء الشاشة بعد تدويرها 90 درجة. يتيح لك ذلك التقاط المزيد من المشهد بشكل عمودي مقارنةً بنسبة العرض إلى الارتفاع التي تبلغ 1:1.
الطلب: امرأة تمارس رياضة المشي لمسافات طويلة، لقطة مقرّبة من أحذيتها المنعكسة في بركة، جبال كبيرة في الخلفية، بأسلوب إعلاني، زوايا درامية (نسبة العرض إلى الارتفاع 3:4) الطلب: لقطة جوية لنهر يجري في وادٍ سحري (نسبة العرض إلى الارتفاع 3:4) شاشة عريضة (16:9): حلّت هذه النسبة محلّ نسبة 4:3، وهي الآن نسبة العرض إلى الارتفاع الأكثر شيوعًا لأجهزة التلفزيون والشاشات وشاشات الهواتف الجوّالة (أفقية). استخدِم نسبة العرض إلى الارتفاع هذه عندما تريد تصوير المزيد من الخلفية (مثلاً، المناظر الطبيعية).
الطلب: رجل يرتدي ملابس بيضاء بالكامل ويجلس على الشاطئ، لقطة مقرّبة، إضاءة "ساعة الذهبية" (نسبة عرض إلى ارتفاع 16:9) عمودي (9:16): هذه نسبة شاشة عريضة ولكن تم تدويرها. هذه نسبة عرض إلى ارتفاع جديدة نسبيًا اشتهرت من خلال تطبيقات الفيديوهات القصيرة (مثل YouTube Shorts). استخدِم هذا الخيار للكائنات الطويلة ذات الاتجاهات العمودية القوية، مثل المباني أو الأشجار أو الشلالات أو غيرها من الكائنات المشابهة.
المطلوب: صورة رقمية لساعة ناطحة سحاب ضخمة، حديثة، فخمة، ملحمية مع غروب جميل في الخلفية (نسبة العرض إلى الارتفاع 9:16)
الصور الواقعية
قد توفّر الإصدا��ات المختلفة من نموذج إنشاء الصور مزيجًا من النتائج الفنية والواقعية. استخدِم العبارة التالية في الطلبات لإنشاء نتائج أكثر واقعية، استنادًا إلى الموضوع الذي تريد إنشاؤه.
حالة الاستخدام | نوع العدسة | الأبعاد البؤرية | تفاصيل إضافية |
---|---|---|---|
الأشخاص (صور الأشخاص) | تحسين الصورة، التكبير/التصغير | 24-35 مم | فيلم بالأبيض والأسود، فيلم نوار، عمق الحقل، لونان (ذكر لونَين) |
الطعام والحشرات والنباتات (العناصر والطبيعة الصامتة) | وحدة الماكرو | 60-105 مم | تفاصيل عالية الدقة وتركيز دقيق وإضاءة خاضعة للتحكّم |
الرياضة والحياة البرية (متحرك) | التكبير/التصغير باستخدام عدسة مقرِّبة | 100-400 مم | سرعة غالق سريعة أو تتبُّع الحركة أو الحدث |
صور فلكية، أفقية (بزاوية واسعة) | زاوية عريضة | 10-24 مم | أوقات التعرّض الطويلة أو التركيز الحاد أو التعرّض الطويل أو المياه أو الغيوم السلسة |
صور شخصية
حالة الاستخدام | نوع العدسة | الأبعاد البؤرية | تفاصيل إضافية |
---|---|---|---|
الأشخاص (صور الأشخاص) | تحسين الصورة، التكبير/التصغير | 24-35 مم | فيلم بالأبيض والأسود، فيلم نوار، عمق الحقل، لونان (ذكر لونَين) |
باستخدام عدّة كلمات رئيسية من الجدول، يمكن لخدمة Imagen إنشاء ملفّات بورتريه التالية:
![]() |
![]() |
![]() |
![]() |
الطلب: صورة امرأة بالوضع العمودي بتنسيق 35 مم بلونين أزرق ورمادي
الطراز: imagen-3.0-generate-002
![]() |
![]() |
![]() |
![]() |
الطلب: صورة امرأة بالأبيض والأسود مقاس 35 مم، فيلم نوار
النموذج: imagen-3.0-generate-002
العناصر
حالة الاستخدام | نوع العدسة | الأبعاد البؤرية | تفاصيل إضافية |
---|---|---|---|
الطعام والحشرات والنباتات (العناصر والطبيعة الصامتة) | وحدة الماكرو | 60-105 مم | تفاصيل عالية الدقة وتركيز دقيق وإضاءة خاضعة للتحكّم |
باستخدام عدة كلمات رئيسية من الجدول، يمكن لخدمة Imagen إنشاء صور الأجسام التالية:
![]() |
![]() |
![]() |
![]() |
الطلب: ورقة نبات دعاء، عدسة مقرّبة، 60 مم
النموذج: imagen-3.0-generate-002
![]() |
![]() |
![]() |
![]() |
الطلب: طبق معكرونة، عدسة ماكرو بدقة 100 مم
النموذج: imagen-3.0-generate-002
الحركة
حالة الاستخدام | نوع العدسة | الأبعاد البؤرية | تفاصيل إضافية |
---|---|---|---|
الرياضة والحياة البرية (متحرك) | التكبير/التصغير باستخدام عدسة مقرِّبة | 100-400 مم | سرعة غالق سريعة أو تتبُّع الحركة أو الحدث |
باستخدام عدّة كلمات رئيسية من الجدول، يمكن لخدمة Imagen توليد الصور المتحركة التالية:
![]() |
![]() |
![]() |
![]() |
الطلب: هدف الفوز، سرعة غالق سريعة، تتبُّع الحركة
الطراز: imagen-3.0-generate-002
![]() |
![]() |
![]() |
![]() |
الطلب: غزال يركض في الغابة، سرعة التقاط سريعة، تتبُّع الحركة
الطراز: imagen-3.0-generate-002
زاوية عريضة
حالة الاستخدام | نوع العدسة | الأبعاد البؤرية | تفاصيل إضافية |
---|---|---|---|
صور فلكية، أفقية (بزاوية واسعة) | زاوية عريضة | 10-24 مم | أوقات التعرّض الطويلة أو التركيز الحاد أو التعرّض الطويل أو المياه أو الغيوم السلسة |
باستخدام عدة كلمات رئيسية من الجدول، يمكن لخدمة Imagen توليد الصور التالية بزاوية واسعة:
![]() |
![]() |
![]() |
![]() |
الطلب: سلسلة جبلية شاسعة، زاوية عريضة أفقية 10 مم
النموذج: imagen-3.0-generate-002
![]() |
![]() |
![]() |
![]() |
الطلب: صورة للقمر، تصوير فلكي، زاوية واسعة 10 مم
النموذج: imagen-3.0-generate-002
الخطوات التالية
- اطّلِع على دليل Veo للتعرّف على كيفية إنشاء الفيديوهات باستخدام Gemini API.
- لمزيد من المعلومات عن نماذج Gemini 2.0، اطّلِع على نماذج Gemini والنماذج التجريبية.