Gemini 2.5 Pro প্রিভিউ এখন উৎপাদন ব্যবহারের জন্য উপলব্ধ! আরও জানুন

এই পৃষ্ঠাটি Cloud Translation API অনুবাদ করেছে।

ছবি তৈরি করুন

Gemini API জেমিনি 2.0 ফ্ল্যাশ পরীক্ষামূলক ব্যবহার করে এবং Imagen 3 ব্যবহার করে ইমেজ তৈরিকে সমর্থন করে। এই নির্দেশিকা আপনাকে উভয় মডেলের সাথে শুরু করতে সাহায্য করে।

ইমেজ প্রম্পট গাইডেন্সের জন্য, ইমেজেন প্রম্পট গাইড বিভাগটি দেখুন।

আপনি শুরু করার আগে

Gemini API কল করার আগে, নিশ্চিত করুন যে আপনি আপনার পছন্দের SDK ইনস্টল করেছেন, এবং একটি Gemini API কী কনফিগার করা এবং ব্যবহারের জন্য প্রস্তুত।

মিথুন ব্যবহার করে ছবি তৈরি করুন

জেমিনি 2.0 ফ্ল্যাশ এক্সপেরিমেন্টাল টেক্সট এবং ইনলাইন ইমেজ আউটপুট করার ক্ষমতা সমর্থন করে। এটি আপনাকে কথোপকথনমূলকভাবে চিত্রগুলি সম্পাদনা করতে বা অন্তর্নির্মিত পাঠ্যের সাথে আউটপুট তৈরি করতে মিথুন ব্যবহার করতে দেয় (উদাহরণস্বরূপ, একক পালা করে পাঠ্য এবং চিত্র সহ একটি ব্লগ পোস্ট তৈরি করা)। সমস্ত জেনারেট করা ছবিতে একটি SynthID ওয়াটারমার্ক রয়েছে, এবং Google AI স্টুডিওতে একটি দৃশ্যমান ওয়াটারমার্কও রয়েছে৷

নিচের উদাহরণটি দেখায় কিভাবে টেক্সট-এবং-ইমেজ আউটপুট তৈরি করতে Gemini 2.0 ব্যবহার করতে হয়:

পাইথন

from google import genai
from google.genai import types
from PIL import Image
from io import BytesIO
import base64

client = genai.Client()

contents = ('Hi, can you create a 3d rendered image of a pig '
            'with wings and a top hat flying over a happy '
            'futuristic scifi city with lots of greenery?')

response = client.models.generate_content(
    model="gemini-2.0-flash-exp-image-generation",
    contents=contents,
    config=types.GenerateContentConfig(
      response_modalities=['TEXT', 'IMAGE']
    )
)

for part in response.candidates[0].content.parts:
  if part.text is not None:
    print(part.text)
  elif part.inline_data is not None:
    image = Image.open(BytesIO((part.inline_data.data)))
    image.save('gemini-native-image.png')
    image.show()

জাভাস্ক্রিপ্ট

import { GoogleGenAI, Modality } from "@google/genai";
import * as fs from "node:fs";

async function main() {

  const ai = new GoogleGenAI({ apiKey: "GEMINI_API_KEY" });

  const contents =
    "Hi, can you create a 3d rendered image of a pig " +
    "with wings and a top hat flying over a happy " +
    "futuristic scifi city with lots of greenery?";

  // Set responseModalities to include "Image" so the model can generate  an image
  const response = await ai.models.generateContent({
    model: "gemini-2.0-flash-exp-image-generation",
    contents: contents,
    config: {
      responseModalities: [Modality.TEXT, Modality.IMAGE],
    },
  });
  for (const part of response.candidates[0].content.parts) {
    // Based on the part type, either show the text or save the image
    if (part.text) {
      console.log(part.text);
    } else if (part.inlineData) {
      const imageData = part.inlineData.data;
      const buffer = Buffer.from(imageData, "base64");
      fs.writeFileSync("gemini-native-image.png", buffer);
      console.log("Image saved as gemini-native-image.png");
    }
  }
}

main();

বিশ্রাম

curl -s -X POST \
  "https://generativelanguage.googleapis.com/v1beta/models/gemini-2.0-flash-exp-image-generation:generateContent?key=$GEMINI_API_KEY" \
  -H "Content-Type: application/json" \
  -d '{
    "contents": [{
      "parts": [
        {"text": "Hi, can you create a 3d rendered image of a pig with wings and a top hat flying over a happy futuristic scifi city with lots of greenery?"}
      ]
    }],
    "generationConfig":{"responseModalities":["TEXT","IMAGE"]}
  }' \
  | grep -o '"data": "[^"]*"' \
  | cut -d'"' -f4 \
  | base64 --decode > gemini-native-image.png

একটি চমত্কার উড়ন্ত শূকরের AI-উত্পন্ন চিত্র

প্রম্পট এবং প্রসঙ্গের উপর নির্ভর করে, মিথুন বিভিন্ন মোডে সামগ্রী তৈরি করবে (টেক্সট টু ইমেজ, টেক্সট টু ইমেজ এবং টেক্সট ইত্যাদি)। এখানে কিছু উদাহরণ আছে:

টেক্সট টু ইমেজ
- উদাহরণ প্রম্পট: "পটভূমিতে আতশবাজি সহ আইফেল টাওয়ারের একটি চিত্র তৈরি করুন।"
টেক্সট টু ইমেজ এবং টেক্সট (ইন্টারলিভড)
- উদাহরণ প্রম্পট: "পায়েলার জন্য একটি চিত্রিত রেসিপি তৈরি করুন।"
ছবি(গুলি) এবং টেক্সট টু ইমেজ(গুলি) এবং টেক্সট (ইন্টারলিভড)
- উদাহরণ প্রম্পট: (একটি সজ্জিত ঘরের একটি চিত্র সহ) "আমার জায়গায় অন্য কোন রঙের সোফা কাজ করবে? আপনি কি ছবিটি আপডেট করতে পারেন?"
ছবি সম্পাদনা (টেক্সট এবং ইমেজ থেকে ইমেজ)
- উদাহরণ প্রম্পট: "একটি কার্টুনের মতো দেখতে এই ছবিটি সম্পাদনা করুন"
- উদাহরণ প্রম্পট: [একটি বিড়ালের ছবি] + [একটি বালিশের ছবি] + "এই বালিশে আমার বিড়ালের একটি ক্রস সেলাই তৈরি করুন।"
মাল্টি-টার্ন ইমেজ এডিটিং (চ্যাট)
- উদাহরণ প্রম্পট: [একটি নীল গাড়ির একটি ছবি আপলোড করুন।] "এই গাড়িটিকে একটি রূপান্তরযোগ্য করে দিন।" "এখন রং পরিবর্তন করে হলুদ করুন।"

মিথুনের সাথে ইমেজ এডিটিং

ছবি সম্পাদনা করতে, ইনপুট হিসাবে একটি ছবি যোগ করুন। নিম্নলিখিত উদাহরণ বেস64 এনকোড করা ছবি আপলোড করা দেখায়। একাধিক ছবি এবং বড় পেলোডের জন্য, ইমেজ ইনপুট বিভাগটি পরীক্ষা করুন।

পাইথন

from google import genai
from google.genai import types
from PIL import Image
from io import BytesIO

import PIL.Image

image = PIL.Image.open('/path/to/image.png')

client = genai.Client()

text_input = ('Hi, This is a picture of me.'
            'Can you add a llama next to me?',)

response = client.models.generate_content(
    model="gemini-2.0-flash-exp-image-generation",
    contents=[text_input, image],
    config=types.GenerateContentConfig(
      response_modalities=['TEXT', 'IMAGE']
    )
)

for part in response.candidates[0].content.parts:
  if part.text is not None:
    print(part.text)
  elif part.inline_data is not None:
    image = Image.open(BytesIO(part.inline_data.data))
    image.show()

জাভাস্ক্রিপ্ট

import { GoogleGenAI, Modality } from "@google/genai";
import * as fs from "node:fs";

async function main() {

  const ai = new GoogleGenAI({ apiKey: "GEMINI_API_KEY" });

  // Load the image from the local file system
  const imagePath = "path/to/image.png";
  const imageData = fs.readFileSync(imagePath);
  const base64Image = imageData.toString("base64");

  // Prepare the content parts
  const contents = [
    { text: "Can you add a llama next to the image?" },
    {
      inlineData: {
        mimeType: "image/png",
        data: base64Image,
      },
    },
  ];

  // Set responseModalities to include "Image" so the model can generate an image
  const response = await ai.models.generateContent({
    model: "gemini-2.0-flash-exp-image-generation",
    contents: contents,
    config: {
      responseModalities: [Modality.TEXT, Modality.IMAGE],
    },
  });
  for (const part of response.candidates[0].content.parts) {
    // Based on the part type, either show the text or save the image
    if (part.text) {
      console.log(part.text);
    } else if (part.inlineData) {
      const imageData = part.inlineData.data;
      const buffer = Buffer.from(imageData, "base64");
      fs.writeFileSync("gemini-native-image.png", buffer);
      console.log("Image saved as gemini-native-image.png");
    }
  }
}

main();

বিশ্রাম

IMG_PATH=/path/to/your/image1.jpeg

if [[ "$(base64 --version 2>&1)" = *"FreeBSD"* ]]; then
  B64FLAGS="--input"
else
  B64FLAGS="-w0"
fi

IMG_BASE64=$(base64 "$B64FLAGS" "$IMG_PATH" 2>&1)

curl -X POST \
  "https://generativelanguage.googleapis.com/v1beta/models/gemini-2.0-flash-exp-image-generation:generateContent?key=$GEMINI_API_KEY" \
    -H 'Content-Type: application/json' \
    -d "{
      \"contents\": [{
        \"parts\":[
            {\"text\": \"'Hi, This is a picture of me. Can you add a llama next to me\"},
            {
              \"inline_data\": {
                \"mime_type\":\"image/jpeg\",
                \"data\": \"$IMG_BASE64\"
              }
            }
        ]
      }],
      \"generationConfig\": {\"responseModalities\": [\"TEXT\", \"IMAGE\"]}
    }"  \
  | grep -o '"data": "[^"]*"' \
  | cut -d'"' -f4 \
  | base64 --decode > gemini-edited-image.png

সীমাবদ্ধতা

সেরা পারফরম্যান্সের জন্য, নিম্নলিখিত ভাষাগুলি ব্যবহার করুন: EN, es-MX, ja-JP, zh-CN, hi-IN৷
ইমেজ জেনারেশন অডিও বা ভিডিও ইনপুট সমর্থন করে না।
ইমেজ জেনারেশন সবসময় ট্রিগার নাও হতে পারে:
- মডেল শুধুমাত্র টেক্সট আউটপুট হতে পারে. সুস্পষ্টভাবে ইমেজ আউটপুট জিজ্ঞাসা করার চেষ্টা করুন (যেমন "একটি ছবি তৈরি করুন", "ছবি প্রদান করুন যেমন আপনি যান", "চিত্র আপডেট করুন")।
- মডেলটি আ��শিকভাবে তৈরি করা বন্ধ করতে পারে। আবার চেষ্টা করুন বা একটি ভিন্ন প্রম্পট চেষ্টা করুন.
একটি চিত্রের জন্য পাঠ্য তৈরি করার সময়, আপনি যদি প্রথমে পাঠ্য তৈরি করেন এবং তারপর পাঠ্য সহ একটি চিত্রের জন্য জিজ্ঞাসা করেন তবে মিথুন সবচেয়ে ভাল কাজ করে।

একটি মডেল চয়ন করুন

ছবি তৈরি করতে আপনার কোন মডেল ব্যবহার করা উচিত? এটি আপনার ব্যবহারের ক্ষেত্রে নির্ভর করে।

জেমিনি 2.0 প্রাসঙ্গিকভাবে প্রাসঙ্গিক ছবি তৈরি করতে, টেক্সট + ইমেজ মিশ্রিত করতে, বিশ্ব জ্ঞানকে একত্রিত করতে এবং ছবি সম্পর্কে যুক্তির জন্য সেরা। আপনি দীর্ঘ পাঠ্য অনুক্রমের মধ্যে এমবেড করা সঠিক, প্রাসঙ্গিকভাবে প্রাসঙ্গিক ভিজ্যুয়াল তৈরি করতে এটি ব্যবহার করতে পারেন। আপনি কথোপকথন জুড়ে প্রসঙ্গ বজায় রেখে প্রাকৃতিক ভাষা ব্যবহার করে কথোপকথনমূলকভাবে ছবি সম্পাদনা করতে পারেন।

যদি ছবির গুণমান আপনার শীর্ষ অগ্রাধিকার হয়, তাহলে Imagen 3 একটি ভাল পছন্দ। ইমেজেন 3 ফটোরিয়ালিজম, শৈল্পিক বিশদ এবং ইম্প্রেশনিজম বা অ্যানিমের মতো নির্দিষ্ট শৈল্পিক শৈলীতে পারদর্শী। ইমেজেন 3 পণ্যের ব্যাকগ্রাউন্ড আপডেট করা, ছবি আপস্কেল করা এবং ব্র্যান্ডিং এবং স্টাইলকে ভিজ্যুয়ালে যুক্ত করার মতো বিশেষ চিত্র সম্পাদনা কাজের জন্য একটি ভাল পছন্দ। আপনি লোগো বা অন্যান্য ব্র্যান্ডেড পণ্য ডিজাইন তৈরি করতে Imagen 3 ব্যবহার করতে পারেন।

Imagen 3 ব্যবহার করে ছবি তৈরি করুন

Gemini API, Google-এর সর্বোচ্চ মানের টেক্সট-টু-ইমেজ মডেল, Imagen 3 -তে অ্যাক্সেস প্রদান করে, যেখানে বেশ কিছু নতুন এবং উন্নত ক্ষমতা রয়েছে। চিত্র 3 নিম্নলিখিত কাজ করতে পারে:

পূর্ববর্তী মডেলগুলির তুলনায় আরও ভাল বিশদ, সমৃদ্ধ আলো এবং কম বিভ্রান্তিকর শিল্পকর্ম সহ চিত্রগুলি তৈরি করুন
��্বাভাবিক ভাষায় লেখা প্রম্পটগুলি বুঝুন
বিস্তৃত বিন্যাস এবং শৈলীতে ছবি তৈরি করুন
পূর্ববর্তী মডেলের তুলনায় আরো কার্যকরভাবে পাঠ্য রেন্ডার করুন

পাইথন

from google import genai
from google.genai import types
from PIL import Image
from io import BytesIO

client = genai.Client(api_key='GEMINI_API_KEY')

response = client.models.generate_images(
    model='imagen-3.0-generate-002',
    prompt='Robot holding a red skateboard',
    config=types.GenerateImagesConfig(
        number_of_images= 4,
    )
)
for generated_image in response.generated_images:
  image = Image.open(BytesIO(generated_image.image.image_bytes))
  image.show()

জাভাস্ক্রিপ্ট

import { GoogleGenAI } from "@google/genai";
import * as fs from "node:fs";

async function main() {

  const ai = new GoogleGenAI({ apiKey: "GEMINI_API_KEY" });

  const response = await ai.models.generateImages({
    model: 'imagen-3.0-generate-002',
    prompt: 'Robot holding a red skateboard',
    config: {
      numberOfImages: 4,
    },
  });

  let idx = 1;
  for (const generatedImage of response.generatedImages) {
    let imgBytes = generatedImage.image.imageBytes;
    const buffer = Buffer.from(imgBytes, "base64");
    fs.writeFileSync(`imagen-${idx}.png`, buffer);
    idx++;
  }
}

main();

বিশ্রাম

curl -X POST \
    "https://generativelanguage.googleapis.com/v1beta/models/imagen-3.0-generate-002:predict?key=GEMINI_API_KEY" \
    -H "Content-Type: application/json" \
    -d '{
        "instances": [
          {
            "prompt": "Robot holding a red skateboard"
          }
        ],
        "parameters": {
          "sampleCount": 4
        }
      }'

রান্নাঘরে দুটি অস্পষ্ট খরগোশের AI-উত্পন্ন চিত্র

Imagen এই সময়ে শুধুমাত্র ইংরেজি প্রম্পট এবং নিম্নলিখিত প্যারামিটার সমর্থন করে:

ইমেজ মডেল পরামিতি

(প্রোগ্রামিং ভাষা অনুসারে নামকরণের নিয়মগুলি পরিবর্তিত হয়।)

numberOfImages : 1 থেকে 4 (অন্তর্ভুক্ত) পর্যন্ত তৈরি করা ছবির সংখ্যা। ডিফল্ট হল 4।
aspectRatio : উত্পন্ন চিত্রের অনুপাত পরিবর্তন করে। সমর্থিত মানগুলি হল "1:1" , "3:4" , "4:3" , "9:16" , এবং "16:9" ডিফল্ট হল "1:1" ।
personGeneration : মডেলটিকে মানুষের ছবি তৈরি করার অনুমতি দিন। নিম্নলিখিত মানগুলি সমর্থিত:
- "DONT_ALLOW" : মানুষের ছবি তৈরি করা ব্লক করুন।
- "ALLOW_ADULT" : প্রাপ্তবয়স্কদের ছবি তৈরি করুন, কিন্তু শিশুদের নয়৷ এটি ডিফল্ট।

ইমেজ প্রম্পট গাইড

ইমেজেন গাইডের এই বিভাগটি আপনাকে দেখায় কিভাবে একটি টেক্সট-টু-ইমেজ প্রম্পট পরিবর্তন করলে বিভিন্ন ফলাফল পাওয়া যায়, সাথে আপনি যে ছবিগুলি তৈরি করতে পারেন তার উদাহরণ সহ।

প্রম্পট লেখার মৌলিক বিষয়

একটি ভাল প্রম্পট বর্ণনামূলক এবং স্পষ্ট, এবং অর্থপূর্ণ কীওয়ার্ড এবং মডিফায়ার ব্যবহার করে। আপনার বিষয় , প্রসঙ্গ এবং শৈলী ��িন্তা করে শুরু করুন।

বিষয়, প্রসঙ্গ এবং শৈলী জোর দিয়ে প্রম্পট করুন — চিত্র পাঠ্য: একটি *আধুনিক অ্যাপার্টমেন্ট বিল্ডিংয়ের* একটি *স্কেচ* ( **শৈলী** ) ( **বিষয়** ) *আকাশচুম্বী* ( **প্রসঙ্গ এবং পটভূমি** ) দ্বারা বেষ্টিত।

বিষয় : যেকোনো ��্র��্��ট�� থে প্রথমে যে বিষয়টি নিয়ে ভাবতে হবে তা হল বিষয় : যে বস্তু, ব্যক্তি, প্রাণী বা দৃশ্যের আপনি একটি চিত্র চান।
প্রসঙ্গ এবং পটভূমি: বিষয়টি যে পটভূমি বা প্রেক্ষাপটে রাখা হবে তা যেমন গুরুত্বপূর্ণ। আপনার ব��ষয়কে বিভিন্ন পটভূমিতে রাখার চেষ্টা করুন। উদাহরণস্বরূপ, একটি সাদা ব্যাকগ্রাউন্ড সহ একটি স্টুডিও, বাইরে বা অন্দর পরিবেশ।
শৈলী: অবশেষে, আপনি চান ইমেজ শৈলী যোগ করুন. শৈলী সাধারণ (পেইন্টিং, ফটোগ্রাফ, স্কেচ) বা খুব নির্দিষ্ট (পেস্টেল পেইন্টিং, চারকোল অঙ্কন, আইসোমেট্রিক 3D) হতে পারে। আপনি শৈলী একত্রিত করতে পারেন.

আপনি আপনার প্রম্পটের একটি প্রথম সংস্করণ লেখার পরে, আপনি যে ছবিটি চান তা না পাওয়া পর্যন্ত আরও বিশদ যোগ করে আপনার প্রম্পটটি পরিমার্জন করুন। পুনরাবৃত্তি গুরুত্বপূর্ণ। আপনার মূল ধারণাটি প্রতিষ্ঠা করে শুরু করুন, এবং তারপর সেই মূল ধারণাটিকে পরিমার্জন করুন এবং প্রসারিত করুন যতক্ষণ না উত্পন্ন চিত্রটি আপনার দৃষ্টির কাছাকাছি হয়।

ফটোরিয়ালিস্টিক নমুনা ইমেজ 1 — প্রম্পট: একটি হ্রদের পাশে বসন্তে একটি পার্ক

ফটোরিয়ালিস্টিক নমুনা চিত্র 2 — প্রম্পট: একটি হ্রদের পাশে বসন্তে একটি পার্ক, **হ্রদ জুড়ে সূর্য অস্ত যায়, সোনালী সময়**

ফটোরিয়ালিস্টিক নমুনা চিত্র 3 — প্রম্পট: একটি হ্রদের পাশে বসন্তে একটি পার্ক, **হ্রদ জুড়ে সূর্য অস্ত যায়, সোনালি ঘন্টা, লাল বন্য ফুল**

ইমেজেন 3 আপনার ধারণাগুলিকে বিশদ চিত্রগুলিতে রূপান্তর করতে পারে, আপনার প্রম্পটগুলি সংক্ষিপ্ত বা দীর্ঘ এবং বিস্তারিত হোক না কেন। আপনি নিখুঁত ফলাফল অর্জন না করা পর্যন্ত বিশদ যোগ করে, পুনরাবৃত্তিমূলক প্রম্পটিংয়ের মাধ্যমে আপনার দৃষ্টি��ে পরিমার্জন করুন।

সংক্ষিপ্ত প্রম্পট আপনাকে দ্রুত একটি ছবি তৈরি করতে দেয়।

চিত্র 3 সংক্ষিপ্ত প্রম্পট উদাহরণ — প্রম্পট: 20 বছর বয়সী একজন মহিলার ক্লোজ-আপ ফটো, রাস্তার ফটোগ্রাফি, সিনেমা স্টিল, নিঃশব্দ কমলা উষ্ণ টোন

দীর্ঘ প্রম্পট আপনাকে নির্দিষ্ট বিবরণ যোগ করতে এবং আপনার চিত্র তৈরি করতে দেয়।

ইমেজ 3 দীর্ঘ প্রম্পট উদাহরণ — প্রম্পট: রাস্তার ফটোগ্রাফি শৈলী ব্যবহার করে 20 বছর বয়সী একজন মহিলার মনোমুগ্ধকর ছবি। ছবিটি নিঃশব্দ কমলা উষ্ণ টোন সহ একটি চলচ্চিত্রের মতো দেখতে হবে।

ইমেজেন প্রম্পট লেখার জন্য অতিরিক্ত পরামর্শ:

বর্ণনামূলক ভাষা ব্যবহার করুন : চিত্র 3-এর জন্য একটি পরিষ্কার ছবি আঁকার জন্য বিস্তারিত বিশেষণ এবং ক্রিয়াবিশেষণ ব্যবহার করুন।
প্রসঙ্গ প্রদান করুন : যদি প্রয়োজন হয়, AI এর বোঝার জন্য পটভূমির তথ্য অন্তর্ভুক্ত করুন।
নির্দিষ্ট শিল্পী বা শৈলী উল্লেখ করুন : আপনার মনে যদি একটি বিশেষ নান্দনিকতা থাকে, তবে নির্দিষ্ট শিল্পী বা শিল্প আন্দোলনের উল্লেখ করা সহায়ক হতে পারে।
প্রম্পট ইঞ্জিনিয়ারিং টুল ব্যবহার করুন : আপনার প্রম্পটগুলিকে পরিমার্জিত করতে এবং সর্বোত্তম ফলাফল অর্জনে সহায়তা করার জন্য প্রম্পট ইঞ্জিনিয়ারিং সরঞ্জাম বা সংস্থানগুলি অন্বেষণ করার কথা বিবেচনা করুন।
আপনার ব্যক্তিগত এবং গোষ্ঠী চিত্রগুলিতে মুখের বিবরণ উন্নত করা :
- ছবির ফোকাস হিসাবে মুখের বিবরণ নির্দিষ্ট করুন (উদাহরণস্বরূপ, প্রম্পটে "পোর্ট্রেট" শব্দটি ব্যবহার করুন)।

ছবিতে টেক্সট তৈরি করুন

ইমেজেন ইমেজে টেক্সট যোগ করতে পারে, আরও সৃজনশীল ইমেজ তৈরির সম্ভাবনা উন্মুক্ত করে। এই বৈশিষ্ট্য থেকে সর্বাধিক পেতে নিম্নলিখিত নির্দেশিকা ব্যবহার করুন:

আত্মবিশ্বাসের সাথে পুনরাবৃত্তি করুন : আপনি যে চেহারাটি চান তা অর্জন না করা পর্যন্ত আপনাকে চিত্রগুলি পুনরায় তৈরি করতে হতে পারে। ইমেজেনের পাঠ্য সংহতকরণ এখনও বিকশিত হচ্ছে, এবং কখনও কখনও একাধিক প্রচেষ্টা সর্বোত্তম ফলাফল দেয়।
এটি সংক্ষিপ্ত রাখুন : সর্বোত্তম প্রজন্মের জন্য পাঠ্যকে 25 অক্ষর বা তার কম সীমাবদ্ধ করুন।
একাধিক বাক্যাংশ : অতিরিক্ত তথ্য প্রদানের জন্য দুই বা তিনটি স্বতন্ত্র বাক্যাংশ নিয়ে পরীক্ষা করুন। ক্লিনার কম্পোজিশনের জন্য তিনটি বাক্যাংশ অতিক্রম করা এড়িয়ে চলুন।
প্রম্পট: শিরোনাম হিসাবে গাঢ় হরফে "সামারল্যান্ড" লেখা সহ একটি পোস্টার, এই টেক্সটের নীচে স্লোগান রয়েছে "গ্রীষ্মকাল এত ভাল লাগত না"
গাইড প্লেসমেন্ট : ইমেজেন পাঠ্যকে নির্দেশিতভাবে অবস্থান করার চেষ্টা করতে পারে, মাঝে মাঝে বৈচিত্র আশা করে। এই বৈশিষ্ট্যটি ক্রমাগত উন্নত হচ্ছে।
অনুপ্রাণিত ফন্ট শৈলী : ইমেজেনের পছন্দগুলিকে সূক্ষ্মভাবে প্রভাবিত করতে একটি সাধারণ ফন্ট শৈলী নির্দিষ্ট করুন। সুনির্দিষ্ট ফন্ট প্রতিলিপির উপর নির্ভর করবেন না, তবে সৃজনশীল ব্যাখ্যা আশা করুন।
ফন্ট সাইজ : ফন্ট সাইজ জেনারেশনকে প্রভাবিত করতে একটি ফন্ট সাইজ বা আকারের একটি সাধারণ ইঙ্গিত (উদাহরণস্বরূপ, ছোট , মাঝারি , বড় ) নির্দিষ্ট করুন।

প্রম্পট প্যারামিটারাইজেশন

আউটপুট ফলাফলগুলিকে আরও ভালভাবে নিয়ন্ত্রণ করতে, আপনি ইমেজেনে ইনপুটগুলিকে প্যারামিটারাইজ করা সহায়ক বলে মনে করতে পারেন। উদাহরণস্বরূপ, ধরুন আপনি চান আপনার গ্রাহকরা তাদের ব্যবসার জন্য লোগো তৈরি করতে সক্ষম হোক এবং আপনি নিশ্চিত করতে চান যে লোগোগুলি সবসময় একটি কঠিন রঙের পটভূমিতে তৈরি হয়। আপনি ক্লায়েন্ট একটি মেনু থেকে নির্বাচন করতে পারেন যে বিকল্প সীমিত করতে চান.

এই উদাহরণে, আপনি নিম্নলিখিতগুলির মতো একটি প্যারামিটারাইজড প্রম্পট তৈরি করতে পারেন:

A {logo_style} logo for a {company_area} company on a solid color background. Include the text {company_name}.

আপনার কাস্টম ইউজার ইন্টারফেসে, গ্রাহক একটি মেনু ব্যবহার করে পরামিতিগুলি ইনপুট করতে পারে এবং তাদের নির্বাচিত মানটি ইমেজেন প্রাপ্ত প্রম্পটটিকে পূরণ করে।

যেমন:

প্রম্পট: A minimalist logo for a health care company on a solid color background. Include the text Journey .
প্রম্পট: A modern logo for a software company on a solid color background. Include the text Silo .
প্রম্পট: A traditional logo for a baking company on a solid color background. Include the text Seed .

উন্নত প্রম্পট লেখার কৌশল

ফটোগ্রাফি বর্ণনাকারী, আকার এবং উপকরণ, ঐতিহাসিক শিল্প আন্দোলন এবং চিত্রের গুণমান পরিবর্তনকারীর মতো বৈশিষ্ট্যগুলির উপর ভিত্তি করে আরও নির্দিষ্ট প্রম্পট তৈরি করতে নিম্নলিখিত উদাহরণগুলি ব্যবহার করুন।

ফটোগ্রাফি

প্রম্পটে অন্তর্ভুক্ত রয়েছে: "এর একটি ফটো..."

এই স্টাইলটি ব্যবহার করতে, কীওয়ার্ড ব্যবহার করে শুরু করুন যা স্পষ্টভাবে ইমেজেনকে বলে যে আপনি একটি ফটোগ্রাফ খুঁজছেন। "এর একটি ফটো..." দিয়ে আপনার প্রম্পট শুরু করুন। . যেমন:

^{ইমেজ সোর্স: প্রতিটি ইমেজ ইমেজেন 3 মডেলের সাথে সংশ্লিষ্ট টেক্সট প্রম্পট ব্যবহার করে তৈরি করা হয়েছে।}

ফটোগ্রাফি মডিফায়ার

��িম্নলিখিত উদাহরণগুলিতে, আপনি বেশ কয়েকটি ফটোগ্রাফি-নির্দিষ্ট পরিবর্তনকারী এবং পরামিতি দেখতে পারেন। আপনি আরও সুনির্দিষ্ট নিয়ন্ত্রণের জন্য একাধিক সংশোধক একত্রিত করতে পারেন।

ক্যামেরা প্রক্সিমিটি - ক্লোজ আপ, অনেক দূর থেকে নেওয়া

ক্যামেরার নমুনা ছবি বন্ধ করুন — প্রম্পট: কফি বিনের একটি **ক্লোজ-আপ** ফটো

জুম আউট ক্যামেরা নমুনা ছবি — প্রম্পট: একটি ছোট ব্যাগের একটি **জুম আউট** ফটো
একটি অগোছালো রান্নাঘরে কফি বিন

ক্যামেরা অবস্থান - বায়বীয়, নীচে থেকে

বায়বীয় ছবির নমুনা চিত্র — প্রম্পট: আকাশচুম্বী ভবন সহ শহুরে শহরের **বায়বীয় ছবি**

নমুনা চিত্রের নীচে থেকে একটি দৃশ্য — প্রম্পট: **নীচে থেকে** নীল আকাশের সাথে বনের ছাউনির একটি ছবি

আলো - প্রাকৃতিক, নাটকীয়, উষ্ণ, ঠান্ডা

প্রাকৃতিক আলোর নমুনা চিত্র — প্রম্পট: একটি আধুনিক আর্ম চেয়ারের স্টুডিও ফটো, **প্রাকৃতিক আলো**

নাটকীয় আলো নমুনা ইমেজ — প্রম্পট: একটি আধুনিক আর্ম চেয়ারের স্টুডিও ফটো, **নাটকীয় আলো**

ক্যামেরা সেটিংস - মোশন ব্লার, সফট ফোকাস, বোকেহ, পোর্ট্রেট

মোশন ব্লার নমুনা ইমেজ — প্রম্পট: **মোশন ব্লার** সহ একটি গাড়ির ভিতর থেকে আকাশচুম্বী অট্টালিকা সহ একটি শহরের ছবি৷

নরম ফোকাস নমুনা ইমেজ — প্রম্পট: রাতে একটি শহুরে শহরে একটি সেতুর **নরম ফোকাস** ফটোগ্রাফ

লেন্সের ধরন - 35 মিমি, 50 মিমি, ফিশআই, ওয়াইড অ্যাঙ্গেল, ম্যাক্রো

ম্যাক্রো লেন্সের নমুনা চিত্র — প্রম্পট: একটি পাতার ছবি, **ম্যাক্রো লেন্স**

��িশআই লেন্সের নমুনা চিত্র — প্রম্পট: রাস্তার ফটোগ্রাফি, নিউ ইয়র্ক সিটি, **ফিশয়ে লেন্স**

চলচ্চিত্রের ধরন - কালো এবং সাদা, পোলারয়েড

পোলারয়েড ছবির নমুনা ইমেজ — প্রম্পট: সানগ্লাস পরা একটি কুকুরের **পোলারয়েড প্রতিকৃতি**

কালো এবং সাদা ছবির নমুনা ইমেজ — প্রম্পট: সানগ্লাস পরা কুকুরের **কালো এবং সাদা ছবি**

ইলাস্ট্রেশন এবং শিল্প

প্রম্পটের মধ্যে রয়েছে: "একটি painting এর..." , "একটি sketch ..."

শিল্প শৈলী একরঙা শৈলী যেমন পেন্সিল স্কেচ থেকে হাইপার-রিয়ালিস্টিক ডিজিটাল শিল্পে পরিবর্তিত হয়। উদাহরণস্বরূপ, নিম্নলিখিত চিত্রগুলি বিভিন্ন শৈলীর সাথে একই প্রম্পট ব্যবহার করে:

"ব্যাকগ্রাউন্ডে আকাশচুম্বী অট্টালিকা সহ একটি কৌণিক স্পোর্টি বৈদ্যুতিক সেডানের একটি [art style or creation technique] "

শিল্প নমুনা ইমেজ — প্রম্পট: একটি কৌণিক এর একটি **প্রযুক্তিগত পেন্সিল অঙ্কন** ...

^{ইমেজ সোর্স: প্রতিটি ইমেজ ইমেজেন 2 মডেলের সাথে সংশ্লিষ্ট টেক্সট প্রম্পট ব্যবহার করে তৈরি করা হয়েছে।}

আকার এবং উপকরণ

প্রম্পটের মধ্যে রয়েছে: "...এর তৈরি..." , "...এর আকারে..."

এই প্রযুক্তির একটি শক্তি হল আপনি এমন চিত্র তৈরি করতে পারেন যা অন্যথায় কঠিন বা অসম্ভব। উদাহরণস্বরূপ, আপনি বিভিন্ন উপকরণ এবং টেক্সচারে আপনার কোম্পানির লোগো পুনরায় তৈরি করতে পারেন।

আকার এবং উপকরণ উদাহরণ চিত্র 1 — প্রম্পট: পনির **দিয়ে তৈরি** একটি ডাফল ব্যাগ

আকার এবং উপকরণ উদাহরণ চিত্র 2 — প্রম্পট: পাখির **আকারে** নিয়ন টিউব

আকার এবং উপকরণ উদাহরণ চিত্র 3 — প্রম্পট: **কাগজের তৈরি** একটি আর্মচেয়ার, স্টুডিও ফটো, অরিগামি শৈলী

ঐতিহাসিক শিল্পের উল্লেখ

প্রম্পটে অন্তর্ভুক্ত: "...এর শৈলীতে..."

কয়েক বছর ধরে কিছু শৈলী আইকনিক হয়ে উঠেছে। নিচে ঐতিহাসিক পেইন্টিং বা শিল্প শৈলীর ক��ছু ধারণা রয়েছে যা আপনি চেষ্টা করতে পারেন।

" [art period or movement] এর শৈলীতে একটি চিত্র তৈরি করুন: একটি বায়ু খামার"

ইম্প্রেশনিজম উদাহরণ ইমেজ — প্রম্পট: *একটি ইম্প্রেশনিস্ট পেইন্টিংয়ের* শৈলীতে একটি চিত্র তৈরি করুন: একটি বায়ু খামার৷

রেনেসাঁ উদাহরণ চিত্র — প্রম্পট: *একটি রেনেসাঁ পেইন্টিংয়ের* শৈলীতে একটি চিত্র তৈরি করুন: একটি বায়ু খামার৷

পপ শিল্প উদাহরণ ইমেজ — প্রম্পট: *পপ শিল্পের* শৈলীতে একটি চিত্র তৈরি করুন: একটি বায়ু খামার৷

ছবির গুণমান সংশোধক

কিছু কীওয়ার্ড মডেলকে জানাতে পারে যে আপনি একটি উচ্চ-মানের সম্পদ খুঁজছেন। গুণমান সংশোধকগুলির উদাহরণগুলির মধ্যে নিম্নলিখিতগুলি অন্তর্ভুক্ত রয়েছে:

সাধারণ সংশোধক - উচ্চ-মানের, সুন্দর, শৈলীযুক্ত
ফটো - 4K, HDR, স্টুডিও ফটো
আর্ট, ইলাস্ট্রেশন - একজন পেশাদার দ্বারা, বিস্তারিত

নিম্নে গুণমান সংশোধক ছাড়া প্রম্পটের কয়েকটি উদাহরণ এবং গুণগত পরিবর্তনকারীর সাথে একই প্রম্পট রয়েছে।

মডিফায়ার ছাড়া ভুট্টা উদাহরণ ইমেজ — প্রম্পট (কোন মানের সংশোধক নেই): একটি ভুট্টার ডাঁটার ছবি

মডিফায়ার সহ ভুট্টা উদাহরণ চিত্র — প্রম্পট (মানের সংশোধক সহ): **4k HDR সুন্দর**
একটি ভুট্টা ডালপালা ছবি একটি দ্বারা তোলা
পেশাদার ফটোগ্রাফার

আকৃতির অনুপাত

Imagen 3 ইমেজ জেনারেশন আপনাকে পাঁচটি স্বতন্ত্র ইমেজ অ্যাসপেক্ট রেশিও সেট করতে দেয়।

স্কোয়ার (1:1, ডিফল্ট) - একটি আদর্শ বর্গাকার ছবি। এই আকৃতির অনুপাতের সাধারণ ব্যবহারগুলির মধ্যে রয়েছে সোশ্যাল মিডিয়া পোস্ট।

ফুলস্ক্রিন (4:3) - এই আকৃতির অনুপাতটি সাধারণত মিডিয়া বা ফিল্মে ব্যবহৃত হয়। এটি বেশিরভাগ পুরানো (নন-ওয়াইডস্ক্রিন) টিভি এবং মাঝারি ফর্ম্যাট ক্যামেরাগুলির মাত্রাও। এটি অনুভূমিকভাবে আরও দৃশ্য ক্যাপচার করে (1:1 এর তুলনায়), এটি ফটোগ্রাফির জন্য একটি পছন্দের আকৃতির অনুপাত তৈরি করে।

আকৃতির অনুপাত উদাহরণ — প্রম্পট: পিয়ানো বাজানো একজন মিউজিশিয়ানের আঙ্গুলের ক্লোজ আপ, ব্ল্যাক অ্যান্ড হোয়াইট ফিল্ম, ভিনটেজ (4:3 আকৃতির অনুপাত)

পোর্ট্রেট পূর্ণ স্ক্রীন (3:4) - এটি হল পূর্ণস্ক্রীন আকৃতির অনুপাত 90 ডিগ্রি ঘোরানো। এটি 1:1 আকৃতির অনুপাতের তুলনায় উল্লম্বভাবে আরও দৃশ্য ক্যাপচার করতে দেয়।

ওয়াইডস্ক্রিন (16:9) - এই অনুপাতটি 4:3 প্রতিস্থাপিত হয়েছে এবং এটি এখন টিভি, মনিটর এবং মোবাইল ফোনের পর্দার (ল্যান্ডস্কেপ) জন্য সবচেয়ে সাধারণ অনুপাত। আপনি যখন আরও পটভূমি (উদাহরণস্বরূপ, প্রাকৃতিক দৃশ্য) ক্যাপচার করতে চান তখন এই আকৃতির অনুপাতটি ব্যবহার করুন।
প্রম্পট: সমস্ত সাদা পোশাক পরা একজন মানুষ সমুদ্র সৈকতে বসে আছে, ক্লোজ আপ, গোল্ডেন আওয়ার লাইটিং (16:9 আকৃতির অনুপাত)
পোর্ট্রেট (9:16) - এই অনুপাতটি ওয়াইডস্ক্রিন তবে ঘোরানো। এটি এক��ি অপেক্ষাকৃত নতুন আকৃতির অনুপাত যা শর্ট ফর্ম ভিডিও অ্যাপ (উদাহরণস্বরূপ, YouTube শর্টস) দ্বারা জনপ্রিয় হয়েছে। দালান, গাছ, জলপ্রপাত বা অন্যান্য অনুরূপ বস্তুর মতো শক্তিশালী উল্লম্ব অভিযোজন সহ লম্বা বস্তুর জন্য এটি ব্যবহার করুন।
প্রম্পট: পটভূমিতে একটি সুন্দর সূর্যাস্ত সহ একটি বিশাল আকাশচুম্বী, আধুনিক, গ্র্যান্ড, মহাকাব্যের একটি ডিজিটাল রেন্ডার (9:16 আকৃতির অনুপাত)

ফটোরিয়ালিস্টিক ছবি

ইমেজ জেনারেশন মডেলের বিভিন্ন ভার্সন শৈল্পিক এবং ফটোরিয়ালিস্টিক আউটপুটের মিশ্রণ দিতে পারে। আপনি যে বিষয় তৈরি করতে চান তার উপর ভিত্তি করে আরও ফটোরিয়ালিস্টিক আউটপুট তৈরি করতে প্রম্পটে নিম্নলিখিত শব্দ ব্যবহার করুন।

কেস ব্যবহার করুন	লেন্সের ধরন	ফোকাল লেন্থ	অতিরিক্ত বিবরণ
মানুষ (প্রতিকৃতি)	প্রাইম, জুম	24-35 মিমি	ব্ল্যাক অ্যান্ড হোয়াইট ফিল্ম, ফিল্ম নোয়ার, ডেপথ অফ ফিল্ড, ডুওটোন (দুটি রঙ উল্লেখ করুন)
খাদ্য, পোকামাকড়, গাছপালা (বস্তু, স্থির জীবন)	ম্যাক্রো	60-105 মিমি	উচ্চ বিশদ, সুনির্দিষ্ট ফোকাসিং, নিয়ন্ত্রিত আলো
খেলাধুলা, বন্যপ্রাণী (গতি)	টেলিফটো জুম	100-400 মিমি	দ্রুত শাটার গতি, অ্যাকশন বা আন্দোলন ট্র্যাকিং
জ্যোতির্বিদ্যা, ল্যান্ডস্কেপ (ওয়াইড-এঙ্গেল)	ওয়াইড-এঙ্গেল	10-24 মিমি	দীর্ঘ এক্সপোজার সময়, তীক্ষ্ণ ফোকাস, দীর্ঘ এক্সপোজার, মসৃণ জল বা মেঘ

প্রতিকৃতি

কেস ব্যবহার করুন	লেন্সের ধরন	ফোকাল লেন্থ	অতিরিক্ত বিবরণ
মানুষ (প্রতিকৃতি)	প্রাইম, জুম	24-35 মিমি	ব্ল্যাক অ্যান্ড হোয়াইট ফিল্ম, ফিল্ম নোয়ার, ডেপথ অফ ফিল্ড, ডুওটোন (দুটি রঙ উল্লেখ করুন)

টেবিল থে��ে বিভিন্ন কীওয়ার্ড ব্যবহার করে, Imagen নিম্নলিখিত প্রতিকৃতি তৈরি করতে পারে:

প্রম��পট: একজন মহিলা, 35 মিমি প্রতিকৃতি, নীল এবং ধূসর ডুটোন
মডেল: imagen-3.0-generate-002

প্রম্পট: একজন মহিলা, 35 মিমি প্রতিকৃতি, ফিল্ম নয়ার
মডেল: imagen-3.0-generate-002

বস্তু

কেস ব্যবহার করুন	লেন্সের ধরন	ফোকাল লেন্থ	অতিরিক্ত বিবরণ
খাদ্য, পোকামাকড়, গাছপালা (বস্তু, স্থির জীবন)	ম্যাক্রো	60-105 মিমি	উচ্চ বিশদ, সুনির্দিষ্ট ফোকাসিং, নিয়ন্ত্রিত আলো

টেবিল থেকে বেশ কিছু কীওয়ার্ড ব্যবহার করে, Imagen নিম্নলিখিত অবজেক্ট ইমেজ তৈরি করতে পারে:

প্রম্পট: একটি প্রার্থনা গাছের পাতা, ম্যাক্রো লেন্��, 60 ��ম��
মডেল: imagen-3.0-generate-002

প্রম্পট: পাস্তার একটি প্লেট, 100 মিমি ম্যাক্রো লেন্স
মডেল: imagen-3.0-generate-002

গতি

কেস ব্যবহার করুন	লেন্সের ধরন	ফোকাল লেন্থ	অতিরিক্ত বিবরণ
খেলাধুলা, বন্যপ্রাণী (গতি)	টেলিফটো জুম	100-400 মিমি	দ্রুত শাটার গতি, অ্যাকশন বা আন্দোলন ট্র্যাকিং

টেবিল থেকে বেশ কিছু কীওয়ার্ড ব্যবহার করে, Imagen নিম্নলিখিত গতির চিত্র তৈরি করতে পারে:

প্রম্পট: একটি বিজয়ী টাচডাউন, দ্রুত শাটার গতি, আন্দোলন ট্র্যাকিং
মডেল: imagen-3.0-generate-002

প্রম্পট: বনে ছুটে চলা একটি হরিণ, দ্রুত শাটার গতি, চলাচল ট্র্যাকিং
মডেল: imagen-3.0-generate-002

ওয়াইড-এঙ্গেল

কেস ব্যবহার করুন	লেন্সের ধরন	ফোকাল লেন্থ	অতিরিক্ত বিবরণ
জ্যোতির্বিদ্যা, ল্যান্ডস্কেপ (ওয়াইড-এঙ্গেল)	ওয়াইড-এঙ্গেল	10-24 মিমি	দীর্ঘ এক্সপোজার সময়, তীক্ষ্ণ ফোকাস, দীর্ঘ এক্সপোজার, মসৃণ জল বা মেঘ

টেবিল থেকে বেশ কিছু কীওয়ার্ড ব্যবহার করে, Imagen নিম্নলিখিত ওয়াইড-এঙ্গেল ইমেজ তৈরি করতে পারে:

প্রম্পট: একটি বিস্তৃত পর্বতশ্রেণী, ল্যান্ডস্কেপ প্রশস্ত কোণ 10 মিমি
মডেল: imagen-3.0-generate-002

প্রম্পট: চাঁদের একটি ছবি, অ্যাস্ট্রো ফটোগ্রাফি, ওয়াইড অ্যাঙ্গেল 10 মিমি
মডেল: imagen-3.0-generate-002

এরপর কি

কিভাবে Gemini API দিয়ে ভিডিও তৈরি করতে হয় তা জানতে Veo গাইডটি দেখুন।
জেমিনি 2.0 মডেল সম্পর্কে আরও জানতে, জেমিনি মডেল এবং পরীক্ষামূলক মডেলগুলি দেখুন।