
বুধবার, গুগল তার Vertex AI ক্লাউড প্ল্যাটফর্মে কয়েকটি প্রথম-পার্টি মিডিয়া-জেনারেটিং এআই মডেলের আপডেট প্রকাশ করেছে।গুগলের টেক্সট-টু-মিউজিক মডেল Lyria এখন নির্বাচিত গ্রাহকদের জন্য প্রিভিউ হিসেবে উপলব্ধ। এছাড়া, গুগলের ভিডিও ক্রিয়েশন মডেল Veo 2 নতুন সম্পাদনা এবং ভিজ্যুয়াল এফেক্ট কাস্টমাইজেশন অপশনের সঙ্গে উন্নত হয়েছে। গুগল একটি নতুন ভয়েস-ক্লোনিং ফিচারও চালু করেছে, যা Chirp 3 নামে পরিচিত, এবং এটি “অ্যালাউড-লিস্টেড” ব্যবহারকারীদের জন্য উপলব্ধ। এছাড়া, গুগলের Imagen 3 ইমেজ জেনারেটর এখন আরও উন্নত পারফরমেন্স প্রদান করছে।এই আপডেটগুলো Cloud Next ইভেন্টের সময় প্রকাশিত হয়েছে, যা গুগলের এন্টারপ্রাইজ মার্কেটে জেনারেটিভ এআই নিয়ন্ত্রণ করার নতুন প্রচেষ্টা। গুগল এখন সবচেয়ে সরাসরি প্রতিদ্বন্দ্বিতা করছে অ্যামাজনের সঙ্গে, যেটি তার নিজস্ব এআই মডেলগুলির মাধ্যমে বেডরক নামে একটি ক্লাউড প্ল্যাটফর্ম অফার করে।গুগল লিরিয়াকে রয়ালটি–ফ্রি মিউজিক লাইব্রেরির বিকল্প হিসেবে প্রস্তাব করছে। এই মডেলটি ব্যবহার করে গ্রাহকরা বিভিন্ন স্টাইল এবং ঘরানার গান তৈরি করতে পারবেন, যেমন জ্যাজি পিয়ানো সলো বা লো-ফাই ট্র্যাকস।চির্প ৩ প্রায় ৩৫টি ভাষায় বক্তৃতা সিন্থেসাইজ করতে পারে। এটি আগে প্রিভিউ হিসেবে উন্মুক্ত করা হয়েছিল এবং এখন এটি সাধারণত উপলব্ধ। এটি ইনস্ট্যান্ট কাস্টম ভয়েস চালিত করে, যা ১০ সেকেন্ড অডিওর মাধ্যমে একটি ভয়েস ক্লোন করতে সক্ষম। এছাড়া, নতুন একটি টুলও চালু হয়েছে, ট্রান্সক্রিপশন উইথ ডায়ারাইজেশন, যা একাধিক অংশগ্রহণকারীসহ রেকর্ডিং থেকে বক্তাদের আলাদা এবং শনাক্ত করতে সক্ষম।ভিও ২ এখন ভিডিও থেকে ব্যাকগ্রাউন্ড ইমেজ, লোগো এবং অবজেক্ট মুছে ফেলতে পারে, এবং ভিডিও ফুটেজের ফ্রেম সম্প্রসারণ করতে পারে (যেমন, ল্যান্ডস্কেপ ভিডিওকে পোর্ট্রেটের রূপান্তর করা)। এটি এখন ক্যামেরা কোণ এবং পেসিংও সামঞ্জস্য করতে পারে, AI-জেনারেটেড দৃশ্যে টাইম ল্যাপস, ড্রোন-স্টাইল ক্লিপস এবং আরও অনেক কিছু তৈরি করতে পারে।এছাড়া, ইমেজেন ৩ আপগ্রেডে ইমেজের নষ্ট বা অনুপস্থিত অংশ পুনরুদ্ধারের ক্ষমতা উন্নত হয়েছে।ইমেজেন, ভিও, এবং লিরিয়া দ্বারা জেনারেট করা সব মিডিয়া গুগলের SynthID প্রযুক্তি দিয়ে ওয়াটারমার্ক করা হয় (কিন্তু চির্পের ক্ষেত্রে নয়)। গুগল দাবি করেছে যে, তাদের সব জেনারেটিভ এআই মডেলের মধ্যে সুরক্ষা ব্যবস্থা রয়েছে, যাতে ক্ষতিকর কনটেন্ট তৈরি প্রতিরোধ করা যায়।গুগল অতীতে কখনও তার মডেলগুলোকে ট্রেন করার জন্য ব্যবহৃত নির্দিষ্ট ডেটা প্রকাশ করেনি, এবং এই প্রবণতা তারা আজও বজায় রেখেছে। ট্রেনিং ডেটা সাধারণত আইপি সম্পর্কিত কারণে বিতর্কিত হয়। কিছু প্রতিষ্ঠান তাদের মডেলগুলি কপিরাইটেড কাজের উপর ট্রেন করে, অনুমতি ছাড়াই, যদিও এই প্রতিষ্ঠানগুলি দাবি করে যে মার্কিন ফেয়ার ইউজ ডকট্রিন এই প্রাকটিসকে ঢাল হিসেবে ব্যবহার করে। তবে অনেক স্রষ্টা এই বিষয়ে অসন্তুষ্ট এবং আদালতে এই বিষয় নিয়ে লড়াই করছেন।গুগল পূর্বে টেকক্রাঞ্চ-কে জানিয়েছিল যে, তারা তাদের মডেল ট্রেনিংয়ের জন্য অপ্ট-আউট মেকানিজম এবং কপিরাইট সম্পর্কিত বিরোধ থেকে তাদের ক্লাউড এবং Vertex AI গ্রাহকদের সুরক্ষা দিতে একটি ইন্ডেমনিটি পলিসি অফার করে।