
অ্যাপল সম্প্রতি ঘোষণা দিয়েছে তাদের Apple Intelligence ফিচার চালিত AI মডেলগুলোর নতুন আপডেট, যা iOS, macOS সহ নানা প্ল্যাটফর্মে ব্যবহৃত হবে। কিন্তু কোম্পানির নিজস্ব বেঞ্চমার্কেই দেখা গেছে, এই নতুন মডেলগুলো OpenAI-এর মতো প্রতিদ্বন্দ্বী প্রতিষ্ঠানের পুরনো মডেলগুলোর চেয়েও পিছিয়ে।
সোমবার প্রকাশিত এক ব্লগ পোস্টে অ্যাপল জানিয়েছে, তাদের সর্বশেষ “Apple On-Device” মডেল — যা আইফোনসহ বিভিন্ন ডিভাইসে অফলাইনে চলে — সেই মডেলের টেক্সট জেনারেশনের গুণগত মানকে গুগল ও আলিবাবার অনুরূপ আকারের মডেলের সমতুল্য হিসেবে রেট করা হয়েছে। অর্থাৎ, এর পারফরম্যান্স প্রতিদ্বন্দ্বীদের চেয়ে ভালো নয়।
আরেকটি শক্তিশালী মডেল, যার নাম “Apple Server”, যা অ্যাপলের নিজস্ব ডেটা সেন্টারে চলে, সেটিও পারফরম্যান্সে পিছিয়ে রয়েছে। OpenAI-এর এক বছর পুরনো GPT-4o এর তুলনায় Apple Server-এর ফলাফল দুর্বল বলে জানিয়েছে মানব রেটাররা।
এছাড়াও, ইমেজ বিশ্লেষণ সক্ষমতা পরিমাপের একটি আলাদা টেস্টে দেখা যায়, অ্যাপলের Apple Server-এর তুলনায় Meta-এর Llama 4 Scout মডেলকেই বেশি পছন্দ করেছেন রেটাররা। বিষয়টি বিস্ময়কর, কারণ বহু বেঞ্চমার্কে Llama 4 Scout অন্য AI ল্যাব যেমন গুগল, অ্যানথ্রপিক বা OpenAI-এর ফ্ল্যাগশিপ মডেলের তুলনায় পিছিয়ে।
এই ফলাফলগুলো অনেক রিপোর্টকে সমর্থন করছে, যেখানে বলা হয়েছে অ্যাপলের AI গবেষণা বিভাগ এখনো প্রতিযোগিতায় অনেকটাই পিছিয়ে। অ্যাপলের সাম্প্রতিক AI প্রচেষ্টা অনেক সময়েই প্রত্যাশা পূরণ করতে পারেনি। বহু প্রতীক্ষিত Siri আপগ্রেড বারবার বিলম্বিত হয়েছে, এমনকি কিছু গ্রাহক Apple-এর বিরুদ্ধে মামলা করেছেন, অভিযোগ করে যে তারা AI ফিচারের নামে বিভ্রান্তিকর মার্কেটিং করেছে।
Apple On-Device, যার আকার প্রায় ৩ বিলিয়ন প্যারামিটার, এটি টেক্সট সারাংশ তৈরি, বিশ্লেষণ ইত্যাদি কাজ করে। (উল্লেখ্য, প্যারামিটার হলো মডেলের অভ্যন্তরীণ উপাদান যা তার সমস্যার সমাধানের দক্ষতাকে নির্দেশ করে। সাধারণত, প্যারামিটার যত বেশি, মডেলের পারফরম্যান্স তত উন্নত।) সোমবার থেকে থার্ড পার্টি ডেভেলপাররা Apple Foundation Models ফ্রেমওয়ার্ক-এর মাধ্যমে এটি ব্যবহার করতে পারবেন।
অ্যাপলের দাবি, নতুন Apple On-Device ও Apple Server উভয় মডেলই পূর্বের তুলনায় উন্নত টুল-ইউস এবং দক্ষতা প্রদর্শন করে। এদের প্রশিক্ষণ ডেটাসেটে এখন চিত্র, পিডিএফ, ডকুমেন্ট, পান্ডুলিপি, ইনফোগ্রাফিক, টেবিল এবং চার্ট অন্তর্ভুক্ত করা হয়েছে, যার ফলে তারা প্রায় ১৫টি ভাষা বুঝতে সক্ষম।
আপনি চাইলে Apple On-Device মডেলের প্রযুক্তিগত বিবরণ, GPT-4o বনাম Apple Server তুলনা, অথবা Foundation Models API কীভাবে কাজ করে এই সংক্রান্ত আরও বিশ্লেষণ দেখতে পারেন।