اوپن اے آئی کے نئے ماڈلز o3 اور o4-mini، اپنے پرانے ماڈلز کے مقابلے میں زیادہ غلط معلومات فراہم کرنے لگے۔

رپورٹ کے مطابق حال ہی میں اوپن اے آئی کی جانب سے دو نئے ماڈلز o3 اور o4-mini متعارف کروائے گئے جس حوالے سے کمپنی نے دعویٰ کیا کہ مذکورہ ماڈلز صرف تحریر ہی نہیں، بلکہ تصویری مواد کو بھی سمجھنے اور اس پر استدلال کرنے کی صلاحیت رکھتے ہیں۔

ماہرین کے مطابق یہ پیش رفت ان ماڈلز کو محض چیٹ بوٹس سے نکال کر ایک مکمل فکری نظام میں تبدیل کر رہی ہے یعنی ایسا نظام جو نہ صرف دیکھ سکتا ہے بلکہ سوچ بھی سکتا ہے۔ انہیں اب تک کا سب سے Reasoning ماڈلز قرار دیا گیا ہے۔

تاہم چند میڈیا رپورٹس سامنے آئی ہیں جن سے معلوم ہوا کہ اوپن اے آئی کے Reasoning ماڈلز گمراہ کن معلومات فراہم کر رہے ہیں جسے پر صارفین کو تشویش لاحق ہوئی ہے۔

نیا واٹس ایپ فراڈ: تصویر ڈاؤن لوڈ کرنے سے فون ہیک اور بینک اکاؤنٹ خالی ہونے کی حقیقت کیا؟

رپورٹ کے مطابق OpenAI کے ٹیسٹ سے معلوم ہوا ہے کہ ان کے نئے ماڈل، o3 اور o4-mini، اپنے پرانے ماڈلز سے زیادہ غلطیاں کرتے ہیں۔

اوپن اے آئی کے ایک سابق ملازم کا خیال ہے کہ کمپنی کا تربیتی طریقہ نئے ماڈلز کے مزید غلطیاں کرنے کا سبب بن سکتا ہے۔

جبکہ اوپن اے آئی کا کہنا ہے کہ ان کا نیا ماڈل، o3، زیادہ درست اور زیادہ غلط دونوں طرح کے جوابات دے رہا ہے۔

چیٹ جی پی ٹی کے مینوفیکچرر نے دیکھا کہ o3 نے پرسن کیو اے پر 33 فیصد سوالات کے غلط جوابات دیے جبکہ 04-منی نے 48 فیصد گمراہ کن معلومات فراہم کی۔

رپورٹ میں کہا گیا ہے کہ نئے ماڈلز کے غلط جوابات دینے کی شرح پرانے ماڈلز جیسے o1 اور o3-mini کی شرح سے دوگنی ہے۔

رولز رائس کا شاہکار ”فینٹم چیری بلوسم“، اپنی نوعیت کی ایک ہی گاڑی

ماڈلز کی درستگی کو بڑھانے کے لیے ایک موثر حکمت عملی یہ ہے کہ انہیں ویب سرچ کی صلاحیتیں فراہم کی جائیں۔

اوپ ن اے آئی کا پرانا ماڈل، GPT-4o، ویب سرچ کے ساتھ 90 فیصد تک درستگی حاصل کرتا ہے۔ اس سے پتہ چلتا ہے کہ ویب سرچ دوسرے ماڈلز میں بھی غلطیوں کو کم کرنے میں مدد کر فراہم کرسکتا ہے۔

More

Comments
1000 characters