OpenAI ایجنت هوش مصنوعی Operator را به مدل قوی o3 تجهیزکرد_دنیای تکنولوژی

تکنولوژی

نوشته شده توسط:

[ad_1]
نوشته و ویرایش شده توسط مجله ی دنیای تکنولوژی

OpenAI نسخه تازه عامل مرورگر وب و کنترل‌کننده موس خود با نام «Operator» را به مدل پرقدرت o3 ارتقا داد.

بر پایه گزارش‌ها، این نسخه از ۲۳ مه ۲۰۲۵ (اول خرداد) در قالب «پیش‌نمایش پژوهشی» برای مشترکان مطرح ChatGPT Pro با هزینه ۲۰۰ دلار در ماه در دسترس قرار گرفته است.

این ارتقا از مدل GPT-4o به o3، کارکرد، دقت و نرخ پیروزی را افزایش چشمگیری داده و علتشده اشتراک پرو در قیاس با بسته‌های رقیب همانند سرویس ۲۵۰ دلاری گوگل دلنشین‌تر به‌ نظر برسد.

Operator؛ اغاز ورود OpenAI به حوزه ایجنت‌های نیمه‌خودکار

Operator که نخستین بار ژانویه ۲۰۲۵ معارفه شد، نمایانگر ورود OpenAI به حوزه عامل‌های نیمه‌خودکار می بود. این ایجنت جدا گانه در مرورگر مجازی مبتنی‌بر فضای ابری از طریق سایت operator.chatgpt.com فعالیت می‌کند و می‌تواند وظایفی همانند رزرو رستوران، تنظیم لیست خرید یا خواست بلیت را انجام دهد و کاربران اجرای زنده این عمل های را درلحظه مشاهده می‌کنند.

در نسخه تازه مبتنی‌بر مدل o3، دقت و انسجام تعامل با مرورگر افزایش یافته و کاربران می‌توانند منتظر باشند ماموریت های با اشتباه و نیاز به اصلاح کمتری انجام شوند. در برسی‌ها، کاربران مدل o3 را از نظر وضوح، جامعیت و پیروی از دستورالعمل‌ها بهتر از نسخه قبلی دانسته‌اند.

در آزمون OSWorld امتیاز مدل تازه ۴۲.۹ و مدل قبلی ۳۸.۱ بوده، و در WebArena نیز از ۴۸.۱ به ۶۲.۹ افزایش یافته است. بیشترین بهبود در آزمون GAIA دیده می‌بشود که مدل o3 امتیاز ۶۲.۲ را کسب کرده ولی نسخه قبلی فقط ۱۲.۳ امتیاز داشته است.

این مدل با منفعت‌گیری از تدبیرها ایمنی تازه، ۹۴ درصد عمل های حساس را پیش از اجرا قبول می‌کند و این مقدار در تراکنش‌های مالی به ۱۰۰ درصد می‌رسد. این چنین صدمه‌پذیری نسبت به حملات Prompt injection از ۲۳ درصد به ۲۰ درصد افت یافته است. یقیناً Operator هم چنان در برخی تعامل های پرخطر همانند ایمیل یا پلتفرم‌های مالی کارکرد محدودی خواهد داشت.

این ارتقا نه‌فقط پیشرفت فنی است، بلکه بازتابی از ضمانت مستمر OpenAI به گسترش مسئولانه هوش مصنوعی نیز به‌ شمار می‌آید. نسخه Responses API این ابزار اکنون هم چنان بر پایه مدل GPT-4o اراعه می‌بشود.

دسته بندی مطالب

مقالات کسب وکار

مقالات تکنولوژی

مقالات آموزشی

سلامت و تندرستی

[ad_2]