ニュース

OpenAI、ブラウザ操作エージェント「Operator」がo3ベースに強化

Operatorがo3ベースに

OpenAIは23日、AIがブラウザを操作し、タスクを実行するAIエージェント「Operator」のモデルを「OpenAI o3」ベースとして強化した。

Operatorは、1月に研究プレビューとして、Computer Using Agent(CUA)モデルとしてサービス開始。Webを利用してユーザーのタスクを実行できるエージェント型モデルとして、独自のブラウザがWebページを表示し、人間がタイプ、クリック、スクロールするなどと同様の操作をAIが代行する。従来はGPT-4oベースだったが、o3ベースとすることで、より正確な操作が可能となり、タスクの成功率が向上する。また、回答はより明確で詳細かつ構造化されるという。

【参考】o4ベースのOperator
従来Operatorより正確性などを改善

OperatorはChatGPT Pro(200ドル)ユーザー向けに提供される。なお、Operatorは、コーディング環境やターミナルへのネイティブアクセスは備えていない。