Microsoft ResearchのAI Frontiers labは、端末を使うWebエージェント開発フレームワーク「Webwright」をオープンソースで公開しました。
Webwrightはブラウザの状態を1手ずつ予測する方式ではなく、エージェントがPlaywrightのコードを書いてブラウザを操作し、bashコマンドを実行してログやスクリーンショットを確認しながらスクリプトを改良します。
ブラウザセッションは保持せず、永続的な成果物としてローカルワークスペースのコードとログを残す設計です。
システムはRunner、Model Endpoint、terminal Environmentの3要素で構成され、複雑なマルチエージェント調整は行わない単一ループを採用しています。
「done」の誤判定を防ぐため、自己反省設定を生成して最終スクリプトを新しいフォルダで実行し、成功・失敗を判定してからdone:trueを出す仕組みも組み込みました。
評価では、GPT-5.4を用いたOdysseysで60.1%を達成し、ベースのGPT-5.4(33.5%)から26.6ポイント上回りました。
またOnline-Mind2Webでは100ステップ予算で86.67%を記録し、座標ベースの従来型エージェントより改善したと報告しています。
参照元:2026/05/24 「Microsoft Research Releases Webwright: A Terminal-Native Web Agent Framework That Scores 60.1% on Odysseys, Up from Base GPT-5.4’s 33.5%」 https://www.marktechpost.com/2026/05/24/microsoft-research-releases-webwright-a-terminal-native-web-agent-framework-that-scores-60-1-on-odysseys-up-from-base-gpt-5-4s-33-5/
この記事へのリアクション
このニュースをどう受け止めましたか?



コメント