Microsoft Research、端末型Webエージェント「Webwright」を公開し長距離閲覧で高得点

Microsoft ResearchのAI Frontiers labは、端末を使うWebエージェント開発フレームワーク「Webwright」をオープンソースで公開しました。
Webwrightはブラウザの状態を1手ずつ予測する方式ではなく、エージェントがPlaywrightのコードを書いてブラウザを操作し、bashコマンドを実行してログやスクリーンショットを確認しながらスクリプトを改良します。
ブラウザセッションは保持せず、永続的な成果物としてローカルワークスペースのコードとログを残す設計です。
システムはRunner、Model Endpoint、terminal Environmentの3要素で構成され、複雑なマルチエージェント調整は行わない単一ループを採用しています。
「done」の誤判定を防ぐため、自己反省設定を生成して最終スクリプトを新しいフォルダで実行し、成功・失敗を判定してからdone:trueを出す仕組みも組み込みました。
評価では、GPT-5.4を用いたOdysseysで60.1%を達成し、ベースのGPT-5.4(33.5%)から26.6ポイント上回りました。
またOnline-Mind2Webでは100ステップ予算で86.67%を記録し、座標ベースの従来型エージェントより改善したと報告しています。

参照元:2026/05/24 「Microsoft Research Releases Webwright: A Terminal-Native Web Agent Framework That Scores 60.1% on Odysseys, Up from Base GPT-5.4’s 33.5%」 https://www.marktechpost.com/2026/05/24/microsoft-research-releases-webwright-a-terminal-native-web-agent-framework-that-scores-60-1-on-odysseys-up-from-base-gpt-5-4s-33-5/

この記事へのリアクション

このニュースをどう受け止めましたか?

Reader Reaction

このニュース、みなさんはどう感じましたか?ぜひコメント欄であなたの声を聞かせてください。

※本記事に掲載している情報は公開時点のものです。最新情報は公式発表等をご確認ください。

ぜひコメントを添えてシェアお願いします。
  • URLをコピーしました!
  • URLをコピーしました!

アンケート

悩み相談をするなら、どちらに打ち明けたいですか?

回答者数:2人 投票期間:2026/04/16〜2026/05/31
回答はお一人様1回までです。


PR:実務直結の稼げるAIスキルを学べる

DMM 生成AI CAMP

AIを使いこなす側か、使われる側か。今がキャリアの分岐点。

全コース学び放題
入会金・教材費0円
最低契約期間なし・いつでも解約OK

受講生同士が繋がれるコミュニティ

Google検索で 3min AI を優先表示できます

Google検索の「優先ソース」に追加すると、通信ニュースを検索した際に、3min AIの記事が見つけやすくなります。

※Googleの設定画面が開きます。表示されたサイトにチェックを入れると、優先ソースとして設定できます。

Google検索の優先ソースに追加する

コメント

コメントする

CAPTCHA


日本語が含まれない投稿は無視されますのでご注意ください。(スパム対策)

目次