AIエージェントはゆっくりと物になりつつありますが、多くの人は、特にAIエージェントをブラウザに接続し、自動化、Webスクレイピング、テストなどのさまざまなタスクを実行する方法を知りません。これを支援するために、githubリポジトリが呼ばれますブラウザの使用AIエージェントをブラウザに接続する最も簡単な方法の1つを提供します。
ブラウザの使用とは何ですか?
ブラウザの使用は、AIエージェントがWebページをナビゲートし、データを抽出し、インタラクションを自動化できるようにするオープンソースPythonライブラリです。マルチタブ管理、要素追跡、自己修正メカニズムをサポートしますがLLMSとの統合シームレスなAI駆動型ブラウザオートメーションのGPT-4やClaude 3のように。
ブラウザの使用方法Windows 11/10でWebUIを使用しますか?
ブラウザ使用を使用する前に、Openai、Anthropic、Deepseekなどの好みのLLMモデルからAPIキーを持っていることを確認してください。APIキーなしでは、リポジトリを使用できません。次の手順に従ってください。
1]始める
- まず、インストールから始めますPythonの最新バージョン公式ウェブサイトから。
- あなたもそうする必要がありますgitをダウンロードしてインストールします。
- 次に、Windows検索に移動し、CMDと入力し、右クリックして、管理者として開きます。
- CMDで、次のコマンドを実行してリポジトリをクローンします。
git clone https://github.com/browser-use/web-ui.git
cd web-ui
2]仮想環境の作成
次のステップは、仮想環境を作成することです。したがって、CMDでは、次のコマンドを実行します。
python -m venv venv
venv\Scripts\activate
3]依存関係をインストールします
次に、必要な依存関係をインストールする必要があります。このために、次のコマンドを実行してしばらく待ちます。
pip install -r requirements.txt
4]劇作家をインストールします
Playwrightは、ブラウザの使用で使用されるブラウザ自動化ライブラリです。インストールするには、コマンドを実行します。
playwright install
5]ブラウザの実行を実行します
すべてをインストールしたら、プロジェクトを開始する時が来ました。したがって、コマンドプロンプトで、次のコマンドを実行します。
python webui.py --ip 127.0.0.1 --port 7788
コマンドを実行した後、少し待ってください。画面にIPアドレスが付いたURLが表示されます。ブラウザのアドレスバーにコピーして貼り付けるだけで、このURLを使用できます。https://127.0.0.1:7788/。
6]ブラウザの使用の構成と実行
ブラウザを使用してダッシュボードを使用すると、構成する必要がありますエージェントがいます道具。
- まず、クリックしますLLM設定。ここから、LLMプロバイダー、モデル名、ベースURL、およびAPIキーを選択します。
- 次に、行きますエージェント設定エージェントタイプ、最大実行ステップ、ステップごとのアクション、およびその他の設定を構成します。同じことをする必要がありますブラウザ設定(要件に従ってこれらの設定を構成します)。
- 最後に、行きます実行エージェント、タスクの説明と追加情報を入力し、[エージェントの実行]ボタンをクリックして使用を開始します。
したがって、それがブラウザの使用の使用方法でした。これは、インタラクティブな要素を抽出し、深い研究を実施し、ワークフローを自動化するなどの素晴らしいツールです。先に進んで、それがあなたのためにどのように機能するかを見るために自分で試してみてください。
APIキーなしでブラウザの使用を使用できますか?
ブラウザの使用を使用するには、LLMプロバイダー(Openai、人類、Deepseekなど)のAPIキーが必要です。それがなければ、AIエージェントはタスクを処理したり、Webページと効果的に対話することができません。
ブラウザはヘッドレスブラウジングをサポートしていますか?
ブラウザは、レバレッジプレイライトを使用して、ヘッドレスブラウジングをサポートします。これは、目に見えるブラウザウィンドウを開くことなくタスクを自動化できることを意味し、サーバー環境でのWebスクレイピング、テスト、自動化に最適です。