TECH BLOG

エルカミーの技術ブログです

2025-05-28

✅

この記事では、OpenHandsの応用的な使い方として下記の3つを紹介します。

OpenHandsとは何なのか、導入手順や基本的な使い方については、過去の記事をご覧ください。

📎

チャットでは画像のアップロードをする機能があります。

今回はアップロードした画像をもとに、HTML/CSSを使ってフロンドエンドの作成を依頼してみました。

チャットで指示を出す際に、併せて画像をアップロードします。
- 入力画面
- アップロードした画像
タスクが完了するとWorkspaceにHTMLファイルとCSSファイルが作成されます。
下記のような見た目のサイトになっていました。
タイトル、記事バナー、記事タイトルなどのパーツは作成されていますが、レイアウトやデザインの元の画像とは異なる結果になりました。

Jupyterタブではデータ分析から可視化までを行うことができます。

今回はGitHubにアップしたこちらのCSVファイルを使用します。

✅

外部のデータセットを読み込むことも可能です。

例えば、BigQueryに接続した結果は下記のとおりになります。

指示文

Jupyterタブで作業してください。 
このservice_accountを使用してBigQueryに接続してください。

[ここにservice_accountのJSONをコピペ]

OpenHandsはWebブラウジングの機能も備えています。

この機能を直接使うケースは殆ど無いと思いますが、これによって必要な場合にはWeb検索から最新の情報を得たうえでタスクを実行できるようになっています。

Googleニュースから注目ニュースの要約を依頼した例

ここまで読んでいただき、ありがとうございました。

OpenHandsによるタスクは失敗したり期待通りにならないことも少なくないですが、色んなことができることに可能性を感じられました。

最後に、今回OpenHandsを試すなかでLLMモデルとしてgpt-4o miniではなくgpt-4oを選んでしまい、予想外の料金が発生してしまいました。

想定どおりのLLMモデルが使用されていることを設定画面で確認してから使用した方が安心です。