TECH BLOG

Dify へのサインアップ
OpenAI APIまたはGemini APIのAPIキーの取得
- Gemini APIの場合
  1. ここにアクセスし、「APIキーを作成」を選択します。
  2. 「新しいプロジェクトでAPIキーを作成」を押します。
  3. APIキーをコピーします。
- Open AI APIの場合
  - サインアップした後、こちらからAPIキーを作成し、保存します。
APIキーのセットアップ

YouTube Data APIのAPIキーの取得
- こちらを参考に、YouTube Data APIのAPIキーを取得します。
Search APIのAPIキーの取得
- こちらからサインアップ後、APIキーを取得します。

環境

Dify v1.7.1（2025年08月01日時点）

概要

完成イメージ

まずは、今回作成するアプリの完成イメージについてです。

📌

イメージ

左側の項目に、チャンネルのID（channelId）と、検索する日時の範囲（「publishedAfter」から「publishedBefore」）を日本時間で入力します。
入力形式は、「YYYY-MM-DD-HH:MM」です。
右側に動画の要約が返ってきます。

上記のアプリを構築するためにワークフローを作る説明をします。

💡

ワークフローとは

一つ一つの処理を小さなブロック（ノード）としてつなぎ合わせて、一連のプロレスを自動化する機能です。

今回作成するワークフローのDifyの画面です。

このワークフローは、以下のブロックで構成されます。

flowchart LR
    A[開始<br>channelId <br>PublishedAfter<br>PublishedBefore] 
	    --> B[世界標準時に変換]
    B --> C[HTTPリクエスト]
    C --> D[JSON Parse CONTEXT]
    D --> E[YouTube Transcripts API]
    C --> H[JSON Parse TITLE]
    H --> G[テンプレート]
    E --> F[LLM]
    F --> G
    G --> I[終了]

開始：指定する項目（channelId、PublishedAfter、PublishedBefore）を入力します。
世界標準時に変換：入力された時間を世界標準時に変換します。
HTTPリクエスト：指定したチャンネルの、指定した日時の範囲にある動画のIDを取得します。
JSON Parse ID：HTTPリクエストの結果から、動画のIDのみを抽出します。
YouTube Transcripts API：動画IDをもとに字幕を取得します。
LLM：字幕から、動画の内容を要約します。
JSON Parse TITLE：HTTPリクエストの結果から、動画のタイトルを抽出します。
テンプレート：動画のタイトルと内容を結合します。
終了：要約した内容を出力します。

作業手順

ここからは、ワークフロー構築の手順について説明します。

手順

ワークフローの新規作成
ワークフロー作成画面上での作業
ワークフローの動作確認

1. ワークフローの新規作成

最初の画面の「最初から作成」を選択します。
「ワークフロー」を選択し、「アプリのアイコンと名前」を入力してから「作成する」を選択します。

2. ワークフロー作成画面上での作業

「開始」ノードを選択します。
入力フィールドの「フィールドタイプ」の「短文」を選択し、「変数名」と「ラベル名」に「channelId」と入力して「保存」を選択します。

同様に、「PublishedAfter」と「PublishedBefore」を追加します。
変数名とラベル名は同一のもので差し支えありません。

「コード」ノードを追加します。

「入力変数」の「＋」ボタンを押します。

「{x}変数を設定」をクリックし、「開始」の「{x}PublishedAfter」を追加します。

同様に、「{x}PublishedBefore」を追加します。このとき、変数名のラベルはそれぞれ「PublishedAfter」、「PublishedBefore」にしてください。

コードブロックに、以下のコードを入力します。

from datetime import datetime, timedelta, timezone

def validate_and_format_time(input_time: str) -> datetime:
    return datetime.strptime(input_time, "%Y-%m-%d-%H:%M").replace(tzinfo=timezone(timedelta(hours=9)))

def convert_to_utc_range(PublishedAfter: str, PublishedBefore: str) -> dict:
    try:
        jst_after = validate_and_format_time(PublishedAfter)
        jst_before = validate_and_format_time(PublishedBefore)
        utc_after = jst_after.astimezone(timezone.utc).strftime("%Y-%m-%dT%H:%M:%SZ")
        utc_before = jst_before.astimezone(timezone.utc).strftime("%Y-%m-%dT%H:%M:%SZ")
        return {"PublishedAfterUTC": utc_after, "PublishedBeforeUTC": utc_before}
    except ValueError as e:
        return {"error": str(e)}

def main(PublishedAfter: str, PublishedBefore: str) -> dict:
    return convert_to_utc_range(PublishedAfter, PublishedBefore)

ここではPythonで、開始時に日本時間で入力された「PublishedAfter」と「PublishedBefore」を世界標準時に変換する処理を記述しています。

「出力変数」の「＋」ボタンを押し、「PublishedAfterUTC」と「PublishedBeforeUTC」を追加します。ここで、コードブロックの名前もわかりやすく「世界標準時変換」としておきます。

「HTTPリクエスト」ノードを追加します。

💡

「HTTPリクエスト」ノードとは
外部APIやウェブサービスと通信するための機能を提供します。指定したURLやパラメータを用いてリクエストを送り、そのレスポンスを後続の処理で利用できます。

「GET」を選択し、下記のURLを入力します。
https://www.googleapis.com/youtube/v3/search

「パラメータ」の各キーと値を下記の表のように入力します。

キー	値	備考
channelId	{x}channelId	APIで取得する対象のYouTubeチャンネルのIDを指定します．
part	snippet,id	取得するデータの種類を指定します。snippetは基本的なメタ情報を含み、idは動画IDを返します。
order	date	動画を投稿日順に並べるよう指定します。
maxResults	1	取得する動画の最大数を指定します。ここでは最新の1件を取得します。
type	video	動画のみを対象に検索するよう指定します。
PublishedAfter	{x}PublishedAfterUTC	指定した日時以降に投稿された動画を検索するための日付を指定します。
PublishedBefore	{x}PublishedBeforeUTC	指定した日時以前に投稿された動画を検索するための日付を指定します。
key	任意の値	事前準備で取得したYouTube Data APIのAPIキーを指定します。

「ツール」から「JSON Parse」を追加します。

💡

「JSON Parse」ノードとは

「JSON data」と「JSON filter」の値を下記の表のように設定します。

「入力変数」の「JSON data」に「HTTPリクエスト」の「{x}body」を選択します。

「JSON filter」で下記のように記述します。

items[0]["id"]["videoId"]

項目	値	備考
JSON data	{x}body	「HTTPリクエスト」の「{x}body」を選択
JSON filter	items[0]["id"]["videoId"]	ここでは、「HTTPリクエスト」ノードの出力から、動画のID（videoId）を抽出しています。

次に、「ツール」から「SearchAPI」の中にある「YouTube Transcripts API」を選択し、追加します。（ツールから見つからない場合は、マーケットプレイスからSearchAPIをインストールしてください。）

💡

「YouTube Transcripts API」ノードとは
動画のIDをもとに、動画の字幕を取得します。
Youtubeのプラグインにも存在しますが、自動生成される字幕を取得することができないため、SearchAPIでの字幕取得を推奨します。

「language」に「ja（日本語）」を入力します。
「LLM」ノードを追加し、「コンテキスト」に「YouTube Transcripts API」の「{x}text」を選択し、「SYSTEM」にプロンプトを入力します。改行し、「/」を入力した後、「コンテキスト」を選択します。

これで、最新動画の内容の要約は完了です。次に、最新動画のタイトルを取得します。
「HTTPリクエスト」ノードに戻り、「+」ボタンを押して、「JSON Parse」を新しく作成します。

「JSON data」と「JSON filter」の値を下記の表のように設定します。
「入力変数」の「JSON data」に「HTTPリクエスト」の「{x}body」を選択します。
「JSON filter」で下記のように記述します。
items[0]["id"]["title"]

項目	値	備考
JSON data	{x}body	「HTTPリクエスト」の「{x}body」を選択
JSON filter	items[0]['snippet']['title']	ここでは、「HTTPリクエスト」ノードの出力から、動画のタイトルを抽出しています。

このとき、ふたつの「JSONParse」ノードが並列に接続されているかも確認しておきましょう。（役割ごとにノードの名前を変更しておくと見やすくなります。）

「LLM」ノードから「テンプレート」ノードを追加し、「JSON Parse」ノードと並列につなぎます。
「入力変数」に「JSON Parse TITLE」の「text」と、「LLM」ノードの「text」を追加します。
それぞれのラベルを「title」と「text」としてあげましょう。
コードの欄に以下の文章を、コピー＆ペーストします。
```
タイトル: {{ title }}
動画の要約
{{ text }}
```
「終了」ノードを追加し、「出力変数」の「変数名」に「output」を、「{x} 変数を設定」に「テンプレート」の「output」を選択します。