アニメ動画ファンブログ

ベタですが『アニメ動画ファンブログ』というサイトをつくりました。

VOD Fan Blog

Dify

Difyとは

bandicam 2024-05-19 13-53-21-863.jpg

Difyは、オープンソースのLLM(大規模言語モデル)アプリ開発プラットフォームです。2023年に公開され、RAGエンジン(Retrieval-Augmented Generation)を使用して、エージェントから複雑なAIワークフローまでLLMアプリを簡単に開発することができます。

「5分以内にドメイン知識を組み込んだカスタマイズされたチャットボットやAIアシスタントを展開し、人間とAIの協働を先導します。」 — Dify公式サイトより

Difyの名前は「Define Intelligence For You(あなたのために知性を定義する)」に由来しているとされ、AIアプリケーション開発を民主化するというビジョンを持っています。

Difyの主な特長は以下の通りです。

bandicam 2025-04-22 15-53-27-326.jpg

オープンソース

GitHubで公開されており、コミュニティによる継続的な開発・改良が行われています。

RAGエンジン搭載

Retrieval-Augmented Generationエンジンにより、検索結果を基に精度の高い回答を生成します。

直感的なインターフェース

ノーコードでAIアプリケーションを開発できる、使いやすいビジュアルエディタを提供。

豊富なAIモデル連携

GPT-4.5、Claude 3.7 Sonnetなど、最先端のAIモデルとシームレスに連携可能。

Difyは、Python/FlaskとNext.jsで開発されており、PostgreSQLをデータベースとして使用しています。

運営.jpg

Difyでできること

Difyは多様な機能を提供し、さまざまなAIアプリケーションの開発を可能にします。以下に主な機能を紹介します。

bandicam 2025-04-22 18-11-23-349.jpg

1. AIアプリケーション開発

チャットボット

ユーザーとの対話型コミュニケーションを行うAIチャットボットを作成できます。

AIアシスタント

特定の業務や分野に特化した知的アシスタントを構築可能です。

テキスト生成

ブログ記事、レポート、メールなど、様々なテキストコンテンツを生成します。

2. RAG(Retrieval-Augmented Generation)機能

Difyに搭載されたRAGエンジンを使用することで、以下のことが可能になります。

  • PDFやWord、Excelなど様々な形式のドキュメントからテキストを抽出
  • 抽出したテキストをベクトルデータベースに格納
  • ユーザーの質問に関連する情報を検索・取得し、それを基に回答を生成
  • 企業の内部資料やナレッジベースに基づいた正確な回答の提供

このRAG機能により、AIの回答の精度と信頼性が大幅に向上します。

3. AIエージェント構築

Difyでは、自律的に動作するAIエージェントを構築できます。エージェントは以下のような特徴を持ちます。

  • 企業が定義したツールとデータを自立的に使用して複雑なタスクを解決
  • Google検索、DALL·E、Stable Diffusion、WolframAlphaなど、50以上の組み込みツールとの連携
  • LLMの関数呼び出しまたはReActに基づいてエージェントを定義
  • タスクの分解、適切なツールの選択、結果の統合などを自動的に実行

4. AIワークフロー編成

複雑なAIワークフローをビジュアルに設計・編成できます。

  • ドラッグ&ドロップでフローチャートのように処理の流れを設計
  • 条件分岐、繰り返し処理などの複雑なロジックも視覚的に表現
  • 複数のAIモデルを組み合わせたハイブリッドなワークフローの構築
  • 既存のシステムとの統合や、実行時の状況監視機能

5. エンタープライズ機能

企業での活用に適した機能も充実しています。

  • シングルサインオン(SSO)対応
  • 詳細なアクセス制御と権限管理
  • 推論の監視、ログの記録、データの注釈付け
  • モデルの微調整と継続的な最適化
  • プライベートデプロイメントによるデータセキュリティの確保

バージョン1以降のアップデート情報まとめ

bandicam 2025-04-22 16-45-41-825.jpg

1. プラグイン機能での他社サービス連携

  • プラグインシステムの導入: v1.0.0から、Difyプラットフォームに独自の機能拡張を追加できるようになりました
  • プラグインの種類:
    • モデルプラグイン:AIモデルやLLM APIを統合
    • ツールプラグイン:Google等の外部サービスと連携
    • エージェント戦略プラグイン:LLMの行動を最適化
    • 拡張プラグイン:HTTP APIとの接続を簡素化
    • バンドルプラグイン:複数プラグインを単一パッケージとして提供
  • プラグインの入手方法:
    • Dify Marketplaceから公式プラグインを入手
    • GitHubリポジトリからコミュニティ製プラグインをインストール

2. MCP対応でAIによる開発・操作の実行

  • MCPサーバー機能: Difyアプリを「Machine Capability Protocol」対応のサーバーエンドポイントとして公開
  • MCPクライアント対応: 外部MCPサーバー(Zapierなどのツールプラットフォーム)と連携可能
  • 主な利点:
    • AIがツールを動的に発見・呼び出し可能に
    • コード開発、レポート作成、情報抽出などの自動化プロセスを強化
    • CursorなどのMCP対応クライアントとシームレスに連携可能

3. ワークフロー機能の拡充

  • ループノードの追加: 特定条件を満たすまで繰り返し処理を実行(v1.2.0で追加)
  • 処理能力:
    • 前回の結果に依存する反復タスクの実行
    • 終了条件または最大繰り返し回数に基づく制御が可能
    • 複雑な反復処理が簡単に構築可能に
  • 活用事例:
    • 条件付きのデータ処理(x < 50などの条件指定)
    • 動画の自動生成などの繰り返し処理を要する高度なワークフロー
    • エラー率や精度が特定基準に達するまでの処理の反復

これらのアップデートにより、Difyはより柔軟で強力なAIアプリケーション開発プラットフォームへと進化しています。特にプラグイン機能とMCP対応により外部サービスとの連携が容易になり、ループノードの追加によってより複雑なワークフローの構築が可能になりました。

参考:アップデートまとめ詳細資料

https://page.genspark.site/page/toolu_01VZ9jUg1gAmGeDUC86D6AUY/dify_updates_v1_and_later.html

他ツールとの違い

「AIワークフロー作成ツール」比較

ツール名開発元主な特徴対象ユーザープログラミング要否主な用途提供形態料金
DifyLangGenieusオープンソースのLLMアプリ開発プラットフォーム。RAGエンジンを使用し、エージェントから複雑なAIワークフローまでをオーケストレーション可能。直感的なUIでノードを接続してワークフローを設計。ノンエンジニア〜エンジニアノーコード〜ローコードチャットボット、テキスト生成、エージェント、ワークフローオープンソース/クラウド無料プラン:200回までの開発/テストProfessional:$59/月(月契約)、$49/月(年契約)Team:$159/月(月契約)、$133/月(年契約)
CozeByteDanceByteDanceが提供するAIエージェント開発プラットフォーム。トリガー機能と長期記憶機能が特徴的。ノンエンジニア〜エンジニアノーコードチャットボット、AIエージェント、自動応答システムクラウド最近有料化が発表され、従量課金制各LLMのトークン料金は公式サービスと同等
JinbaflowCarnot日本発の「和製Dify」として知られる。生成AIを組み合わせたワークフロー構築ツール。英語での指示でワークフロー作成が可能。ノンエンジニア〜エンジニアノーコードデータ変換、分析、他サービスとの連携、業務効率化クラウド無料プラン:利用制限ありスタータープラン:$6/月プロプラン:$25/月企業プラン:要問い合わせ

「AI機能つきノーコードツール」比較

ツール名開発元主な特徴対象ユーザーAIの役割主な用途提供形態料金
CreateCreate AI言葉による説明だけでWebアプリを作成できる。生成AIによってコードが自動生成される。ノンエンジニアアプリ自動生成Webアプリケーション開発クラウド無料プラン:基本機能Pro:$19/月Business:$99/月Enterprise:要問い合わせ
Node-AINode-AIノーコードでAI開発ができるプラットフォーム。誰でもAIに関われる「AIの民主化」を目指している。ノンエンジニアモデル開発・活用AI開発、機械学習モデルの構築クラウド無料プラン:あり有料プラン:営業に問い合わせ(シングルテナント版・マルチテナント版あり)
Power Platform with CopilotMicrosoftMicrosoftのノーコードプラットフォームにAI機能が追加されたもの。Copilotがアプリやワークフローのコード生成をサポート。ノンエンジニア〜開発者コード生成・自動化業務アプリ開発、ワークフロー自動化クラウド/オンプレミスMicrosoft 365 Copilot:月額$30/ユーザーCopilot Studio:月額¥25,000(年間契約)
TeachableMachineGoogleGoogleが提供する簡単に機械学習モデルを作成できるツール。画像、音声、ポーズの認識モデルを簡単に作成可能。ノンエンジニアモデル開発・訓練画像認識、音声認識、ポーズ検出クラウド完全無料
BubbleBubble本格的なWebアプリケーション開発のためのノーコードプラットフォーム。高い自由度とカスタマイズ性が特徴。ノンエンジニア〜開発者Webアプリケーション開発、サービス開発クラウド部分的無料プラン:テスト用Starter:$32/月(月契約)Growth:$119/月(月契約)Team:$399/月(月契約)※年間契約で割引あり

参考:詳細な比較表

https://genspark.genspark.site/slides?project_id=cb9cb942-278e-4c82-ab8b-c20e85aa89a4&slide_id=toolu_01GbQQaqJdoE1PEmwjZFX4Vg

Difyの導入ステップ

Difyを導入する方法は主に2つあります。クラウドサービスを利用する方法と、自分のサーバーやローカル環境にセルフホスティングする方法です。それぞれの導入ステップを見ていきましょう。

1. Dify Cloudを利用する方法

すると、アカウント作成が完了し、以下の画面に遷移します。

bandicam 2024-05-19 15-25-34-361.jpg
  • 「スタジオ」「探索」「ナレッジ」「ツール」

最上部中央に表示されている4つのページからご紹介します。 中核となる機能は「スタジオ」ですので、表示順の中で2番目の「スタジオ」から解説していきます。 その後は表示順の左から進行します。

「スタジオ」

bandicam 2024-05-19 15-25-34-361.jpg

基本的なチャットボットを作成するだけなら、この機能だけで完結できます。

画面左側の「最初から作成」を選んで、はじめてみましょう。

bandicam 2024-05-19 15-46-16-457.jpg

・質問にAIが回答する「チャットボット」 ・文章生成に特化した「テキストジェネレーター」 ・外部アプリケーションも連携させて自動で出力をさせる「エージェント」 ・細かくカスタマイズ可能な「ワークフロー」 上記4種類から選んでAIアプリ開発をスタートできます

オーケストレーション方法はひとまず無視して、アプリに名前と説明をつけてみましょう。 アイコンも自由に選択することができます(自作アイコンをアップももちろんOK)。

今回は、翻訳アプリを作成してみましょう。 アプリ名「日英/英日翻訳AI」 説明「日本語を英語に、英語を日本語に変換するAIアプリです」

bandicam 2024-05-19 15-53-10-030.jpg

「作成する」をクリックすると、以下の画面に遷移します。

bandicam 2024-05-19 15-53-50-178.jpg

「手順」の欄に指示文(プロンプト)を入力します。

今回は「入力が日本語であれば英語に、英語であれば日本語に翻訳を行ってください。」というシンプルなものにしました。

画面右側の「デバッグとプレビュー」の欄の最下部のボックスに「こんにちは。コーヒーを一杯ください。」と入力すると……?

bandicam 2024-05-19 16-10-15-266.jpg

「Hello. Can I have a cup of coffee, please?」と、ただしい英訳を返してくれました。

もうこれだけで自作AIが完成です!

あとは、画面右上の「公開する」をクリックし、忘れずに「更新」をしてください。

その後、「アプリを実行」をクリックすれば、新しいURLが発行され、独自のAIアプリをWeb上に公開できます。

2. セルフホスティングする方法

Dockerを使ってローカル環境またはプライベートサーバーにDifyをインストールする手順です。

ステップ1: 前提条件の確認

Dockerと Docker Composeがインストールされていることを確認します。推奨スペックはCPU: 2コア以上、RAM: 4GB以上です。

ステップ2: リポジトリのクローン

GitHubからDifyリポジトリをクローンします。

git clone <https://github.com/langgenius/dify.git>

ステップ3: Dockerコンテナの起動

クローンしたディレクトリのdockerフォルダに移動し、Docker Composeを実行します。

cd dify/dockerdocker compose up -d

ステップ4: 初期設定

ブラウザでhttp://localhost/installにアクセスし、初期化プロセスを開始します。管理者アカウントの作成や基本設定を行います。

ステップ5: APIキーの設定とアプリケーション作成

クラウド版と同様に、APIキーの設定とアプリケーションの作成を行います。

メリット: データのプライバシーが確保でき、完全なコントロールが可能です。インターネットに接続されていない環境でも利用できます。

注意点: サーバーの管理・運用の知識が必要です。また、サーバーのリソースや安定性はユーザー側で確保する必要があります。

新機能:Zapier MCPを使ってみよう

1. 概要

Model Context Protocol (MCP)は、Anthropicによって導入された、AIモデルが外部ツールやAPIを発見、理解、安全に呼び出すための標準プロトコルです。ZapierのMCPサーバーは7,000以上のアプリと30,000以上のアクションを単一のMCPサーバーURLにパッケージ化したもので、Difyエージェントと簡単に連携できます。

参考:Dify MCP Plugin Hands-On Guide: Integrating Zapier for Effortless Agent Tool Calls https://dify.ai/blog/dify-mcp-plugin-hands-on-guide-integrating-zapier-for-effortless-agent-tool-calls

2. 前提条件

  • Difyアカウント
  • Zapierアカウント
  • 接続したいサービスのアカウント(例:Gmail、Slack、Notion等)

3. Zapier MCP設定の手順

3.1 Zapier MCPの設定

  1. Zapier MCP設定ページにアクセスする
  2. あなた専用のMCPサーバーエンドポイントリンクをコピーする
  3. 「Edit MCP Actions」をクリックして新しいツールとアクションを追加する

3.2 アクションの設定(例:Gmail送信)

  1. アプリケーション(例:Gmail)を選択する
  2. 「Send Email」などの特定のアクションを選択して設定する
  1. Gmailでメール送信を設定する場合:
    • 「Connect」をクリックしてGmailにログインし、アカウントを認証する
    • 受信者、件名、本文などのフィールドで「Have AI guess a value」を選択し、AIが動的にコンテンツを生成できるようにする
  1. 必要に応じて追加のアクションを設定する

4. DifyでのMCP SSEプラグインの設定

4.1 MCP SSEプラグインのインストール

  1. Difyマーケットプレイスから「MCP SSE」プラグインをインストールする
  2. インストール後、以下のJSONテンプレートのURLをあなたのZapier MCP Server URLに置き換えて、プラグイン設定に貼り付ける:
Copy{
  "server_name": {
    "url": "<https://actions.zapier.com/mcp/*******/sse>",
    "headers": {},
    "timeout": 5,
    "sse_read_timeout": 300
  }
}

※ ******* の部分には実際のZapier MCPのIDが入ります

4.2 複数のMCPサーバーを使用する場合(オプション)

複数のMCPサーバー(例:ZapierとComposio)を使用する場合、設定は以下のようになります:

Copy{
  "server_name1": {
    "url": "<https://actions.zapier.com/mcp/*******/sse>",
    "headers": {},
    "timeout": 5,
    "sse_read_timeout": 300
  },
  "server_name2": {
    "url": "別のMCPサーバーのURL"
  }
}

5. Difyでのエージェントアプリケーションの作成と設定

  1. 新しいエージェントアプリを作成する
  2. 「Tools」セクションで、設定したMCP SSEプラグインを有効にする

6. 追加機能の設定(オプション)

6.1 連絡先データベースの設定

  1. 連絡先のExcelファイルをDifyのナレッジベースにアップロードする
  2. これにより、エージェントは名前とメッセージ内容を提供するだけで、受信者のメールアドレスを自動的に一致させることができる

6.2 確認プロンプトの設定

特定のプロンプトを設定して、メールを送信する前にユーザーに確認を求めるようにする:

6.3 GPT-4oプロンプトの例

以下のようなプロンプトを設定して、エージェントがメール送信前に確認を取るようにできます:

# 役割
あなたはメール送信アシスタントです。

# 機能
1. `gmail_send_email`という名前のツールを使用してメールを送信できます。
2. ナレッジベースで連絡先のメールアドレスを自動的に検索できます。

# ワークフロー
1. ユーザー{{user_name}}は送信者です。ユーザーのリクエストに基づいて、受信者、件名、メール本文を決定します。必要に応じて、ナレッジベースで受信者のメールアドレスを検索します。
2. ツールを呼び出してメールを送信する前に、メールの完全な内容(受信者、件名、本文)をユーザー{{user_name}}に表示し、確認を求める必要があります。
3. ユーザーの確認を受けた後、ツールを呼び出してメールを送信する準備をします。

# ツール呼び出し要件(コア指示)
1. メールを送信するには、`gmail_send_email`という名前のツールのみを呼び出す必要があります。
2. `gmail_send_email`ツールを呼び出す際には、以下の3つのキーのみを含むJSONオブジェクトを構築する必要があります:
   `to`: 受信者のメールアドレス(文字列)
   `subject`: メールの件名(文字列)
   `body`: メールの本文内容(文字列)
3. 次に、このJSONオブジェクトをJSON標準に準拠した文字列にシリアル化し、この文字列を`gmail_send_email`ツールの`arguments`パラメータとして渡します。

ツール呼び出し形式の例(gmail_send_emailを使用):
```json
{
  "mcp_sse_call_tool": {
    "tool_name": "gmail_send_email",
    "arguments": "{\\"to\\":\\"recipient_email_address\\",\\"subject\\":\\"email_subject\\",\\"body\\":\\"This is the email body content.\\"}"
  }
}


## 7. MCP Agent Strategyプラグインを使用した統合(代替方法)

### 7.1 MCP Agent Strategyプラグインのインストール

SSEプラグインに加えて、MCP Agent Strategyプラグインを使用することもできます。このプラグインはMCPをワークフローエージェントノードに直接組み込みます。

![MCP Agent Strategyプラグイン画面](<https://framerusercontent.com/images/b15M5bdAhN4iCpIzhaMIEaWtyE.png>)

### 7.2 MCP Agent Strategyプラグインの設定

インストール後、以下のようにMCPサーバーURLを設定します:

```json
{
  "server_name": {
    "url": "<https://actions.zapier.com/mcp/*******/sse>",
    "headers": {},
    "timeout": 5,
    "sse_read_timeout": 300
  }
}

7. 実際の動作

対象のアドレスを指定してあいさつ文を送らせてみます。

自分のアドレス.jpg

まずは、文面の案を出してきました。

名称未設定のデザイン.jpg

「はい」と入力すると……

名称未設定のデザイン (1).jpg

ちゃんと送信が完了しています!

AIアプリにお願いするだけで、メールの送信(を含む様々な操作)を完了できる点が、MCPのすごいところです!

DifyとZapierMCPを使ったツール連携ユースケース5選【有料会員限定】

ユースケース1:自動メール送信

image.png

ユースケース2:カレンダースケジュール管理

image.png

ユースケース3:顧客情報管理

image.png

ユースケース4:ワークフロー自動化

image.png

ユースケース5:通知・アラート管理

image.png

まとめ

AIテクノロジーの進化は止まることを知らず、その活用方法も日々多様化しています。Difyのようなツールは、AIの恩恵を広く社会に届けるための重要な架け橋となっています。

今後も、Difyはオープンソースコミュニティの支援を受けながら進化を続け、より多くの機能や統合オプションが追加されていくことでしょう。AIアプリケーション開発に興味がある方は、ぜひDifyを試してみてください。自分だけのAIアシスタントやアプリケーションを作る楽しさを体験できるはずです。