Slackで社内文書検索 4/4回（任意のLLMによる回答生成編）

関連記事

LangGraphとは

はじめに

この記事は、「Slackで社内文書検索 3/4回（Slackからのコマンドとメッセージの受信編）」の続きです。開発の流れは以下の通りです。

メモ

開発の流れ

Slack APIアプリの作成と設定
Vertex AI Searchのアプリの作成とデータストアの自動更新
Slackからのコマンドとメッセージの受信
任意のLLMによる回答生成

今回は任意のLLMによる回答生成について説明していきます。 Cloud Functionsのファンクションの作成やコードだけが見たい方はこちら

概要

今回は以下の処理のうち、Pub/Subからイベントを受け取って、ユーザに返答するまでの処理の説明をします。

任意のLLMによる回答生成

今回の見出しが任意のLLMとなっているのは、コマンドによってLLMを指定して回答を生成するようにしているからです。コマンドは「Slackで社内文書検索 1/4回（Slack APIアプリの作成と設定編）」の記事で示しましたが、再度示しておきます。

コマンド	説明	備考
コマンド	説明	備考
/palm2	回答生成に使うLLMモデルを「PaLM2」にする。	コマンドに続けて質問文を送る。
/gpt-3	回答生成に使うLLMモデルを「GPT-3.5」にする。	コマンドに続けて質問文を送る。
/gpt-4	回答生成に使うLLMモデルを「GPT-4」にする。	コマンドに続けて質問文を送る。

回答生成では、Vertex AI Searchのアプリを用いて、メッセージ（質問）に対する関連資料を検索し、任意のLLMモデルを使ってその資料の内容を参考に質問に関連する回答を生成します。回答生成の処理の概要を以下に示します。

https://viewer.diagrams.net/?border=0&tags={}&highlight=0000ff&edit=_blank&layers=1&nav=1&title=回答生成.svg#R7Vxrd6LI1v41fuxeXBP9iGIMOQIxYgx+maVoIwjqqxiEX3+ezU1ATSfd6X77zOpZMxMsqnZV7etTu6po8B3/2NtNt0t1M194DY6ZHxu83OA4lm0J+EMlUVoi3DJpgb1z5mlRqWDoxIusZV56cOaLfVaWFgWbjRc422qhtVmvF1ZQKZvudpuwWu3bxptXCrZTe1EZBhUMram3OKs2dubBMi1tiqXa9wvHXuY9s0z2Zja1VvZuc1hn/a0360X6xp/mZLKq++V0vglLRXy3wXd2m02QPvnHzsIjtlY5dnflbTHk3WIdvKcBlzZ4nXqHbNbZuIIoZ0MykQXVZxp8O1w6wWK4nVr0NoTgUbYMfA+/WDye958N6XWxCxbHUlE2nt5i4y+CXYQq2dsvvJgNItObm4xEeBLCLZOVLUsC4HKFm2aCtwvaJw7gIWPCFQ42/zyOCM0KP1o3Z/xoiefsYHMd+yl23Px57PjC8rdVhtyeMaTJXdAP4TMYIvx5DOEEvsoP4ffx4/aMHR1vc5g3OCgOz9L87w5rK3A26/0Zn/arRWAtMzaVWEIzd+CHJc+x1ygLNsQzbzpbeI+bvUPEUGqBYYtdqXq/VmG2CYKNjwrTjE7RYg9pOGvbILrylxuUfNusgywCsWz+Oxtp/ruz8Ta7ZOR8K/mHKC2nW6rj+EkwaU/32zQUfXOOpAHt5IWUlzJ5CZ7n02Da4KX0J3e3f7UbXPsIJnCdx3uNm0RtYTY+HqyYcab3T4wlb177/JyfRyKvRuKr5VuvqiuFaqcVz33LUe6XwawnxvrabCn+kpnft2Pdab7O/Wd33usepuPm68y/O8wixZ5z3mres1uKq4SK095Mxt56ej/A767Yd1eCbqxE3bB41egedbnLaR208T1vzjy8LmTGUTtSqMhoK1+tj7k8OJpgGvsHzIZZjI+ecv8kWr1RS1k/eYv7wavJa7HiCr7CL5d6uDpY/CBccJPtrBfeKPEg0uVnX5ODVk6nv9YY9SXwp+PjXndUTnO91cQ1b78NTXfR6952hmI8lx9uJ763n8kb1xw/u6Y/Weo8k/fR7PPpWB6drI1xDM2Xp43S0/bmixY/Dh9Ao+soPXBjxcSKrB50w1MxY67vDqK5ax1UQ9urkRThN7NwlNe3aUl1Wvu+odpaR4r7xsPNbEjlS6LHzB0m+j49JadH3GfBfXEmD4he1DeUQHMYbuEzB1XuBno3TN4r8sOe3qmrMMzGcKM4zYqE2kvog21yxyWkCAmB00PFnkDWhtHl0RM3k9VAdQRG9UziBGPIVP70Hkqdc0pah+aN+RtqoPfCQI0YZu4+1Kn1rColp6xXJ/4k/IggI2bWYZi+McBIpUiRTVtbb4P+UAjVoSTgHfFDUOQReLCyqY6RajFX4ftg1TQ5L0LPHngvPA4VDlbiLgzG0YeCqIMzlgsrGL7Z5kjzNvkVrGpF/cFCFbIwpx8XOo8ZalvL1/aTIeiTZRlqWreniaAhJvJz2hHRq/Gm01rnvT+mPgBvPyvCstUIy7aaZyFFuBBS+E9AYK3vRpRhsNklTvNvPPnj4wlZDjcdP/MDv0VWAWuTbPRjq4bplDxdPL/3yAqYxUvbg6djJi9Lps9psRWVbT6JAfdFDGBU12Yn7qAWA+6KGKC5pjjpmVwpBlCciYo4w93Bnz34plGLM3zeh+ZP/FKMMcJXi38SZ73R97yek3s9zLVnR+q9yQ/l9sc8L3xVe6OuTX7aeU9sKGLNUe9I/ExGPODsQF1vyj6nafXumGmn7c56dzFpA/gB39JegYZGkX0qP3AaY4e1/tbVvlSn7PsymgkNim1TecKpI5up+1WLtKfTTv0jNId8KnHqpEH41Vt60/F8Myd/iDrWmsq7B63sbyGHydtzikpzEqfw83N3rqj3H+CFYdv62EbMn28oVn8o0glppPshCYifIIGj6tvc3L1TtOqMMe4Hz+QHdhZtYOcUobrUPz8dPzHTjOvT3vN2wi0ZSCqmCJTUHwrs74tCnNj8ytfjkPCVE89Ckch+5W7Oo5HAfhV/Ph69J0eymNuL3L1vdsFyY2/WU697Kq0EBK4anhbruUTpKgox3sZaGUtnnRbfOV5eqbqm3Ae7zarISnFp7Yy8kLyf7oLS7/l0v6w1LkUfgWsKdzy92Rx21uJxsXPApcVumIY1VGriJUjai+DKS+uwe006eHNJS2x6U/IlmRbZtN3CmwbOazUpd0mgGbnHjYNuT1iGq+uQcFulkc06bVbOldUp1fMOZ5QyFtUpJRpWzPJ9Ssf/Vbr/ZaUTxc/ROaH59TuUPlHn3pHa+qtzf6zO1bLExZLtw26urrt1Qp+ncTxzrnFdvtHkGpKQPPANrIrShzafPTSbWZ0Wmt54YHx7tsOTTU+NbqvRZBpNttEVGu27hsSeqTDQR3CmHMkWDZQXelgrKunv2bqvvrD0nfk8MYJLOd+qYn/GKr3IvuaSYs93Bm6bF1bpn5D35dnLouOJ5Zmg+ExQ7XYuw05eUpLhucToFdto3WYP0s0lOTdJI5qoc9No3eRqkhK8IfVpoa/bRltoSOde7N+jAnkSJtcApvX7NOACLj5nPT2IjRaTyKlLr/7FwmDqwfqW+33iuBC9LxsJLKqdu9nC395VbRUPrX+vpGobzBwvfr09X1U2b3+NpHT95WUUhvPWbM2t2no8aD4uv1wS3yfsK57x5ALn3tiJZ7+783xpY5FlfxmXxDMuPR5mIDWk//9NB/9p6eCu0HfVY7o9aIqabEearETVFLES9qkfGf8Zq1CLVUaXzZhSUOdbjlfoyVdp/PQ2pMnp4ydfc69uQ15JQX94G3I1GU/ickKP2s97z5HS8yip1wbXKG3K9F2TwbOYPnfFSuLOGBww+2oK1VBQZqIMc7p/8izv+TB9eaIkImtxz9EIxmFyz48z7zmeDBXb5Fr7Ga8E07HITF4ewhl3XM573uvMYWnOVJYkIEereafEN9qO8yejyX7GtVboK/nbH2uvs16Ltq/ciT/xq8nDdJbPnVnv+TDptLczl3FGXIu1fM174h+WVm+5NaNqArnPZbNwy5to7NLi9vZ0TMlvBbpKugdOuIMsvTk4qMkG3Hw7uX/aUPJZ6wh8Lc15VB2B1xzFno3v4in7Jpdqszjb+nPyrb9u1HfTBColUvvuSMBzxkcFOvgczTq2OxiuqknaTiswX7RdJd3de/atUhIZFlxOIIeK+9a2onlIkr3ptiKHMR3zbcW+a0U1uRhHd/ryAOojzCLZ1kn594OtVwfa7MlaH/WOEOmdfAsVUnCup/Uxx5QPJAU/3CiMskXPjAVPY3ETeCmG7Dgyx2IMXjCToU2b1ILWkfB3dSlBXm3rs8v5/cN20bEP2lAK+q7NKx20j6TkN7SE1YdSpOKvGq2K7RWUcyg/ojxSfRtcGIlz1z6o8tOmb3QPWrLFXk/wNy9tXt+no5/4rWhmoKbfYlDu/UdWY/g8+LtRpEYS9QhfN9jm2wT4zSQjiARGG9uoJzFzN+lZSd69bJz6oYbqNkC6fZFtV2AGio12R31cmY2iYja0ffEGLdik9ZFN+ze1I+FolGkH7BGa8tYme5R5wGRznryf6o6yjfZUZ9/ebK9YRcrjYdH3UX97g1/sp9ubad9p/ctty1od0wbiZP1ICaXk309BagU0y1ceOVAtQTX+wsojXz9+PlI7Pzj4nM6QYyTlL1b7pVgtRQz0zNL2O0Xs6bh1SP11F/Yx2U5e5p1ZYn+SDT8TqfEKKEESYD+26lpAFjanxopQw2q8Rt7RVSO9xwYV5OGqsAcr1GWFnY2ZwvMqHSnV+0iyH3tP3mStpnHaT56rscNW5OO67hHhn5ezNXkfeMUOw2kOfC/QneZ295orkcWLwDfcf2B9KeXjcjF+jtRylLYxDps8U7Z5j1qt0Bxr2/n96gY+JznUk7ReJ34Rcyz5Dowd7SkapccUMKpZggc8ZmFswuyQzpZ8aRJlZBvRganP7eMjCNQS+qH2KX8y7Dh8eEVv8KZPog4+pMeGEsknkQU8EhGLfnYWwk/OIu46lRlQ+yz2lOrFajzis9gWKLLFQ0/BAYvXhuFRNTA7wvqGYuuJj1dFcIft0wyhq5qR6HkxqwzBAr1nawK5QOt4tqnsFuOPZlzg9V9STKgD0+hA5Yi/u8mQ3QP9eiZ3F+rrh9f5WFzpEbud+UFMZXiPvh5ep9zoZua3DpNhXUolf/9xrvMXpH466OYztmqMgCRhq4ayB2/AAynWDFNQeipsOQQ+60aqPACSYWDHKw5xLurLFOPJviUR5UcgL7LVUCf+Fs9APIhdqMNoURhW6nVCQkPge5dTHaArwgWQCf7b940SbVnCb4qrSqjRAbyiTVhugzVb0Ubol/uRLbs0BrRpe33Dsk9tV/uCZq28RJ9X7jf2bCiFoC0iHrOI87Eud20zQplcjE/8MI/klX2an4W5PmN8pl3iAc2noJkg0cu8EvR0fLm8OCDOvN2xypMBd51fK7wrj2dynV+uVKYjluYrYD1tL5x2kMpPBa5aRRiHoGKVQWWFTFya/wDexjxqrlLiOdbdw/JcK/IQa7oVaOMRftd5U9CN9eEbfKPDm6SPxZhGJz0bVvSMeYNv79czR7qqC+CZhj5gH1g7yl0B/WMNiVWNAT8zfC/v7Kq+1XinlHQE/Yf1uiWadlW/Kryo2yZ+n8ZS08sa/cq76ljkSn+F3tfK6zwr6Rl0TIadOH959Q5e8ShnPmCT9Tle9vUueNip2m6J3vGch1f9vaB3pJM/rbYLsaq+zitD4pWSX+7TMdGSPPon/ofAp7V3NTrw/QbkosngRWwB11qi6q54io99Y4TfyZWFbM600idZWCGe07litQ+aiM0je+5IkU64xhhgfZjxfYh1qZH4tKJdXj+jl9Cgg+alvlK6SWzI+krbEB/yvgIV627UZ7CWTWNVcmjdEsGvLFZl/WXjLMab/07jXkBjngxRP+0DmEfltag9TrGVwquxKcI/wXet8NvkVLnLaojRZUT90/wq4m1Bw07ybqirFjxKeZDSlYq5ap0wwvg5pRi/FGopBknbQ7eTNkaC8ZjT/CkWKwLhKvTP5D64NI/jJT6mODHxCZX+0nG1b5Qek9iYGlO8H6TjpXHGZtJnITe6FtFlbC1Gf67KEB+JNyrlZBATNBpPh4EtWyzGBxmE6G8AjDsQlETWSqy63SPZKuZAYzqmPs0WgOh54CjK+sb0jPKYrmIAG2NdRuWQozHiU/rAE64E/JHYPNZ3WDENpSRfohnqEXTSLJY8YjGmPfSAob5hmwLawF9RPDPDxL9RHgbPKT9MzMvkNIN8C7UZ0XjjVHfoosNIyOROmTj0i1WEkdg62o0QF81Ep+ATmYz/GJPKom2McfOp/O2I8CbGDRmCPvH/bXxfXwmdsu8uZd9NUU8z+kEJe5fxfraO3QDzBDm2D2Y97zAZa0tL3kYz/vkwkevvtq/TsXADGuzMH9z2x95hyoM7L8ASLxltY3uYcaJXxfhY28jwv2frhjrOJ9tU4bss0iEm4UescmexMpJK2Lzq4y/jsSqGfcP3l+OHWPHnVezKX4mPYgVvVtsXbau+/h24K7NHwoB6sruhsJphc7X1D6cPP8qXCn7AuO7q2F4sY/vaGuEN/GBdWQetju/iD8ozX1jC7icZXZNxFTvY8DcDVu/8EHaoxtgqlj+qPWD56Ad0SK7j+NU1PoVqJF3lNfou84oDr/grvKpikCrWyteMR/gU0FZE9LHH2gvPEl1EYdJ4SPo2wnqS1loUAySKHUzqu0esLqtCn9rHRMdCfcIfqwj97xP7dRXwD/4W61ItWTNgrSdbFANi0LWT3ToDfYOvGu1kGCoLO8jrJnPXYuoX8TyJbbTPNWIoFwA5o5xit20Do2C9pxy1YRrDkvgv2zblpgnTpeskartK4nTqn80j4gRdFqQcC2xKTWOeQZcxrZR+jJgVW4n/AM/gxwb7tI7C5rhLJxwXd0PNGO1prEncMuyfx1+y+sN4IvUxSV8nDDGUqtjpzrR1GXoVn8ab6OcJ75Xa5tigmEMFK1DMreIvOwL+gg3n2AT41FFKebR0pzTNUSVx7baeJ9KLXWmL08fPvmakea3+uJSDK8WvbB/+BvH5lO8aH7czHzHxRSriVu3d/8047/DOvFc5hwe5D0LoyFnGsXQ1JaA9fOh1DD2Ff+3yaoJB6MpwgosIa4TpO4ls7Zj4WnkV92XCFl1WdQe18uKZIb9G9gM/wMLO6fLkEbZUq3OtLe3USpRL3Cf58MRWye4QY/AMXEW5nEo5+Ep+JYRuJnpS6rvUplqvNHbCrCV6RUzL1hmwTdkSyYYwHr5oI5ON27BT6H5UjIUv84D2/2AfbKKbEXCnDLw4LNVJcFZOzyqNLe9zkNhmTl+l/EhBp1p+GkOCB2DHA9jKiFVO49yTD8z7uNwWcwdmBoYmP47YqkL+wDywXdhUiJjVfmuNnJ0NoX0L2LuE/mFjwMS0mws/LNbXnbU4Te0RhxUOc6Rr7FG173e1hS+G3pKfB/4gf0HvVcpTXVunDqX0KiQweeIvDfK9FvylSb6NYpCg3BU5zBhjg/+Dn0eMMIfvGNMb+ct3jOmtnOU7+HEl5/axtmIlH1vN5wIroB18wU/x4qNtOxVM8h4+Xmlri+/S52sYNVvja4RNaO1FuC0m3DDiEZ+Bg7sflPFZrvajPA0+3P4a7v0oX6/ky5J1AbATeBT/LD/eI6s3Me7H5vPjOnZ5jRTTiRiUxYhPv9defm4u5bbxj9sL2qb2kvhQ2EmcxDND5eg0FvA6B1y2rOHGMJtPUMnnlfM8wKOpXpXzfVI+ljKtCp5N35+waIYZOcrZVPJmV9pl+akiZ5joe4cRqljTYiH/cYZpWNhCpCe5Psw92b+nM0X0cRCFwToHWGzw3f7yfBedvdScMo5NcmzX+Fel+Qav8vk8Y82vJbknOpPw/XGlfwdidiY0s3/4RR9r0k7SF5PIK5a4szzdD+aUNAPrHt+MvpNTOt9Drr2b+q3tzM1zS3s6cbmzOG1pYT2dY3LdF19n/qiys4+1CaN2znbm5V99yui2dt2IPz8zz184M//rzhidf3zq7GDR3wuL5xcWa7cT36UCv+GSbPGhv4/eWKx//+yM0OfdWLysh+/4ZuBfPfxj9bCuPjzL/Zge1hX6jNCv1sPzTye9eU8yva4pVy9n4t8/++bXT4Ww+s2v5oVPR/7Oa1/ChRvQf9y1r+Ke8f/bvS/hwm3jsyPEtfO33z1F/N3Dwskx43bxMd+SP/yW/HPxTO/lY7/4vQwC+nCxRJzg7qz5mvvqWJv1NwfC3X210CN3lxwE5u6ofE8HgTeWM/W++Iu5M/1Cnx5GmUhO5Y79Z+hhYP9YNKbF/J/9q/2F5Zpft/C3n6EBDF+7ysqJ4tcLH97hz7UgL/t8Jfj7TZT/5TB79vkcnq19LfDdcbb+SZ8zSr840Arn11AbXbHRatMV9+4txdSW8O/5SsVPXk3JvytTxFz+zI980qV4/Dx9Oj0V9unT9Hz3vw==

1. イベントを受け取る

Pub/Subからイベントを受け取る部分は、Cloud Functionsでファンクションを作成する際にトリガーとしてPub/Subを指定することで実現にします。設定方法はこちらで説明しています。受け取ったイベントからメッセージとコマンドを取り出すには以下のように関数を定義します。

python

@functions_framework.cloud_event
def send_slack_message(cloud_event):
    # Decode the Pub/Sub message data
    pubsub_message = base64.b64decode(cloud_event.data["message"]["data"]).decode("utf-8")
    pubsub_message_data = json.loads(pubsub_message)
    message = pubsub_message_data["data"]["message"]
    message = message.strip("<>")
    command = pubsub_message_data["data"]["command"]

2. 資料を検索する

ここではVertex AI Searchのアプリを使って、質問に関連のある資料を検索します。今回はLangChainのRetrieversのGoogleVertexAISearchRetrieverを用いてVertex AI Searchの検索機能を実装しました。 GoogleVertexAISearchRetrieverを呼び出す際にたくさん引数を渡しますが、今回はmax_documentsに注目して説明します。その他の引数の説明についてはこちらをご覧ください。 max_documentsは検索結果として表示する資料の数を指定するものになります。今回は1にしていますが、データストアが大規模になるにつれ、関連資料が増えてくると考えられるので、将来的には複数の資料を引用して回答生成することも視野に入れています。

python

from langchain.retrievers import GoogleVertexAISearchRetriever
 
retriever = GoogleVertexAISearchRetriever(
    project_id=PROJECT_ID,
    location_id=LOCATION_ID,
    data_store_id=DATA_STORE_ID,
    max_documents=1,
    engine_data_type=0,
    max_extractive_answer_count=1,
    get_extractive_answers=False,
    query_expansion_condition=2,
)
result = retriever.get_relevant_documents(query)
url = result[0].metadata["source"]
document = result[0].metadata["source"][result[0].metadata["source"].rfind("/") + 1:]

上記のresultには参考資料のURLやその資料の要約などが含まれていますが、要約の精度があまり良くなかったので、今回はURLのみを利用します。また、documentではURLから資料の名前（例：○○.pdf）を取り出しています。

3. 資料をロードする

ここでは、検索してきた資料の内容をロードします。今回は、LangChainのDocument loadersのGCSFileLoaderを用いて、ファイルをロードします。関数の中で、資料検索とファイルのロードをしています。

python

from langchain.document_loaders import PyPDFLoader, GCSFileLoader
 
 
def load_pdf(file_path):
    return PyPDFLoader(file_path)
 
 
def load_text(message):
    url, document = search(message)
 
   
    loader = GCSFileLoader(project_name=PROJECT_ID, bucket=BUCKET_ID, blob=document, loader_func=load_pdf)
    text = loader.load()
 
    return text, url

4. 回答生成

ここでは、PaLM2とGPT-3.5、GPT-4の3つのLLMで回答を生成します。今回は、LangChainのChainsを用いて回答を生成します。回答生成の処理は以下のようになります。PaLM2ではStuff、GPT-3.5、GPT-4ではMap Reduceという方法をとります。

回答生成の処理

PaLM2 PaLM2は試作段階であり、GPT-3.5やGPT-4に比べ、出力の大きさが小さい上に、クオリティも低い。（2023/10/30現在）そのため、PaLM2はStuffDocumentsChainを用いて、テキストを参考に回答生成する簡単な処理になっています。 StuffDocumentsChainを用いた理由としては、StuffDocumentsChainはドキュメントを複数プロンプトに埋め込めるという特徴を持っているので、将来的に回答生成に利用する資料の容量が増えたときに対応が楽になるからです。

The stuff documents chain ("stuff" as in "to stuff" or "to fill") is the most straightforward of the document chains. It takes a list of documents, inserts them all into a prompt and passes that prompt to an LLM. 以下にコードを示します。

python

from langchain.chains.llm import LLMChain
from langchain.prompts import PromptTemplate
from langchain.chat_models import ChatVertexAI
from langchain.chains.combine_documents.stuff import StuffDocumentsChain
 
def summarize_palm2(message, docs, url):
    prompt_template = """\nUse the following text to answer the question. If there is no information relevant to your question, please say "No information".:\n# Question\n""" + message + """\n# text\n{text}"""
 
    PROMPT = PromptTemplate(template=prompt_template, input_variables=["text"])
    llm = ChatVertexAI(model="chat-bison@001", temperature=0)
 
    llm_chain = LLMChain(llm=llm, prompt=PROMPT)
    stuff_chain = StuffDocumentsChain(
        llm_chain=llm_chain,
        document_variable_name="text",
    )
 
    return stuff_chain.run(docs)

今回ChatVertexAIのモデルはchat-bisonを用いましたが、目的に応じてモデルも変更できます。モデルの一覧は以下のサイトをご覧ください。

https://cloud.google.com/vertex-ai/docs/generative-ai/model-reference/overview

GPT-3.5とGPT-4 GPT-3.5、GPT-4では回答生成に、load_summarize_chainを用います。 load_summarize_chainを用いることで、Map Reduceを簡単に実装できます。処理の流れを簡単に説明します。まず、参考資料を分割して、それぞれの資料から回答生成に必要そうな情報を抽出します（下のコードのPROMPT）。次に、分割された資料から抽出した情報から回答生成を行います（下のコードのCOMBINE_PROMPT）。以下にコードを示します。

python

from langchain.prompts import PromptTemplate
from langchain.chains.summarize import load_summarize_chain
from langchain.chat_models import ChatOpenAI
 
def summarize_gpt(message, docs, url, model):
    prompt_template = """
    You are a professional editor. Please extract sentences related to the following questions. However, the following constraints must be followed:
 
    # Constraints
    - Do not omit any important keywords.
    - Extract without compromising the original intent of the text.
    - Avoid using fictional expressions or terms.
    - Do not modify any numbers within the text.
    - Ensure that the extracted sentences contain detailed information.
    # Question\n""" + message + """\n# Input Text\n{text}"""
 
    # ただし、以下のテキストに以下の質問に関連する情報がない場合は「出力フォーマット1」に従い、以下のテキストに以下の質問に関連する情報がある場合は「出力フォーマット2」に従ってください。
    combine_prompt = """
    あなたはプロの編集者です。以下のテキストを使って、以下の質問に以下の出力のフォーマットに従って「回答」と「参考」を答えてください。:
    
    # 質問\n""" + message + """\n# テキスト\n{text}""" + """
    
    ### 出力フォーマット
    回答：（質問に対する回答を示す）
    参考：（質問に関連する情報がない場合は無し、質問に関連する情報がある場合は右のurlをそのまま出力してください）""" + url
 
    PROMPT = PromptTemplate(template=prompt_template, input_variables=["text"])
    COMBINE_PROMPT = PromptTemplate(template=combine_prompt, input_variables=["text"])
 
    llm = ChatOpenAI(model=model, temperature=0)
 
    chain = load_summarize_chain(
        llm, chain_type="map_reduce", verbose=True, map_prompt=PROMPT, combine_prompt=COMBINE_PROMPT
    )
    response = chain(
        {
            "input_documents": docs,
            "token_max": 7000,
        },
        return_only_outputs=True,
    )
    
    return response["output_text"]

回答生成と返信をするファンクション

以上の説明を踏まえてファンクションを作成します。今回作成するファンクションの作成方法は前々回の記事と変わらないので、こちらを参照してください。ただし、前回の記事と異なる部分があります。その部分は以下に従ってください。

メモ

変更内容

トリガー
HTTPS
未認証の呼び出しを許可を選択
トリガーの追加

:::details 説明

トリガーを追加を選択します。
Pub/Subトリガーを選択します。
イベントで「google.cloud.pubsub.topic.v1.messagePublished」を選択します。
Cloud Pub/Sub トピックを選択してくださいで前回の記事で作成したトピックを選択します。
トリガーを保存を選択します。

ランタイム環境変数
以下の４つを追加

名前	値
名前	値
PROJECT_ID	Google Cloud のプロジェクトID
BUCKET_ID	GCSのバケット名 (gs:// は不要)
DATA_STORE_ID	Vertex AI SearchのアプリのデータストアのID
OPENAI_API_KEY	OPENAIのAPIキー
SLACK_BOT_TOKEN	アプリの認証に用いるトークン
SLACK_SIGNNG_SECRET	リクエストの認証に用いるサイン
WEBHOOK_URL	Slackのワークスペースのチャンネルに返信するのに用いる

SLACK_BOT_TOKEN

Slack APIのページに移動

https://api.slack.com/apps
作成したアプリを選択
サイドバーのOAuth & Permissonsを選択
OAuth Tokens for Your WorkspaceのBot User OAuth Tokenをコピー

SLACK_SIGNNG_SECRET

Slack APIのページに移動

https://api.slack.com/apps
作成したアプリを選択
サイドバーのBasic Informationを選択
App CredentialsのSigning SecretのShowを押す

WEBHOOK_URL

Slack APIのページに移動

https://api.slack.com/apps
作成したアプリを選択
サイドバーのIncoming Webhooksを選択
Webhook URLs for Your WorkspaceのWebhook URLから今回のSlack APIアプリのインストール先のチャンネルに対応したWebhook URLをコピーします。

main.py

:::details code

python

import base64
import json
import mimetypes
import os
import tempfile
 
import functions_framework
import urllib3
from langchain.retrievers import GoogleVertexAISearchRetriever
from langchain.callbacks import get_openai_callback
from langchain.chains.summarize import load_summarize_chain
from langchain.chat_models import ChatOpenAI, ChatVertexAI
from langchain.document_loaders import PyPDFLoader, GCSFileLoader
from langchain.prompts import PromptTemplate
from langchain.text_splitter import RecursiveCharacterTextSplitter
from langchain.chains.combine_documents.stuff import StuffDocumentsChain
from langchain.chains import LLMChain
 
PROJECT_ID = os.environ.get("PROJECT_ID")
DATA_STORE_ID = os.environ.get("DATA_STORE_ID")
BUCKET_ID = os.environ.get("BUCKET_ID")
 
http = urllib3.PoolManager()
SLACK_BOT_TOKEN = os.environ.get("SLACK_BOT_TOKEN")
WEBHOOK_URL = os.environ.get("WEBHOOK_URL")
 
def search(query):
 retriever = GoogleVertexAISearchRetriever(
     project_id=PROJECT_ID,
     location_id=global,
     data_store_id=DATA_STORE_ID,
     max_documents=1,
     engine_data_type=0,
     max_extractive_answer_count=1,
     get_extractive_answers=False,
     query_expansion_condition=2,
 )
 
 result = retriever.get_relevant_documents(query)
 if query == "":
     slack_message = {"text": "質問文を書いてください。"}
     encoded_msg = json.dumps(slack_message, default=str).encode("utf-8")
     http.request("POST", WEBHOOK_URL, body=encoded_msg)
 elif len(result) == 0:
     slack_message = {"text": "検索でエラーが発生しました。少ししてからやり直してください。"}
     encoded_msg = json.dumps(slack_message, default=str).encode("utf-8")
     http.request("POST", WEBHOOK_URL, body=encoded_msg)
 
 url = result[0].metadata["source"]
 document = result[0].metadata["source"][result[0].metadata["source"].rfind("/") + 1:]
 # print(document)
 return url, document
 
 
def load_pdf(file_path):
 return PyPDFLoader(file_path)
 
 
def load_text(message):
 url, document = search(message)
 
 
 loader = GCSFileLoader(project_name=PROJECT_ID, bucket=BUCKET_ID, blob=document, loader_func=load_pdf)
 text = loader.load()
 
 return text, url
 
 
def summarize_palm2(message, docs, url):
 prompt_template = """\nUse the following text to answer the question. If there is no information relevant to your question, please say "No information".:\n# Question\n""" + message + """\n# text\n{text}"""
 
 PROMPT = PromptTemplate(template=prompt_template, input_variables=["text"])
 llm = ChatVertexAI(model="chat-bison@001", temperature=0)
 
 llm_chain = LLMChain(llm=llm, prompt=PROMPT)
 stuff_chain = StuffDocumentsChain(
     llm_chain=llm_chain,
     document_variable_name="text",
 )
 
 return stuff_chain.run(docs)
 
def summarize_gpt(message, docs, url, model):
 prompt_template = """
 You are a professional editor. Please extract sentences related to the following questions. However, the following constraints must be followed:
 
 # Constraints
 - Do not omit any important keywords.
 - Extract without compromising the original intent of the text.
 - Avoid using fictional expressions or terms.
 - Do not modify any numbers within the text.
 - Ensure that the extracted sentences contain detailed information.
 # Question\n""" + message + """\n# Input Text\n{text}"""
 
 # ただし、以下のテキストに以下の質問に関連する情報がない場合は「出力フォーマット1」に従い、以下のテキストに以下の質問に関連する情報がある場合は「出力フォーマット2」に従ってください。
 combine_prompt = """
 あなたはプロの編集者です。以下のテキストを使って、以下の質問に以下の出力のフォーマットに従って「回答」と「参考」を答えてください。:
 
 # 質問\n""" + message + """\n# テキスト\n{text}""" + """
 
 ### 出力フォーマット
 回答：（質問に対する回答を示す）
 参考：（質問に関連する情報がない場合は無し、質問に関連する情報がある場合は右のurlをそのまま出力してください）""" + url
 
 PROMPT = PromptTemplate(template=prompt_template, input_variables=["text"])
 COMBINE_PROMPT = PromptTemplate(template=combine_prompt, input_variables=["text"])
 
 llm = ChatOpenAI(model=model, temperature=0)
 
 chain = load_summarize_chain(
     llm, chain_type="map_reduce", verbose=True, map_prompt=PROMPT, combine_prompt=COMBINE_PROMPT
 )
 response = chain(
     {
         "input_documents": docs,
         "token_max": 7000,
     },
     return_only_outputs=True,
 )
 
 return response["output_text"]
 
 
# Triggered from a message on a Cloud Pub/Sub topic.
@functions_framework.cloud_event
def send_slack_message(cloud_event):
 # Decode the Pub/Sub message data
 pubsub_message = base64.b64decode(cloud_event.data["message"]["data"]).decode("utf-8")
 pubsub_message_data = json.loads(pubsub_message)
 message = pubsub_message_data["data"]["message"]
 message = message.strip("<>")
 command = pubsub_message_data["data"]["command"]
 doc, url = load_text(message)
 
 if command == "/palm2":
     response = summarize_palm2(message, doc, url)
     slack_message = {"text": "モデル：PaLM2\n質問：" + message + "\n回答：" + response + "\n参考：" + url} 
 elif command == "/gpt-3":
     response = summarize_gpt(message, doc, url, model="gpt-3.5-turbo")
     slack_message = {"text": "モデル：GPT-3.5\n質問：" + message + "\n" + response}
 elif command == "/gpt-4":
     response = summarize_gpt(message, doc, url, model="gpt-4")
     slack_message = {"text": "モデル：GPT-4\n質問：" + message + "\n" + response}
 else:
     slack_message = {"text": "コマンドがありません。"}
 
 try:
     encoded_msg = json.dumps(slack_message, default=str).encode("utf-8")
     http.request("POST", WEBHOOK_URL, body=encoded_msg)
     return "Message sent to Slack"
 except Exception as e:
     print(e)
     encoded_msg = json.dumps(e, default=str).encode("utf-8")
     http.request("POST", WEBHOOK_URL, body=encoded_msg)
     return "Message sent to Slack"

:::

requirements.txt

:::details code

python

functions-framework==3.*
azure-core==1.26.4
langchain==0.0.312
openai==0.27.7
pypdf==3.13.0
slack-bolt==1.18.0
slack-sdk==3.21.3
requests==2.29.0
urllib3==1.26.15
tiktoken==0.4.0
google-cloud-discoveryengine==0.11.2
google-cloud-storage==2.10.0
google-cloud-aiplatform>=1.33.0

:::

エントリポイント
send_slack_messageに変更

:::

以上でファンクションの作成は終了です！回答のクオリティについては、PaLM2はVertex AI Searchのアプリのデータストアの中の資料にない内容を質問するとハルシネーションが起きてしまいました。また、PaLM2は出力の大きさが比較的小さいため、GPT-3.5やGPT-4に比べ、ざっくりとした回答になりました。 GPT-3.5、GPT-4に関しては、申し分ないクオリティの回答を生成する上に、私が行った実験の中ではハルシネーションは起こしませんでした。

最後に

今回は任意のLLMによる回答生成の説明をしました。これで、Slackで社内文書検索システムシリーズは終了になります。今後の展望としては、参考資料を増やして回答生成を行ったり、PaLM2を活用できるプロンプトやパイプラインを探していきたいです。

参考

https://python.langchain.com/docs/integrations/retrievers/google_vertex_ai_search

https://python.langchain.com/docs/integrations/document_loaders/google_cloud_storage_file

https://python.langchain.com/docs/use_cases/summarization#option-1-stuff

Slackで社内文書検索 4/4回（任意のLLMによる回答生成編）

はじめに

概要

任意のLLMによる回答生成

1. イベントを受け取る

2. 資料を検索する

3. 資料をロードする

4. 回答生成

回答生成と返信をするファンクション

最後に

参考

関連記事

議事録作成システムの構築 2/3回(Speech to Text編)

社内文書に関するSlack ChatBot 1/4回 (Slack API 編)

【LangGraphチュートリアル解説】プロンプト生成編

Slackで社内文書検索 2/4回（Vertex AI Searchのアプリの作成とデータストアの自動更新編）

AIエージェント・Dify構築支援