Google Drive
本文介绍如何从Google Drive中加载文档。目前只支持Google Docs。
使用前提:
- 创建一个Google Cloud项目或使用已有项目;
- 启用 Google Drive API (opens in a new tab);
- 为桌面应用程序授权凭据 (opens in a new tab);
- 执行以下命令安装所需的模块:
pip install --upgrade google-api-python-client google-auth-httplib2 google-auth-oauthlib
指定GoogleDriveLoader
默认加载凭据文件的路径:
credentials.json
文件默认路径为~/.credentials/credentials.json
,可通过credentials_path
参数配置;token.json
文件会在首次使用加载器时自动创建,默认路径同上,可通过token_path
参数配置。
GoogleDriveLoader
支持从Google Docs文档ID列表或文件夹ID中加载文档。可在URL中获取文件夹或文档的ID:
- 文件夹链接:https://drive.google.com/drive/folders/1yucgL9WGgWZdM1TOuKkeghlPizuzMYb5,文件夹id为"1yucgL9WGgWZdM1TOuKkeghlPizuzMYb5"; (opens in a new tab)
- 文档链接:https://docs.google.com/document/d/1bfaMQ18_i56204VaQDVeAFpqEijJTgvurupdEDiaUQw/edit,文档id为"1bfaMQ18_i56204VaQDVeAFpqEijJTgvurupdEDiaUQw"。 (opens in a new tab)
使用示例:
from langchain.document_loaders import GoogleDriveLoader
loader = GoogleDriveLoader(
folder_id="1yucgL9WGgWZdM1TOuKkeghlPizuzMYb5",
recursive=False
)
docs = loader.load()