### 安装 Git LFS | |
开始之前,请确保您的系统上已安装 Git 大文件存储 (Git LFS)。使用以下命令进行安装 | |
```bash | |
git lfs install | |
``` | |
### 从 Hugging Face 下载模型 | |
请使用以下命令从 Hugging Face 下载 PDF-Extract-Kit 模型: | |
```bash | |
git lfs clone https://huggingface.co/wanderkid/PDF-Extract-Kit | |
``` | |
确保在克隆过程中启用了 Git LFS,以便正确下载所有大文件。 | |
### 从 ModelScope 下载模型 | |
#### SDK下载 | |
```bash | |
# 首先安装modelscope | |
pip install modelscope | |
``` | |
```python | |
# 使用modelscope sdk下载模型 | |
from modelscope import snapshot_download | |
model_dir = snapshot_download('wanderkid/PDF-Extract-Kit') | |
``` | |
#### Git下载 | |
也可以使用git clone从 ModelScope 下载模型: | |
```bash | |
git clone https://www.modelscope.cn/wanderkid/PDF-Extract-Kit.git | |
``` | |
将 'models' 目录移动到具有较大磁盘空间的目录中,最好是在固态硬盘(SSD)上。 | |
模型文件夹的结构如下,包含了不同组件的配置文件和权重文件: | |
``` | |
./ | |
├── Layout | |
│ ├── config.json | |
│ └── model_final.pth | |
├── MFD | |
│ └── weights.pt | |
├── MFR | |
│ └── UniMERNet | |
│ ├── config.json | |
│ ├── preprocessor_config.json | |
│ ├── pytorch_model.bin | |
│ ├── README.md | |
│ ├── tokenizer_config.json | |
│ └── tokenizer.json | |
└── README.md | |
``` | |