InternVL2-2B Food Recognition Finetuned Model
Model Description
这是一个基于 InternVL2-2B 模型使用 LoRA 方法在食物识别数据集上微调的多模态模型。该模型专门优化了对食物图像的理解和描述能力。
Key Features
- 基础模型: InternVL2-2B
- 微调方法: LoRA (Low-Rank Adaptation)
- 训练迭代: 640 iterations
- 特定领域: 食物识别与描述
- 多模态能力: 图像理解和文本生成
Training Details
Base Model
- 架构: InternVL2
- 参数量: 2B
- 类型: 视觉-语言多模态模型
Fine-tuning
- 方法: LoRA
- 配置文件: internvl_v2_internlm2_2b_lora_finetune_food.py
- 训练步数: 640
- 学习率: 3.5e-5
- 训练轮数: 10 epochs
Usage
- Downloads last month
- 4
Evaluation results
- Accuracy on food-datasetself-reported85.500
- F1-Score on food-datasetself-reported84.300