--- license: apache-2.0 language: - en - zh - ja pipeline_tag: image-text-to-text tags: - fire - wildfire - multimodal library_name: transformers --- # Qwen2-Wildfire-2B ## 中文 Qwen2-Wildfire-2B 提供了对野火火灾场景的深度识别,可以提供比其他模型更深入的场景细节信息。相较于其他深度学习模型,它能够为消防工作提供更多有效的信息,且由于模型体量为2B,将来也可以方便地搭载到移动设备上。我们的模型能够识别以下八大关键要素: - 火灾类型与环境描述 - 火焰特性(颜色、高度、强度) - 烟雾特性(颜色、密度、扩散方向) - 火行为(传播速度、运动模式) - 受影响区域描述(火灾覆盖范围、涉及的植被或结构) - 现场应对措施(消防员、车辆、设备的可见性) - 环境因素(周围地形、风速、温度) - 图像质量(拍摄时间、角度、分辨率) 训练的数据集由4135张高质量图片构成,经过人工检查后进行标注,并用于微调 Qwen 的 Qwen2-VL-2B-Instruct 模型,取得了很好的效果。 ### 致谢与许可说明 感谢大家对本微调模型的支持。作为开源模型,欢迎大家自由使用,但请务必注明出处。相关研究论文已在学术会议发表,并公开了完整的研究流程和实现步骤。 ## English Qwen2-Wildfire-2B provides deep recognition of wildfire scenarios, offering more detailed scene information than other models. Compared to other deep learning models, it can provide more effective information for firefighting work, and with its 2B size, it can be conveniently deployed on mobile devices in the future. Our model can recognize the following eight key elements: - Fire type and environmental description - Flame characteristics (color, height, intensity) - Smoke characteristics (color, density, spread direction) - Fire behavior (spread speed, movement pattern) - Affected area description (fire coverage, vegetation or structures involved) - On-site response measures (visibility of firefighters, vehicles, equipment) - Environmental factors (surrounding terrain, wind speed, temperature) - Image quality (capture time, angle, resolution) The training dataset consists of 4,135 high-quality images, which were manually checked and labeled, and used to fine-tune Qwen's Qwen2-VL-2B-Instruct model, achieving excellent results. ### Acknowledgments and License Notice We appreciate everyone's support for this fine-tuned model. As an open-source model, you are welcome to use it freely, but please be sure to cite the source. The related research paper has been presented at academic conferences, and the complete research process and implementation steps have been made public. ## 日本語 Qwen2-Wildfire-2Bは、野火災害シーンの深い認識を提供し、他のモデルよりも詳細なシーン情報を提供します。他の深層学習モデルと比較して、消防活動により効果的な情報を提供でき、2Bのサイズにより、将来的にモバイルデバイスへの展開も容易です。私たちのモデルは以下の8つの重要な要素を認識できます: - 火災の種類と環境の説明 - 炎の特性(色、高さ、強度) - 煙の特性(色、密度、拡散方向) - 火の挙動(伝播速度、移動パターン) - 被災地域の説明(火災の範囲、影響を受けた植生や構造物) - 現場対応措置(消防士、車両、機器の視認性) - 環境要因(周辺地形、風速、気温) - 画像品質(撮影時間、角度、解像度) トレーニングデータセットは4,135枚の高品質画像で構成され、手動で確認・ラベリングされ、QwenのQwen2-VL-2B-Instructモデルの微調整に使用され、優れた結果を達成しました。 ### 謝辞とライセンス表示 この微調整モデルへのご支援に感謝いたします。オープンソースモデルとして、自由にご利用いただけますが、必ず出典を明記してください。関連研究論文は学術会議で発表され、完全な研究プロセスと実装手順が公開されています。