File size: 2,690 Bytes
2ae4669 |
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99 100 101 |
---
language:
- vi
library_name: transformers
pipeline_tag: text-classification
tags:
- Vietnamese
- sentiment
- analysis
---
# Sentiment Analysis in Vietnamese - Phân tích cảm xúc trong tiếng Việt
## Phở Bert phân tích cảm xúc
## Model description
Mô hình có tác dụng xác định cảm xúc của đoạn văn.
Sử dụng nhãn: "Tích cực", "Tiêu cực", "Trung tính"
Ví dụ:
Thời tiết hôm nay không được đẹp, trời mưa và lạnh.
```text
Tiêu cực: 0.9596341252326965
Tích cực: 0.010115462355315685
Trung tính: 0.030250443145632744
```
Hôm nay đi làm thật vui, ăn uống thật ngon.
```text
Tiêu cực: 0.002220266032963991
Tích cực: 0.9917450547218323
Trung tính: 0.006034655496478081
```
Bình thường. Không có gì đặc biệt.
```text
Tiêu cực: 0.03198615834116936
Tích cực: 0.05307402461767197
Trung tính: 0.9149397611618042
```
## Base model
Mô hình được đạo tạo dựa trên cơ sở của model PhoBert-Base của VinAI (https://huggingface.co/vinai/phobert-large)
## Training data
Mô hình được đào tạo dựa trên dữ liệu được thu thập bởi linhlpv (https://www.kaggle.com/datasets/linhlpv/vietnamese-sentiment-analyst) - có chỉnh sửa.
Với 31436 nội dung đánh giá sảm phẩm.
## Model variations
Chưa xác định
## Intended uses & limitations
Chưa xác định
## License
Đây là một open-source library, bạn có thể sử dụng nó với bất kì mục đích nào.
Rất cảm ơn nếu bạn ghi nguồn khi sử dụng mô hình này (nếu không ghi cũng không sao).
### How to use
```python
from transformers import AutoTokenizer, AutoModelForSequenceClassification
import torch
import os
def clear():
os.system('clear')
checkpoint = "mr4/phobert-base-vi-sentiment-analysis"
tokenizer = AutoTokenizer.from_pretrained(checkpoint)
model = AutoModelForSequenceClassification.from_pretrained(checkpoint)
clear()
print("Ngày hôm nay của bạn thế nào?")
val = input("")
raw_inputs = [val]
inputs = tokenizer(raw_inputs, padding=True,
truncation=True, return_tensors="pt")
outputs = model(**inputs)
predictions = torch.nn.functional.softmax(outputs.logits, dim=-1)
clear()
print(">>>>>>>>>>>>>>>>>>>>>>>>>>")
for i, prediction in enumerate(predictions):
print(raw_inputs[i])
for j, value in enumerate(prediction):
print(
" " + model.config.id2label[j] + ": " + str(value.item()))
print("<<<<<<<<<<<<<<<<<<<<<<<<<<")
```
## Liên hệ
Mọi thông tin liên quan có thể liên hệ qua email: [email protected]. |