Den4ikAI
/

ruBert-tiny-replicas-classifier

Text Classification

Model card Files Files and versions Community

Den4ikAI commited on May 17, 2023

Commit

0e885c2

·

1 Parent(s): 67520b8

Update README.md

Files changed (1) hide show

README.md +37 -0

README.md CHANGED Viewed

@@ -1,3 +1,40 @@
 ---
 license: mit
 ---

 ---
 license: mit
+language:
+- ru
 ---
+Описание классов:
+1. about_user - реагирует, когда пользователь говорит о себе. Например, "меня зовут андрей"
+2. inaccurate_question - реагирует на философские и размытые вопросы. Например, "что такое любовь, когда деньги придут за мной"
+3. exact_question - реагирует на точные, фактологичные вопросы. Например, "когда родился пушкин, почему трава зеленая"
+4. instruct - реагирует на вопросы, ответ на которые представляет собой инструкцию. Например, "как установить windows, как приготовить борщ"
+5. about_system - реагирует на вопросы о личности ассистента. Например, "как тебя зовут, ты кто такая"
+6. problem - реагирует на реплики, где пользователь рассказывает о своих проблемах. Например, "у меня болит зуб, мне проткнули колесо"
+7. dialogue - реагирует на диалоговые реплики. Например, "привет"
+Код инференса:
+```python
+import torch
+from transformers import AutoTokenizer, AutoModelForSequenceClassification
+device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
+tokenizer = AutoTokenizer.from_pretrained('Den4ikAI/rubert_tiny_questions_classifier')
+model = AutoModelForSequenceClassification.from_pretrained('Den4ikAI/rubert_tiny_questions_classifier')
+model.to(device)
+model.eval()
+classes = ['about_user', 'inaccurate_question', 'exact_question', 'instruct', 'about_system', 'problem', 'dialogue']
+def get_sentence_type(text):
+    inputs = tokenizer(text, max_length=512, add_special_tokens=False, return_tensors='pt').to(device)
+    with torch.no_grad():
+        logits = model(**inputs).logits
+        probas = list(torch.sigmoid(logits)[0].cpu().detach().numpy())
+    out = classes[probas.index(max(probas))]
+    return out
+while 1:
+  print(get_sentence_type(input(":> ")))
+```