text-ypesk2

Sleeping

App Files Files Community

ypesk commited on Jan 31

Commit

37072c8

verified ·

1 Parent(s): 821e9d2

Update tasks/text.py

Browse files

Files changed (1) hide show

tasks/text.py +6 -6

tasks/text.py CHANGED Viewed

@@ -181,7 +181,7 @@ async def evaluate_text(request: TextEvaluationRequest):
     test_dataset = dataset["test"]
     if MODEL =="mlp":
-        model = ConspiracyClassification768.from_pretrained("ypesk/frugal-ai-EURECOM-mlp-768")
         model = model.to(device)
         emb_model = SentenceTransformer("sentence-transformers/sentence-t5-large")
         batch_size = 6
@@ -205,7 +205,7 @@ async def evaluate_text(request: TextEvaluationRequest):
     elif MODEL == "ct":
         model = CTBERT.from_pretrained("ypesk/frugal-ai-EURECOM-ct-bert-baseline")
         model = model.to(device)
-        tokenizer = AutoTokenizer.from_pretrained('digitalepidemiologylab/covid-twitter-bert')
         test_texts = [t['quote'] for t in test_dataset]
@@ -225,7 +225,7 @@ async def evaluate_text(request: TextEvaluationRequest):
         test_dataloader = DataLoader(test_data, sampler=test_sampler, batch_size=batch_size)
     elif MODEL == "modern-base":
-        model = conspiracyModelBase.from_pretrained("ypesk/frugal-ai-EURECOM-modern-base-baseline")
         model = model.to(device)
         tokenizer = AutoTokenizer.from_pretrained("answerdotai/ModernBERT-base")
@@ -246,7 +246,7 @@ async def evaluate_text(request: TextEvaluationRequest):
         test_dataloader = DataLoader(test_data, sampler=test_sampler, batch_size=batch_size)
     elif MODEL == "modern-large":
-        model = conspiracyModelLarge.from_pretrained('ypesk/frugal-ai-EURECOM-modern-large-baseline')
         model = model.to(device)
         tokenizer = AutoTokenizer.from_pretrained("answerdotai/ModernBERT-large")
@@ -267,7 +267,7 @@ async def evaluate_text(request: TextEvaluationRequest):
         test_dataloader = DataLoader(test_data, sampler=test_sampler, batch_size=batch_size)
     elif MODEL == "gte-base":
-        model = gteModel.from_pretrained("ypesk/frugal-ai-EURECOM-gte-base-baseline")
         model = model.to(device)
         tokenizer = AutoTokenizer.from_pretrained('Alibaba-NLP/gte-base-en-v1.5')
@@ -289,7 +289,7 @@ async def evaluate_text(request: TextEvaluationRequest):
         test_dataloader = DataLoader(test_data, sampler=test_sampler, batch_size=batch_size)
     elif MODEL == "gte-large":
-        model = gteModelLarge.from_pretrained("ypesk/frugal-ai-EURECOM-gte-large-baseline")
         model = model.to(device)
         tokenizer = AutoTokenizer.from_pretrained('Alibaba-NLP/gte-large-en-v1.5')

     test_dataset = dataset["test"]
     if MODEL =="mlp":
+        model = ConspiracyClassification768.from_pretrained("ypesk/frugal-ai-EURECOM-mlp-768-fullset")
         model = model.to(device)
         emb_model = SentenceTransformer("sentence-transformers/sentence-t5-large")
         batch_size = 6
     elif MODEL == "ct":
         model = CTBERT.from_pretrained("ypesk/frugal-ai-EURECOM-ct-bert-baseline")
         model = model.to(device)
+        tokenizer = AutoTokenizer.from_pretrained('digitalepidemiologylab/covid-twitter-bert-fullset')
         test_texts = [t['quote'] for t in test_dataset]
         test_dataloader = DataLoader(test_data, sampler=test_sampler, batch_size=batch_size)
     elif MODEL == "modern-base":
+        model = conspiracyModelBase.from_pretrained("ypesk/frugal-ai-EURECOM-modern-base-fullset")
         model = model.to(device)
         tokenizer = AutoTokenizer.from_pretrained("answerdotai/ModernBERT-base")
         test_dataloader = DataLoader(test_data, sampler=test_sampler, batch_size=batch_size)
     elif MODEL == "modern-large":
+        model = conspiracyModelLarge.from_pretrained('ypesk/frugal-ai-EURECOM-modern-large-fullset')
         model = model.to(device)
         tokenizer = AutoTokenizer.from_pretrained("answerdotai/ModernBERT-large")
         test_dataloader = DataLoader(test_data, sampler=test_sampler, batch_size=batch_size)
     elif MODEL == "gte-base":
+        model = gteModel.from_pretrained("ypesk/frugal-ai-EURECOM-gte-base-fullset")
         model = model.to(device)
         tokenizer = AutoTokenizer.from_pretrained('Alibaba-NLP/gte-base-en-v1.5')
         test_dataloader = DataLoader(test_data, sampler=test_sampler, batch_size=batch_size)
     elif MODEL == "gte-large":
+        model = gteModelLarge.from_pretrained("ypesk/frugal-ai-EURECOM-gte-large-fullset")
         model = model.to(device)
         tokenizer = AutoTokenizer.from_pretrained('Alibaba-NLP/gte-large-en-v1.5')