Spaces:

eaglelandsonce
/

pytorch

Running

eaglelandsonce commited on Jun 10, 2024

Commit

ae9ee23

verified ·

1 Parent(s): 284b3b6

Update pages/17_RNN_News.py

Files changed (1) hide show

pages/17_RNN_News.py CHANGED Viewed

@@ -6,6 +6,7 @@ from torchtext.data.utils import get_tokenizer
 from torchtext.vocab import build_vocab_from_iterator
 from torchtext.datasets import AG_NEWS
 from torch.utils.data import DataLoader, random_split
 import matplotlib.pyplot as plt
 import pandas as pd
 import numpy as np
@@ -28,12 +29,11 @@ class RNN(nn.Module):
 # Create a custom collate function to pad sequences
 def collate_batch(batch):
-    label_list, text_list, lengths = [], [], []
     for _label, _text in batch:
         label_list.append(label_pipeline(_label))
         processed_text = torch.tensor(text_pipeline(_text), dtype=torch.int64)
         text_list.append(processed_text)
-        lengths.append(processed_text.size(0))
     labels = torch.tensor(label_list, dtype=torch.int64)
     texts = pad_sequence(text_list, batch_first=True, padding_value=vocab["<pad>"])
     return texts, labels
@@ -191,4 +191,4 @@ if 'trained_model' in st.session_state and st.sidebar.button('Show Test Results'
     for i, (text, true_label, predicted) in enumerate(samples):
         st.write(f'Sample {i+1}')
         st.text(' '.join([vocab.get_itos()[token] for token in text]))
-        st.write(f'Ground Truth: {LABEL.vocab.itos[true_label.item()]}, Predicted: {LABEL.vocab.itos[predicted.item()]}')

 from torchtext.vocab import build_vocab_from_iterator
 from torchtext.datasets import AG_NEWS
 from torch.utils.data import DataLoader, random_split
+from torch.nn.utils.rnn import pad_sequence
 import matplotlib.pyplot as plt
 import pandas as pd
 import numpy as np
 # Create a custom collate function to pad sequences
 def collate_batch(batch):
+    label_list, text_list = [], []
     for _label, _text in batch:
         label_list.append(label_pipeline(_label))
         processed_text = torch.tensor(text_pipeline(_text), dtype=torch.int64)
         text_list.append(processed_text)
     labels = torch.tensor(label_list, dtype=torch.int64)
     texts = pad_sequence(text_list, batch_first=True, padding_value=vocab["<pad>"])
     return texts, labels
     for i, (text, true_label, predicted) in enumerate(samples):
         st.write(f'Sample {i+1}')
         st.text(' '.join([vocab.get_itos()[token] for token in text]))
+        st.write(f'Ground Truth: {true_label.item()}, Predicted: {predicted.item()}')