Spaces:

SJTU-TES
/

Fake-Detect

Sleeping

ubuntu commited on Apr 9, 2024

Commit

90620f9

1 Parent(s): 6d46819

fix bug

Files changed (2) hide show

app.py CHANGED Viewed

@@ -17,9 +17,6 @@ def _handle_fd_solve(img_path: str):
     if img_path is None:
         raise gr.Error("Please upload file completely!")
-    # gzip
-    os.system("gzip clip/bpe_simple_vocab_16e6.txt")
     # Begin solve and record the solving time
     start_time = time.time()
     detect(

     if img_path is None:
         raise gr.Error("Please upload file completely!")
     # Begin solve and record the solving time
     start_time = time.time()
     detect(

clip/simple_tokenizer.py CHANGED Viewed

@@ -6,7 +6,6 @@ from functools import lru_cache
 import ftfy
 import regex as re
 @lru_cache()
 def default_bpe():
     return os.path.join(os.path.dirname(os.path.abspath(__file__)), "bpe_simple_vocab_16e6.txt.gz")
@@ -63,6 +62,9 @@ class SimpleTokenizer(object):
     def __init__(self, bpe_path: str = default_bpe()):
         self.byte_encoder = bytes_to_unicode()
         self.byte_decoder = {v: k for k, v in self.byte_encoder.items()}
         merges = gzip.open(bpe_path).read().decode("utf-8").split('\n')
         merges = merges[1:49152-256-2+1]
         merges = [tuple(merge.split()) for merge in merges]

 import ftfy
 import regex as re
 @lru_cache()
 def default_bpe():
     return os.path.join(os.path.dirname(os.path.abspath(__file__)), "bpe_simple_vocab_16e6.txt.gz")
     def __init__(self, bpe_path: str = default_bpe()):
         self.byte_encoder = bytes_to_unicode()
         self.byte_decoder = {v: k for k, v in self.byte_encoder.items()}
+        if not os.system(bpe_path):
+            txt_path = bpe_path.replace(".gz", ".txt")
+            os.system(f"gzip {txt_path}")
         merges = gzip.open(bpe_path).read().decode("utf-8").split('\n')
         merges = merges[1:49152-256-2+1]
         merges = [tuple(merge.split()) for merge in merges]