Spaces:

speech-uk
/

kenlm-ui

Running

Yehor commited on Mar 26

Commit

a0ba0fc

verified ·

1 Parent(s): a5fdabe

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -234,12 +234,12 @@ def text_to_kenlm(
     # Commands to run in the container
     cmd = (
-        f"{kenlm_bin}/lmplz --temp_prefix {app_dir} --memory 90% --text {intermediate_file} --arpa {app_dir}/my_model.arpa -o {_order} --prune {_arpa_prune} --discount_fallback",
     )
     print(subprocess.run(cmd, shell=True))
-    file_name = f"{app_dir}/my_model.arpa"
-    file_name_fixed = f"{app_dir}/my_model_correct.arpa"
     # Fix the ARPA file
     with (
@@ -262,7 +262,7 @@ def text_to_kenlm(
     file_name = file_name_fixed
     if _do_limit_topk:
-        file_name = f"{app_dir}/my_model-{_topk_words}-words.arpa"
         _, vocab_str = convert_and_filter_topk(app_dir, intermediate_file, _topk_words)
@@ -281,14 +281,14 @@ def text_to_kenlm(
         if _do_quantize:
             file_name_quantized = (
-                f"{app_dir}/my_model-{_binary_type}-{_topk_words}-words.bin"
             )
             cmd = f"{kenlm_bin}/build_binary -a {_binary_a_bits} -b {_binary_b_bits} -q {_binary_q_bits} -v {_binary_type} {file_name} {file_name_quantized}"
             print(subprocess.run(cmd, shell=True))
     else:
         if _do_quantize:
-            file_name = f"{app_dir}/my_model-{_binary_type}.bin"
             cmd = f"{kenlm_bin}/build_binary -a {_binary_a_bits} -b {_binary_b_bits} -q {_binary_q_bits} -v {_binary_type} {file_name_fixed} {file_name}"
             print(subprocess.run(cmd, shell=True))

     # Commands to run in the container
     cmd = (
+        f"{kenlm_bin}/lmplz --temp_prefix /tmp --memory 90% --text {intermediate_file} --arpa /tmp/my_model.arpa -o {_order} --prune {_arpa_prune} --discount_fallback",
     )
     print(subprocess.run(cmd, shell=True))
+    file_name = "/tmp/my_model.arpa"
+    file_name_fixed = "/tmp/my_model_correct.arpa"
     # Fix the ARPA file
     with (
     file_name = file_name_fixed
     if _do_limit_topk:
+        file_name = f"/tmp/my_model-{_topk_words}-words.arpa"
         _, vocab_str = convert_and_filter_topk(app_dir, intermediate_file, _topk_words)
         if _do_quantize:
             file_name_quantized = (
+                f"/tmp/my_model-{_binary_type}-{_topk_words}-words.bin"
             )
             cmd = f"{kenlm_bin}/build_binary -a {_binary_a_bits} -b {_binary_b_bits} -q {_binary_q_bits} -v {_binary_type} {file_name} {file_name_quantized}"
             print(subprocess.run(cmd, shell=True))
     else:
         if _do_quantize:
+            file_name = f"/tmp/my_model-{_binary_type}.bin"
             cmd = f"{kenlm_bin}/build_binary -a {_binary_a_bits} -b {_binary_b_bits} -q {_binary_q_bits} -v {_binary_type} {file_name_fixed} {file_name}"
             print(subprocess.run(cmd, shell=True))