Spaces:
Sleeping
Sleeping
Update app.py
Browse files
app.py
CHANGED
@@ -1,6 +1,7 @@
|
|
1 |
import os
|
2 |
import threading
|
3 |
import gradio as gr
|
|
|
4 |
from transformers import (
|
5 |
AutoModelForCausalLM,
|
6 |
AutoTokenizer,
|
@@ -13,6 +14,7 @@ hf_token = os.environ["HUGGINGFACEHUB_API_TOKEN"]
|
|
13 |
# Load tokenizer & model locally
|
14 |
tokenizer = AutoTokenizer.from_pretrained(MODEL_NAME, token=hf_token)
|
15 |
model = AutoModelForCausalLM.from_pretrained(MODEL_NAME, token=hf_token)
|
|
|
16 |
model.eval()
|
17 |
|
18 |
def respond(
|
@@ -61,7 +63,7 @@ demo = gr.ChatInterface(
|
|
61 |
examples = [
|
62 |
["Il était une fois un petit garçon qui vivait dans un village paisible.", 512, 0.7, 0.9],
|
63 |
["Il était une fois une grenouille qui rêvait de toucher les étoiles chaque nuit depuis son étang.", 512, 0.7, 0.9],
|
64 |
-
["Il était une fois un
|
65 |
],
|
66 |
cache_examples=False,
|
67 |
)
|
|
|
1 |
import os
|
2 |
import threading
|
3 |
import gradio as gr
|
4 |
+
import torch
|
5 |
from transformers import (
|
6 |
AutoModelForCausalLM,
|
7 |
AutoTokenizer,
|
|
|
14 |
# Load tokenizer & model locally
|
15 |
tokenizer = AutoTokenizer.from_pretrained(MODEL_NAME, token=hf_token)
|
16 |
model = AutoModelForCausalLM.from_pretrained(MODEL_NAME, token=hf_token)
|
17 |
+
model = torch.compile(model)
|
18 |
model.eval()
|
19 |
|
20 |
def respond(
|
|
|
63 |
examples = [
|
64 |
["Il était une fois un petit garçon qui vivait dans un village paisible.", 512, 0.7, 0.9],
|
65 |
["Il était une fois une grenouille qui rêvait de toucher les étoiles chaque nuit depuis son étang.", 512, 0.7, 0.9],
|
66 |
+
["Il était une fois un petit lapin perdu", 512, 0.7, 0.9],
|
67 |
],
|
68 |
cache_examples=False,
|
69 |
)
|