File size: 1,859 Bytes
ede8cb5
 
6d2d4e1
ede8cb5
 
 
b6d36be
 
ede8cb5
b6d36be
 
 
ede8cb5
b6d36be
ede8cb5
 
 
 
6d2d4e1
 
69b0a31
6d2d4e1
 
 
 
 
b6d36be
 
 
ede8cb5
b6d36be
ede8cb5
b6d36be
 
 
 
 
 
 
 
 
bbc075a
 
b6d36be
bbc075a
ede8cb5
b6d36be
ede8cb5
b6d36be
 
 
 
ede8cb5
 
 
 
b6d36be
ede8cb5
 
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
import gradio as gr
import tiktoken
import json

def count_tokens(text):
    """
    计算输入文本中的 token 数量,并根据用户选择格式化文本。
    
    Args:
        text (str): 输入文本。
        use_markdown (bool): 是否使用 Markdown/LaTeX 格式输出。
    
    Returns:
        tuple: 返回 token 数量和格式化后的文本。
    """
    encoding = tiktoken.encoding_for_model("gpt-4")
    tokens = encoding.encode(text)
    
    try:
        parsed_json = json.loads(text)
        text = json.dumps(parsed_json, indent=4, ensure_ascii=False)
    except json.JSONDecodeError:
        pass
   
    text = text.replace("\\n", "\n")
    
    formatted_text = text
    
    return len(tokens), gr.update(value=formatted_text)

# 定义 Gradio 接口
iface = gr.Interface(
    fn=count_tokens,                   
    inputs=[
        gr.Textbox(
            lines=10, 
            max_lines=1000000, 
            placeholder="Enter your text here..."
        ),
        # gr.Checkbox(label="使用 Markdown/LaTeX 格式输出", value=True)  # 格式选择开关
    ],  
    outputs=[
        "number",
        gr.Markdown(label="Beautified Text")
    ],
    title="Token Counter with tiktoken",
    description="Enter text below to calculate the number of tokens using the tiktoken library. Supports LaTeX formulas using $ for inline and $$ for block formulas.",
    examples=[
        ["这是一个行内公式示例:$E=mc^2$"],
        ["这是一个块级公式示例:$$\\sum_{i=1}^n i = \\frac{n(n+1)}{2}$$"],
        ["这是混合示例:\n行内公式:$\\alpha + \\beta$\n块级公式:$$\\int_0^\\infty e^{-x^2} dx = \\frac{\\sqrt{\\pi}}{2}$$"],
        ["普通文本示例:Hello, how are you doing today?"],
    ],
    theme="default"
)

# 启动应用
if __name__ == "__main__":
    iface.launch()