Y1OV commited on
Commit
1d6a8f2
·
verified ·
1 Parent(s): 97b4313

Upload 4 files

Browse files
Files changed (4) hide show
  1. ITOG.csv +45 -0
  2. oblzn.csv +45 -0
  3. provokac.csv +45 -0
  4. vidvopr.csv +45 -0
ITOG.csv ADDED
@@ -0,0 +1,45 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ model,NUM_Q_multich_EM,NUM_Q_multich_CC,NUM_Q_multich_PM,NUM_Q_onech_EM,NUM_Q_seq_EM,NUM_Q_seq_CC,NUM_Q_seq_PM,NUM_Q_map_EM,NUM_Q_map_CC,NUM_Q_map_PM,OPEN_Q_EM,OPEN_Q_F1,OPEN_Q_LR,LEADERBOARD
2
+ claude-3-5-sonnet,84.0,85.0,90.0,94.0,73.0,73.0,73.0,43.0,44.0,46.0,63.0,69.0,78.0,70.38461538461539
3
+ gemini-pro-1.5,73.0,78.0,84.0,91.0,66.0,66.0,66.0,59.0,60.0,66.0,55.00000000000001,67.0,77.0,69.84615384615384
4
+ deepseek-r1,79.0,82.0,86.0,67.0,82.0,82.0,82.0,57.99999999999999,61.0,59.0,22.0,61.0,69.0,68.46153846153847
5
+ qwen2.5:72b-instruct-q4_0,59.0,75.0,74.0,90.0,68.0,68.0,68.0,38.0,40.0,44.0,39.0,50.0,63.0,59.69230769230769
6
+ t-tech/T-pro-it-1.0,64.0,69.0,78.0,89.0,66.0,66.0,66.0,41.0,42.0,48.0,34.0,49.0,64.0,59.69230769230769
7
+ mistral-123b,69.0,74.0,82.0,89.0,63.0,63.0,63.0,24.0,24.0,28.000000000000004,54.0,62.0,71.0,58.92307692307692
8
+ gpt-4o,77.0,81.0,86.0,94.0,64.0,64.0,66.0,22.0,22.0,28.999999999999996,11.0,64.0,72.0,57.84615384615385
9
+ qwen2.5:32b-instruct-q4_0,59.0,66.0,75.0,86.0,60.0,60.0,60.0,35.0,36.0,42.0,31.0,41.0,55.00000000000001,54.30769230769231
10
+ qwen2:72b-instruct-q4_0,56.99999999999999,70.0,73.0,86.0,63.0,63.0,63.0,33.0,34.0,39.0,12.0,45.0,55.00000000000001,53.30769230769231
11
+ rscr/ruadapt_qwen2.5_32b:Q4_K_M,54.0,56.99999999999999,72.0,86.0,60.0,60.0,60.0,35.0,35.0,44.0,31.0,39.0,56.00000000000001,53.0
12
+ GigaChat-Pro,61.0,64.0,76.0,79.0,45.0,45.0,45.0,25.0,25.0,30.0,48.0,55.00000000000001,68.0,51.23076923076923
13
+ GigaChat-Max,73.0,76.0,83.0,85.0,38.0,38.0,38.0,16.0,16.0,23.0,48.0,55.00000000000001,69.0,50.61538461538461
14
+ YandexGPT4-Pro,31.0,35.0,77.0,85.0,35.0,35.0,54.0,21.0,21.0,47.0,45.0,56.00000000000001,69.0,47.0
15
+ YandexGPT4-Pro-32k,31.0,34.0,77.0,85.0,34.0,34.0,55.00000000000001,21.0,21.0,47.0,45.0,56.99999999999999,69.0,46.92307692307692
16
+ gemma2:27b-instruct-q4_0,49.0,56.99999999999999,69.0,82.0,48.0,48.0,48.0,13.0,13.0,18.0,39.0,48.0,63.0,45.76923076923077
17
+ GigaChat-Lite,56.99999999999999,61.0,72.0,75.0,38.0,38.0,38.0,13.0,13.0,17.0,35.0,42.0,56.99999999999999,42.76923076923077
18
+ ai-sage/GigaChat-20B-A3B-instruct,30.0,33.0,44.0,76.0,42.0,42.0,42.0,12.0,12.0,16.0,38.0,47.0,61.0,38.07692307692308
19
+ llama405,21.0,62.0,77.0,60.0,24.0,33.0,51.0,5.0,7.000000000000001,20.0,9.0,56.00000000000001,66.0,37.76923076923077
20
+ gemma2:9b-instruct-q4_0,41.0,54.0,64.0,77.0,32.0,33.0,35.0,5.0,5.0,10.0,25.0,34.0,49.0,35.69230769230769
21
+ llama3.1:70b-instruct-q4_0,42.0,57.99999999999999,68.0,49.0,14.000000000000002,17.0,33.0,1.0,2.0,14.000000000000002,11.0,54.0,64.0,32.84615384615385
22
+ llama3:70b-instruct-q4_0,35.0,63.0,60.0,79.0,12.0,14.000000000000002,25.0,4.0,5.0,6.0,7.000000000000001,47.0,57.99999999999999,31.923076923076923
23
+ YandexGPT4-Lite,33.0,38.0,57.99999999999999,74.0,6.0,6.0,7.000000000000001,2.0,2.0,5.0,35.0,52.0,66.0,29.53846153846154
24
+ qwen2.5:7b-instruct-q4_0,27.0,36.0,57.99999999999999,71.0,30.0,30.0,30.0,5.0,6.0,10.0,15.0,19.0,38.0,28.846153846153847
25
+ rscr/vikhr_nemo_12b:latest,23.0,31.0,53.0,56.00000000000001,11.0,19.0,20.0,2.0,3.0,11.0,12.0,28.999999999999996,41.0,23.923076923076923
26
+ ilyagusev/saiga_nemo_12b,3.0,4.0,59.0,70.0,17.0,17.0,18.0,1.0,1.0,10.0,23.0,34.0,48.0,23.46153846153846
27
+ qwen2:7b-instruct-q4_0,11.0,13.0,55.00000000000001,67.0,22.0,22.0,23.0,2.0,2.0,8.0,5.0,13.0,28.999999999999996,20.923076923076923
28
+ phi3:14b-medium-4k-instruct-q4_0,0.0,0.0,60.0,70.0,3.0,4.0,41.0,0.0,0.0,9.0,7.000000000000001,20.0,31.0,18.846153846153847
29
+ owl/t-lite:q4_0-instruct,3.0,6.0,42.0,66.0,10.0,11.0,12.0,1.0,1.0,3.0,4.0,35.0,48.0,18.615384615384617
30
+ ilyagusev/saiga_llama3,2.0,9.0,52.0,65.0,9.0,9.0,20.0,0.0,0.0,4.0,8.0,24.0,38.0,18.46153846153846
31
+ mistral:7b-instruct-v0.3-q4_0,0.0,0.0,44.0,54.0,0.0,0.0,31.0,0.0,0.0,4.0,3.0,14.000000000000002,24.0,13.384615384615385
32
+ yi:9b,8.0,17.0,39.0,39.0,12.0,14.000000000000002,14.000000000000002,0.0,0.0,1.0,2.0,6.0,14.000000000000002,12.76923076923077
33
+ mixtral:8x7b-instruct-v0.1-q4_0,0.0,13.0,53.0,16.0,2.0,15.0,27.0,0.0,2.0,12.0,2.0,9.0,12.0,12.538461538461538
34
+ solar:10.7b-instruct-v1-q4_0,0.0,0.0,49.0,50.0,0.0,0.0,19.0,0.0,0.0,3.0,4.0,13.0,22.0,12.307692307692308
35
+ wavecut/vikhr:7b-instruct_0.4-Q4_1,0.0,0.0,39.0,41.0,2.0,3.0,7.000000000000001,0.0,0.0,1.0,10.0,19.0,30.0,11.692307692307692
36
+ random,4.04341349223239,7.59736114066823,32.698446477974,24.5103137458832,14.0740740740741,14.0740740740741,14.0740740740741,0.828500414250207,0.828500414250207,3.23115161557581,,,,11.5959909523056
37
+ llama3.1:8b-instruct-q4_0,0.0,0.0,50.0,4.0,0.0,1.0,3.0,0.0,0.0,6.0,0.0,24.0,40.0,9.846153846153847
38
+ qwen:7b,0.0,0.0,30.0,36.0,12.0,12.0,14.000000000000002,0.0,0.0,1.0,0.0,3.0,16.0,9.538461538461538
39
+ llama3:8b-instruct-q4_0,0.0,0.0,50.0,12.0,0.0,1.0,3.0,0.0,0.0,4.0,0.0,20.0,33.0,9.461538461538462
40
+ gemma:7b-instruct-v1.1-q4_0,2.0,9.0,39.0,13.0,7.000000000000001,10.0,11.0,1.0,1.0,4.0,0.0,4.0,16.0,9.0
41
+ yi:6b,1.0,18.0,13.0,28.000000000000004,0.0,6.0,4.0,0.0,1.0,1.0,1.0,3.0,10.0,6.615384615384615
42
+ llama3.2:3b-instruct-q4_0,0.0,0.0,30.0,0.0,0.0,0.0,10.0,0.0,0.0,1.0,0.0,6.0,19.0,5.076923076923077
43
+ llama2:13b,0.0,0.0,25.0,0.0,0.0,0.0,1.0,0.0,0.0,0.0,0.0,7.000000000000001,12.0,3.4615384615384617
44
+ llama3.2:1b-instruct-q4_0,0.0,1.0,14.000000000000002,0.0,0.0,3.0,0.0,0.0,0.0,0.0,0.0,2.0,10.0,2.3076923076923075
45
+ Среднее значение,29.373102639354244,35.734822352108566,58.41159177855753,59.5467514824624,27.536606373815676,28.815676141257537,33.95521102497847,12.530895358470936,12.972755823587216,18.470491898036645,19.833333333333332,34.61904761904762,46.42857142857143,32.053216247549145
oblzn.csv ADDED
@@ -0,0 +1,45 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ model,GEO_num_q_EM,GEO_num_q_CC,GEO_num_q_PM,GEO_open_q_EM,GEO_open_q_F1,GEO_open_q_LR,GEO_avg,HIST_num_q_EM,HIST_num_q_CC,HIST_num_q_PM,HIST_open_q_EM,HIST_open_q_F1,HIST_open_q_LR,HIST_avg,SOC_num_q_EM,SOC_num_q_CC,SOC_num_q_PM,SOC_open_q_EM,SOC_open_q_F1,SOC_open_q_LR,SOC_avg,POL_num_q_EM,POL_num_q_CC,POL_num_q_PM,POL_avg,DOMAIN_avg
2
+ claude-3-5-sonnet,89.0,89.0,90.0,65.0,72.0,79.0,80.66666666666667,79.0,80.0,81.0,55.00000000000001,62.0,74.0,71.83333333333333,87.0,89.0,91.0,95.0,96.0,96.0,92.33333333333333,78.0,78.0,80.0,78.66666666666667,81.19047619047619
3
+ gemini-pro-1.5,89.0,90.0,90.0,57.99999999999999,70.0,76.0,78.83333333333333,74.0,75.0,79.0,48.0,61.0,74.0,68.5,82.0,85.0,88.0,89.0,92.0,97.0,88.83333333333333,73.0,74.0,76.0,74.33333333333333,78.0952380952381
4
+ mistral-123b,80.0,81.0,83.0,62.0,69.0,74.0,74.83333333333333,66.0,67.0,70.0,44.0,53.0,65.0,60.833333333333336,78.0,82.0,86.0,89.0,91.0,94.0,86.66666666666667,71.0,71.0,73.0,71.66666666666667,73.76190476190476
5
+ qwen2.5:72b-instruct-q4_0,84.0,86.0,87.0,55.00000000000001,63.0,72.0,74.5,66.0,69.0,70.0,30.0,41.0,56.99999999999999,55.5,72.0,83.0,81.0,74.0,81.0,87.0,79.66666666666667,74.0,76.0,76.0,75.33333333333333,70.66666666666667
6
+ deepseek-r1,79.0,90.0,91.0,5.0,56.99999999999999,60.0,63.666666666666664,72.0,83.0,83.0,20.0,56.00000000000001,68.0,63.666666666666664,70.0,86.0,89.0,57.99999999999999,87.0,87.0,79.5,59.0,74.0,76.0,69.66666666666667,69.04761904761905
7
+ GigaChat-Max,74.0,75.0,76.0,57.99999999999999,65.0,75.0,70.5,59.0,60.0,63.0,38.0,46.0,63.0,54.833333333333336,81.0,83.0,87.0,79.0,83.0,89.0,83.66666666666667,64.0,64.0,65.0,64.33333333333333,68.9047619047619
8
+ gpt-4o,82.0,82.0,83.0,2.0,71.0,73.0,65.5,73.0,74.0,77.0,15.0,56.99999999999999,69.0,60.833333333333336,84.0,87.0,89.0,11.0,86.0,88.0,74.16666666666667,76.0,76.0,78.0,76.66666666666667,68.23809523809524
9
+ t-tech/T-pro-it-1.0,83.0,84.0,86.0,46.0,56.99999999999999,67.0,70.5,66.0,67.0,72.0,27.0,44.0,60.0,56.0,75.0,80.0,84.0,61.0,69.0,79.0,74.66666666666667,74.0,75.0,76.0,75.0,68.19047619047619
10
+ GigaChat-Pro,79.0,81.0,80.0,64.0,69.0,77.0,75.0,52.0,54.0,56.99999999999999,38.0,46.0,62.0,51.5,72.0,74.0,80.0,71.0,75.0,84.0,76.0,56.99999999999999,59.0,59.0,58.333333333333336,66.19047619047619
11
+ qwen2.5:32b-instruct-q4_0,81.0,82.0,84.0,42.0,54.0,64.0,67.83333333333333,59.0,61.0,65.0,23.0,32.0,48.0,48.0,73.0,79.0,82.0,71.0,77.0,83.0,77.5,73.0,75.0,75.0,74.33333333333333,65.85714285714286
12
+ rscr/ruadapt_qwen2.5_32b:Q4_K_M,77.0,77.0,81.0,40.0,50.0,64.0,64.83333333333333,57.99999999999999,59.0,65.0,22.0,31.0,50.0,47.5,71.0,73.0,81.0,71.0,75.0,82.0,75.5,72.0,73.0,73.0,72.66666666666667,64.04761904761905
13
+ YandexGPT4-Pro-32k,65.0,65.0,80.0,44.0,56.99999999999999,66.0,62.833333333333336,52.0,52.0,68.0,39.0,50.0,65.0,54.333333333333336,55.00000000000001,56.99999999999999,84.0,79.0,87.0,92.0,75.66666666666667,59.0,59.0,62.0,60.0,63.666666666666664
14
+ YandexGPT4-Pro,64.0,64.0,80.0,44.0,56.00000000000001,66.0,62.333333333333336,52.0,53.0,68.0,39.0,50.0,65.0,54.5,55.00000000000001,57.99999999999999,84.0,79.0,87.0,92.0,75.83333333333333,59.0,59.0,62.0,60.0,63.61904761904762
15
+ gemma2:27b-instruct-q4_0,68.0,70.0,73.0,52.0,60.0,70.0,65.5,49.0,51.0,55.00000000000001,35.0,45.0,60.0,49.166666666666664,66.0,71.0,77.0,38.0,46.0,66.0,60.666666666666664,72.0,74.0,74.0,73.33333333333333,60.57142857142857
16
+ qwen2:72b-instruct-q4_0,81.0,84.0,84.0,4.0,61.0,64.0,63.0,61.0,65.0,66.0,14.000000000000002,39.0,51.0,49.333333333333336,69.0,80.0,79.0,15.0,55.00000000000001,67.0,60.833333333333336,69.0,75.0,72.0,72.0,59.76190476190476
17
+ GigaChat-Lite,70.0,71.0,72.0,52.0,63.0,72.0,66.66666666666667,45.0,46.0,50.0,24.0,30.0,47.0,40.333333333333336,70.0,73.0,79.0,63.0,65.0,76.0,71.0,55.00000000000001,56.00000000000001,56.99999999999999,56.0,58.857142857142854
18
+ ai-sage/GigaChat-20B-A3B-instruct,62.0,64.0,65.0,53.0,61.0,70.0,62.5,48.0,52.0,54.0,28.999999999999996,40.0,56.99999999999999,46.666666666666664,46.0,49.0,53.0,67.0,71.0,79.0,60.833333333333336,67.0,70.0,69.0,68.66666666666667,58.38095238095238
19
+ llama405,37.0,70.0,79.0,5.0,61.0,66.0,53.0,39.0,60.0,68.0,12.0,49.0,62.0,48.333333333333336,37.0,75.0,83.0,5.0,83.0,86.0,61.5,41.0,71.0,71.0,61.0,55.23809523809524
20
+ gemma2:9b-instruct-q4_0,59.0,63.0,65.0,33.0,43.0,56.00000000000001,53.166666666666664,41.0,45.0,49.0,19.0,27.0,43.0,37.333333333333336,60.0,69.0,73.0,55.00000000000001,62.0,75.0,65.66666666666667,69.0,72.0,72.0,71.0,54.76190476190476
21
+ YandexGPT4-Lite,49.0,50.0,54.0,35.0,50.0,64.0,50.333333333333336,38.0,39.0,44.0,33.0,48.0,63.0,44.166666666666664,54.0,57.99999999999999,70.0,45.0,74.0,82.0,63.833333333333336,53.0,54.0,55.00000000000001,54.0,52.95238095238095
22
+ llama3.1:70b-instruct-q4_0,33.0,63.0,69.0,0.0,65.0,69.0,49.833333333333336,30.0,50.0,55.00000000000001,14.000000000000002,48.0,61.0,43.0,49.0,71.0,77.0,6.0,74.0,79.0,59.333333333333336,37.0,73.0,74.0,61.333333333333336,52.23809523809524
23
+ llama3:70b-instruct-q4_0,56.99999999999999,64.0,63.0,2.0,62.0,66.0,52.333333333333336,41.0,47.0,49.0,7.000000000000001,42.0,56.00000000000001,40.333333333333336,54.0,73.0,69.0,15.0,49.0,61.0,53.5,69.0,71.0,72.0,70.66666666666667,51.857142857142854
24
+ qwen2.5:7b-instruct-q4_0,54.0,55.00000000000001,60.0,21.0,28.000000000000004,46.0,44.0,34.0,35.0,42.0,6.0,10.0,30.0,26.166666666666668,50.0,56.00000000000001,69.0,60.0,64.0,74.0,62.166666666666664,66.0,67.0,68.0,67.0,47.38095238095238
25
+ ilyagusev/saiga_nemo_12b,41.0,42.0,54.0,39.0,48.0,60.0,47.333333333333336,33.0,33.0,45.0,19.0,30.0,44.0,34.0,30.0,30.0,65.0,28.000000000000004,38.0,56.99999999999999,41.333333333333336,65.0,66.0,66.0,65.66666666666667,44.42857142857143
26
+ rscr/vikhr_nemo_12b:latest,28.000000000000004,44.0,40.0,13.0,32.0,42.0,33.166666666666664,28.999999999999996,41.0,43.0,10.0,26.0,39.0,31.333333333333332,41.0,51.0,62.0,27.0,44.0,57.99999999999999,47.166666666666664,56.00000000000001,67.0,64.0,62.333333333333336,40.80952380952381
27
+ ilyagusev/saiga_llama3,38.0,40.0,51.0,18.0,39.0,52.0,39.666666666666664,28.000000000000004,28.000000000000004,39.0,3.0,17.0,31.0,24.333333333333332,27.0,32.0,60.0,21.0,45.0,59.0,40.666666666666664,65.0,65.0,66.0,65.33333333333333,39.23809523809524
28
+ owl/t-lite:q4_0-instruct,37.0,40.0,47.0,1.0,48.0,56.99999999999999,38.333333333333336,30.0,31.0,37.0,3.0,28.999999999999996,44.0,29.0,28.999999999999996,31.0,54.0,15.0,50.0,61.0,40.0,57.99999999999999,60.0,60.0,59.333333333333336,39.142857142857146
29
+ phi3:14b-medium-4k-instruct-q4_0,41.0,43.0,62.0,20.0,38.0,51.0,42.5,30.0,33.0,49.0,3.0,15.0,25.0,25.833333333333332,27.0,30.0,68.0,4.0,27.0,37.0,32.166666666666664,64.0,69.0,69.0,67.33333333333333,38.333333333333336
30
+ qwen2:7b-instruct-q4_0,46.0,47.0,54.0,8.0,13.0,30.0,33.0,28.000000000000004,30.0,38.0,3.0,9.0,25.0,22.166666666666668,36.0,38.0,66.0,12.0,34.0,51.0,39.5,63.0,64.0,65.0,64.0,36.19047619047619
31
+ mistral:7b-instruct-v0.3-q4_0,28.999999999999996,30.0,45.0,10.0,19.0,30.0,27.166666666666668,21.0,24.0,35.0,1.0,10.0,21.0,18.666666666666668,22.0,24.0,53.0,6.0,32.0,36.0,28.833333333333332,55.00000000000001,56.00000000000001,56.99999999999999,56.0,29.333333333333332
32
+ solar:10.7b-instruct-v1-q4_0,23.0,35.0,46.0,3.0,11.0,17.0,22.5,18.0,27.0,37.0,4.0,12.0,21.0,19.833333333333332,24.0,26.0,57.99999999999999,9.0,23.0,36.0,29.333333333333332,48.0,61.0,61.0,56.666666666666664,28.571428571428573
33
+ llama3.1:8b-instruct-q4_0,1.0,35.0,44.0,0.0,34.0,48.0,27.0,2.0,26.0,34.0,0.0,19.0,36.0,19.5,2.0,26.0,57.99999999999999,0.0,41.0,54.0,30.166666666666668,9.0,62.0,62.0,44.333333333333336,28.238095238095237
34
+ llama3:8b-instruct-q4_0,6.0,35.0,46.0,0.0,34.0,46.0,27.833333333333332,6.0,26.0,35.0,0.0,15.0,28.999999999999996,18.5,5.0,27.0,60.0,0.0,24.0,34.0,25.0,11.0,62.0,63.0,45.333333333333336,26.857142857142858
35
+ wavecut/vikhr:7b-instruct_0.4-Q4_1,23.0,28.000000000000004,35.0,11.0,21.0,30.0,24.666666666666668,17.0,20.0,27.0,8.0,18.0,28.000000000000004,19.666666666666668,16.0,19.0,45.0,17.0,27.0,41.0,27.5,37.0,47.0,46.0,43.333333333333336,26.714285714285715
36
+ mixtral:8x7b-instruct-v0.1-q4_0,8.0,50.0,56.00000000000001,2.0,9.0,11.0,22.666666666666668,8.0,38.0,47.0,1.0,8.0,12.0,19.0,6.0,39.0,61.0,3.0,16.0,17.0,23.666666666666668,12.0,71.0,65.0,49.333333333333336,25.714285714285715
37
+ yi:9b,21.0,30.0,33.0,0.0,4.0,8.0,16.0,16.0,20.0,24.0,0.0,3.0,13.0,12.666666666666666,26.0,36.0,48.0,16.0,22.0,34.0,30.333333333333332,39.0,56.00000000000001,53.0,49.333333333333336,23.904761904761905
38
+ gemma:7b-instruct-v1.1-q4_0,12.0,39.0,44.0,0.0,4.0,12.0,18.5,5.0,22.0,27.0,0.0,4.0,16.0,12.333333333333334,7.000000000000001,30.0,49.0,0.0,11.0,18.0,19.166666666666668,18.0,57.99999999999999,57.99999999999999,44.666666666666664,20.666666666666668
39
+ random,16.8372093023256,17.5813953488372,22.3720930232558,,,,18.9302325581395,13.2535364526659,13.9281828073993,20.4134929270947,,,,15.8650707290533,11.6207951070336,13.8188073394495,29.0997706422018,,,,18.1797910295616,26.1275272161742,26.905132192846,28.149300155521,27.0606531881804,20.0089368762337
40
+ qwen:7b,20.0,20.0,26.0,0.0,2.0,13.0,13.5,15.0,15.0,22.0,0.0,2.0,14.000000000000002,11.333333333333334,16.0,16.0,35.0,1.0,16.0,33.0,19.5,40.0,40.0,41.0,40.333333333333336,18.428571428571427
41
+ llama3.2:3b-instruct-q4_0,0.0,24.0,30.0,0.0,10.0,22.0,14.333333333333334,0.0,18.0,26.0,0.0,4.0,18.0,11.0,0.0,21.0,40.0,0.0,7.000000000000001,21.0,14.833333333333334,0.0,53.0,54.0,35.666666666666664,16.571428571428573
42
+ yi:6b,17.0,24.0,20.0,0.0,3.0,7.000000000000001,11.833333333333334,11.0,17.0,15.0,0.0,2.0,9.0,9.0,11.0,27.0,25.0,8.0,12.0,16.0,16.5,33.0,42.0,41.0,38.666666666666664,16.19047619047619
43
+ llama2:13b,0.0,42.0,5.0,0.0,10.0,15.0,12.0,0.0,23.0,6.0,0.0,6.0,11.0,7.666666666666667,0.0,17.0,19.0,0.0,9.0,11.0,9.333333333333334,0.0,59.0,8.0,22.333333333333332,11.476190476190476
44
+ llama3.2:1b-instruct-q4_0,0.0,20.0,10.0,0.0,2.0,9.0,6.833333333333333,0.0,17.0,12.0,0.0,2.0,10.0,6.833333333333333,0.0,20.0,16.0,0.0,5.0,6.0,7.833333333333333,0.0,36.0,18.0,18.0,8.714285714285714
45
+ Среднее значение,46.60086533261222,55.47863710113575,3.0,23.023809523809526,41.54761904761905,50.38095238095238,45.812330989724174,36.37798921982944,42.95181820482324,48.102639370397554,16.333333333333332,29.476190476190474,42.76190476190476,35.84182335028806,42.94466965365195,52.205088542777894,65.25813420098143,34.833333333333336,52.666666666666664,61.30952380952381,51.170847853400666,50.840175051538935,63.18384028355456,61.86393721291909,58.62931751600421,46.34904504363333
provokac.csv ADDED
@@ -0,0 +1,45 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ model,PROVOC_1_num_q_EM,PROVOC_1_num_q_CC,PROVOC_1_num_q_PM,PROVOC_1_open_q_EM,PROVOC_1_open_q_F1,PROVOC_1_open_q_LR,PROVOC_1_avg,PROVOC_2_num_q_EM,PROVOC_2_num_q_CC,PROVOC_2_num_q_PM,PROVOC_2_open_q_EM,PROVOC_2_open_q_F1,PROVOC_2_open_q_LR,PROVOC_2_avg,PROVOC_3_num_q_EM,PROVOC_3_num_q_CC,PROVOC_3_num_q_PM,PROVOC_3_open_q_EM,PROVOC_3_open_q_F1,PROVOC_3_open_q_LR,PROVOC_3_avg,PROVOC_avg
2
+ claude-3-5-sonnet,88.0,89.0,90.0,67.0,73.0,83.0,81.66666666666667,84.0,84.0,86.0,65.0,73.0,81.0,78.83333333333333,77.0,78.0,81.0,55.00000000000001,60.0,72.0,70.5,77.0
3
+ gemini-pro-1.5,83.0,85.0,86.0,61.0,71.0,83.0,78.16666666666667,81.0,83.0,85.0,54.0,68.0,77.0,74.66666666666667,72.0,74.0,80.0,51.0,60.0,71.0,68.0,73.61111111111111
4
+ mistral-123b,78.0,79.0,82.0,56.99999999999999,67.0,78.0,73.5,73.0,75.0,78.0,56.00000000000001,64.0,72.0,69.66666666666667,66.0,69.0,74.0,48.0,54.0,63.0,62.333333333333336,68.5
5
+ deepseek-r1,77.0,89.0,91.0,30.0,67.0,74.0,71.33333333333333,65.0,85.0,86.0,18.0,59.0,66.0,63.166666666666664,69.0,77.0,79.0,15.0,55.00000000000001,65.0,60.0,64.83333333333333
6
+ GigaChat-Max,76.0,76.0,78.0,54.0,60.0,74.0,69.66666666666667,72.0,73.0,76.0,49.0,56.99999999999999,70.0,66.16666666666667,60.0,62.0,67.0,40.0,47.0,62.0,56.333333333333336,64.05555555555556
7
+ gpt-4o,85.0,87.0,88.0,20.0,71.0,78.0,71.5,79.0,80.0,83.0,6.0,64.0,71.0,63.833333333333336,67.0,69.0,74.0,6.0,56.00000000000001,66.0,56.333333333333336,63.888888888888886
8
+ qwen2.5:72b-instruct-q4_0,76.0,81.0,81.0,41.0,51.0,66.0,66.0,73.0,79.0,78.0,44.0,54.0,65.0,65.5,61.0,71.0,71.0,34.0,44.0,57.99999999999999,56.5,62.666666666666664
9
+ t-tech/T-pro-it-1.0,77.0,79.0,82.0,38.0,53.0,69.0,66.33333333333333,74.0,76.0,79.0,36.0,49.0,63.0,62.833333333333336,65.0,68.0,74.0,28.000000000000004,44.0,57.99999999999999,56.166666666666664,61.77777777777778
10
+ GigaChat-Pro,71.0,73.0,75.0,52.0,61.0,74.0,67.66666666666667,63.0,64.0,69.0,55.00000000000001,61.0,73.0,64.16666666666667,56.00000000000001,57.99999999999999,65.0,38.0,43.0,57.99999999999999,53.0,61.611111111111114
11
+ YandexGPT4-Pro,64.0,64.0,80.0,52.0,63.0,75.0,66.33333333333333,59.0,60.0,77.0,43.0,56.99999999999999,70.0,61.0,36.0,38.0,67.0,39.0,49.0,61.0,48.333333333333336,58.55555555555556
12
+ YandexGPT4-Pro-32k,64.0,64.0,80.0,52.0,63.0,75.0,66.33333333333333,59.0,60.0,77.0,43.0,56.99999999999999,70.0,61.0,36.0,38.0,67.0,39.0,49.0,60.0,48.166666666666664,58.5
13
+ qwen2.5:32b-instruct-q4_0,72.0,75.0,78.0,33.0,42.0,57.99999999999999,59.666666666666664,71.0,74.0,76.0,33.0,43.0,55.00000000000001,58.666666666666664,61.0,66.0,72.0,28.999999999999996,38.0,51.0,52.833333333333336,57.05555555555556
14
+ gemma2:27b-instruct-q4_0,65.0,67.0,72.0,41.0,50.0,66.0,60.166666666666664,61.0,64.0,68.0,40.0,49.0,62.0,57.333333333333336,52.0,56.99999999999999,63.0,35.0,45.0,59.0,51.833333333333336,56.44444444444444
15
+ rscr/ruadapt_qwen2.5_32b:Q4_K_M,70.0,71.0,76.0,34.0,42.0,59.0,58.666666666666664,69.0,70.0,76.0,33.0,42.0,56.99999999999999,57.833333333333336,59.0,61.0,70.0,25.0,34.0,52.0,50.166666666666664,55.55555555555556
16
+ qwen2:72b-instruct-q4_0,74.0,79.0,79.0,14.000000000000002,45.0,57.99999999999999,58.166666666666664,69.0,75.0,74.0,10.0,48.0,56.00000000000001,55.333333333333336,56.99999999999999,67.0,68.0,13.0,41.0,50.0,49.333333333333336,54.27777777777778
17
+ GigaChat-Lite,63.0,65.0,68.0,33.0,40.0,56.99999999999999,54.333333333333336,63.0,64.0,68.0,44.0,53.0,64.0,59.333333333333336,51.0,54.0,60.0,28.999999999999996,35.0,49.0,46.333333333333336,53.333333333333336
18
+ llama405,41.0,70.0,79.0,13.0,57.99999999999999,71.0,55.333333333333336,41.0,72.0,77.0,6.0,56.99999999999999,66.0,53.166666666666664,28.000000000000004,61.0,69.0,7.000000000000001,52.0,60.0,46.166666666666664,51.55555555555556
19
+ YandexGPT4-Lite,51.0,52.0,59.0,38.0,56.00000000000001,70.0,54.333333333333336,51.0,52.0,59.0,35.0,52.0,66.0,52.5,37.0,40.0,49.0,31.0,46.0,60.0,43.833333333333336,50.22222222222222
20
+ ai-sage/GigaChat-20B-A3B-instruct,57.99999999999999,62.0,63.0,39.0,49.0,64.0,55.833333333333336,52.0,55.00000000000001,56.99999999999999,44.0,52.0,65.0,54.166666666666664,33.0,35.0,40.0,31.0,42.0,56.00000000000001,39.5,49.833333333333336
21
+ llama3.1:70b-instruct-q4_0,40.0,63.0,70.0,14.000000000000002,55.00000000000001,68.0,51.666666666666664,41.0,65.0,68.0,7.000000000000001,56.99999999999999,65.0,50.5,35.0,56.00000000000001,62.0,10.0,50.0,59.0,45.333333333333336,49.166666666666664
22
+ llama3:70b-instruct-q4_0,54.0,63.0,64.0,9.0,47.0,60.0,49.5,52.0,64.0,61.0,5.0,50.0,59.0,48.5,41.0,57.99999999999999,55.00000000000001,7.000000000000001,43.0,55.00000000000001,43.166666666666664,47.05555555555556
23
+ gemma2:9b-instruct-q4_0,56.00000000000001,62.0,65.0,28.000000000000004,36.0,52.0,49.833333333333336,56.00000000000001,61.0,63.0,27.0,36.0,52.0,49.166666666666664,45.0,53.0,56.99999999999999,21.0,28.999999999999996,44.0,41.5,46.833333333333336
24
+ ilyagusev/saiga_nemo_12b,38.0,39.0,56.00000000000001,24.0,33.0,49.0,39.833333333333336,39.0,39.0,57.99999999999999,27.0,37.0,52.0,42.0,22.0,22.0,55.00000000000001,20.0,31.0,44.0,32.333333333333336,38.05555555555556
25
+ qwen2.5:7b-instruct-q4_0,47.0,49.0,59.0,16.0,20.0,39.0,38.333333333333336,48.0,51.0,56.99999999999999,18.0,24.0,41.0,39.833333333333336,41.0,46.0,55.00000000000001,10.0,14.000000000000002,32.0,33.0,37.05555555555556
26
+ rscr/vikhr_nemo_12b:latest,36.0,48.0,50.0,15.0,32.0,47.0,38.0,38.0,49.0,54.0,12.0,31.0,42.0,37.666666666666664,32.0,42.0,52.0,9.0,25.0,35.0,32.5,36.05555555555556
27
+ owl/t-lite:q4_0-instruct,34.0,37.0,48.0,6.0,34.0,50.0,34.833333333333336,37.0,39.0,49.0,4.0,40.0,50.0,36.5,22.0,24.0,43.0,1.0,32.0,43.0,27.5,32.94444444444444
28
+ ilyagusev/saiga_llama3,34.0,35.0,52.0,6.0,23.0,38.0,31.333333333333332,35.0,37.0,52.0,11.0,28.999999999999996,44.0,34.666666666666664,21.0,27.0,48.0,6.0,21.0,34.0,26.166666666666668,30.72222222222222
29
+ phi3:14b-medium-4k-instruct-q4_0,36.0,38.0,63.0,3.0,18.0,30.0,31.333333333333332,36.0,41.0,60.0,10.0,26.0,37.0,35.0,20.0,23.0,55.00000000000001,7.000000000000001,18.0,28.000000000000004,25.166666666666668,30.5
30
+ qwen2:7b-instruct-q4_0,41.0,43.0,55.00000000000001,5.0,14.000000000000002,32.0,31.666666666666668,38.0,40.0,54.0,7.000000000000001,14.000000000000002,31.0,30.666666666666668,24.0,26.0,51.0,3.0,10.0,24.0,23.0,28.444444444444443
31
+ llama3.1:8b-instruct-q4_0,2.0,31.0,45.0,0.0,23.0,42.0,23.833333333333332,3.0,35.0,49.0,0.0,27.0,42.0,26.0,2.0,19.0,49.0,0.0,22.0,37.0,21.5,23.77777777777778
32
+ solar:10.7b-instruct-v1-q4_0,24.0,32.0,49.0,4.0,14.000000000000002,25.0,24.666666666666668,28.999999999999996,35.0,50.0,4.0,13.0,22.0,25.5,14.000000000000002,19.0,46.0,4.0,12.0,18.0,18.833333333333332,23.0
33
+ wavecut/vikhr:7b-instruct_0.4-Q4_1,21.0,24.0,36.0,11.0,19.0,31.0,23.666666666666668,22.0,26.0,38.0,8.0,19.0,28.999999999999996,23.666666666666668,12.0,14.000000000000002,35.0,10.0,20.0,28.999999999999996,20.0,22.444444444444443
34
+ mistral:7b-instruct-v0.3-q4_0,27.0,28.000000000000004,46.0,3.0,14.000000000000002,26.0,24.0,28.999999999999996,32.0,46.0,3.0,15.0,24.0,24.833333333333332,15.0,16.0,41.0,4.0,13.0,22.0,18.5,22.444444444444443
35
+ llama3:8b-instruct-q4_0,7.000000000000001,32.0,48.0,0.0,17.0,33.0,22.833333333333332,6.0,34.0,51.0,0.0,24.0,36.0,25.166666666666668,3.0,19.0,46.0,0.0,18.0,28.999999999999996,19.166666666666668,22.38888888888889
36
+ mixtral:8x7b-instruct-v0.1-q4_0,9.0,44.0,56.00000000000001,2.0,10.0,15.0,22.666666666666668,7.000000000000001,46.0,56.99999999999999,1.0,9.0,11.0,21.833333333333332,4.0,32.0,51.0,2.0,9.0,10.0,18.0,20.833333333333332
37
+ yi:9b,22.0,30.0,36.0,3.0,6.0,17.0,19.0,25.0,32.0,37.0,2.0,6.0,13.0,19.166666666666668,18.0,28.000000000000004,37.0,0.0,4.0,11.0,16.333333333333332,18.166666666666668
38
+ random,15.4513003569607,16.8111507734149,25.5141934387217,,,,19.2588815230324,14.3196829590489,15.4821664464993,23.3157199471598,,,,17.7058564509027,10.0271002710027,11.4837398373984,25.0338753387534,,,,15.5149051490515,17.4932143743289
39
+ gemma:7b-instruct-v1.1-q4_0,8.0,33.0,42.0,0.0,4.0,17.0,17.333333333333332,7.000000000000001,33.0,41.0,0.0,5.0,15.0,16.833333333333332,6.0,22.0,38.0,0.0,4.0,15.0,14.166666666666666,16.11111111111111
40
+ qwen:7b,19.0,20.0,28.999999999999996,0.0,4.0,18.0,15.0,20.0,20.0,30.0,0.0,4.0,17.0,15.166666666666666,10.0,11.0,27.0,0.0,2.0,12.0,10.333333333333334,13.5
41
+ llama3.2:3b-instruct-q4_0,0.0,23.0,34.0,0.0,5.0,21.0,13.833333333333334,0.0,27.0,37.0,0.0,7.000000000000001,19.0,15.0,0.0,14.000000000000002,31.0,0.0,6.0,17.0,11.333333333333334,13.38888888888889
42
+ yi:6b,15.0,22.0,21.0,1.0,3.0,12.0,12.333333333333334,14.000000000000002,26.0,24.0,1.0,4.0,9.0,13.0,9.0,23.0,18.0,0.0,3.0,8.0,10.166666666666666,11.833333333333334
43
+ llama2:13b,0.0,32.0,10.0,0.0,6.0,12.0,10.0,0.0,24.0,9.0,0.0,7.000000000000001,11.0,8.5,0.0,15.0,17.0,0.0,8.0,14.000000000000002,9.0,9.166666666666666
44
+ llama3.2:1b-instruct-q4_0,0.0,20.0,15.0,0.0,2.0,10.0,7.833333333333333,0.0,25.0,15.0,0.0,2.0,9.0,8.5,0.0,12.0,10.0,0.0,2.0,10.0,5.666666666666667,7.333333333333333
45
+ Среднее значение,44.61514651992932,52.83281745984686,59.57009752183073,21.88095238095238,36.214285714285715,49.42857142857143,43.89749336875268,43.14696937114067,52.12749224294185,58.425946975515345,20.5,36.785714285714285,47.595238095238095,42.89626022754039,33.69830465746518,41.29031953110229,53.34962500787798,16.833333333333332,30.714285714285715,41.92857142857143,36.13600554610198,40.97658638079835
vidvopr.csv ADDED
@@ -0,0 +1,45 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ model,NUM_Q_multich_EM,NUM_Q_multich_CC,NUM_Q_multich_PM,NUM_Q_multich_avg,NUM_Q_onech_EM,NUM_Q_onech_CC,NUM_Q_onech_PM,NUM_Q_onech_avg,NUM_Q_seq_EM,NUM_Q_seq_CC,NUM_Q_seq_PM,NUM_Q_seq_avg,NUM_Q_map_EM,NUM_Q_map_CC,NUM_Q_map_PM,NUM_Q_map_avg,OPEN_Q_EM,OPEN_Q_F1,OPEN_Q_LR,OPEN_Q_avg,Q_TYPE_avg
2
+ claude-3-5-sonnet,84.0,85.0,90.0,86.33333333333333,94.0,94.0,94.0,94.0,73.0,73.0,73.0,73.0,43.0,44.0,46.0,44.333333333333336,63.0,69.0,78.0,70.0,73.53333333333333
3
+ gemini-pro-1.5,73.0,78.0,84.0,78.33333333333333,91.0,92.0,91.0,91.33333333333333,66.0,66.0,66.0,66.0,59.0,60.0,66.0,61.666666666666664,55.00000000000001,67.0,77.0,66.33333333333333,72.73333333333333
4
+ deepseek-r1,79.0,82.0,86.0,82.33333333333333,67.0,93.0,93.0,84.33333333333333,82.0,82.0,82.0,82.0,57.99999999999999,61.0,59.0,59.333333333333336,22.0,61.0,69.0,50.666666666666664,71.73333333333333
5
+ qwen2.5:72b-instruct-q4_0,59.0,75.0,74.0,69.33333333333333,90.0,90.0,90.0,90.0,68.0,68.0,68.0,68.0,38.0,40.0,44.0,40.666666666666664,39.0,50.0,63.0,50.666666666666664,63.733333333333334
6
+ t-tech/T-pro-it-1.0,64.0,69.0,78.0,70.33333333333333,89.0,89.0,89.0,89.0,66.0,66.0,66.0,66.0,41.0,42.0,48.0,43.666666666666664,34.0,49.0,64.0,49.0,63.6
7
+ mistral-123b,69.0,74.0,82.0,75.0,89.0,89.0,89.0,89.0,63.0,63.0,63.0,63.0,24.0,24.0,28.000000000000004,25.333333333333332,54.0,62.0,71.0,62.333333333333336,62.93333333333333
8
+ gpt-4o,77.0,81.0,86.0,81.33333333333333,94.0,95.0,95.0,94.66666666666667,64.0,64.0,66.0,64.66666666666667,22.0,22.0,28.999999999999996,24.333333333333332,11.0,64.0,72.0,49.0,62.8
9
+ qwen2.5:32b-instruct-q4_0,59.0,66.0,75.0,66.66666666666667,86.0,87.0,87.0,86.66666666666667,60.0,60.0,60.0,60.0,35.0,36.0,42.0,37.666666666666664,31.0,41.0,55.00000000000001,42.333333333333336,58.666666666666664
10
+ qwen2:72b-instruct-q4_0,56.99999999999999,70.0,73.0,66.66666666666667,86.0,89.0,86.0,87.0,63.0,63.0,63.0,63.0,33.0,34.0,39.0,35.333333333333336,12.0,45.0,55.00000000000001,37.333333333333336,57.86666666666667
11
+ rscr/ruadapt_qwen2.5_32b:Q4_K_M,54.0,56.99999999999999,72.0,61.0,86.0,86.0,86.0,86.0,60.0,60.0,60.0,60.0,35.0,35.0,44.0,38.0,31.0,39.0,56.00000000000001,42.0,57.4
12
+ GigaChat-Max,73.0,76.0,83.0,77.33333333333333,85.0,85.0,85.0,85.0,38.0,38.0,38.0,38.0,16.0,16.0,23.0,18.333333333333332,48.0,55.00000000000001,69.0,57.333333333333336,55.2
13
+ GigaChat-Pro,61.0,64.0,76.0,67.0,79.0,81.0,79.0,79.66666666666667,45.0,45.0,45.0,45.0,25.0,25.0,30.0,26.666666666666668,48.0,55.00000000000001,68.0,57.0,55.06666666666667
14
+ YandexGPT4-Pro,31.0,35.0,77.0,47.666666666666664,85.0,85.0,85.0,85.0,35.0,35.0,54.0,41.333333333333336,21.0,21.0,47.0,29.666666666666668,45.0,56.00000000000001,69.0,56.666666666666664,52.06666666666667
15
+ YandexGPT4-Pro-32k,31.0,34.0,77.0,47.333333333333336,85.0,85.0,85.0,85.0,34.0,34.0,55.00000000000001,41.0,21.0,21.0,47.0,29.666666666666668,45.0,56.99999999999999,69.0,57.0,52.0
16
+ gemma2:27b-instruct-q4_0,49.0,56.99999999999999,69.0,58.333333333333336,82.0,83.0,82.0,82.33333333333333,48.0,48.0,48.0,48.0,13.0,13.0,18.0,14.666666666666666,39.0,48.0,63.0,50.0,50.666666666666664
17
+ GigaChat-Lite,56.99999999999999,61.0,72.0,63.333333333333336,75.0,76.0,75.0,75.33333333333333,38.0,38.0,38.0,38.0,13.0,13.0,17.0,14.333333333333334,35.0,42.0,56.99999999999999,44.666666666666664,47.13333333333333
18
+ llama405,21.0,62.0,77.0,53.333333333333336,60.0,91.0,91.0,80.66666666666667,24.0,33.0,51.0,36.0,5.0,7.000000000000001,20.0,10.666666666666666,9.0,56.00000000000001,66.0,43.666666666666664,44.86666666666667
19
+ ai-sage/GigaChat-20B-A3B-instruct,30.0,33.0,44.0,35.666666666666664,76.0,81.0,76.0,77.66666666666667,42.0,42.0,42.0,42.0,12.0,12.0,16.0,13.333333333333334,38.0,47.0,61.0,48.666666666666664,43.46666666666667
20
+ gemma2:9b-instruct-q4_0,41.0,54.0,64.0,53.0,77.0,80.0,77.0,78.0,32.0,33.0,35.0,33.333333333333336,5.0,5.0,10.0,6.666666666666667,25.0,34.0,49.0,36.0,41.4
21
+ llama3.1:70b-instruct-q4_0,42.0,57.99999999999999,68.0,56.0,49.0,85.0,84.0,72.66666666666667,14.000000000000002,17.0,33.0,21.333333333333332,1.0,2.0,14.000000000000002,5.666666666666667,11.0,54.0,64.0,43.0,39.733333333333334
22
+ llama3:70b-instruct-q4_0,35.0,63.0,60.0,52.666666666666664,79.0,81.0,79.0,79.66666666666667,12.0,14.000000000000002,25.0,17.0,4.0,5.0,6.0,5.0,7.000000000000001,47.0,57.99999999999999,37.333333333333336,38.333333333333336
23
+ YandexGPT4-Lite,33.0,38.0,57.99999999999999,43.0,74.0,75.0,74.0,74.33333333333333,6.0,6.0,7.000000000000001,6.333333333333333,2.0,2.0,5.0,3.0,35.0,52.0,66.0,51.0,35.53333333333333
24
+ qwen2.5:7b-instruct-q4_0,27.0,36.0,57.99999999999999,40.333333333333336,71.0,72.0,71.0,71.33333333333333,30.0,30.0,30.0,30.0,5.0,6.0,10.0,7.0,15.0,19.0,38.0,24.0,34.53333333333333
25
+ rscr/vikhr_nemo_12b:latest,23.0,31.0,53.0,35.666666666666664,56.00000000000001,73.0,64.0,64.33333333333333,11.0,19.0,20.0,16.666666666666668,2.0,3.0,11.0,5.333333333333333,12.0,28.999999999999996,41.0,27.333333333333332,29.866666666666667
26
+ ilyagusev/saiga_nemo_12b,3.0,4.0,59.0,22.0,70.0,71.0,70.0,70.33333333333333,17.0,17.0,18.0,17.333333333333332,1.0,1.0,10.0,4.0,23.0,34.0,48.0,35.0,29.733333333333334
27
+ qwen2:7b-instruct-q4_0,11.0,13.0,55.00000000000001,26.333333333333332,67.0,68.0,67.0,67.33333333333333,22.0,22.0,23.0,22.333333333333332,2.0,2.0,8.0,4.0,5.0,13.0,28.999999999999996,15.666666666666666,27.133333333333333
28
+ phi3:14b-medium-4k-instruct-q4_0,0.0,0.0,60.0,20.0,70.0,76.0,74.0,73.33333333333333,3.0,4.0,41.0,16.0,0.0,0.0,9.0,3.0,7.000000000000001,20.0,31.0,19.333333333333332,26.333333333333332
29
+ owl/t-lite:q4_0-instruct,3.0,6.0,42.0,17.0,66.0,68.0,67.0,67.0,10.0,11.0,12.0,11.0,1.0,1.0,3.0,1.6666666666666667,4.0,35.0,48.0,29.0,25.133333333333333
30
+ ilyagusev/saiga_llama3,2.0,9.0,52.0,21.0,65.0,65.0,65.0,65.0,9.0,9.0,20.0,12.666666666666666,0.0,0.0,4.0,1.3333333333333333,8.0,24.0,38.0,23.333333333333332,24.666666666666668
31
+ mixtral:8x7b-instruct-v0.1-q4_0,0.0,13.0,53.0,22.0,16.0,78.0,71.0,55.0,2.0,15.0,27.0,14.666666666666666,0.0,2.0,12.0,4.666666666666667,2.0,9.0,12.0,7.666666666666667,20.8
32
+ mistral:7b-instruct-v0.3-q4_0,0.0,0.0,44.0,14.666666666666666,54.0,57.99999999999999,56.99999999999999,56.333333333333336,0.0,0.0,31.0,10.333333333333334,0.0,0.0,4.0,1.3333333333333333,3.0,14.000000000000002,24.0,13.666666666666666,19.266666666666666
33
+ solar:10.7b-instruct-v1-q4_0,0.0,0.0,49.0,16.333333333333332,50.0,65.0,63.0,59.333333333333336,0.0,0.0,19.0,6.333333333333333,0.0,0.0,3.0,1.0,4.0,13.0,22.0,13.0,19.2
34
+ yi:9b,8.0,17.0,39.0,21.333333333333332,39.0,49.0,46.0,44.666666666666664,12.0,14.000000000000002,14.000000000000002,13.333333333333334,0.0,0.0,1.0,0.3333333333333333,2.0,6.0,14.000000000000002,7.333333333333333,17.4
35
+ llama3.1:8b-instruct-q4_0,0.0,0.0,50.0,16.666666666666668,4.0,64.0,60.0,42.666666666666664,0.0,1.0,3.0,1.3333333333333333,0.0,0.0,6.0,2.0,0.0,24.0,40.0,21.333333333333332,16.8
36
+ llama3:8b-instruct-q4_0,0.0,0.0,50.0,16.666666666666668,12.0,65.0,64.0,47.0,0.0,1.0,3.0,1.3333333333333333,0.0,0.0,4.0,1.3333333333333333,0.0,20.0,33.0,17.666666666666668,16.8
37
+ wavecut/vikhr:7b-instruct_0.4-Q4_1,0.0,0.0,39.0,13.0,41.0,49.0,47.0,45.666666666666664,2.0,3.0,7.000000000000001,4.0,0.0,0.0,1.0,0.3333333333333333,10.0,19.0,30.0,19.666666666666668,16.533333333333335
38
+ gemma:7b-instruct-v1.1-q4_0,2.0,9.0,39.0,16.666666666666668,13.0,56.00000000000001,54.0,41.0,7.000000000000001,10.0,11.0,9.333333333333334,1.0,1.0,4.0,2.0,0.0,4.0,16.0,6.666666666666667,15.133333333333333
39
+ random,4.04341349223239,7.59736114066823,32.698446477974,14.77974037029154,24.5103137458832,24.5103137458832,24.5103137458832,24.5103137458832,14.0740740740741,14.0740740740741,14.0740740740741,14.0740740740741,0.828500414250207,0.828500414250207,3.23115161557581,1.629384148025408,,,,,13.7483780845685
40
+ qwen:7b,0.0,0.0,30.0,10.0,36.0,37.0,36.0,36.333333333333336,12.0,12.0,14.000000000000002,12.666666666666666,0.0,0.0,1.0,0.3333333333333333,0.0,3.0,16.0,6.333333333333333,13.133333333333333
41
+ llama3.2:3b-instruct-q4_0,0.0,0.0,30.0,10.0,0.0,48.0,48.0,32.0,0.0,0.0,10.0,3.3333333333333335,0.0,0.0,1.0,0.3333333333333333,0.0,6.0,19.0,8.333333333333334,10.8
42
+ yi:6b,1.0,18.0,13.0,10.666666666666666,28.000000000000004,36.0,35.0,33.0,0.0,6.0,4.0,3.3333333333333335,0.0,1.0,1.0,0.6666666666666666,1.0,3.0,10.0,4.666666666666667,10.466666666666667
43
+ llama2:13b,0.0,0.0,25.0,8.333333333333334,0.0,56.00000000000001,4.0,20.000000000000004,0.0,0.0,1.0,0.3333333333333333,0.0,0.0,0.0,0.0,0.0,7.000000000000001,12.0,6.333333333333333,7.0
44
+ llama3.2:1b-instruct-q4_0,0.0,1.0,14.000000000000002,5.000000000000001,0.0,42.0,19.0,20.333333333333332,0.0,3.0,0.0,1.0,0.0,0.0,0.0,0.0,0.0,2.0,10.0,4.0,6.066666666666666
45
+ Среднее значение,29.373102639354244,35.734822352108566,58.41159177855753,41.17317225667345,59.5467514824624,72.38396078478799,69.26768171502054,67.06613132742365,27.536606373815676,28.815676141257537,33.95521102497847,30.10249784668388,12.530895358470936,12.972755823587216,18.470491898036645,14.658047693364935,19.833333333333332,34.61904761904762,46.42857142857143,33.62698412698412,37.23290801747059