xlm-roberta-large_ALL_BCE_new_data_multihead_19_shuffled_special_tokens_final

This model is a fine-tuned version of xlm-roberta-large on the None dataset. It achieves the following results on the evaluation set:

Model description

More information needed

More information needed

More information needed

The following hyperparameters were used during training:

Training Loss	Epoch	Step	Validation Loss	F1 Macro 0.1	F1 Macro 0.15	F1 Macro 0.2	F1 Macro 0.25	F1 Macro 0.3	F1 Macro 0.35	F1 Macro 0.4	F1 Macro 0.45	F1 Macro 0.5	F1 Macro 0.55	F1 Macro 0.6	F1 Macro 0.65	F1 Macro 0.7	F1 Macro 0.75	Threshold 0	Threshold 1	Threshold 2	Threshold 3	Threshold 4	Threshold 5	Threshold 6	Threshold 7	Threshold 8	Threshold 9	Threshold 10	Threshold 11	Threshold 12	Threshold 13	Threshold 14	Threshold 15	Threshold 16	Threshold 17	Threshold 18	0	1	2	3	4	5	6	7	8	9	10	11	12	13	14	15	16	17	18	Max F1	Mean F1
1.4193	1.0	7458	1.4534	0.0606	0.0634	0.0648	0.0667	0.0689	0.0718	0.0765	0.0771	0.0811	0.0839	0.0856	0.0772	0.0562	0.0434	0.4	0.55	0.6	0.3	0.55	0.7	0.55	0.55	0.6	0.5	0.4	0.6	0.6	0.1	0.5	0.55	0.55	0.5	0.35	0.0376	0.0951	0.1069	0.0416	0.1579	0.1767	0.1486	0.0558	0.0742	0.2208	0.0532	0.1499	0.0799	0.0095	0.0968	0.0655	0.1053	0.0621	0.0296	0.0856	0.0930
1.4423	2.0	14916	1.4217	0.0608	0.0627	0.0641	0.0673	0.0693	0.0732	0.0783	0.0835	0.0829	0.0861	0.0793	0.0621	0.0363	0.0093	0.6	0.45	0.65	0.35	0.5	0.65	0.55	0.55	0.6	0.55	0.25	0.55	0.45	0.15	0.45	0.55	0.5	0.55	0.35	0.0476	0.0951	0.1069	0.0416	0.1569	0.1767	0.1486	0.0538	0.0742	0.2204	0.0520	0.1455	0.0799	0.0095	0.0968	0.0679	0.1100	0.0621	0.0270	0.0861	0.0933
1.4186	3.0	22374	1.4169	0.0608	0.0628	0.0639	0.0677	0.0681	0.0723	0.0790	0.0818	0.0874	0.0904	0.0771	0.0611	0.0421	0.0235	0.45	0.5	0.7	0.35	0.6	0.65	0.55	0.45	0.55	0.5	0.5	0.6	0.4	0.1	0.45	0.55	0.55	0.5	0.35	0.0476	0.0951	0.1069	0.0416	0.1579	0.1767	0.1486	0.0558	0.0742	0.2208	0.0532	0.1499	0.0799	0.0095	0.0968	0.0679	0.1100	0.0621	0.0296	0.0904	0.0939