--- base_model: Tnt3o5/tnt_v4_lega_new_tokens library_name: sentence-transformers metrics: - cosine_accuracy@1 - cosine_accuracy@3 - cosine_accuracy@5 - cosine_accuracy@10 - cosine_precision@1 - cosine_precision@3 - cosine_precision@5 - cosine_precision@10 - cosine_recall@1 - cosine_recall@3 - cosine_recall@5 - cosine_recall@10 - cosine_ndcg@10 - cosine_mrr@10 - cosine_map@100 pipeline_tag: sentence-similarity tags: - sentence-transformers - sentence-similarity - feature-extraction - generated_from_trainer - dataset_size:101442 - loss:MatryoshkaLoss - loss:MultipleNegativesRankingLoss widget: - source_sentence: Ai có quyền điều_chỉnh Mệnh_lệnh vận_chuyển vật_liệu nổ công_nghiệp trong doanh_nghiệp Quân_đội ? sentences: - 'Quyền đăng_ký sáng_chế , kiểu_dáng công_nghiệp , thiết_kế bố_trí Tổ_chức , cá_nhân sau đây có quyền đăng_ký sáng_chế , kiểu_dáng công_nghiệp , thiết_kế bố_trí : Tác giả_tạo ra sáng_chế , kiểu_dáng công_nghiệp , thiết_kế bố_trí bằng công_sức và chi_phí của mình ; Tổ_chức , cá_nhân đầu_tư kinh_phí , phương_tiện vật_chất cho tác_giả dưới hình_thức giao việc , thuê việc , tổ_chức , cá_nhân được giao quản_lý nguồn gen cung_cấp nguồn gen , tri_thức truyền_thống về nguồn gen theo hợp_đồng tiếp_cận nguồn gen và chia_sẻ lợi_ích , trừ trường_hợp các bên có thỏa_thuận khác hoặc trường_hợp quy_định tại Điều_86a của Luật này . Trường_hợp nhiều tổ_chức , cá_nhân cùng nhau tạo ra hoặc đầu_tư để tạo ra sáng_chế , kiểu_dáng công_nghiệp , thiết_kế bố_trí thì các tổ_chức , cá_nhân đó đều có quyền đăng_ký và quyền đăng_ký đó chỉ được thực_hiện nếu được tất_cả các tổ_chức , cá_nhân đó đồng_ý . Tổ_chức , cá_nhân có quyền đăng_ký quy_định tại Điều này có quyền chuyển_giao quyền đăng_ký cho tổ_chức , cá_nhân khác dưới hình_thức hợp_đồng bằng văn_bản , để thừa_kế hoặc kế_thừa theo quy_định của pháp_luật , kể_cả trường_hợp đã nộp đơn đăng_ký .' - 'Nhiệm_vụ cụ_thể của các thành_viên Hội_đồng Ngoài việc thực_hiện các nhiệm_vụ quy_định tại Điều_5 của Quy_chế này , Thành_viên Hội_đồng còn có nhiệm_vụ cụ_thể sau đây : Thành_viên Hội_đồng là Lãnh_đạo Vụ Pháp_chế có nhiệm_vụ giúp Chủ_tịch , Phó Chủ_tịch Hội_đồng , Hội_đồng , điều_hành các công_việc thường_xuyên của Hội_đồng ; trực_tiếp lãnh_đạo Tổ Thường_trực ; giải_quyết công_việc đột_xuất của Hội_đồng khi cả Chủ_tịch và Phó Chủ_tịch Hội đồng_đều đi vắng . Thành_viên Hội_đồng là Lãnh_đạo Vụ An_toàn giao_thông có nhiệm_vụ trực_tiếp theo_dõi , đôn_đốc , kiểm_tra và phối_hợp với thủ_trưởng các cơ_quan , đơn_vị thuộc Bộ , Thành_viên Hội_đồng là Lãnh_đạo Văn_phòng Ủy_ban ATGTQG , Giám_đốc Sở GTVT , Chủ_tịch Tập_đoàn VINASHIN , Tổng giám_đốc các Tổng Công_ty : Hàng_hải Việt_Nam , Đường_sắt Việt_Nam , Hàng_không Việt_Nam chỉ_đạo công_tác tuyên_truyền PBGDPL về trật_tự , an_toàn giao_thông .' - Cấp , điều_chỉnh , thu_hồi và tạm ngừng cấp_Mệnh lệnh vận_chuyển vật_liệu nổ công_nghiệp , tiền chất thuốc_nổ Tổng_Tham_mưu_trưởng cấp , điều_chỉnh , thu_hồi hoặc ủy_quyền cho người chỉ_huy cơ_quan , đơn_vị thuộc quyền dưới một cấp cấp , điều_chỉnh , thu_hồi Mệnh_lệnh vận_chuyển vật_liệu nổ công_nghiệp , tiền chất thuốc_nổ cho cá 5 doanh_nghiệp trực_thuộc Bộ Quốc_phòng và các doanh_nghiệp cổ_phần có vốn nhà_nước do Bộ Quốc_phòng làm đại_diện chủ sở_hữu . Đối_với trường_hợp đột_xuất khác không có trong kế_hoạch được Tổng_Tham_mưu_trưởng phê_duyệt như quy_định tại Điều_5 Thông_tư này , cơ_quan , đơn_vị , doanh_nghiệp cấp dưới báo_cáo cơ_quan , đơn_vị , doanh_nghiệp trực_thuộc Bộ Quốc_phòng đề_nghị Tổng_Tham_mưu_trưởng cấp_Mệnh lệnh vận_chuyển vật_liệu nổ công_nghiệp , tiền chất thuốc_nổ . Người chỉ_huy cơ_quan , đơn_vị ( không phải doanh nghiệ trực_thuộc Bộ Quốc_phòng căn_cứ vào kế_hoạch được Tổng_Tham_mưu_trưởng phê_duyệt , thực_hiện hoặc ủy_quyền cho người chỉ_huy cơ_quan , đơn_vị thuộc quyền dưới một cấp cấp , điều_chỉnh , thu_hồi Mệnh_lệnh vận_chuyển vật_liệu nổ công_nghiệp , tiền chất thuốc_nổ cho đối_tượng thuộc phạm_vi quản_lý . - source_sentence: Ai có quyền quyết_định phong quân_hàm Đại_tá đối_với sĩ_quan Quân_đội giữ chức_vụ Chính_ủy Lữ_đoàn ? sentences: - 'Thẩm_quyền quyết_định đối_với sĩ_quan Thẩm_quyền bổ_nhiệm , miễn_nhiệm , cách_chức , phong , thăng , giáng , tước quân_hàm đối_với sĩ_quan được quy_định như sau : Chủ_tịch_nước bổ_nhiệm , miễn_nhiệm , cách_chức Tổng_Tham_mưu_trưởng , Chủ_nhiệm Tổng_Cục_Chính_trị ; phong , thăng , giáng , tước quân_hàm Cấp tướng , Chuẩn Đô_đốc , Phó Đô_đốc , Đô_đốc Hải_quân ; Thủ_tướng_Chính_phủ bổ_nhiệm , miễn_nhiệm , cách_chức Thứ_trưởng ; Phó_Tổng_Tham_mưu_trưởng , Phó Chủ_nhiệm Tổng_Cục_Chính_trị ; Giám_đốc , Chính_ủy Học_viện Quốc_phòng ; Chủ_nhiệm Tổng_cục , Tổng cục_trưởng , Chính_ủy Tổng_cục ; Tư_lệnh , Chính_ủy Quân_khu ; Tư_lệnh , Chính_ủy Quân_chủng ; Tư_lệnh , Chính_ủy Bộ_đội Biên_phòng ; Tư_lệnh , Chính_ủy Cảnh_sát biển Việt_Nam ; Trưởng_Ban Cơ_yếu Chính_phủ và các chức_vụ khác theo quy_định của Cấp có thẩm_quyền ; Bộ_trưởng_Bộ_Quốc_phòng bổ_nhiệm , miễn_nhiệm , cách_chức các chức_vụ và phong , thăng , giáng , tước các Cấp_bậc quân_hàm còn lại và nâng lương sĩ_quan ; Việc bổ_nhiệm , miễn_nhiệm , cách_chức các chức_vụ thuộc ngành Kiểm_sát , Toà_án , Thi_hành án trong quân_đội được thực_hiện theo quy_định của pháp_luật . Cấp có thẩm_quyền quyết_định bổ_nhiệm đến chức_vụ nào thì có quyền miễn_nhiệm , cách_chức , giáng chức , quyết_định kéo_dài thời_hạn phục_vụ tại_ngũ , điều_động , biệt_phái , giao chức_vụ thấp hơn , cho thôi phục_vụ tại_ngũ , chuyển ngạch và giải ngạch sĩ_quan dự_bị đến chức_vụ đó .' - 'Nhiệm_vụ , quyền_hạn của Tổng Giám_đốc Trình Hội_đồng thành_viên VNPT để Hội_đồng thành_viên Trình cơ_quan nhà_nước có thẩm_quyền quyết_định hoặc phê_duyệt các nội_dung thuộc quyền của chủ sở_hữu đối_với VNPT theo quy_định của Điều_lệ này . Trình Hội_đồng thành_viên VNPT xem_xét , quyết_định các nội_dung thuộc thẩm_quyền của Hội_đồng thành_viên VNPT. Ban_hành quy_chế quản_lý nội_bộ sau khi Hội_đồng thành_viên thông_qua . Theo phân_cấp hoặc ủy_quyền theo quy_định của Điều_lệ này , Quy_chế_tài_chính , các quy_chế quản_lý nội_bộ của VNPT và các quy_định khác của pháp_luật , Tổng Giám_đốc quyết_định : Các dự_án đầu_tư ; hợp_đồng mua , bán tài_sản . Các hợp_đồng vay , thuê , cho thuê và hợp_đồng khác . Phương_án sử_dụng vốn , tài_sản của VNPT để góp vốn , mua cổ_phần của các doanh_nghiệp . Ban_hành các quy_định , quy Trình nội_bộ phục_vụ công_tác quản_lý , Điều_hành sản_xuất kinh_doanh của VNPT. Quyết_định thành_lập , giải_thể , tổ_chức lại các đơn_vị kinh_tế hạch_toán phụ_thuộc đơn_vị trực_thuộc của VNPT.' - 'Thẩm_quyền quyết_định đối_với sĩ_quan Thẩm_quyền bổ_nhiệm , miễn_nhiệm , cách_chức , phong , thăng , giáng , tước quân_hàm đối_với sĩ_quan được quy_định như sau : Chủ_tịch_nước bổ_nhiệm , miễn_nhiệm , cách_chức Tổng_Tham_mưu_trưởng , Chủ_nhiệm Tổng_Cục_Chính_trị ; phong , thăng , giáng , tước quân_hàm Cấp tướng , Chuẩn Đô_đốc , Phó Đô_đốc , Đô_đốc Hải_quân ; Thủ_tướng_Chính_phủ bổ_nhiệm , miễn_nhiệm , cách_chức Thứ_trưởng ; Phó_Tổng_Tham_mưu_trưởng , Phó Chủ_nhiệm Tổng_Cục_Chính_trị ; Giám_đốc , Chính_ủy Học_viện Quốc_phòng ; Chủ_nhiệm Tổng_cục , Tổng cục_trưởng , Chính_ủy Tổng_cục ; Tư_lệnh , Chính_ủy Quân_khu ; Tư_lệnh , Chính_ủy Quân_chủng ; Tư_lệnh , Chính_ủy Bộ_đội Biên_phòng ; Tư_lệnh , Chính_ủy Cảnh_sát biển Việt_Nam ; Trưởng_Ban Cơ_yếu Chính_phủ và các chức_vụ khác theo quy_định của Cấp có thẩm_quyền ; Bộ_trưởng_Bộ_Quốc_phòng bổ_nhiệm , miễn_nhiệm , cách_chức các chức_vụ và phong , thăng , giáng , tước các Cấp_bậc quân_hàm còn lại và nâng lương sĩ_quan ; Việc bổ_nhiệm , miễn_nhiệm , cách_chức các chức_vụ thuộc ngành Kiểm_sát , Toà_án , Thi_hành án trong quân_đội được thực_hiện theo quy_định của pháp_luật . Cấp có thẩm_quyền quyết_định bổ_nhiệm đến chức_vụ nào thì có quyền miễn_nhiệm , cách_chức , giáng chức , quyết_định kéo_dài thời_hạn phục_vụ tại_ngũ , điều_động , biệt_phái , giao chức_vụ thấp hơn , cho thôi phục_vụ tại_ngũ , chuyển ngạch và giải ngạch sĩ_quan dự_bị đến chức_vụ đó .' - source_sentence: Ai có quyền quyết_định thành_lập Hội_đồng Giám_định y_khoa cấp tỉnh ? Hội_đồng có tư_cách pháp_nhân không ? sentences: - Thẩm_quyền thành_lập Hội_đồng giám_định y_khoa các cấp Hội_đồng giám_định y_khoa cấp tỉnh do cơ_quan chuyên_môn thuộc Ủy_ban_nhân_dân tỉnh quyết_định thành_lập . Hội_đồng giám_định y_khoa cấp trung_ương do Bộ_Y_tế quyết_định thành_lập . Bộ Quốc_phòng , Bộ_Công_An , Bộ_Giao_thông_Vận_tải căn_cứ quy_định của Thông_tư này để quyết_định thành_lập Hội_đồng giám_định y_khoa các Bộ theo quy_định tại điểm_b Khoản_2 Điều_161 Nghị_định số 131/2021/NĐCP. - Thẩm_quyền phong , thăng , giáng , tước cấp_bậc hàm , nâng lương sĩ_quan , hạ sĩ_quan , chiến_sĩ ; bổ_nhiệm , miễn_nhiệm , cách_chức , giáng chức các chức_vụ ; bổ_nhiệm , miễn_nhiệm chức_danh trong Công_an nhân_dân Chủ_tịch_nước phong , thăng cấp_bậc hàm_cấp tướng đối_với sĩ_quan Công_an nhân_dân . Thủ_tướng_Chính_phủ bổ_nhiệm chức_vụ Thứ_trưởng Bộ_Công_An ; quyết_định nâng lương cấp_bậc hàm Đại_tướng , Thượng_tướng . Bộ_trưởng Bộ_Công_An quyết_định nâng lương cấp_bậc hàm Trung_tướng , Thiếu_tướng ; quy_định việc phong , thăng , nâng lương các cấp_bậc hàm , bổ_nhiệm các chức_vụ , chức_danh còn lại trong Công_an nhân_dân . Người có thẩm_quyền phong , thăng cấp_bậc hàm nào thì có thẩm_quyền giáng , tước cấp_bậc hàm đó ; mỗi lần chỉ được thăng , giáng 01 cấp_bậc hàm , trừ trường_hợp đặc_biệt mới xét thăng , giáng nhiều cấp_bậc hàm . Người có thẩm_quyền bổ_nhiệm chức_vụ nào thì có thẩm_quyền miễn_nhiệm , cách_chức , giáng chức đối_với chức_vụ đó . Người có thẩm_quyền bổ_nhiệm chức_danh nào thì có thẩm_quyền miễn_nhiệm đối_với chức_danh đó . - Thẩm_quyền duyệt kế_hoạch Đại_hội Đoàn các cấp Ban Thường_vụ Đoàn cấp trên trực_tiếp có trách_nhiệm và thẩm_quyền duyệt kế_hoạch Đại_hội Đoàn các đơn_vị trực_thuộc . Ban Bí_thư Trung_ương Đoàn duyệt kế_hoạch Đại_hội Đoàn cấp tỉnh . - source_sentence: Ai có quyền ký hợp_đồng cộng tác_viên với người đáp_ứng đủ tiêu_chuẩn có nguyện_vọng làm Cộng tác_viên pháp điển ? sentences: - 'Thẩm_quyền lập biên_bản_vi_phạm hành_chính trong lĩnh_vực Kiểm_toán_Nhà_nước_Người có thẩm_quyền lập biên_bản_vi_phạm hành_chính trong lĩnh_vực Kiểm_toán_Nhà_nước quy_định tại Điều_15 của Pháp_lệnh số { 04 / 2023 / UBTVQH15 , } bao_gồm : Kiểm toán_viên nhà_nước ; Tổ_trưởng tổ kiểm_toán ; Phó trưởng_đoàn kiểm_toán ; Trưởng_đoàn kiểm_toán ; đ ) Kiểm toán_trưởng . Trường_hợp người đang thi_hành nhiệm_vụ kiểm_toán , kiểm_tra thực_hiện kết_luận , kiến_nghị kiểm_toán , nhiệm_vụ tiếp_nhận báo_cáo cáo định_kỳ hoặc nhiệm_vụ khác mà không phải là người có thẩm_quyền lập biên_bản_vi_phạm hành_chính , nếu phát_hiện_hành_vi vi_phạm hành_chính trong lĩnh_vực Kiểm_toán_Nhà_nước thì phải lập biên_bản làm_việc để ghi_nhận sự_việc và chuyển ngay biên_bản làm_việc đến người có thẩm_quyền để lập biên_bản_vi_phạm hành_chính theo quy_định .' - '" Điều Đăng_ký_kết_hôn Việc kết_hôn phải được đăng_ký và do cơ_quan nhà_nước có thẩm_Quyền thực_hiện theo quy_định của Luật này và pháp Luật về hộ_tịch . Việc kết_hôn không được đăng_ký theo quy_định tại khoản này thì không có giá_trị pháp_lý . Vợ_chồng đã ly_hôn muốn xác_lập lại quan_hệ vợ_chồng thì phải đăng_ký kết_hôn . Điều Giải_quyết hậu_quả của việc nam , nữ chung sống với nhau như vợ_chồng mà không đăng_ký kết_hôn Nam , nữ có đủ điều_kiện kết_hôn theo quy_định của Luật này chung sống với nhau như vợ_chồng mà không đăng_ký kết_hôn thì không làm phát_sinh Quyền , nghĩa_vụ giữa vợ và chồng . Quyền , nghĩa_vụ đối_với con , tài_sản , nghĩa_vụ và hợp_đồng giữa các bên được giải_quyết theo quy_định tại Điều_15 và Điều_16 của Luật này . Trong trường_hợp nam , nữ chung sống với nhau như vợ_chồng theo quy_định tại Khoản 1_Điều này nhưng sau đó thực_hiện việc đăng_ký kết_hôn theo quy_định của pháp Luật thì quan_hệ hôn_nhân được xác_lập từ thời điểm đăng_ký kết_hôn . "' - Thẩm_quyền , trách_nhiệm của các đơn_vị thuộc Bộ_Tư_pháp trong việc quản_lý , sử_dụng Cộng tác_viên Các đơn_vị thuộc Bộ_Tư_pháp Thủ_trưởng đơn_vị thực_hiện pháp điển có quyền ký hợp_đồng cộng_tác với người đáp_ứng đủ tiêu_chuẩn quy_định tại Điều_2 Quy_chế này , có nguyện_vọng làm Cộng tác_viên theo nhu_cầu thực_tế và phạm_vi , tính_chất công_việc thực_hiện pháp điển của đơn_vị ; thông_báo cho Cục Kiểm_tra văn_bản quy_phạm pháp_luật về việc ký hợp_đồng thuê Cộng tác_viên và tình_hình thực_hiện công_việc của Cộng tác_viên . Đơn_vị thực_hiện pháp điển không được sử_dụng cán_bộ , công_chức , viên_chức thuộc biên_chế của đơn_vị làm Cộng tác_viên với đơn_vị mình . Thủ_trưởng đơn_vị thuộc Bộ_Tư_pháp thực_hiện pháp điển có_thể tham_khảo Danh_sách nguồn Cộng tác_viên do Cục Kiểm_tra văn_bản quy_phạm pháp_luật lập để ký hợp_đồng thuê Cộng tác_viên thực_hiện công_tác pháp điển thuộc thẩm_quyền , trách_nhiệm của đơn_vị mình . - source_sentence: Ai có quyền_hủy bỏ kết_quả bầu_cử và quyết_định bầu_cử lại đại_biểu Quốc_hội ? sentences: - '" Điều Thẩm_quyền quyết_định tạm hoãn gọi nhập_ngũ , miễn gọi nhập_ngũ và công_nhận hoàn_thành nghĩa_vụ quân_sự tại_ngũ Chủ_tịch Ủy_ban_nhân_dân cấp huyện quyết_định tạm hoãn gọi nhập_ngũ và miễn gọi nhập_ngũ đối_với công_dân quy_định tại Điều_41 của Luật này . Chỉ huy_trưởng Ban chỉ_huy quân_sự cấp huyện quyết_định công_nhận hoàn_thành nghĩa_vụ quân_sự tại_ngũ đối_với công_dân quy_định tại Khoản_4 Điều_4 của Luật này . "' - Cơ_cấu tổ_chức Tổng cục_trưởng Tổng_cục Hải_quan quy_định nhiệm_vụ và quyền_hạn của các Phòng , Đội , Hải_Đội thuộc và trực_thuộc Cục Điều_tra chống buôn_lậu . - Hủy_bỏ kết_quả bầu_cử và quyết_định bầu_cử lại Hội_đồng_Bầu_cử_Quốc_gia tự mình hoặc theo đề_nghị của Ủy_ban_Thường_vụ_Quốc_hội , Chính_phủ , Ủy_ban trung_ương Mặt_trận_Tổ_quốc Việt_Nam , Ủy_ban bầu_cử ở tỉnh Hủy_bỏ kết_quả bầu_cử ở khu_vực bỏ_phiếu , đơn_vị bầu_cử có vi_phạm_pháp_luật nghiêm_trọng và quyết_định ngày bầu_cử lại ở khu_vực bỏ_phiếu , đơn_vị bầu_cử đó . Trong trường_hợp bầu_cử lại thì ngày bầu_cử được tiến_hành chậm nhất là 15 ngày sau ngày bầu_cử đầu_tiên . Trong cuộc bầu_cử lại , cử_tri chỉ chọn bầu trong danh_sách những người ứng_cử tại cuộc bầu_cử đầu_tiên . model-index: - name: SentenceTransformer based on Tnt3o5/tnt_v4_lega_new_tokens results: - task: type: information-retrieval name: Information Retrieval dataset: name: dim 256 type: dim_256 metrics: - type: cosine_accuracy@1 value: 0.4254 name: Cosine Accuracy@1 - type: cosine_accuracy@3 value: 0.6052 name: Cosine Accuracy@3 - type: cosine_accuracy@5 value: 0.6636 name: Cosine Accuracy@5 - type: cosine_accuracy@10 value: 0.7248 name: Cosine Accuracy@10 - type: cosine_precision@1 value: 0.4254 name: Cosine Precision@1 - type: cosine_precision@3 value: 0.20706666666666665 name: Cosine Precision@3 - type: cosine_precision@5 value: 0.13752 name: Cosine Precision@5 - type: cosine_precision@10 value: 0.07594 name: Cosine Precision@10 - type: cosine_recall@1 value: 0.4051 name: Cosine Recall@1 - type: cosine_recall@3 value: 0.58215 name: Cosine Recall@3 - type: cosine_recall@5 value: 0.6421 name: Cosine Recall@5 - type: cosine_recall@10 value: 0.7052 name: Cosine Recall@10 - type: cosine_ndcg@10 value: 0.5619612781230402 name: Cosine Ndcg@10 - type: cosine_mrr@10 value: 0.526433492063493 name: Cosine Mrr@10 - type: cosine_map@100 value: 0.514814431994549 name: Cosine Map@100 - task: type: information-retrieval name: Information Retrieval dataset: name: dim 128 type: dim_128 metrics: - type: cosine_accuracy@1 value: 0.4264 name: Cosine Accuracy@1 - type: cosine_accuracy@3 value: 0.6 name: Cosine Accuracy@3 - type: cosine_accuracy@5 value: 0.662 name: Cosine Accuracy@5 - type: cosine_accuracy@10 value: 0.7194 name: Cosine Accuracy@10 - type: cosine_precision@1 value: 0.4264 name: Cosine Precision@1 - type: cosine_precision@3 value: 0.2053333333333333 name: Cosine Precision@3 - type: cosine_precision@5 value: 0.13707999999999998 name: Cosine Precision@5 - type: cosine_precision@10 value: 0.07544 name: Cosine Precision@10 - type: cosine_recall@1 value: 0.40606666666666663 name: Cosine Recall@1 - type: cosine_recall@3 value: 0.57705 name: Cosine Recall@3 - type: cosine_recall@5 value: 0.6404666666666667 name: Cosine Recall@5 - type: cosine_recall@10 value: 0.70015 name: Cosine Recall@10 - type: cosine_ndcg@10 value: 0.5591685699820262 name: Cosine Ndcg@10 - type: cosine_mrr@10 value: 0.5244388095238101 name: Cosine Mrr@10 - type: cosine_map@100 value: 0.5128272708639572 name: Cosine Map@100 - task: type: information-retrieval name: Information Retrieval dataset: name: dim 64 type: dim_64 metrics: - type: cosine_accuracy@1 value: 0.4076 name: Cosine Accuracy@1 - type: cosine_accuracy@3 value: 0.5866 name: Cosine Accuracy@3 - type: cosine_accuracy@5 value: 0.6478 name: Cosine Accuracy@5 - type: cosine_accuracy@10 value: 0.708 name: Cosine Accuracy@10 - type: cosine_precision@1 value: 0.4076 name: Cosine Precision@1 - type: cosine_precision@3 value: 0.20026666666666665 name: Cosine Precision@3 - type: cosine_precision@5 value: 0.13403999999999996 name: Cosine Precision@5 - type: cosine_precision@10 value: 0.0741 name: Cosine Precision@10 - type: cosine_recall@1 value: 0.38761666666666666 name: Cosine Recall@1 - type: cosine_recall@3 value: 0.5637666666666666 name: Cosine Recall@3 - type: cosine_recall@5 value: 0.6255666666666667 name: Cosine Recall@5 - type: cosine_recall@10 value: 0.6879833333333333 name: Cosine Recall@10 - type: cosine_ndcg@10 value: 0.5444437738024127 name: Cosine Ndcg@10 - type: cosine_mrr@10 value: 0.5090488888888896 name: Cosine Mrr@10 - type: cosine_map@100 value: 0.49745729547355066 name: Cosine Map@100 --- # SentenceTransformer based on Tnt3o5/tnt_v4_lega_new_tokens This is a [sentence-transformers](https://www.SBERT.net) model finetuned from [Tnt3o5/tnt_v4_lega_new_tokens](https://huggingface.co/Tnt3o5/tnt_v4_lega_new_tokens). It maps sentences & paragraphs to a 768-dimensional dense vector space and can be used for semantic textual similarity, semantic search, paraphrase mining, text classification, clustering, and more. ## Model Details ### Model Description - **Model Type:** Sentence Transformer - **Base model:** [Tnt3o5/tnt_v4_lega_new_tokens](https://huggingface.co/Tnt3o5/tnt_v4_lega_new_tokens) - **Maximum Sequence Length:** 256 tokens - **Output Dimensionality:** 768 dimensions - **Similarity Function:** Cosine Similarity ### Model Sources - **Documentation:** [Sentence Transformers Documentation](https://sbert.net) - **Repository:** [Sentence Transformers on GitHub](https://github.com/UKPLab/sentence-transformers) - **Hugging Face:** [Sentence Transformers on Hugging Face](https://huggingface.co/models?library=sentence-transformers) ### Full Model Architecture ``` SentenceTransformer( (0): Transformer({'max_seq_length': 256, 'do_lower_case': False}) with Transformer model: RobertaModel (1): Pooling({'word_embedding_dimension': 768, 'pooling_mode_cls_token': False, 'pooling_mode_mean_tokens': True, 'pooling_mode_max_tokens': False, 'pooling_mode_mean_sqrt_len_tokens': False, 'pooling_mode_weightedmean_tokens': False, 'pooling_mode_lasttoken': False, 'include_prompt': True}) ) ``` ## Usage ### Direct Usage (Sentence Transformers) First install the Sentence Transformers library: ```bash pip install -U sentence-transformers ``` Then you can load this model and run inference. ```python from sentence_transformers import SentenceTransformer # Download from the 🤗 Hub model = SentenceTransformer("Tnt3o5/tnt_v5_lega_new_tokens") # Run inference sentences = [ 'Ai có quyền_hủy bỏ kết_quả bầu_cử và quyết_định bầu_cử lại đại_biểu Quốc_hội ?', 'Hủy_bỏ kết_quả bầu_cử và quyết_định bầu_cử lại Hội_đồng_Bầu_cử_Quốc_gia tự mình hoặc theo đề_nghị của Ủy_ban_Thường_vụ_Quốc_hội , Chính_phủ , Ủy_ban trung_ương Mặt_trận_Tổ_quốc Việt_Nam , Ủy_ban bầu_cử ở tỉnh Hủy_bỏ kết_quả bầu_cử ở khu_vực bỏ_phiếu , đơn_vị bầu_cử có vi_phạm_pháp_luật nghiêm_trọng và quyết_định ngày bầu_cử lại ở khu_vực bỏ_phiếu , đơn_vị bầu_cử đó . Trong trường_hợp bầu_cử lại thì ngày bầu_cử được tiến_hành chậm nhất là 15 ngày sau ngày bầu_cử đầu_tiên . Trong cuộc bầu_cử lại , cử_tri chỉ chọn bầu trong danh_sách những người ứng_cử tại cuộc bầu_cử đầu_tiên .', 'Cơ_cấu tổ_chức Tổng cục_trưởng Tổng_cục Hải_quan quy_định nhiệm_vụ và quyền_hạn của các Phòng , Đội , Hải_Đội thuộc và trực_thuộc Cục Điều_tra chống buôn_lậu .', ] embeddings = model.encode(sentences) print(embeddings.shape) # [3, 768] # Get the similarity scores for the embeddings similarities = model.similarity(embeddings, embeddings) print(similarities.shape) # [3, 3] ``` ## Evaluation ### Metrics #### Information Retrieval * Datasets: `dim_256`, `dim_128` and `dim_64` * Evaluated with [InformationRetrievalEvaluator](https://sbert.net/docs/package_reference/sentence_transformer/evaluation.html#sentence_transformers.evaluation.InformationRetrievalEvaluator) | Metric | dim_256 | dim_128 | dim_64 | |:--------------------|:----------|:-----------|:-----------| | cosine_accuracy@1 | 0.4254 | 0.4264 | 0.4076 | | cosine_accuracy@3 | 0.6052 | 0.6 | 0.5866 | | cosine_accuracy@5 | 0.6636 | 0.662 | 0.6478 | | cosine_accuracy@10 | 0.7248 | 0.7194 | 0.708 | | cosine_precision@1 | 0.4254 | 0.4264 | 0.4076 | | cosine_precision@3 | 0.2071 | 0.2053 | 0.2003 | | cosine_precision@5 | 0.1375 | 0.1371 | 0.134 | | cosine_precision@10 | 0.0759 | 0.0754 | 0.0741 | | cosine_recall@1 | 0.4051 | 0.4061 | 0.3876 | | cosine_recall@3 | 0.5821 | 0.577 | 0.5638 | | cosine_recall@5 | 0.6421 | 0.6405 | 0.6256 | | cosine_recall@10 | 0.7052 | 0.7002 | 0.688 | | **cosine_ndcg@10** | **0.562** | **0.5592** | **0.5444** | | cosine_mrr@10 | 0.5264 | 0.5244 | 0.509 | | cosine_map@100 | 0.5148 | 0.5128 | 0.4975 | ## Training Details ### Training Dataset #### Unnamed Dataset * Size: 101,442 training samples * Columns: anchor and positive * Approximate statistics based on the first 1000 samples: | | anchor | positive | |:--------|:----------------------------------------------------------------------------------|:------------------------------------------------------------------------------------| | type | string | string | | details | | | * Samples: | anchor | positive | |:-----------------------------------------------------------------------------------------------------------|:-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------| | " Người_lớn ( trên 16 tuổi ) " được hiểu là “ Người_lớn và trẻ_em trên 16 tuổi ” | " Khi triển_khai “ Hướng_dẫn quản_lý tại nhà đối_với người mắc COVID - 19 ” , đề_nghị hướng_dẫn , làm rõ một_số nội_dung như sau : . Mục 3 “ Người_lớn ( trên 16 tuổ ” : đề_nghị hướng_dẫn là “ Người_lớn và trẻ_em trên 16 tuổi ” . " | | 03 Quy_chuẩn kỹ_thuật quốc_gia được ban_hành tại Thông_tư 04 là Quy_chuẩn nào ? | Ban_hành kèm theo Thông_tư này 03 Quy_chuẩn kỹ_thuật quốc_gia sau : Quy_chuẩn kỹ_thuật quốc_gia về bộ trục bánh_xe của đầu_máy , toa_xe Số_hiệu : QCVN 110 : 2023/BGTVT. Quy_chuẩn kỹ_thuật quốc_gia về bộ móc_nối , đỡ đấm của đầu_máy , toa_xe Số_hiệu : QCVN 111 : 2023/BGTVT. Quy_chuẩn kỹ_thuật quốc_gia về van hãm sử_dụng trên đầu_máy , toa_xe Số_hiệu : QCVN 112 : 2023/BGTVT. | | 03 Tổng công_ty Cảng hàng_không thực_hiện hợp_nhất có trách_nhiệm như thế_nào theo quy_định ? | Các Tổng công_ty thực_hiện hợp_nhất nêu tại Điều_1 Quyết_định này có trách_nhiệm chuyển_giao nguyên_trạng toàn_bộ tài_sản , tài_chính , lao_động , đất_đai , dự_án đang triển_khai , các quyền , nghĩa_vụ và lợi_ích hợp_pháp khác sang Tổng công_ty Cảng hàng_không Việt_Nam . Trong thời_gian chưa chuyển_giao , Chủ_tịch Hội_đồng thành_viên , Tổng giám_đốc và các cá_nhân có liên_quan của 03 Tổng công_ty thực_hiện hợp_nhất chịu trách_nhiệm quản_lý toàn_bộ tài_sản , tiền vốn của Tổng công_ty , không để hư_hỏng , hao_hụt , thất_thoát . | * Loss: [MatryoshkaLoss](https://sbert.net/docs/package_reference/sentence_transformer/losses.html#matryoshkaloss) with these parameters: ```json { "loss": "MultipleNegativesRankingLoss", "matryoshka_dims": [ 256, 128, 64 ], "matryoshka_weights": [ 1, 1, 1 ], "n_dims_per_step": -1 } ``` ### Evaluation Dataset #### Unnamed Dataset * Size: 4,450 evaluation samples * Columns: anchor and positive * Approximate statistics based on the first 1000 samples: | | anchor | positive | |:--------|:----------------------------------------------------------------------------------|:------------------------------------------------------------------------------------| | type | string | string | | details | | | * Samples: | anchor | positive | |:-----------------------------------------------------------------------------------------------------------|:-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------| | " Người_lớn ( trên 16 tuổi ) " được hiểu là “ Người_lớn và trẻ_em trên 16 tuổi ” | " Khi triển_khai “ Hướng_dẫn quản_lý tại nhà đối_với người mắc COVID - 19 ” , đề_nghị hướng_dẫn , làm rõ một_số nội_dung như sau : . Mục 3 “ Người_lớn ( trên 16 tuổ ” : đề_nghị hướng_dẫn là “ Người_lớn và trẻ_em trên 16 tuổi ” . " | | 03 Quy_chuẩn kỹ_thuật quốc_gia được ban_hành tại Thông_tư 04 là Quy_chuẩn nào ? | Ban_hành kèm theo Thông_tư này 03 Quy_chuẩn kỹ_thuật quốc_gia sau : Quy_chuẩn kỹ_thuật quốc_gia về bộ trục bánh_xe của đầu_máy , toa_xe Số_hiệu : QCVN 110 : 2023/BGTVT. Quy_chuẩn kỹ_thuật quốc_gia về bộ móc_nối , đỡ đấm của đầu_máy , toa_xe Số_hiệu : QCVN 111 : 2023/BGTVT. Quy_chuẩn kỹ_thuật quốc_gia về van hãm sử_dụng trên đầu_máy , toa_xe Số_hiệu : QCVN 112 : 2023/BGTVT. | | 03 Tổng công_ty Cảng hàng_không thực_hiện hợp_nhất có trách_nhiệm như thế_nào theo quy_định ? | Các Tổng công_ty thực_hiện hợp_nhất nêu tại Điều_1 Quyết_định này có trách_nhiệm chuyển_giao nguyên_trạng toàn_bộ tài_sản , tài_chính , lao_động , đất_đai , dự_án đang triển_khai , các quyền , nghĩa_vụ và lợi_ích hợp_pháp khác sang Tổng công_ty Cảng hàng_không Việt_Nam . Trong thời_gian chưa chuyển_giao , Chủ_tịch Hội_đồng thành_viên , Tổng giám_đốc và các cá_nhân có liên_quan của 03 Tổng công_ty thực_hiện hợp_nhất chịu trách_nhiệm quản_lý toàn_bộ tài_sản , tiền vốn của Tổng công_ty , không để hư_hỏng , hao_hụt , thất_thoát . | * Loss: [MatryoshkaLoss](https://sbert.net/docs/package_reference/sentence_transformer/losses.html#matryoshkaloss) with these parameters: ```json { "loss": "MultipleNegativesRankingLoss", "matryoshka_dims": [ 256, 128, 64 ], "matryoshka_weights": [ 1, 1, 1 ], "n_dims_per_step": -1 } ``` ### Training Hyperparameters #### Non-Default Hyperparameters - `eval_strategy`: steps - `per_device_train_batch_size`: 16 - `per_device_eval_batch_size`: 16 - `gradient_accumulation_steps`: 8 - `learning_rate`: 2e-05 - `weight_decay`: 0.01 - `max_grad_norm`: 0.1 - `max_steps`: 1200 - `lr_scheduler_type`: cosine - `warmup_ratio`: 0.15 - `fp16`: True - `load_best_model_at_end`: True - `optim`: adamw_torch_fused - `gradient_checkpointing`: True - `batch_sampler`: no_duplicates #### All Hyperparameters
Click to expand - `overwrite_output_dir`: False - `do_predict`: False - `eval_strategy`: steps - `prediction_loss_only`: True - `per_device_train_batch_size`: 16 - `per_device_eval_batch_size`: 16 - `per_gpu_train_batch_size`: None - `per_gpu_eval_batch_size`: None - `gradient_accumulation_steps`: 8 - `eval_accumulation_steps`: None - `torch_empty_cache_steps`: None - `learning_rate`: 2e-05 - `weight_decay`: 0.01 - `adam_beta1`: 0.9 - `adam_beta2`: 0.999 - `adam_epsilon`: 1e-08 - `max_grad_norm`: 0.1 - `num_train_epochs`: 3.0 - `max_steps`: 1200 - `lr_scheduler_type`: cosine - `lr_scheduler_kwargs`: {} - `warmup_ratio`: 0.15 - `warmup_steps`: 0 - `log_level`: passive - `log_level_replica`: warning - `log_on_each_node`: True - `logging_nan_inf_filter`: True - `save_safetensors`: True - `save_on_each_node`: False - `save_only_model`: False - `restore_callback_states_from_checkpoint`: False - `no_cuda`: False - `use_cpu`: False - `use_mps_device`: False - `seed`: 42 - `data_seed`: None - `jit_mode_eval`: False - `use_ipex`: False - `bf16`: False - `fp16`: True - `fp16_opt_level`: O1 - `half_precision_backend`: auto - `bf16_full_eval`: False - `fp16_full_eval`: False - `tf32`: None - `local_rank`: 0 - `ddp_backend`: None - `tpu_num_cores`: None - `tpu_metrics_debug`: False - `debug`: [] - `dataloader_drop_last`: False - `dataloader_num_workers`: 0 - `dataloader_prefetch_factor`: None - `past_index`: -1 - `disable_tqdm`: False - `remove_unused_columns`: True - `label_names`: None - `load_best_model_at_end`: True - `ignore_data_skip`: False - `fsdp`: [] - `fsdp_min_num_params`: 0 - `fsdp_config`: {'min_num_params': 0, 'xla': False, 'xla_fsdp_v2': False, 'xla_fsdp_grad_ckpt': False} - `fsdp_transformer_layer_cls_to_wrap`: None - `accelerator_config`: {'split_batches': False, 'dispatch_batches': None, 'even_batches': True, 'use_seedable_sampler': True, 'non_blocking': False, 'gradient_accumulation_kwargs': None} - `deepspeed`: None - `label_smoothing_factor`: 0.0 - `optim`: adamw_torch_fused - `optim_args`: None - `adafactor`: False - `group_by_length`: False - `length_column_name`: length - `ddp_find_unused_parameters`: None - `ddp_bucket_cap_mb`: None - `ddp_broadcast_buffers`: False - `dataloader_pin_memory`: True - `dataloader_persistent_workers`: False - `skip_memory_metrics`: True - `use_legacy_prediction_loop`: False - `push_to_hub`: False - `resume_from_checkpoint`: None - `hub_model_id`: None - `hub_strategy`: every_save - `hub_private_repo`: False - `hub_always_push`: False - `gradient_checkpointing`: True - `gradient_checkpointing_kwargs`: None - `include_inputs_for_metrics`: False - `eval_do_concat_batches`: True - `fp16_backend`: auto - `push_to_hub_model_id`: None - `push_to_hub_organization`: None - `mp_parameters`: - `auto_find_batch_size`: False - `full_determinism`: False - `torchdynamo`: None - `ray_scope`: last - `ddp_timeout`: 1800 - `torch_compile`: False - `torch_compile_backend`: None - `torch_compile_mode`: None - `dispatch_batches`: None - `split_batches`: None - `include_tokens_per_second`: False - `include_num_input_tokens_seen`: False - `neftune_noise_alpha`: None - `optim_target_modules`: None - `batch_eval_metrics`: False - `eval_on_start`: False - `use_liger_kernel`: False - `eval_use_gather_object`: False - `prompts`: None - `batch_sampler`: no_duplicates - `multi_dataset_batch_sampler`: proportional
### Training Logs | Epoch | Step | Training Loss | Validation Loss | dim_256_cosine_ndcg@10 | dim_128_cosine_ndcg@10 | dim_64_cosine_ndcg@10 | |:----------:|:--------:|:-------------:|:---------------:|:----------------------:|:----------------------:|:---------------------:| | 0.5047 | 400 | 0.4797 | 0.3000 | 0.5544 | 0.5504 | 0.5393 | | 1.0090 | 800 | 0.4274 | 0.2888 | 0.5583 | 0.5534 | 0.5415 | | **1.5136** | **1200** | **0.3211** | **0.2089** | **0.562** | **0.5592** | **0.5444** | * The bold row denotes the saved checkpoint. ### Framework Versions - Python: 3.10.14 - Sentence Transformers: 3.3.0 - Transformers: 4.45.1 - PyTorch: 2.4.0 - Accelerate: 0.34.2 - Datasets: 3.0.1 - Tokenizers: 0.20.0 ## Citation ### BibTeX #### Sentence Transformers ```bibtex @inproceedings{reimers-2019-sentence-bert, title = "Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks", author = "Reimers, Nils and Gurevych, Iryna", booktitle = "Proceedings of the 2019 Conference on Empirical Methods in Natural Language Processing", month = "11", year = "2019", publisher = "Association for Computational Linguistics", url = "https://arxiv.org/abs/1908.10084", } ``` #### MatryoshkaLoss ```bibtex @misc{kusupati2024matryoshka, title={Matryoshka Representation Learning}, author={Aditya Kusupati and Gantavya Bhatt and Aniket Rege and Matthew Wallingford and Aditya Sinha and Vivek Ramanujan and William Howard-Snyder and Kaifeng Chen and Sham Kakade and Prateek Jain and Ali Farhadi}, year={2024}, eprint={2205.13147}, archivePrefix={arXiv}, primaryClass={cs.LG} } ``` #### MultipleNegativesRankingLoss ```bibtex @misc{henderson2017efficient, title={Efficient Natural Language Response Suggestion for Smart Reply}, author={Matthew Henderson and Rami Al-Rfou and Brian Strope and Yun-hsuan Sung and Laszlo Lukacs and Ruiqi Guo and Sanjiv Kumar and Balint Miklos and Ray Kurzweil}, year={2017}, eprint={1705.00652}, archivePrefix={arXiv}, primaryClass={cs.CL} } ```