Fairseq

#3
by Hanul2 - opened

안녕하세요. 혹시 fairseq로 만든 checkpoint 파일이 있을까요?

TPU에서 학습하기 위해서 fairseq을 사용하지 않고 flax 기반의 코드를 작성해 사용했습니다. 그렇기에 fairseq에서 불러올 수 있는 가중치가 존재하지 않습니다.

만약 필요하시다면 가중치 변환 코드를 반대로 적용해 만들 수 있으리라 생각합니다.

네 한 번 해보겠습니다 감사합니다

lucid org

fairseq 전용 가중치가 추가되었습니다.
사전학습에 사용되는 일부 가중치는 랜덤으로 초기화되었지만, 대다수의 용도에는 문제 없을 것입니다

hyunwoo3235 changed discussion status to closed

Sign up or log in to comment