### 20240121 업데이트 1. `config`에 `is_share` 추가, Colab 등의 환경에서 이를 `True`로 설정하여 webui를 공용 네트워크에 매핑되도록 할 수 있습니다. 2. WebUI에 영어 번역이 추가되었습니다. 3. `cmd-asr`은 damo 모델이 이미 포함되어 있는지 자동으로 확인하고, 기본 경로에 없는 경우 modelscope에서 자동 다운로드 되도록 수정하였습니다. 4. [SoVITS 학습 중 ZeroDivisionError가 발생](https://github.com/RVC-Boss/GPT-SoVITS/issues/79)하는 경우 복구를 시도합니다. (길이가 0인 샘플 필터링 등) 5. TEMP 파일 폴더에서 오디오 및 기타 파일을 정리하여 최적화합니다. 6. 합성 오디오가 레퍼런스 오디오의 끝부분을 포함하는 문제를 개선하였습니다. ### 20240122 업데이트 1. 너무 짧은 출력 파일이 중복된 레퍼런스 오디오를 반환하는 문제 수정하였습니다. 2. 영어-일본어 학습이 원활하게 진행되는 QA를 완료하였습니다. (다만, 일본어 학습은 루트 디렉토리에 영어 이외의 문자가 없어야 합니다) 3. 오디오 경로를 검사합니다. 잘못된 경로를 읽으려고 할 때 '경로가 존재하지 않습니다'라는 에러 메시지를 반환하도록 수정하였습니다. 이는 ffmpeg 모듈의 에러가 아닙니다. ### 20240123 업데이트 1. hubert에서 nan 추출로 인한 SoVITS/GPT 학습 중 ZeroDivisionError 관련 에러를 해결하였습니다. 2. 추론 인터페이스에서 모델을 빠르게 전환할 수 있도록 지원하도록 수정되었습니다. 3. 모델 파일 정렬 로직 최적화하였습니다. 4. 중문 분석에 `jieba_fast`를 `jieba`로 대체하였습니다. ### 20240126 업데이트 1. 중국어와 영어, 일본어와 영어가 혼합된 출력 텍스트를 지원합니다. 2. 출력에서 선택적 분할 모드를 지원합니다. 3. uvr5가 디렉토리를 읽고 자동으로 종료되는 문제를 수정하였습니다. 4. 여러 줄바꿈으로 인한 추론 오류를 수정하였습니다. 5. 추론 인터페이스에서 불필요한 로그 제거하였습니다. 6. MacOS에서의 학습 및 추론을 지원합니다. 7. 반정밀을 지원하지 않는 카드를 자동으로 식별하여 단일 정밀도를 강제 적용하고, CPU 추론에서 단일 정밀도를 강제 적용합니다. ### 20240128 업데이트 1. 숫자를 한자로 읽는 문제를 수정했습니다. 2. 문장 시작 부분의 일부 단어가 누락되는 문제 수정하였습니다. 3. 부적절한 길이의 레퍼런스 오디오를 제한하였습니다. 4. GPT 학습 시 ckpt가 저장되지 않는 문제 수정하였습니다. 5. Dockerfile에서 모델 다운로드 프로세스 개선하였습니다. ### 20240129 업데이트 1. 반정밀도 훈련에 문제가 있는 16 시리즈 및 기타 그래픽 카드의 훈련 구성을 단정밀도 훈련으로 변경했습니다. 2. Colab에서도 사용이 가능한 버전을 테스트 및 업데이트 하였습니다. 3. `git clone modelscope funasr` 저장소와 오래된 버전의 funasr 사용으로 인해 인터페이스가 일치하지 않는 오류를 수정하였습니다. ### 20240130 업데이트 1. 경로와 관련된 문자열을 파싱하여 큰따옴표를 자동으로 제거합니다. 또한, 경로를 복사하는 경우 큰따옴표가 포함되어도 오류가 발생하지 않습니다. 2. 중국어 및 영어 문자열의 문장 부호가 잘리는 문제 및 문장의 시작과 끝에 문장 부호가 추가되는 문제를 수정했습니다. 3. 문장 부호의 수를 확장하였습니다. ### 20240201 업데이트 1. uvr5가 잘못된 형식으로 읽어들이는 문제를 수정하였습니다. 2. 중국어, 일본어, 영어가 혼합된 여러 텍스트를 자동으로 분리하여 언어를 인식합니다. ### 20240202 업데이트 1. asr 경로의 끝에 `/`가 포함되어 있는 경우 오류가 발생하는 문제를 수정하였습니다. 2. paddlespeech의 Normalizer를 도입하여 [문제를 해결](https://github.com/RVC-Boss/GPT-SoVITS/pull/377)하여, 예를 들어 xx.xx%(백분율), 元/吨이 元吨으로 읽히는 문제를 해결하였습니다. 또한, 밑줄이 더 이상 오류를 발생시키지 않습니다. ### 20240207 업데이트 1. 언어 전달 매개변수가 혼란스러워져 [중국어 추론 효과가 저하되는 문제](https://github.com/RVC-Boss/GPT-SoVITS/issues/391)를 수정하였습니다. 2. uvr5가 `inf everywhere` [오류를 반환하는 문제](https://github.com/RVC-Boss/GPT-SoVITS/pull/403)를 수정하였습니다. 3. uvr5의 `is_half` 매개변수가 bool로 변환되지 않아 항상 반정밀도 추론으로 설정되어 16 시리즈 그래픽 카드에서 `inf`가 반환되는 [문제](https://github.com/RVC-Boss/GPT-SoVITS/commit/14a285109a521679f8846589c22da8f656a46ad8)를 수정하였습니다. 4. 영어 텍스트 입력을 최적화하였습니다. 5. gradio 종속성을 지원합니다. 6. 루트 디렉토리가 비어 있으면 `.list` 전체 경로를 자동으로 읽습니다. 7. faster whisper ASR 일본어 및 영어를 지원합니다. ### 20240208 업데이트 1. GPT 학습이 카드에 따라 멈추는 문제와 [GPT 학습 중 ZeroDivisionError](https://github.com/RVC-Boss/GPT-SoVITS/commit/59f35adad85815df27e9c6b33d420f5ebfd8376b) 문제를 수정하였습니다. ### 20240212 업데이트 1. faster whisper 및 funasr 로직을 최적화하였습니다. faster whisper는 이미지 스토어에서 다운로드하여 huggingface에 연결하지 못하는 문제를 회피합니다. 2. DPO Loss 실험적 학습 옵션을 활성화하여 부정적 샘플을 생성하여 [GPT 반복 및 누락 문자 문제](https://github.com/RVC-Boss/GPT-SoVITS/pull/457)를 완화합니다. 추론 인터페이스에 몇 가지 추론 매개변수를 공개합니다. ### 20240214 업데이트 1. 학습에서 중국어 실험 이름을 지원합니다. (이전에 오류가 발생했습니다) 2. DPO 학습을 선택적으로 설정할 수 있도록 변경하였습니다. 배치 크기를 선택하면 자동으로 절반으로 줄어듭니다. 추론 인터페이스에서 새로운 매개변수를 전달하지 않는 문제를 수정하였습니다. ### 20240216 업데이트 1. 참조 텍스트 입력을 지원합니다. 2. 프론트엔드에 있던 중국어 텍스트 입력 버그를 수정하였습니다. ### 20240221 업데이트 1. 데이터 처리에 음성 노이즈 감소 옵션을 추가하였습니다. (노이즈 감소는 16k 샘플링률만 남기며, 노이즈가 크지 않다면 사용하지 마십시오.) 2. 중국어 및 일본어 프론트엔드 처리를 최적화하였습니다. https://github.com/RVC-Boss/GPT-SoVITS/pull/559 https://github.com/RVC-Boss/GPT-SoVITS/pull/556 https://github.com/RVC-Boss/GPT-SoVITS/pull/532 https://github.com/RVC-Boss/GPT-SoVITS/pull/507 https://github.com/RVC-Boss/GPT-SoVITS/pull/509 3. Mac에서 CPU 추론이 더 빨라졌으므로 추론 장치를 mps에서 CPU로 변경하였습니다. 4. colab에서 공용 URL을 열지 않는 문제를 수정하였습니다. ### 20240306 업데이트 1. 추론 속도를 50% 빠르게 하였습니다. (RTX3090+pytorch2.2.1+cu11.8+win10+py39 테스트 완료) https://github.com/RVC-Boss/GPT-SoVITS/pull/672 2. faster whisper를 사용할 때 중국어 ASR을 먼저 다운로드할 필요가 없습니다. 3. uvr5의 잔향 제거 모델이 잔향이 있는지 여부를 반대로 반환하는 문제를 수정하였습니다. 4. faster whisper가 CUDA를 사용할 수 없는 경우 자동으로 CPU 추론을 사용하도록 수정하였습니다. 5. is_half의 판단을 수정하여 Mac에서 CPU 추론이 정상적으로 작동하도록 수정하였습니다. todolist: 1. 중국어 다양한 발음 단어 추론 최적화(테스트 결과를 작성하시는 분은 pr 코멘트 영역에 작성해주시면 감사하겠습니다)