MIT
/

ast-finetuned-audioset-10-10-0.4593

Audio Classification

audio-spectrogram-transformer

Inference Endpoints

Model card Files Files and versions Community

nielsr HF staff commited on Nov 21, 2022

Commit

0a45c91

·

1 Parent(s): 7779200

Update README.md

Files changed (1) hide show

README.md +1 -1

README.md CHANGED Viewed

@@ -12,7 +12,7 @@ Disclaimer: The team releasing Audio Spectrogram Transformer did not write a mod
 ## Model description
-The Audio Spectrogram Transformer is equivalent to [ViT](https://huggingface.co/docs/transformers/model_doc/detr), but applied on audio. Audio is first turned into an image (as a spectrogram), after which a Vision Transformer is applied. The model gets state-of-the-art results on several audio classification benchmarks.
 ## Usage

 ## Model description
+The Audio Spectrogram Transformer is equivalent to [ViT](https://huggingface.co/docs/transformers/model_doc/vit), but applied on audio. Audio is first turned into an image (as a spectrogram), after which a Vision Transformer is applied. The model gets state-of-the-art results on several audio classification benchmarks.
 ## Usage