Upload AutoEncoder

Browse files

Files changed (3) hide show

config.json +5 -5
model.safetensors +2 -2
modeling_autoencoder.py +94 -41

config.json CHANGED Viewed

@@ -6,14 +6,14 @@
     "AutoConfig": "modeling_autoencoder.AutoEncoderConfig",
     "AutoModel": "modeling_autoencoder.AutoEncoder"
   },
-  "bidirectional": true,
   "compression_rate": 0.5,
-  "dropout_rate": 0.5,
-  "input_dim": 784,
   "latent_dim": 32,
-  "layer_types": "lstm",
   "model_type": "autoencoder",
-  "num_layers": 4,
   "torch_dtype": "float32",
   "transformers_version": "4.35.2"
 }

     "AutoConfig": "modeling_autoencoder.AutoEncoderConfig",
     "AutoModel": "modeling_autoencoder.AutoEncoder"
   },
+  "bidirectional": false,
   "compression_rate": 0.5,
+  "dropout_rate": 0.1,
+  "input_dim": 128,
   "latent_dim": 32,
+  "layer_types": "linear",
   "model_type": "autoencoder",
+  "num_layers": 2,
   "torch_dtype": "float32",
   "transformers_version": "4.35.2"
 }

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:61c6f8af940de39412307f20af9dedc7df9e669e2a516638ee565e44d8cb5118
-size 47379808

 version https://git-lfs.github.com/spec/v1
+oid sha256:81f3c0326c30137a113ac0434b67dd54eb8505c7d4f801a1597629712ae7dd71
+size 83728

modeling_autoencoder.py CHANGED Viewed

@@ -1,6 +1,6 @@
-from torch import nn
 from transformers import PretrainedConfig, PreTrainedModel, AutoConfig, AutoModel
 # from huggingface_hub import notebook_login
@@ -14,18 +14,32 @@ from transformers import PretrainedConfig, PreTrainedModel, AutoConfig, AutoMode
 # AutoModel.register(AutoEncoderConfig, AutoModel)
 # autoencoder.push_to_hub("autoencoder")
 class AutoEncoderConfig(PretrainedConfig):
     model_type = "autoencoder"
     def __init__(
         self,
-        input_dim=None,
-        latent_dim=None,
-        layer_types=None,
-        dropout_rate=None,
-        num_layers=None,
-        compression_rate=None,
-        bidirectional=False,
         **kwargs
     ):
         super().__init__(**kwargs)
@@ -37,31 +51,55 @@ class AutoEncoderConfig(PretrainedConfig):
         self.compression_rate = compression_rate
         self.bidirectional = bidirectional
-def create_layers(model_section, layer_types, input_dim, latent_dim, num_layers, dropout_rate, compression_rate, bidirectional):
     layers = []
     current_dim = input_dim
-    input_diamensions = []
-    output_diamensions = []
     for _ in range(num_layers):
-        input_diamensions.append(current_dim)
         next_dim = max(int(current_dim * compression_rate), latent_dim)
         current_dim = next_dim
-        output_diamensions.append(current_dim)
-    output_diamensions[num_layers - 1] = latent_dim
     if model_section == "decoder":
-        input_diamensions, output_diamensions = output_diamensions, input_diamensions
-        input_diamensions.reverse()
-        output_diamensions.reverse()
-        if bidirectional & (layer_types in ['lstm', 'rnn', 'gru']):
-            output_diamensions = [2*value for value in output_diamensions]
-    for idx, (input_dim, output_dim) in enumerate(zip(input_diamensions, output_diamensions)):
         if layer_types == 'linear':
             layers.append(nn.Linear(input_dim, output_dim))
         elif layer_types == 'lstm':
@@ -70,53 +108,68 @@ def create_layers(model_section, layer_types, input_dim, latent_dim, num_layers,
             layers.append(nn.RNN(input_dim, output_dim // (2 if bidirectional else 1), batch_first=True, bidirectional=bidirectional))
         elif layer_types == 'gru':
             layers.append(nn.GRU(input_dim, output_dim // (2 if bidirectional else 1), batch_first=True, bidirectional=bidirectional))
-        if (idx != num_layers - 1) & (dropout_rate != None):
             layers.append(nn.Dropout(dropout_rate))
     return nn.Sequential(*layers)
 class AutoEncoder(PreTrainedModel):
     config_class = AutoEncoderConfig
-    def __init__(self, config):
         super(AutoEncoder, self).__init__(config)
-        self.encoder = create_layers("encoder",
             config.layer_types, config.input_dim, config.latent_dim,
             config.num_layers, config.dropout_rate, config.compression_rate,
-            config.bidirectional,
         )
         # Assuming symmetry between encoder and decoder
-        self.decoder = create_layers("decoder",
             config.layer_types, config.input_dim, config.latent_dim,
             config.num_layers, config.dropout_rate, config.compression_rate,
-            config.bidirectional,
         )
-    def forward(self, x):
         if self.config.layer_types in ['lstm', 'rnn', 'gru']:
             for layer in self.encoder:
-                print(layer)
                 if isinstance(layer, nn.LSTM):
-                    x, (h_n, c_n)= layer(x)
-                elif isinstance(layer, nn.RNN):
-                    x, h_o = layer(x)
-                elif isinstance(layer, nn.GRU):
                     x, h_o = layer(x)
                 else:
                     x = layer(x)
             for layer in self.decoder:
                 if isinstance(layer, nn.LSTM):
                     x, (h_n, c_n) = layer(x)
-                elif isinstance(layer, nn.RNN):
-                    x, h_o = layer(x)
-                elif isinstance(layer, nn.GRU):
                     x, h_o = layer(x)
                 else:
                     x = layer(x)
         else:
             x = self.encoder(x)
             x = self.decoder(x)
-        return x

+from typing import Optional, Sequence
+from torch import nn, Tensor
 from transformers import PretrainedConfig, PreTrainedModel, AutoConfig, AutoModel
 # from huggingface_hub import notebook_login
 # AutoModel.register(AutoEncoderConfig, AutoModel)
 # autoencoder.push_to_hub("autoencoder")
 class AutoEncoderConfig(PretrainedConfig):
+    """
+    Configuration class for AutoEncoder. This class stores the parameters for the autoencoder model.
+    Attributes:
+        input_dim (int): The dimensionality of the input data (default: 128).
+        latent_dim (int): The dimensionality of the latent representation (default: 64).
+        layer_types (str): The type of layers used, e.g., 'linear', 'lstm', 'gru', 'rnn' (default: 'linear').
+        dropout_rate (float): The dropout rate applied after each layer (except for the last layer) (default: 0.1).
+        num_layers (int): The number of layers in the encoder/decoder (default: 3).
+        compression_rate (float): Factor by which to compress the dimensions through layers (default: 0.5).
+        bidirectional (bool): Whether the sequence layers should be bidirectional (default: False).
+    """
     model_type = "autoencoder"
     def __init__(
         self,
+        input_dim: int = 128,
+        latent_dim: int = 64,
+        layer_types: str = 'linear',
+        dropout_rate: float = 0.1,
+        num_layers: int = 3,
+        compression_rate: float = 0.5,
+        bidirectional: bool = False,
         **kwargs
     ):
         super().__init__(**kwargs)
         self.compression_rate = compression_rate
         self.bidirectional = bidirectional
+def create_layers(
+    model_section: str,
+    layer_types: str,
+    input_dim: int,
+    latent_dim: int,
+    num_layers: int,
+    dropout_rate: float,
+    compression_rate: float,
+    bidirectional: bool
+) -> nn.Sequential:
+    """
+    Creates a sequence of layers for the encoder or decoder part of the autoencoder.
+    Args:
+        model_section (str): A string indicating whether this is for 'encoder' or 'decoder'.
+        layer_types (str): The type of layers to include in the sequence.
+        input_dim (int): The input dimension for the first layer.
+        latent_dim (int): The target dimension for the latent representation.
+        num_layers (int): The number of layers to create.
+        dropout_rate (float): The dropout rate to apply between layers.
+        compression_rate (float): The compression rate for reducing dimensions through layers.
+        bidirectional (bool): Whether the RNN layers should be bidirectional.
+    Returns:
+        A nn.Sequential module containing the created layers.
+    """
     layers = []
     current_dim = input_dim
+    input_dimensions = []
+    output_dimensions = []
     for _ in range(num_layers):
+        input_dimensions.append(current_dim)
         next_dim = max(int(current_dim * compression_rate), latent_dim)
         current_dim = next_dim
+        output_dimensions.append(current_dim)
+    output_dimensions[num_layers - 1] = latent_dim
     if model_section == "decoder":
+        input_dimensions, output_dimensions = output_dimensions, input_dimensions
+        input_dimensions.reverse()
+        output_dimensions.reverse()
+        if bidirectional and (layer_types in ['lstm', 'rnn', 'gru']):
+            output_dimensions = [2 * value for value in output_dimensions]
+    for idx, (input_dim, output_dim) in enumerate(zip(input_dimensions, output_dimensions)):
         if layer_types == 'linear':
             layers.append(nn.Linear(input_dim, output_dim))
         elif layer_types == 'lstm':
             layers.append(nn.RNN(input_dim, output_dim // (2 if bidirectional else 1), batch_first=True, bidirectional=bidirectional))
         elif layer_types == 'gru':
             layers.append(nn.GRU(input_dim, output_dim // (2 if bidirectional else 1), batch_first=True, bidirectional=bidirectional))
+        if (idx != num_layers - 1) and (dropout_rate is not None):
             layers.append(nn.Dropout(dropout_rate))
     return nn.Sequential(*layers)
 class AutoEncoder(PreTrainedModel):
+    """
+    AutoEncoder model for creating an encoder-decoder architecture.
+    Inherits from PreTrainedModel to utilize its pretrained model features from the Hugging Face library.
+    Args:
+        config (AutoEncoderConfig): The configuration instance with all model parameters.
+    """
     config_class = AutoEncoderConfig
+    def __init__(self, config: AutoEncoderConfig):
         super(AutoEncoder, self).__init__(config)
+        self.encoder = create_layers(
+            "encoder",
             config.layer_types, config.input_dim, config.latent_dim,
             config.num_layers, config.dropout_rate, config.compression_rate,
+            config.bidirectional
         )
         # Assuming symmetry between encoder and decoder
+        self.decoder = create_layers(
+            "decoder",
             config.layer_types, config.input_dim, config.latent_dim,
             config.num_layers, config.dropout_rate, config.compression_rate,
+            config.bidirectional
         )
+    def forward(self, x: Tensor) -> Tensor:
+        """
+        Forward pass through the autoencoder.
+        Args:
+            x (Tensor): The input tensor to encode and decode.
+        Returns:
+            A Tensor that is the output of the decoder.
+        """
+        # Assuming self.config.layer_types contains only a single layer type as a string.
+        # If using sequence models, handle each layer's outputs
         if self.config.layer_types in ['lstm', 'rnn', 'gru']:
             for layer in self.encoder:
                 if isinstance(layer, nn.LSTM):
+                    x, (h_n, c_n) = layer(x)
+                elif isinstance(layer, nn.RNN) or isinstance(layer, nn.GRU):
                     x, h_o = layer(x)
                 else:
                     x = layer(x)
             for layer in self.decoder:
                 if isinstance(layer, nn.LSTM):
                     x, (h_n, c_n) = layer(x)
+                elif isinstance(layer, nn.RNN) or isinstance(layer, nn.GRU):
                     x, h_o = layer(x)
                 else:
                     x = layer(x)
         else:
             x = self.encoder(x)
             x = self.decoder(x)
+        return x