Upload model, config, model card

Files changed (4) hide show

.gitattributes CHANGED Viewed

@@ -6,3 +6,4 @@
 *.tar.gz filter=lfs diff=lfs merge=lfs -text
 *.ot filter=lfs diff=lfs merge=lfs -text
 *.onnx filter=lfs diff=lfs merge=lfs -text

 *.tar.gz filter=lfs diff=lfs merge=lfs -text
 *.ot filter=lfs diff=lfs merge=lfs -text
 *.onnx filter=lfs diff=lfs merge=lfs -text
+*.pt filter=lfs diff=lfs merge=lfs -text

1/model.pt ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:df898a82514678d8bfc066b4d78dd19059700e52b89ff79f6e1c75fd83e750ea
+size 260947099

README.md ADDED Viewed

+---
+language:
+- en
+thumbnail:
+tags:
+- question-answering
+- torchscript
+- FastNN
+license: mit
+datasets:
+- squad
+metrics:
+---
+# TorchScript model of distilbert-squad
+## Model description
+A serialized torchscript model of distilbert-squad with a config.pbtxt for deployment using NVIDIA Triton Inference Server.

config.pbtxt ADDED Viewed

+name: "distilbert-squad"
+platform: "pytorch_libtorch"
+max_batch_size: 64
+input [
+  {
+    name: "input__0"
+    data_type: TYPE_INT64
+    dims: [512]
+  },
+  {
+    name: "input__1"
+    data_type: TYPE_INT64
+    dims: [512]
+  },
+  {
+    name: "input__2"
+    data_type: TYPE_INT64
+    dims: [512]
+  },
+  {
+    name: "input__3"
+    data_type: TYPE_INT64
+    dims: [1]
+  },
+  {
+    name: "input__4"
+    data_type: TYPE_INT64
+    dims: [1]
+  },
+  {
+    name: "input__5"
+    data_type: TYPE_FP32
+    dims: [512]
+  }
+]
+output [
+  {
+    name: "output__0"
+    data_type: TYPE_FP32
+    dims: [512]
+  },
+  {
+    name: "output__1"
+    data_type: TYPE_FP32
+    dims: [512]
+  },
+  {
+    name: "output__2"
+    data_type: TYPE_INT64
+    dims: [1]
+  }
+]
+dynamic_batching {
+  preferred_batch_size: [ 1,2,4,8,16,32,64 ]
+  max_queue_delay_microseconds: 30000
+}
+version_policy: { latest { num_versions : 1 }}
+optimization {
+  graph { level: 1 }
+}