Raghavan commited on
Commit
bff109e
·
1 Parent(s): af2e7df

Upload 3 files

Browse files
Files changed (3) hide show
  1. config.json +193 -358
  2. model.safetensors +2 -2
  3. preprocessor_config.json +29 -0
config.json CHANGED
@@ -1,19 +1,199 @@
1
  {
2
- "act_func": "relu",
3
  "architectures": [
4
  "TextNetBackbone"
5
  ],
6
- "bias": false,
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
7
  "depths": [
8
  10,
9
  10,
10
  8,
11
  5
12
  ],
13
- "dilation": 1,
14
- "dropout_rate": 0,
15
- "groups": 1,
16
- "has_shuffle": false,
17
  "hidden_sizes": [
18
  64,
19
  64,
@@ -21,12 +201,9 @@
21
  256,
22
  512
23
  ],
24
- "in_channels": 3,
25
  "initializer_range": 0.02,
26
- "kernel_size": 3,
27
  "model_type": "textnet",
28
- "ops_order": "weight_bn_act",
29
- "out_channels": 64,
30
  "out_features": [
31
  "stage1",
32
  "stage2",
@@ -39,351 +216,6 @@
39
  3,
40
  4
41
  ],
42
- "stage1_dilation": [
43
- 1,
44
- 1,
45
- 1,
46
- 1,
47
- 1,
48
- 1,
49
- 1,
50
- 1,
51
- 1,
52
- 1
53
- ],
54
- "stage1_groups": [
55
- 1,
56
- 1,
57
- 1,
58
- 1,
59
- 1,
60
- 1,
61
- 1,
62
- 1,
63
- 1,
64
- 1
65
- ],
66
- "stage1_in_channels": [
67
- 64,
68
- 64,
69
- 64,
70
- 64,
71
- 64,
72
- 64,
73
- 64,
74
- 64,
75
- 64,
76
- 64
77
- ],
78
- "stage1_kernel_size": [
79
- [
80
- 3,
81
- 3
82
- ],
83
- [
84
- 3,
85
- 3
86
- ],
87
- [
88
- 3,
89
- 1
90
- ],
91
- [
92
- 3,
93
- 3
94
- ],
95
- [
96
- 3,
97
- 1
98
- ],
99
- [
100
- 3,
101
- 3
102
- ],
103
- [
104
- 3,
105
- 3
106
- ],
107
- [
108
- 1,
109
- 3
110
- ],
111
- [
112
- 3,
113
- 3
114
- ],
115
- [
116
- 3,
117
- 3
118
- ]
119
- ],
120
- "stage1_out_channels": [
121
- 64,
122
- 64,
123
- 64,
124
- 64,
125
- 64,
126
- 64,
127
- 64,
128
- 64,
129
- 64,
130
- 64
131
- ],
132
- "stage1_stride": [
133
- 1,
134
- 2,
135
- 1,
136
- 1,
137
- 1,
138
- 1,
139
- 1,
140
- 1,
141
- 1,
142
- 1
143
- ],
144
- "stage2_dilation": [
145
- 1,
146
- 1,
147
- 1,
148
- 1,
149
- 1,
150
- 1,
151
- 1,
152
- 1,
153
- 1,
154
- 1
155
- ],
156
- "stage2_groups": [
157
- 1,
158
- 1,
159
- 1,
160
- 1,
161
- 1,
162
- 1,
163
- 1,
164
- 1,
165
- 1,
166
- 1
167
- ],
168
- "stage2_in_channels": [
169
- 64,
170
- 128,
171
- 128,
172
- 128,
173
- 128,
174
- 128,
175
- 128,
176
- 128,
177
- 128,
178
- 128
179
- ],
180
- "stage2_kernel_size": [
181
- [
182
- 3,
183
- 3
184
- ],
185
- [
186
- 1,
187
- 3
188
- ],
189
- [
190
- 3,
191
- 3
192
- ],
193
- [
194
- 3,
195
- 1
196
- ],
197
- [
198
- 3,
199
- 3
200
- ],
201
- [
202
- 3,
203
- 3
204
- ],
205
- [
206
- 3,
207
- 1
208
- ],
209
- [
210
- 3,
211
- 1
212
- ],
213
- [
214
- 3,
215
- 3
216
- ],
217
- [
218
- 3,
219
- 3
220
- ]
221
- ],
222
- "stage2_out_channels": [
223
- 128,
224
- 128,
225
- 128,
226
- 128,
227
- 128,
228
- 128,
229
- 128,
230
- 128,
231
- 128,
232
- 128
233
- ],
234
- "stage2_stride": [
235
- 2,
236
- 1,
237
- 1,
238
- 1,
239
- 1,
240
- 1,
241
- 1,
242
- 1,
243
- 1,
244
- 1
245
- ],
246
- "stage3_dilation": [
247
- 1,
248
- 1,
249
- 1,
250
- 1,
251
- 1,
252
- 1,
253
- 1,
254
- 1
255
- ],
256
- "stage3_groups": [
257
- 1,
258
- 1,
259
- 1,
260
- 1,
261
- 1,
262
- 1,
263
- 1,
264
- 1
265
- ],
266
- "stage3_in_channels": [
267
- 128,
268
- 256,
269
- 256,
270
- 256,
271
- 256,
272
- 256,
273
- 256,
274
- 256
275
- ],
276
- "stage3_kernel_size": [
277
- [
278
- 3,
279
- 3
280
- ],
281
- [
282
- 3,
283
- 3
284
- ],
285
- [
286
- 3,
287
- 3
288
- ],
289
- [
290
- 1,
291
- 3
292
- ],
293
- [
294
- 3,
295
- 3
296
- ],
297
- [
298
- 3,
299
- 1
300
- ],
301
- [
302
- 3,
303
- 3
304
- ],
305
- [
306
- 3,
307
- 1
308
- ]
309
- ],
310
- "stage3_out_channels": [
311
- 256,
312
- 256,
313
- 256,
314
- 256,
315
- 256,
316
- 256,
317
- 256,
318
- 256
319
- ],
320
- "stage3_stride": [
321
- 2,
322
- 1,
323
- 1,
324
- 1,
325
- 1,
326
- 1,
327
- 1,
328
- 1
329
- ],
330
- "stage4_dilation": [
331
- 1,
332
- 1,
333
- 1,
334
- 1,
335
- 1
336
- ],
337
- "stage4_groups": [
338
- 1,
339
- 1,
340
- 1,
341
- 1,
342
- 1
343
- ],
344
- "stage4_in_channels": [
345
- 256,
346
- 512,
347
- 512,
348
- 512,
349
- 512
350
- ],
351
- "stage4_kernel_size": [
352
- [
353
- 3,
354
- 3
355
- ],
356
- [
357
- 1,
358
- 3
359
- ],
360
- [
361
- 3,
362
- 1
363
- ],
364
- [
365
- 3,
366
- 1
367
- ],
368
- [
369
- 1,
370
- 3
371
- ]
372
- ],
373
- "stage4_out_channels": [
374
- 512,
375
- 512,
376
- 512,
377
- 512,
378
- 512
379
- ],
380
- "stage4_stride": [
381
- 2,
382
- 1,
383
- 1,
384
- 1,
385
- 1
386
- ],
387
  "stage_names": [
388
  "stem",
389
  "stage1",
@@ -391,8 +223,11 @@
391
  "stage3",
392
  "stage4"
393
  ],
394
- "stride": 2,
 
 
 
 
395
  "torch_dtype": "float32",
396
- "transformers_version": "4.36.0.dev0",
397
- "use_bn": true
398
  }
 
1
  {
 
2
  "architectures": [
3
  "TextNetBackbone"
4
  ],
5
+ "batch_norm_eps": 1e-05,
6
+ "conv_layer_kernel_sizes": [
7
+ [
8
+ [
9
+ 3,
10
+ 3
11
+ ],
12
+ [
13
+ 3,
14
+ 3
15
+ ],
16
+ [
17
+ 3,
18
+ 1
19
+ ],
20
+ [
21
+ 3,
22
+ 3
23
+ ],
24
+ [
25
+ 3,
26
+ 1
27
+ ],
28
+ [
29
+ 3,
30
+ 3
31
+ ],
32
+ [
33
+ 3,
34
+ 3
35
+ ],
36
+ [
37
+ 1,
38
+ 3
39
+ ],
40
+ [
41
+ 3,
42
+ 3
43
+ ],
44
+ [
45
+ 3,
46
+ 3
47
+ ]
48
+ ],
49
+ [
50
+ [
51
+ 3,
52
+ 3
53
+ ],
54
+ [
55
+ 1,
56
+ 3
57
+ ],
58
+ [
59
+ 3,
60
+ 3
61
+ ],
62
+ [
63
+ 3,
64
+ 1
65
+ ],
66
+ [
67
+ 3,
68
+ 3
69
+ ],
70
+ [
71
+ 3,
72
+ 3
73
+ ],
74
+ [
75
+ 3,
76
+ 1
77
+ ],
78
+ [
79
+ 3,
80
+ 1
81
+ ],
82
+ [
83
+ 3,
84
+ 3
85
+ ],
86
+ [
87
+ 3,
88
+ 3
89
+ ]
90
+ ],
91
+ [
92
+ [
93
+ 3,
94
+ 3
95
+ ],
96
+ [
97
+ 3,
98
+ 3
99
+ ],
100
+ [
101
+ 3,
102
+ 3
103
+ ],
104
+ [
105
+ 1,
106
+ 3
107
+ ],
108
+ [
109
+ 3,
110
+ 3
111
+ ],
112
+ [
113
+ 3,
114
+ 1
115
+ ],
116
+ [
117
+ 3,
118
+ 3
119
+ ],
120
+ [
121
+ 3,
122
+ 1
123
+ ]
124
+ ],
125
+ [
126
+ [
127
+ 3,
128
+ 3
129
+ ],
130
+ [
131
+ 1,
132
+ 3
133
+ ],
134
+ [
135
+ 3,
136
+ 1
137
+ ],
138
+ [
139
+ 3,
140
+ 1
141
+ ],
142
+ [
143
+ 1,
144
+ 3
145
+ ]
146
+ ]
147
+ ],
148
+ "conv_layer_strides": [
149
+ [
150
+ 1,
151
+ 2,
152
+ 1,
153
+ 1,
154
+ 1,
155
+ 1,
156
+ 1,
157
+ 1,
158
+ 1,
159
+ 1
160
+ ],
161
+ [
162
+ 2,
163
+ 1,
164
+ 1,
165
+ 1,
166
+ 1,
167
+ 1,
168
+ 1,
169
+ 1,
170
+ 1,
171
+ 1
172
+ ],
173
+ [
174
+ 2,
175
+ 1,
176
+ 1,
177
+ 1,
178
+ 1,
179
+ 1,
180
+ 1,
181
+ 1
182
+ ],
183
+ [
184
+ 2,
185
+ 1,
186
+ 1,
187
+ 1,
188
+ 1
189
+ ]
190
+ ],
191
  "depths": [
192
  10,
193
  10,
194
  8,
195
  5
196
  ],
 
 
 
 
197
  "hidden_sizes": [
198
  64,
199
  64,
 
201
  256,
202
  512
203
  ],
204
+ "image_size": 224,
205
  "initializer_range": 0.02,
 
206
  "model_type": "textnet",
 
 
207
  "out_features": [
208
  "stage1",
209
  "stage2",
 
216
  3,
217
  4
218
  ],
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
219
  "stage_names": [
220
  "stem",
221
  "stage1",
 
223
  "stage3",
224
  "stage4"
225
  ],
226
+ "stem_act_func": "relu",
227
+ "stem_kernel_size": 3,
228
+ "stem_num_channels": 3,
229
+ "stem_out_channels": 64,
230
+ "stem_stride": 2,
231
  "torch_dtype": "float32",
232
+ "transformers_version": "4.36.0.dev0"
 
233
  }
model.safetensors CHANGED
@@ -1,3 +1,3 @@
1
  version https://git-lfs.github.com/spec/v1
2
- oid sha256:aff1d08ccfa0dc520eef4f9d0b9fdc9bdfb9ca11698a4ce4eddd015ba6af09b7
3
- size 54281104
 
1
  version https://git-lfs.github.com/spec/v1
2
+ oid sha256:2c014ba1a5d3db8b20e3416dfa6288d8e4aa97cfbaeb67e0f331ceef48194dc9
3
+ size 54291592
preprocessor_config.json ADDED
@@ -0,0 +1,29 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {
2
+ "crop_size": {
3
+ "height": 224,
4
+ "width": 224
5
+ },
6
+ "do_center_crop": true,
7
+ "do_convert_rgb": true,
8
+ "do_normalize": true,
9
+ "do_rescale": true,
10
+ "do_resize": true,
11
+ "image_mean": [
12
+ 0.48145466,
13
+ 0.4578275,
14
+ 0.40821073
15
+ ],
16
+ "image_processor_type": "CLIPImageProcessor",
17
+ "image_std": [
18
+ 0.26862954,
19
+ 0.26130258,
20
+ 0.27577711
21
+ ],
22
+ "resample": 3,
23
+ "rescale_factor": 0.00392156862745098,
24
+ "size": {
25
+ "height": 800,
26
+ "width": 800
27
+ },
28
+ "use_square_size": false
29
+ }