{ "cells": [ { "cell_type": "code", "execution_count": 1, "id": "fd576577", "metadata": {}, "outputs": [], "source": [ "import pandas as pd" ] }, { "cell_type": "markdown", "id": "6d2e6e40", "metadata": {}, "source": [ "### Distributions of generated data" ] }, { "cell_type": "code", "execution_count": 2, "id": "e969313f", "metadata": {}, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "(5, 93)\n" ] }, { "data": { "text/html": [ "
\n", " | log | \n", "n_traces | \n", "n_unique_traces | \n", "ratio_unique_traces_per_trace | \n", "trace_len_min | \n", "trace_len_max | \n", "trace_len_mean | \n", "trace_len_median | \n", "trace_len_mode | \n", "trace_len_std | \n", "... | \n", "entropy_lempel_ziv | \n", "entropy_k_block_diff_1 | \n", "entropy_k_block_diff_3 | \n", "entropy_k_block_diff_5 | \n", "entropy_k_block_ratio_1 | \n", "entropy_k_block_ratio_3 | \n", "entropy_k_block_ratio_5 | \n", "entropy_knn_3 | \n", "entropy_knn_5 | \n", "entropy_knn_7 | \n", "
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0 | \n", "100_64_0_0_0.5_0.5_0_0 | \n", "100 | \n", "100 | \n", "1.000000 | \n", "12 | \n", "479 | \n", "88.510000 | \n", "55.0 | \n", "42 | \n", "98.720463 | \n", "... | \n", "3.912 | \n", "-0.005 | \n", "3.134 | \n", "0.280 | \n", "4.255 | \n", "5.376 | \n", "5.376 | \n", "4.020 | \n", "3.471 | \n", "3.128 | \n", "
1 | \n", "100_64_0_0_0.5_0.5_0_1 | \n", "100 | \n", "100 | \n", "1.000000 | \n", "8 | \n", "193 | \n", "42.880000 | \n", "31.0 | \n", "9 | \n", "38.637619 | \n", "... | \n", "3.475 | \n", "-0.011 | \n", "2.669 | \n", "1.800 | \n", "3.626 | \n", "4.584 | \n", "4.584 | \n", "3.877 | \n", "3.352 | \n", "3.018 | \n", "
2 | \n", "100_64_0_0_0.5_0_0.5_0 | \n", "100 | \n", "100 | \n", "1.000000 | \n", "4 | \n", "30 | \n", "15.990000 | \n", "16.5 | \n", "18 | \n", "7.132314 | \n", "... | \n", "4.653 | \n", "5.634 | \n", "5.634 | \n", "5.634 | \n", "5.634 | \n", "5.634 | \n", "5.634 | \n", "4.075 | \n", "3.532 | \n", "3.189 | \n", "
3 | \n", "100_64_0_0_0.5_0_0.5_1 | \n", "55 | \n", "41 | \n", "0.745455 | \n", "1 | \n", "20 | \n", "5.927273 | \n", "5.0 | \n", "1 | \n", "4.789589 | \n", "... | \n", "4.046 | \n", "5.274 | \n", "5.274 | \n", "5.274 | \n", "5.274 | \n", "5.274 | \n", "5.274 | \n", "3.193 | \n", "2.678 | \n", "2.361 | \n", "
4 | \n", "100_64_0_0_0_0.5_0.5_0 | \n", "52 | \n", "37 | \n", "0.711538 | \n", "1 | \n", "21 | \n", "5.076923 | \n", "3.0 | \n", "3 | \n", "4.726546 | \n", "... | \n", "2.803 | \n", "-0.133 | \n", "4.016 | \n", "1.273 | \n", "4.016 | \n", "4.016 | \n", "4.016 | \n", "2.908 | \n", "2.443 | \n", "2.168 | \n", "
5 rows × 93 columns
\n", "\n", " | log | \n", "n_traces | \n", "n_unique_traces | \n", "ratio_unique_traces_per_trace | \n", "trace_len_min | \n", "trace_len_max | \n", "trace_len_mean | \n", "trace_len_median | \n", "trace_len_mode | \n", "trace_len_std | \n", "... | \n", "entropy_k_block_diff_1 | \n", "entropy_k_block_diff_3 | \n", "entropy_k_block_diff_5 | \n", "entropy_k_block_ratio_1 | \n", "entropy_k_block_ratio_3 | \n", "entropy_k_block_ratio_5 | \n", "entropy_knn_3 | \n", "entropy_knn_5 | \n", "entropy_knn_7 | \n", "Log Nature | \n", "
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0 | \n", "BPIC15_2 | \n", "832 | \n", "828 | \n", "0.995192 | \n", "1 | \n", "132 | \n", "53.310096 | \n", "54.0 | \n", "61 | \n", "19.894977 | \n", "... | \n", "7.105 | \n", "7.105 | \n", "7.105 | \n", "7.105 | \n", "7.105 | \n", "7.105 | \n", "5.545 | \n", "5.039 | \n", "4.721 | \n", "Real | \n", "
1 | \n", "BPI_Challenge_2018 | \n", "43809 | \n", "28457 | \n", "0.649570 | \n", "24 | \n", "2973 | \n", "57.391541 | \n", "49.0 | \n", "49 | \n", "34.872131 | \n", "... | \n", "-0.010 | \n", "1.855 | \n", "0.511 | \n", "1.403 | \n", "3.572 | \n", "2.001 | \n", "7.849 | \n", "7.371 | \n", "7.067 | \n", "Real | \n", "
2 | \n", "Receipt_WABO_CoSeLoG | \n", "1434 | \n", "116 | \n", "0.080893 | \n", "1 | \n", "25 | \n", "5.981172 | \n", "6.0 | \n", "6 | \n", "2.166129 | \n", "... | \n", "2.672 | \n", "2.966 | \n", "0.804 | \n", "1.484 | \n", "2.966 | \n", "2.966 | \n", "3.260 | \n", "2.845 | \n", "2.584 | \n", "Real | \n", "
3 | \n", "BPIC15_3 | \n", "1409 | \n", "1349 | \n", "0.957417 | \n", "3 | \n", "124 | \n", "42.356991 | \n", "42.0 | \n", "44 | \n", "16.138406 | \n", "... | \n", "-0.007 | \n", "6.780 | \n", "6.780 | \n", "6.780 | \n", "6.780 | \n", "6.780 | \n", "5.701 | \n", "5.212 | \n", "4.900 | \n", "Real | \n", "
4 | \n", "BPI_Challenge_2019 | \n", "251734 | \n", "11973 | \n", "0.047562 | \n", "1 | \n", "990 | \n", "6.339720 | \n", "5.0 | \n", "5 | \n", "13.057417 | \n", "... | \n", "-0.041 | \n", "1.530 | \n", "0.840 | \n", "0.620 | \n", "3.244 | \n", "1.913 | \n", "7.333 | \n", "6.882 | \n", "6.601 | \n", "Real | \n", "
5 rows × 94 columns
\n", "\n", " | log | \n", "n_traces | \n", "n_unique_traces | \n", "ratio_unique_traces_per_trace | \n", "trace_len_min | \n", "trace_len_max | \n", "trace_len_mean | \n", "trace_len_median | \n", "trace_len_mode | \n", "trace_len_std | \n", "... | \n", "entropy_k_block_diff_1 | \n", "entropy_k_block_diff_3 | \n", "entropy_k_block_diff_5 | \n", "entropy_k_block_ratio_1 | \n", "entropy_k_block_ratio_3 | \n", "entropy_k_block_ratio_5 | \n", "entropy_knn_3 | \n", "entropy_knn_5 | \n", "entropy_knn_7 | \n", "Log Nature | \n", "
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0 | \n", "BPIC15_2 | \n", "832 | \n", "828 | \n", "0.995192 | \n", "1 | \n", "132 | \n", "53.310096 | \n", "54.0 | \n", "61 | \n", "19.894977 | \n", "... | \n", "7.105 | \n", "7.105 | \n", "7.105 | \n", "7.105 | \n", "7.105 | \n", "7.105 | \n", "5.545 | \n", "5.039 | \n", "4.721 | \n", "Real | \n", "
1 | \n", "BPI_Challenge_2018 | \n", "43809 | \n", "28457 | \n", "0.649570 | \n", "24 | \n", "2973 | \n", "57.391541 | \n", "49.0 | \n", "49 | \n", "34.872131 | \n", "... | \n", "-0.010 | \n", "1.855 | \n", "0.511 | \n", "1.403 | \n", "3.572 | \n", "2.001 | \n", "7.849 | \n", "7.371 | \n", "7.067 | \n", "Real | \n", "
2 | \n", "Receipt_WABO_CoSeLoG | \n", "1434 | \n", "116 | \n", "0.080893 | \n", "1 | \n", "25 | \n", "5.981172 | \n", "6.0 | \n", "6 | \n", "2.166129 | \n", "... | \n", "2.672 | \n", "2.966 | \n", "0.804 | \n", "1.484 | \n", "2.966 | \n", "2.966 | \n", "3.260 | \n", "2.845 | \n", "2.584 | \n", "Real | \n", "
3 | \n", "BPIC15_3 | \n", "1409 | \n", "1349 | \n", "0.957417 | \n", "3 | \n", "124 | \n", "42.356991 | \n", "42.0 | \n", "44 | \n", "16.138406 | \n", "... | \n", "-0.007 | \n", "6.780 | \n", "6.780 | \n", "6.780 | \n", "6.780 | \n", "6.780 | \n", "5.701 | \n", "5.212 | \n", "4.900 | \n", "Real | \n", "
4 | \n", "BPI_Challenge_2019 | \n", "251734 | \n", "11973 | \n", "0.047562 | \n", "1 | \n", "990 | \n", "6.339720 | \n", "5.0 | \n", "5 | \n", "13.057417 | \n", "... | \n", "-0.041 | \n", "1.530 | \n", "0.840 | \n", "0.620 | \n", "3.244 | \n", "1.913 | \n", "7.333 | \n", "6.882 | \n", "6.601 | \n", "Real | \n", "
5 | \n", "RequestForPayment | \n", "6886 | \n", "89 | \n", "0.012925 | \n", "1 | \n", "20 | \n", "5.343596 | \n", "5.0 | \n", "5 | \n", "1.467384 | \n", "... | \n", "-0.328 | \n", "0.323 | \n", "0.323 | \n", "0.587 | \n", "2.883 | \n", "2.883 | \n", "2.921 | \n", "2.574 | \n", "2.312 | \n", "Real | \n", "
6 | \n", "PrepaidTravelCost | \n", "2099 | \n", "202 | \n", "0.096236 | \n", "1 | \n", "21 | \n", "8.692711 | \n", "8.0 | \n", "8 | \n", "2.253873 | \n", "... | \n", "-0.092 | \n", "3.734 | \n", "0.815 | \n", "3.734 | \n", "3.734 | \n", "3.734 | \n", "3.661 | \n", "3.258 | \n", "2.987 | \n", "Real | \n", "
7 | \n", "DomesticDeclarations | \n", "10500 | \n", "99 | \n", "0.009429 | \n", "1 | \n", "24 | \n", "5.374952 | \n", "5.0 | \n", "5 | \n", "1.486345 | \n", "... | \n", "-0.295 | \n", "0.325 | \n", "0.325 | \n", "0.612 | \n", "2.827 | \n", "2.827 | \n", "2.942 | \n", "2.576 | \n", "2.315 | \n", "Real | \n", "
8 | \n", "BPIC15_4 | \n", "1053 | \n", "1049 | \n", "0.996201 | \n", "1 | \n", "116 | \n", "44.912631 | \n", "44.0 | \n", "42 | \n", "14.947644 | \n", "... | \n", "-0.002 | \n", "6.824 | \n", "6.824 | \n", "6.824 | \n", "6.824 | \n", "6.824 | \n", "5.539 | \n", "5.040 | \n", "4.729 | \n", "Real | \n", "
9 | \n", "BPI_Challenge_2012 | \n", "13087 | \n", "4366 | \n", "0.333614 | \n", "3 | \n", "175 | \n", "20.035149 | \n", "11.0 | \n", "3 | \n", "19.943559 | \n", "... | \n", "0.000 | \n", "1.315 | \n", "0.443 | \n", "1.034 | \n", "3.688 | \n", "2.502 | \n", "6.071 | \n", "5.616 | \n", "5.335 | \n", "Real | \n", "
10 | \n", "Hospital_log | \n", "1143 | \n", "981 | \n", "0.858268 | \n", "1 | \n", "1814 | \n", "131.488189 | \n", "55.0 | \n", "2 | \n", "202.528729 | \n", "... | \n", "0.000 | \n", "2.198 | \n", "1.089 | \n", "3.296 | \n", "5.918 | \n", "4.058 | \n", "5.768 | \n", "5.252 | \n", "4.931 | \n", "Real | \n", "
11 | \n", "BPIC15_5 | \n", "1156 | \n", "1153 | \n", "0.997405 | \n", "5 | \n", "154 | \n", "51.109862 | \n", "50.0 | \n", "44 | \n", "16.029953 | \n", "... | \n", "-0.004 | \n", "6.947 | \n", "2.850 | \n", "6.947 | \n", "6.947 | \n", "6.947 | \n", "5.659 | \n", "5.159 | \n", "4.841 | \n", "Real | \n", "
12 | \n", "CoSeLoG_WABO_2 | \n", "645 | \n", "644 | \n", "0.998450 | \n", "1 | \n", "124 | \n", "51.741085 | \n", "51.0 | \n", "44 | \n", "20.373556 | \n", "... | \n", "7.077 | \n", "7.077 | \n", "7.077 | \n", "7.077 | \n", "7.077 | \n", "7.077 | \n", "5.243 | \n", "4.742 | \n", "4.430 | \n", "Real | \n", "
13 | \n", "Road_Traffic_Fine_Management_Process | \n", "150370 | \n", "231 | \n", "0.001536 | \n", "2 | \n", "20 | \n", "3.733923 | \n", "5.0 | \n", "2 | \n", "1.641012 | \n", "... | \n", "-0.184 | \n", "0.318 | \n", "0.318 | \n", "0.670 | \n", "2.642 | \n", "2.642 | \n", "3.398 | \n", "3.004 | \n", "2.790 | \n", "Real | \n", "
14 | \n", "BPI_Challenge_2017_Offer_log | \n", "42995 | \n", "16 | \n", "0.000372 | \n", "3 | \n", "5 | \n", "4.508641 | \n", "5.0 | \n", "5 | \n", "0.560753 | \n", "... | \n", "2.655 | \n", "2.655 | \n", "2.655 | \n", "2.655 | \n", "2.655 | \n", "2.655 | \n", "1.081 | \n", "0.648 | \n", "0.618 | \n", "Real | \n", "
15 | \n", "Sepsis_Cases_Event_Log | \n", "1050 | \n", "846 | \n", "0.805714 | \n", "3 | \n", "185 | \n", "14.489524 | \n", "13.0 | \n", "8 | \n", "11.470475 | \n", "... | \n", "-0.019 | \n", "1.837 | \n", "1.712 | \n", "2.262 | \n", "3.238 | \n", "2.538 | \n", "4.956 | \n", "4.490 | \n", "4.191 | \n", "Real | \n", "
16 | \n", "CoSeLoG_WABO_3 | \n", "1087 | \n", "1032 | \n", "0.949402 | \n", "3 | \n", "124 | \n", "41.215271 | \n", "41.0 | \n", "46 | \n", "15.780335 | \n", "... | \n", "-0.006 | \n", "6.732 | \n", "6.732 | \n", "6.732 | \n", "6.732 | \n", "6.732 | \n", "5.313 | \n", "4.835 | \n", "4.537 | \n", "Real | \n", "
17 | \n", "BPI_Challenge_2013_closed_problems | \n", "1487 | \n", "183 | \n", "0.123067 | \n", "1 | \n", "35 | \n", "4.478816 | \n", "3.0 | \n", "2 | \n", "3.170888 | \n", "... | \n", "0.962 | \n", "0.871 | \n", "0.871 | \n", "0.935 | \n", "1.043 | \n", "1.043 | \n", "3.094 | \n", "2.644 | \n", "2.386 | \n", "Real | \n", "
18 | \n", "BPI_Challenge_2013_incidents | \n", "7554 | \n", "1511 | \n", "0.200026 | \n", "1 | \n", "123 | \n", "8.675271 | \n", "6.0 | \n", "3 | \n", "7.625071 | \n", "... | \n", "0.786 | \n", "0.855 | \n", "0.842 | \n", "0.920 | \n", "1.150 | \n", "1.052 | \n", "4.858 | \n", "4.371 | \n", "4.083 | \n", "Real | \n", "
19 | \n", "PermitLog | \n", "7065 | \n", "1478 | \n", "0.209200 | \n", "3 | \n", "90 | \n", "12.254919 | \n", "11.0 | \n", "10 | \n", "5.584833 | \n", "... | \n", "-0.048 | \n", "1.253 | \n", "1.126 | \n", "2.764 | \n", "4.276 | \n", "4.276 | \n", "5.436 | \n", "4.999 | \n", "4.725 | \n", "Real | \n", "
20 | \n", "BPIC15_1 | \n", "1199 | \n", "1170 | \n", "0.975813 | \n", "2 | \n", "101 | \n", "43.550459 | \n", "44.0 | \n", "44 | \n", "16.981536 | \n", "... | \n", "6.942 | \n", "6.942 | \n", "6.942 | \n", "6.942 | \n", "6.942 | \n", "6.942 | \n", "5.740 | \n", "5.242 | \n", "4.931 | \n", "Real | \n", "
21 | \n", "InternationalDeclarations | \n", "6449 | \n", "753 | \n", "0.116762 | \n", "3 | \n", "27 | \n", "11.187936 | \n", "10.0 | \n", "10 | \n", "2.740671 | \n", "... | \n", "-0.005 | \n", "3.972 | \n", "0.881 | \n", "3.972 | \n", "3.972 | \n", "3.972 | \n", "4.681 | \n", "4.251 | \n", "3.986 | \n", "Real | \n", "
22 | \n", "BPI_Challenge_2017 | \n", "31509 | \n", "15930 | \n", "0.505570 | \n", "10 | \n", "180 | \n", "38.156305 | \n", "35.0 | \n", "24 | \n", "16.715043 | \n", "... | \n", "0.344 | \n", "1.303 | \n", "0.450 | \n", "1.225 | \n", "3.786 | \n", "2.545 | \n", "7.009 | \n", "6.579 | \n", "6.297 | \n", "Real | \n", "
0 | \n", "100_64_0_0_0.5_0.5_0_0 | \n", "100 | \n", "100 | \n", "1.000000 | \n", "12 | \n", "479 | \n", "88.510000 | \n", "55.0 | \n", "42 | \n", "98.720463 | \n", "... | \n", "-0.005 | \n", "3.134 | \n", "0.280 | \n", "4.255 | \n", "5.376 | \n", "5.376 | \n", "4.020 | \n", "3.471 | \n", "3.128 | \n", "Generated | \n", "
1 | \n", "100_64_0_0_0.5_0.5_0_1 | \n", "100 | \n", "100 | \n", "1.000000 | \n", "8 | \n", "193 | \n", "42.880000 | \n", "31.0 | \n", "9 | \n", "38.637619 | \n", "... | \n", "-0.011 | \n", "2.669 | \n", "1.800 | \n", "3.626 | \n", "4.584 | \n", "4.584 | \n", "3.877 | \n", "3.352 | \n", "3.018 | \n", "Generated | \n", "
2 | \n", "100_64_0_0_0.5_0_0.5_0 | \n", "100 | \n", "100 | \n", "1.000000 | \n", "4 | \n", "30 | \n", "15.990000 | \n", "16.5 | \n", "18 | \n", "7.132314 | \n", "... | \n", "5.634 | \n", "5.634 | \n", "5.634 | \n", "5.634 | \n", "5.634 | \n", "5.634 | \n", "4.075 | \n", "3.532 | \n", "3.189 | \n", "Generated | \n", "
3 | \n", "100_64_0_0_0.5_0_0.5_1 | \n", "55 | \n", "41 | \n", "0.745455 | \n", "1 | \n", "20 | \n", "5.927273 | \n", "5.0 | \n", "1 | \n", "4.789589 | \n", "... | \n", "5.274 | \n", "5.274 | \n", "5.274 | \n", "5.274 | \n", "5.274 | \n", "5.274 | \n", "3.193 | \n", "2.678 | \n", "2.361 | \n", "Generated | \n", "
4 | \n", "100_64_0_0_0_0.5_0.5_0 | \n", "52 | \n", "37 | \n", "0.711538 | \n", "1 | \n", "21 | \n", "5.076923 | \n", "3.0 | \n", "3 | \n", "4.726546 | \n", "... | \n", "-0.133 | \n", "4.016 | \n", "1.273 | \n", "4.016 | \n", "4.016 | \n", "4.016 | \n", "2.908 | \n", "2.443 | \n", "2.168 | \n", "Generated | \n", "
28 rows × 94 columns
\n", "