{ "cells": [ { "cell_type": "code", "execution_count": 1, "metadata": {}, "outputs": [], "source": [ "import pandas as pd\n", "\n", "from sklearn.preprocessing import MultiLabelBinarizer\n", "from sklearn.svm import OneClassSVM \n", "from sklearn.model_selection import train_test_split\n", "from sklearn.metrics import f1_score" ] }, { "cell_type": "code", "execution_count": 2, "metadata": {}, "outputs": [], "source": [ "df = pd.read_pickle('../data/processed/features.pkl')" ] }, { "cell_type": "code", "execution_count": 3, "metadata": {}, "outputs": [ { "data": { "text/html": [ "
\n", " | verified_email | \n", "verified_primary_email | \n", "n_works | \n", "n_doi | \n", "n_arxiv | \n", "n_pmc | \n", "n_other_pids | \n", "label | \n", "n_emails | \n", "n_urls | \n", "... | \n", "n_employment | \n", "n_ext_work_source | \n", "n_valid_education | \n", "n_valid_employment | \n", "biography_length | \n", "biography_n_sentences | \n", "biography_n_words | \n", "date_diff | \n", "ref_year | \n", "date_stale | \n", "
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0 | \n", "False | \n", "False | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "False | \n", "<NA> | \n", "<NA> | \n", "... | \n", "<NA> | \n", "<NA> | \n", "NaN | \n", "NaN | \n", "<NA> | \n", "NaN | \n", "NaN | \n", "0.009618 | \n", "2018 | \n", "1153.980551 | \n", "
1 | \n", "True | \n", "True | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "False | \n", "<NA> | \n", "<NA> | \n", "... | \n", "1 | \n", "<NA> | \n", "NaN | \n", "1.0 | \n", "<NA> | \n", "NaN | \n", "NaN | \n", "715.078025 | \n", "2018 | \n", "406.980815 | \n", "
2 | \n", "True | \n", "True | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "False | \n", "<NA> | \n", "<NA> | \n", "... | \n", "<NA> | \n", "<NA> | \n", "NaN | \n", "NaN | \n", "<NA> | \n", "NaN | \n", "NaN | \n", "48.001631 | \n", "2019 | \n", "456.736688 | \n", "
3 | \n", "True | \n", "True | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "False | \n", "<NA> | \n", "<NA> | \n", "... | \n", "1 | \n", "<NA> | \n", "NaN | \n", "0.0 | \n", "<NA> | \n", "NaN | \n", "NaN | \n", "1863.042464 | \n", "2015 | \n", "217.817512 | \n", "
4 | \n", "True | \n", "True | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "False | \n", "<NA> | \n", "<NA> | \n", "... | \n", "2 | \n", "<NA> | \n", "NaN | \n", "1.0 | \n", "<NA> | \n", "NaN | \n", "NaN | \n", "827.372135 | \n", "2014 | \n", "1779.456397 | \n", "
... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "
10989644 | \n", "True | \n", "True | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "False | \n", "<NA> | \n", "<NA> | \n", "... | \n", "1 | \n", "<NA> | \n", "1.0 | \n", "1.0 | \n", "118 | \n", "2.0 | \n", "23.0 | \n", "0.051116 | \n", "2020 | \n", "139.242812 | \n", "
10989645 | \n", "True | \n", "True | \n", "7 | \n", "7 | \n", "0 | \n", "1 | \n", "0 | \n", "True | \n", "<NA> | \n", "<NA> | \n", "... | \n", "2 | \n", "2 | \n", "2.0 | \n", "0.0 | \n", "<NA> | \n", "NaN | \n", "NaN | \n", "2131.978000 | \n", "2015 | \n", "158.560081 | \n", "
10989646 | \n", "True | \n", "True | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "False | \n", "<NA> | \n", "<NA> | \n", "... | \n", "<NA> | \n", "<NA> | \n", "NaN | \n", "NaN | \n", "<NA> | \n", "NaN | \n", "NaN | \n", "0.000597 | \n", "2020 | \n", "139.226289 | \n", "
10989647 | \n", "True | \n", "True | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "False | \n", "<NA> | \n", "<NA> | \n", "... | \n", "1 | \n", "<NA> | \n", "2.0 | \n", "1.0 | \n", "<NA> | \n", "NaN | \n", "NaN | \n", "1433.222830 | \n", "2016 | \n", "150.839463 | \n", "
10989648 | \n", "True | \n", "True | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "False | \n", "<NA> | \n", "<NA> | \n", "... | \n", "<NA> | \n", "<NA> | \n", "NaN | \n", "NaN | \n", "<NA> | \n", "NaN | \n", "NaN | \n", "1591.542558 | \n", "2016 | \n", "152.263413 | \n", "
10989649 rows × 23 columns
\n", "\n", " | verified_email | \n", "verified_primary_email | \n", "n_works | \n", "n_doi | \n", "n_arxiv | \n", "n_pmc | \n", "n_other_pids | \n", "label | \n", "n_emails | \n", "n_urls | \n", "... | \n", "n_employment | \n", "n_ext_work_source | \n", "n_valid_education | \n", "n_valid_employment | \n", "biography_length | \n", "biography_n_sentences | \n", "biography_n_words | \n", "date_diff | \n", "ref_year | \n", "date_stale | \n", "
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0 | \n", "False | \n", "False | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "False | \n", "0 | \n", "0 | \n", "... | \n", "0 | \n", "0 | \n", "0.0 | \n", "0.0 | \n", "0 | \n", "0.0 | \n", "0.0 | \n", "0.009618 | \n", "2018 | \n", "1153.980551 | \n", "
1 | \n", "True | \n", "True | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "False | \n", "0 | \n", "0 | \n", "... | \n", "1 | \n", "0 | \n", "0.0 | \n", "1.0 | \n", "0 | \n", "0.0 | \n", "0.0 | \n", "715.078025 | \n", "2018 | \n", "406.980815 | \n", "
2 | \n", "True | \n", "True | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "False | \n", "0 | \n", "0 | \n", "... | \n", "0 | \n", "0 | \n", "0.0 | \n", "0.0 | \n", "0 | \n", "0.0 | \n", "0.0 | \n", "48.001631 | \n", "2019 | \n", "456.736688 | \n", "
3 | \n", "True | \n", "True | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "False | \n", "0 | \n", "0 | \n", "... | \n", "1 | \n", "0 | \n", "0.0 | \n", "0.0 | \n", "0 | \n", "0.0 | \n", "0.0 | \n", "1863.042464 | \n", "2015 | \n", "217.817512 | \n", "
4 | \n", "True | \n", "True | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "False | \n", "0 | \n", "0 | \n", "... | \n", "2 | \n", "0 | \n", "0.0 | \n", "1.0 | \n", "0 | \n", "0.0 | \n", "0.0 | \n", "827.372135 | \n", "2014 | \n", "1779.456397 | \n", "
... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "
10989644 | \n", "True | \n", "True | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "False | \n", "0 | \n", "0 | \n", "... | \n", "1 | \n", "0 | \n", "1.0 | \n", "1.0 | \n", "118 | \n", "2.0 | \n", "23.0 | \n", "0.051116 | \n", "2020 | \n", "139.242812 | \n", "
10989645 | \n", "True | \n", "True | \n", "7 | \n", "7 | \n", "0 | \n", "1 | \n", "0 | \n", "True | \n", "0 | \n", "0 | \n", "... | \n", "2 | \n", "2 | \n", "2.0 | \n", "0.0 | \n", "0 | \n", "0.0 | \n", "0.0 | \n", "2131.978000 | \n", "2015 | \n", "158.560081 | \n", "
10989646 | \n", "True | \n", "True | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "False | \n", "0 | \n", "0 | \n", "... | \n", "0 | \n", "0 | \n", "0.0 | \n", "0.0 | \n", "0 | \n", "0.0 | \n", "0.0 | \n", "0.000597 | \n", "2020 | \n", "139.226289 | \n", "
10989647 | \n", "True | \n", "True | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "False | \n", "0 | \n", "0 | \n", "... | \n", "1 | \n", "0 | \n", "2.0 | \n", "1.0 | \n", "0 | \n", "0.0 | \n", "0.0 | \n", "1433.222830 | \n", "2016 | \n", "150.839463 | \n", "
10989648 | \n", "True | \n", "True | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "False | \n", "0 | \n", "0 | \n", "... | \n", "0 | \n", "0 | \n", "0.0 | \n", "0.0 | \n", "0 | \n", "0.0 | \n", "0.0 | \n", "1591.542558 | \n", "2016 | \n", "152.263413 | \n", "
10989649 rows × 23 columns
\n", "\n", " | verified_email | \n", "verified_primary_email | \n", "n_works | \n", "n_doi | \n", "n_arxiv | \n", "n_pmc | \n", "n_other_pids | \n", "n_emails | \n", "n_urls | \n", "n_ids | \n", "... | \n", "n_valid_education | \n", "n_valid_employment | \n", "biography_length | \n", "biography_n_sentences | \n", "biography_n_words | \n", "date_diff | \n", "ref_year | \n", "date_stale | \n", "label | \n", "prediction | \n", "
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
8422958 | \n", "True | \n", "True | \n", "7 | \n", "3 | \n", "0 | \n", "0 | \n", "6 | \n", "0 | \n", "0 | \n", "1 | \n", "... | \n", "2.0 | \n", "1.0 | \n", "0 | \n", "0.0 | \n", "0.0 | \n", "1149.760128 | \n", "2016 | \n", "498.053074 | \n", "-1.0 | \n", "1 | \n", "
30426 | \n", "True | \n", "True | \n", "5 | \n", "5 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "... | \n", "1.0 | \n", "3.0 | \n", "0 | \n", "0.0 | \n", "0.0 | \n", "2446.815456 | \n", "2014 | \n", "112.064679 | \n", "1.0 | \n", "-1 | \n", "
1941223 | \n", "True | \n", "True | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "... | \n", "0.0 | \n", "0.0 | \n", "0 | \n", "0.0 | \n", "0.0 | \n", "811.573040 | \n", "2017 | \n", "486.567693 | \n", "-1.0 | \n", "1 | \n", "
9232681 | \n", "True | \n", "True | \n", "1 | \n", "1 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "... | \n", "0.0 | \n", "0.0 | \n", "0 | \n", "0.0 | \n", "0.0 | \n", "888.520157 | \n", "2017 | \n", "359.397781 | \n", "-1.0 | \n", "1 | \n", "
7646644 | \n", "False | \n", "False | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "... | \n", "0.0 | \n", "0.0 | \n", "0 | \n", "0.0 | \n", "0.0 | \n", "0.000030 | \n", "2017 | \n", "1443.731837 | \n", "1.0 | \n", "-1 | \n", "
... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "
4769520 | \n", "True | \n", "True | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "... | \n", "0.0 | \n", "0.0 | \n", "0 | \n", "0.0 | \n", "0.0 | \n", "781.732331 | \n", "2019 | \n", "46.115046 | \n", "-1.0 | \n", "1 | \n", "
2817268 | \n", "True | \n", "True | \n", "9 | \n", "7 | \n", "0 | \n", "0 | \n", "5 | \n", "0 | \n", "0 | \n", "1 | \n", "... | \n", "3.0 | \n", "0.0 | \n", "0 | \n", "0.0 | \n", "0.0 | \n", "1782.543747 | \n", "2014 | \n", "544.549425 | \n", "-1.0 | \n", "1 | \n", "
4840353 | \n", "True | \n", "True | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "... | \n", "0.0 | \n", "0.0 | \n", "0 | \n", "0.0 | \n", "0.0 | \n", "659.864595 | \n", "2017 | \n", "634.846007 | \n", "1.0 | \n", "-1 | \n", "
9717615 | \n", "True | \n", "True | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "1 | \n", "... | \n", "0.0 | \n", "0.0 | \n", "0 | \n", "0.0 | \n", "0.0 | \n", "1971.810335 | \n", "2015 | \n", "38.063916 | \n", "-1.0 | \n", "1 | \n", "
2290714 | \n", "False | \n", "False | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "... | \n", "0.0 | \n", "0.0 | \n", "0 | \n", "0.0 | \n", "0.0 | \n", "947.216224 | \n", "2018 | \n", "104.732935 | \n", "-1.0 | \n", "1 | \n", "
205377 rows × 24 columns
\n", "\n", " | verified_email | \n", "verified_primary_email | \n", "n_works | \n", "n_doi | \n", "n_arxiv | \n", "n_pmc | \n", "n_other_pids | \n", "n_emails | \n", "n_urls | \n", "n_ids | \n", "... | \n", "n_valid_education | \n", "n_valid_employment | \n", "biography_length | \n", "biography_n_sentences | \n", "biography_n_words | \n", "date_diff | \n", "ref_year | \n", "date_stale | \n", "label | \n", "prediction | \n", "
---|
0 rows × 24 columns
\n", "\n", " | verified_email | \n", "verified_primary_email | \n", "n_works | \n", "n_doi | \n", "n_arxiv | \n", "n_pmc | \n", "n_other_pids | \n", "n_emails | \n", "n_urls | \n", "n_ids | \n", "... | \n", "n_valid_education | \n", "n_valid_employment | \n", "biography_length | \n", "biography_n_sentences | \n", "biography_n_words | \n", "date_diff | \n", "ref_year | \n", "date_stale | \n", "label | \n", "prediction | \n", "
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
1319584 | \n", "True | \n", "True | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "1 | \n", "0 | \n", "... | \n", "0.0 | \n", "0.0 | \n", "637 | \n", "4.0 | \n", "113.0 | \n", "0.000852 | \n", "2020 | \n", "143.341818 | \n", "-1.0 | \n", "-1 | \n", "
7579770 | \n", "True | \n", "True | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "1 | \n", "0 | \n", "... | \n", "0.0 | \n", "0.0 | \n", "445 | \n", "4.0 | \n", "85.0 | \n", "0.002694 | \n", "2020 | \n", "184.261009 | \n", "-1.0 | \n", "-1 | \n", "
9173011 | \n", "True | \n", "True | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "1 | \n", "0 | \n", "... | \n", "0.0 | \n", "0.0 | \n", "445 | \n", "4.0 | \n", "85.0 | \n", "0.005271 | \n", "2020 | \n", "169.293431 | \n", "-1.0 | \n", "-1 | \n", "
1209389 | \n", "True | \n", "True | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "1 | \n", "0 | \n", "... | \n", "0.0 | \n", "0.0 | \n", "445 | \n", "4.0 | \n", "85.0 | \n", "0.006071 | \n", "2020 | \n", "146.328318 | \n", "-1.0 | \n", "-1 | \n", "
4173344 | \n", "True | \n", "True | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "1 | \n", "0 | \n", "... | \n", "0.0 | \n", "0.0 | \n", "445 | \n", "4.0 | \n", "85.0 | \n", "0.005405 | \n", "2020 | \n", "191.303842 | \n", "-1.0 | \n", "-1 | \n", "
10985986 | \n", "True | \n", "True | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "1 | \n", "0 | \n", "... | \n", "0.0 | \n", "0.0 | \n", "445 | \n", "4.0 | \n", "85.0 | \n", "0.003662 | \n", "2020 | \n", "195.359312 | \n", "-1.0 | \n", "-1 | \n", "
6208696 | \n", "True | \n", "True | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "1 | \n", "0 | \n", "... | \n", "0.0 | \n", "0.0 | \n", "445 | \n", "4.0 | \n", "85.0 | \n", "0.001287 | \n", "2020 | \n", "142.360796 | \n", "-1.0 | \n", "-1 | \n", "
801178 | \n", "True | \n", "True | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "1 | \n", "0 | \n", "... | \n", "0.0 | \n", "0.0 | \n", "445 | \n", "4.0 | \n", "85.0 | \n", "0.008069 | \n", "2020 | \n", "131.828965 | \n", "-1.0 | \n", "-1 | \n", "
4392500 | \n", "True | \n", "True | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "1 | \n", "0 | \n", "... | \n", "0.0 | \n", "0.0 | \n", "445 | \n", "4.0 | \n", "85.0 | \n", "0.004414 | \n", "2020 | \n", "206.150937 | \n", "-1.0 | \n", "-1 | \n", "
7963350 | \n", "True | \n", "True | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "1 | \n", "0 | \n", "... | \n", "0.0 | \n", "0.0 | \n", "445 | \n", "4.0 | \n", "85.0 | \n", "0.003572 | \n", "2020 | \n", "190.312686 | \n", "-1.0 | \n", "-1 | \n", "
5659388 | \n", "True | \n", "True | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "1 | \n", "0 | \n", "... | \n", "0.0 | \n", "0.0 | \n", "445 | \n", "4.0 | \n", "85.0 | \n", "0.011685 | \n", "2020 | \n", "140.250630 | \n", "-1.0 | \n", "-1 | \n", "
2749172 | \n", "True | \n", "True | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "1 | \n", "0 | \n", "... | \n", "0.0 | \n", "0.0 | \n", "540 | \n", "4.0 | \n", "103.0 | \n", "0.001172 | \n", "2020 | \n", "142.989201 | \n", "-1.0 | \n", "-1 | \n", "
4230883 | \n", "True | \n", "True | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "1 | \n", "0 | \n", "... | \n", "0.0 | \n", "0.0 | \n", "445 | \n", "4.0 | \n", "85.0 | \n", "0.001681 | \n", "2020 | \n", "153.354072 | \n", "-1.0 | \n", "-1 | \n", "
6370669 | \n", "True | \n", "True | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "1 | \n", "0 | \n", "... | \n", "0.0 | \n", "0.0 | \n", "445 | \n", "4.0 | \n", "85.0 | \n", "0.006984 | \n", "2020 | \n", "178.167846 | \n", "-1.0 | \n", "-1 | \n", "
5109458 | \n", "True | \n", "True | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "1 | \n", "0 | \n", "... | \n", "0.0 | \n", "0.0 | \n", "445 | \n", "4.0 | \n", "85.0 | \n", "0.004633 | \n", "2020 | \n", "140.166676 | \n", "-1.0 | \n", "-1 | \n", "
7689620 | \n", "True | \n", "True | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "1 | \n", "0 | \n", "... | \n", "0.0 | \n", "0.0 | \n", "445 | \n", "4.0 | \n", "85.0 | \n", "0.003671 | \n", "2020 | \n", "203.189280 | \n", "-1.0 | \n", "-1 | \n", "
9831120 | \n", "True | \n", "True | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "1 | \n", "0 | \n", "... | \n", "0.0 | \n", "0.0 | \n", "445 | \n", "4.0 | \n", "85.0 | \n", "0.004996 | \n", "2020 | \n", "167.149854 | \n", "-1.0 | \n", "-1 | \n", "
6263478 | \n", "True | \n", "True | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "1 | \n", "0 | \n", "... | \n", "0.0 | \n", "0.0 | \n", "552 | \n", "4.0 | \n", "107.0 | \n", "0.005174 | \n", "2020 | \n", "140.365511 | \n", "-1.0 | \n", "-1 | \n", "
10581997 | \n", "True | \n", "True | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "1 | \n", "0 | \n", "... | \n", "0.0 | \n", "0.0 | \n", "445 | \n", "4.0 | \n", "85.0 | \n", "0.020527 | \n", "2020 | \n", "129.861984 | \n", "-1.0 | \n", "-1 | \n", "
3243302 | \n", "True | \n", "True | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "1 | \n", "0 | \n", "... | \n", "0.0 | \n", "0.0 | \n", "445 | \n", "4.0 | \n", "85.0 | \n", "0.003391 | \n", "2020 | \n", "140.230023 | \n", "-1.0 | \n", "-1 | \n", "
3659063 | \n", "True | \n", "True | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "1 | \n", "0 | \n", "... | \n", "0.0 | \n", "0.0 | \n", "445 | \n", "4.0 | \n", "85.0 | \n", "0.010618 | \n", "2020 | \n", "131.658167 | \n", "-1.0 | \n", "-1 | \n", "
6099073 | \n", "True | \n", "True | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "1 | \n", "0 | \n", "... | \n", "0.0 | \n", "0.0 | \n", "445 | \n", "4.0 | \n", "85.0 | \n", "0.025714 | \n", "2020 | \n", "142.184268 | \n", "-1.0 | \n", "-1 | \n", "
3953358 | \n", "True | \n", "True | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "... | \n", "0.0 | \n", "0.0 | \n", "445 | \n", "4.0 | \n", "85.0 | \n", "0.005145 | \n", "2020 | \n", "185.115723 | \n", "-1.0 | \n", "-1 | \n", "
9724190 | \n", "True | \n", "True | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "1 | \n", "0 | \n", "... | \n", "0.0 | \n", "0.0 | \n", "543 | \n", "4.0 | \n", "107.0 | \n", "6.993352 | \n", "2020 | \n", "135.124112 | \n", "-1.0 | \n", "-1 | \n", "
1041978 | \n", "True | \n", "True | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "1 | \n", "0 | \n", "... | \n", "0.0 | \n", "0.0 | \n", "445 | \n", "4.0 | \n", "85.0 | \n", "0.006524 | \n", "2020 | \n", "167.270642 | \n", "-1.0 | \n", "-1 | \n", "
880090 | \n", "True | \n", "True | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "1 | \n", "0 | \n", "... | \n", "0.0 | \n", "0.0 | \n", "445 | \n", "4.0 | \n", "85.0 | \n", "0.001572 | \n", "2020 | \n", "143.298327 | \n", "-1.0 | \n", "-1 | \n", "
8492341 | \n", "True | \n", "True | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "1 | \n", "0 | \n", "... | \n", "0.0 | \n", "0.0 | \n", "445 | \n", "4.0 | \n", "85.0 | \n", "0.006172 | \n", "2020 | \n", "123.742413 | \n", "-1.0 | \n", "-1 | \n", "
8952735 | \n", "True | \n", "True | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "1 | \n", "0 | \n", "... | \n", "0.0 | \n", "0.0 | \n", "445 | \n", "4.0 | \n", "85.0 | \n", "0.004785 | \n", "2020 | \n", "188.359673 | \n", "-1.0 | \n", "-1 | \n", "
3274872 | \n", "True | \n", "True | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "1 | \n", "0 | \n", "... | \n", "0.0 | \n", "0.0 | \n", "445 | \n", "4.0 | \n", "85.0 | \n", "0.017478 | \n", "2020 | \n", "126.967926 | \n", "-1.0 | \n", "-1 | \n", "
989919 | \n", "True | \n", "True | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "0 | \n", "1 | \n", "0 | \n", "... | \n", "0.0 | \n", "0.0 | \n", "561 | \n", "5.0 | \n", "110.0 | \n", "0.002649 | \n", "2020 | \n", "146.098129 | \n", "-1.0 | \n", "-1 | \n", "
30 rows × 24 columns
\n", "