dnet-hadoop/dhp-workflows/dhp-aggregation/src/test/java/eu/dnetlib/dhp/collection/plugin/file/FileCollectorPluginTest.java

package eu.dnetlib.dhp.collection.plugin.file;

import eu.dnetlib.dhp.collection.ApiDescriptor;
import eu.dnetlib.dhp.common.aggregation.AggregatorReport;
import eu.dnetlib.dhp.common.collection.CollectorException;
import net.bytebuddy.asm.Advice;
import org.apache.hadoop.conf.Configuration;
import org.apache.hadoop.fs.FileSystem;
import org.apache.hadoop.fs.LocalFileSystem;
import org.junit.jupiter.api.Assertions;
import org.junit.jupiter.api.BeforeEach;
import org.junit.jupiter.api.Test;
import org.slf4j.Logger;
import org.slf4j.LoggerFactory;

import java.io.IOException;
import java.util.HashMap;
import java.util.stream.Stream;

public class FileCollectorPluginTest {

    private static final Logger log = LoggerFactory.getLogger(FileGZipCollectorPluginTest.class);

    private final ApiDescriptor api = new ApiDescriptor();

    private FileCollectorPlugin plugin;

    private static final String SPLIT_ON_ELEMENT = "repository";

    @BeforeEach
    public void setUp() throws IOException {

        final String gzipFile = this
                .getClass()
                .getResource("/eu/dnetlib/dhp/collection/plugin/file/opendoar.xml")
                .getFile();

        api.setBaseUrl(gzipFile);

        HashMap<String, String> params = new HashMap<>();
        params.put("splitOnElement", SPLIT_ON_ELEMENT);

        api.setParams(params);

        FileSystem fs = FileSystem.get(new Configuration());
        plugin = new FileCollectorPlugin(fs);
    }

    @Test
    void test() throws CollectorException {

        final Stream<String> stream = plugin.collect(api, new AggregatorReport());

        stream.limit(10).forEach(s -> {
            Assertions.assertTrue(s.length() > 0);
            log.info(s);
        });
    }
}