46 changed files with 2902 additions and 2397 deletions
--- a/dhp-workflows/dhp-aggregation/src/main/java/eu/dnetlib/dhp/actionmanager/project/utils/EXCELParser.java
+++ b/dhp-workflows/dhp-aggregation/src/main/java/eu/dnetlib/dhp/actionmanager/project/utils/EXCELParser.java
@ -32,7 +32,7 @@ public class EXCELParser {
 		XSSFSheet sheet = wb.getSheet(sheetName);
-		if(sheetName == null){
+		if (sheetName == null) {
 			throw new RuntimeException("Sheet name " + sheetName + " not present in current file");
 		}
--- a/dhp-workflows/dhp-aggregation/src/test/java/eu/dnetlib/dhp/actionmanager/project/EXCELParserTest.java
+++ b/dhp-workflows/dhp-aggregation/src/test/java/eu/dnetlib/dhp/actionmanager/project/EXCELParserTest.java
@ -35,8 +35,9 @@ public class EXCELParserTest {
 		EXCELParser excelParser = new EXCELParser();
-		List<Object> pl = excelParser
+		final String classForName = "eu.dnetlib.dhp.actionmanager.project.utils.ExcelTopic";
-			.parse(httpConnector.getInputSourceAsStream(URL), "eu.dnetlib.dhp.actionmanager.project.utils.ExcelTopic");
+		final String sheetName = "Topics";
 		List<Object> pl = excelParser.parse(httpConnector.getInputSourceAsStream(URL), classForName, sheetName);
 		Assertions.assertEquals(3837, pl.size());
--- a/dhp-workflows/dhp-doiboost/src/main/java/eu/dnetlib/doiboost/orcid/OrcidDownloader.java
+++ b/dhp-workflows/dhp-doiboost/src/main/java/eu/dnetlib/doiboost/orcid/OrcidDownloader.java
@ -1,208 +0,0 @@
 package eu.dnetlib.doiboost.orcid;
 import java.io.*;
 import java.text.SimpleDateFormat;
 import java.util.Arrays;
 import java.util.Date;
 import java.util.List;
 import org.apache.commons.compress.archivers.tar.TarArchiveEntry;
 import org.apache.commons.compress.archivers.tar.TarArchiveInputStream;
 import org.apache.commons.compress.compressors.gzip.GzipCompressorInputStream;
 import org.apache.commons.io.IOUtils;
 import org.apache.hadoop.conf.Configuration;
 import org.apache.hadoop.fs.FSDataInputStream;
 import org.apache.hadoop.fs.FileSystem;
 import org.apache.hadoop.fs.Path;
 import org.apache.hadoop.io.SequenceFile;
 import org.apache.hadoop.io.Text;
 import org.apache.hadoop.io.compress.GzipCodec;
 import org.apache.http.client.methods.CloseableHttpResponse;
 import org.apache.http.client.methods.HttpGet;
 import org.apache.http.impl.client.CloseableHttpClient;
 import org.apache.http.impl.client.HttpClients;
 import org.mortbay.log.Log;
 import eu.dnetlib.dhp.application.ArgumentApplicationParser;
 public class OrcidDownloader extends OrcidDSManager {
 	static final int REQ_LIMIT = 24;
 	static final int REQ_MAX_TEST = -1;
 	static final int RECORD_PARSED_COUNTER_LOG_INTERVAL = 500;
 	static final String DATE_FORMAT = "yyyy-MM-dd HH:mm:ss";
 	static final String lastUpdate = "2020-09-29 00:00:00";
 	private String lambdaFileName;
 	private String outputPath;
 	private String token;
 	public static void main(String[] args) throws IOException, Exception {
 		OrcidDownloader orcidDownloader = new OrcidDownloader();
 		orcidDownloader.loadArgs(args);
 		orcidDownloader.parseLambdaFile();
 	}
 	private String downloadRecord(String orcidId) throws IOException {
 		try (CloseableHttpClient client = HttpClients.createDefault()) {
 			HttpGet httpGet = new HttpGet("https://api.orcid.org/v3.0/" + orcidId + "/record");
 			httpGet.addHeader("Accept", "application/vnd.orcid+xml");
 			httpGet.addHeader("Authorization", String.format("Bearer %s", token));
 			CloseableHttpResponse response = client.execute(httpGet);
 			if (response.getStatusLine().getStatusCode() != 200) {
 				Log
 					.info(
 						"Downloading " + orcidId + " status code: " + response.getStatusLine().getStatusCode());
 				return new String("");
 			}
 //			return IOUtils.toString(response.getEntity().getContent());
 			return xmlStreamToString(response.getEntity().getContent());
 		}
 	}
 	private String xmlStreamToString(InputStream xmlStream) throws IOException {
 		BufferedReader br = new BufferedReader(new InputStreamReader(xmlStream));
 		String line;
 		StringBuffer buffer = new StringBuffer();
 		while ((line = br.readLine()) != null) {
 			buffer.append(line);
 		}
 		return buffer.toString();
 	}
 	public void parseLambdaFile() throws Exception {
 		int parsedRecordsCounter = 0;
 		int downloadedRecordsCounter = 0;
 		int savedRecordsCounter = 0;
 		long startDownload = 0;
 		Configuration conf = initConfigurationObject();
 		FileSystem fs = initFileSystemObject(conf);
 		String lambdaFileUri = hdfsServerUri.concat(workingPath).concat(lambdaFileName);
 		Path hdfsreadpath = new Path(lambdaFileUri);
 		FSDataInputStream lambdaFileStream = fs.open(hdfsreadpath);
 		Path hdfsoutputPath = new Path(
 			hdfsServerUri
 				.concat(workingPath)
 				.concat(outputPath)
 				.concat("updated_xml_authors.seq"));
 		try (TarArchiveInputStream tais = new TarArchiveInputStream(
 			new GzipCompressorInputStream(lambdaFileStream))) {
 			TarArchiveEntry entry = null;
 			StringBuilder sb = new StringBuilder();
 			try (SequenceFile.Writer writer = SequenceFile
 				.createWriter(
 					conf,
 					SequenceFile.Writer.file(hdfsoutputPath),
 					SequenceFile.Writer.keyClass(Text.class),
 					SequenceFile.Writer.valueClass(Text.class),
 					SequenceFile.Writer.compression(SequenceFile.CompressionType.BLOCK, new GzipCodec()))) {
 				startDownload = System.currentTimeMillis();
 				while ((entry = tais.getNextTarEntry()) != null) {
 					BufferedReader br = new BufferedReader(new InputStreamReader(tais)); // Read directly from tarInput
 					String line;
 					while ((line = br.readLine()) != null) {
 						String[] values = line.split(",");
 						List<String> recordInfo = Arrays.asList(values);
 						int nReqTmp = 0;
 						long startReqTmp = System.currentTimeMillis();
 						// skip headers line
 						if (parsedRecordsCounter == 0) {
 							parsedRecordsCounter++;
 							continue;
 						}
 						parsedRecordsCounter++;
 						String orcidId = recordInfo.get(0);
 						if (isModified(orcidId, recordInfo.get(3))) {
 							String record = downloadRecord(orcidId);
 							downloadedRecordsCounter++;
 							if (!record.isEmpty()) {
 //							String compressRecord = ArgumentApplicationParser.compressArgument(record);
 								final Text key = new Text(recordInfo.get(0));
 								final Text value = new Text(record);
 								writer.append(key, value);
 								savedRecordsCounter++;
 							}
 						} else {
 							break;
 						}
 						long endReq = System.currentTimeMillis();
 						nReqTmp++;
 						if (nReqTmp == REQ_LIMIT) {
 							long reqSessionDuration = endReq - startReqTmp;
 							if (reqSessionDuration <= 1000) {
 								Log
 									.info(
 										"\nreqSessionDuration: "
 											+ reqSessionDuration
 											+ " nReqTmp: "
 											+ nReqTmp
 											+ " wait ....");
 								Thread.sleep(1000 - reqSessionDuration);
 							} else {
 								nReqTmp = 0;
 								startReqTmp = System.currentTimeMillis();
 							}
 						}
 						if ((parsedRecordsCounter % RECORD_PARSED_COUNTER_LOG_INTERVAL) == 0) {
 							Log
 								.info(
 									"Current parsed: "
 										+ parsedRecordsCounter
 										+ " downloaded: "
 										+ downloadedRecordsCounter
 										+ " saved: "
 										+ savedRecordsCounter);
 							if (REQ_MAX_TEST != -1 && parsedRecordsCounter > REQ_MAX_TEST) {
 								break;
 							}
 						}
 					}
 					long endDownload = System.currentTimeMillis();
 					long downloadTime = endDownload - startDownload;
 					Log.info("Download time: " + ((downloadTime / 1000) / 60) + " minutes");
 				}
 			}
 		}
 		Log.info("Download started at: " + new Date(startDownload).toString());
 		Log.info("Download ended at: " + new Date(System.currentTimeMillis()).toString());
 		Log.info("Parsed Records Counter: " + parsedRecordsCounter);
 		Log.info("Downloaded Records Counter: " + downloadedRecordsCounter);
 		Log.info("Saved Records Counter: " + savedRecordsCounter);
 	}
 	private void loadArgs(String[] args) throws IOException, Exception {
 		final ArgumentApplicationParser parser = new ArgumentApplicationParser(
 			IOUtils
 				.toString(
 					OrcidDownloader.class
 						.getResourceAsStream(
 							"/eu/dnetlib/dhp/doiboost/download_orcid_data.json")));
 		parser.parseArgument(args);
 		hdfsServerUri = parser.get("hdfsServerUri");
 		Log.info("HDFS URI: " + hdfsServerUri);
 		workingPath = parser.get("workingPath");
 		Log.info("Default Path: " + workingPath);
 		lambdaFileName = parser.get("lambdaFileName");
 		Log.info("Lambda File Name: " + lambdaFileName);
 		outputPath = parser.get("outputPath");
 		Log.info("Output Data: " + outputPath);
 		token = parser.get("token");
 	}
 	public boolean isModified(String orcidId, String modifiedDate) {
 		Date modifiedDateDt = null;
 		Date lastUpdateDt = null;
 		try {
 			if (modifiedDate.length() != 19) {
 				modifiedDate = modifiedDate.substring(0, 19);
 			}
 			modifiedDateDt = new SimpleDateFormat(DATE_FORMAT).parse(modifiedDate);
 			lastUpdateDt = new SimpleDateFormat(DATE_FORMAT).parse(lastUpdate);
 		} catch (Exception e) {
 			Log.info("[" + orcidId + "] Parsing date: ", e.getMessage());
 			return true;
 		}
 		return modifiedDateDt.after(lastUpdateDt);
 	}
 }
--- a/dhp-workflows/dhp-doiboost/src/main/java/eu/dnetlib/doiboost/orcid/SparkDownloadOrcidAuthors.java
+++ b/dhp-workflows/dhp-doiboost/src/main/java/eu/dnetlib/doiboost/orcid/SparkDownloadOrcidAuthors.java
@ -8,6 +8,7 @@ import java.util.Date;
 import java.util.Optional;
 import org.apache.commons.io.IOUtils;
 import org.apache.commons.lang3.StringUtils;
 import org.apache.hadoop.io.Text;
 import org.apache.hadoop.mapreduce.lib.output.SequenceFileOutputFormat;
 import org.apache.http.client.methods.CloseableHttpResponse;
@ -24,13 +25,13 @@ import org.slf4j.LoggerFactory;
 import eu.dnetlib.dhp.application.ArgumentApplicationParser;
 import eu.dnetlib.doiboost.orcid.model.DownloadedRecordData;
 import eu.dnetlib.doiboost.orcid.util.HDFSUtil;
 import scala.Tuple2;
 public class SparkDownloadOrcidAuthors {
 	static Logger logger = LoggerFactory.getLogger(SparkDownloadOrcidAuthors.class);
 	static final String DATE_FORMAT = "yyyy-MM-dd HH:mm:ss";
 	static final String lastUpdate = "2020-09-29 00:00:00";
 	public static void main(String[] args) throws Exception {
@ -53,18 +54,25 @@ public class SparkDownloadOrcidAuthors {
 		final String token = parser.get("token");
 		final String lambdaFileName = parser.get("lambdaFileName");
 		logger.info("lambdaFileName: {}", lambdaFileName);
 		final String hdfsServerUri = parser.get("hdfsServerUri");
 		SparkConf conf = new SparkConf();
 		runWithSparkSession(
 			conf,
 			isSparkSessionManaged,
 			spark -> {
 				String lastUpdate = HDFSUtil.readFromTextFile(hdfsServerUri, workingPath, "last_update.txt");
 				logger.info("lastUpdate: {}", lastUpdate);
 				if (StringUtils.isBlank(lastUpdate)) {
 					throw new RuntimeException("last update info not found");
 				}
 				JavaSparkContext sc = JavaSparkContext.fromSparkContext(spark.sparkContext());
 				LongAccumulator parsedRecordsAcc = spark.sparkContext().longAccumulator("parsed_records");
 				LongAccumulator modifiedRecordsAcc = spark.sparkContext().longAccumulator("to_download_records");
 				LongAccumulator downloadedRecordsAcc = spark.sparkContext().longAccumulator("downloaded_records");
 				LongAccumulator errorHTTP403Acc = spark.sparkContext().longAccumulator("error_HTTP_403");
 				LongAccumulator errorHTTP404Acc = spark.sparkContext().longAccumulator("error_HTTP_404");
 				LongAccumulator errorHTTP409Acc = spark.sparkContext().longAccumulator("error_HTTP_409");
 				LongAccumulator errorHTTP503Acc = spark.sparkContext().longAccumulator("error_HTTP_503");
 				LongAccumulator errorHTTP525Acc = spark.sparkContext().longAccumulator("error_HTTP_525");
@ -73,13 +81,14 @@ public class SparkDownloadOrcidAuthors {
 				logger.info("Retrieving data from lamda sequence file");
 				JavaPairRDD<Text, Text> lamdaFileRDD = sc
 					.sequenceFile(workingPath + lambdaFileName, Text.class, Text.class);
-				logger.info("Data retrieved: " + lamdaFileRDD.count());
+				final long lamdaFileRDDCount = lamdaFileRDD.count();
 				logger.info("Data retrieved: " + lamdaFileRDDCount);
 				Function<Tuple2<Text, Text>, Boolean> isModifiedAfterFilter = data -> {
 					String orcidId = data._1().toString();
 					String lastModifiedDate = data._2().toString();
 					parsedRecordsAcc.add(1);
-					if (isModified(orcidId, lastModifiedDate)) {
+					if (isModified(orcidId, lastModifiedDate, lastUpdate)) {
 						modifiedRecordsAcc.add(1);
 						return true;
 					}
@ -92,49 +101,42 @@ public class SparkDownloadOrcidAuthors {
 					final DownloadedRecordData downloaded = new DownloadedRecordData();
 					downloaded.setOrcidId(orcidId);
 					downloaded.setLastModifiedDate(lastModifiedDate);
-					try (CloseableHttpClient client = HttpClients.createDefault()) {
+					CloseableHttpClient client = HttpClients.createDefault();
-						HttpGet httpGet = new HttpGet("https://api.orcid.org/v3.0/" + orcidId + "/record");
+					HttpGet httpGet = new HttpGet("https://api.orcid.org/v3.0/" + orcidId + "/record");
-						httpGet.addHeader("Accept", "application/vnd.orcid+xml");
+					httpGet.addHeader("Accept", "application/vnd.orcid+xml");
-						httpGet.addHeader("Authorization", String.format("Bearer %s", token));
+					httpGet.addHeader("Authorization", String.format("Bearer %s", token));
-						long startReq = System.currentTimeMillis();
+					long startReq = System.currentTimeMillis();
-						CloseableHttpResponse response = client.execute(httpGet);
+					CloseableHttpResponse response = client.execute(httpGet);
-						long endReq = System.currentTimeMillis();
+					long endReq = System.currentTimeMillis();
-						long reqTime = endReq - startReq;
+					long reqTime = endReq - startReq;
-						if (reqTime < 1000) {
+					if (reqTime < 1000) {
-							Thread.sleep(1000 - reqTime);
+						Thread.sleep(1000 - reqTime);
 					}
 					int statusCode = response.getStatusLine().getStatusCode();
 					downloaded.setStatusCode(statusCode);
 					if (statusCode != 200) {
 						switch (statusCode) {
 							case 403:
 								errorHTTP403Acc.add(1);
 							case 404:
 								errorHTTP404Acc.add(1);
 							case 409:
 								errorHTTP409Acc.add(1);
 							case 503:
 								errorHTTP503Acc.add(1);
 							case 525:
 								errorHTTP525Acc.add(1);
 							default:
 								errorHTTPGenericAcc.add(1);
 						}
 						int statusCode = response.getStatusLine().getStatusCode();
 						downloaded.setStatusCode(statusCode);
 						if (statusCode != 200) {
 							switch (statusCode) {
 								case 403:
 									errorHTTP403Acc.add(1);
 								case 409:
 									errorHTTP409Acc.add(1);
 								case 503:
 									errorHTTP503Acc.add(1);
 									throw new RuntimeException("Orcid request rate limit reached (HTTP 503)");
 								case 525:
 									errorHTTP525Acc.add(1);
 								default:
 									errorHTTPGenericAcc.add(1);
 									logger
 										.info(
 											"Downloading " + orcidId + " status code: "
 												+ response.getStatusLine().getStatusCode());
 							}
 							return downloaded.toTuple2();
 						}
 						downloadedRecordsAcc.add(1);
 						downloaded
 							.setCompressedData(
 								ArgumentApplicationParser
 									.compressArgument(IOUtils.toString(response.getEntity().getContent())));
 					} catch (Throwable e) {
 						logger.info("Downloading " + orcidId, e.getMessage());
 						downloaded.setErrorMessage(e.getMessage());
 						return downloaded.toTuple2();
 					}
 					downloadedRecordsAcc.add(1);
 					downloaded
 						.setCompressedData(
 							ArgumentApplicationParser
 								.compressArgument(IOUtils.toString(response.getEntity().getContent())));
 					client.close();
 					return downloaded.toTuple2();
 				};
@ -142,10 +144,12 @@ public class SparkDownloadOrcidAuthors {
 				logger.info("Start execution ...");
 				JavaPairRDD<Text, Text> authorsModifiedRDD = lamdaFileRDD.filter(isModifiedAfterFilter);
-				logger.info("Authors modified count: " + authorsModifiedRDD.count());
+				long authorsModifiedCount = authorsModifiedRDD.count();
 				logger.info("Authors modified count: " + authorsModifiedCount);
 				logger.info("Start downloading ...");
 				authorsModifiedRDD
-					.repartition(10)
+					.repartition(100)
 					.map(downloadRecordFunction)
 					.mapToPair(t -> new Tuple2(new Text(t._1()), new Text(t._2())))
 					.saveAsNewAPIHadoopFile(
@ -154,10 +158,12 @@ public class SparkDownloadOrcidAuthors {
 						Text.class,
 						SequenceFileOutputFormat.class,
 						sc.hadoopConfiguration());
 				logger.info("parsedRecordsAcc: " + parsedRecordsAcc.value().toString());
 				logger.info("modifiedRecordsAcc: " + modifiedRecordsAcc.value().toString());
 				logger.info("downloadedRecordsAcc: " + downloadedRecordsAcc.value().toString());
 				logger.info("errorHTTP403Acc: " + errorHTTP403Acc.value().toString());
 				logger.info("errorHTTP404Acc: " + errorHTTP404Acc.value().toString());
 				logger.info("errorHTTP409Acc: " + errorHTTP409Acc.value().toString());
 				logger.info("errorHTTP503Acc: " + errorHTTP503Acc.value().toString());
 				logger.info("errorHTTP525Acc: " + errorHTTP525Acc.value().toString());
@ -166,18 +172,27 @@ public class SparkDownloadOrcidAuthors {
 	}
-	private static boolean isModified(String orcidId, String modifiedDate) {
+	public static boolean isModified(String orcidId, String modifiedDate, String lastUpdate) {
 		Date modifiedDateDt;
 		Date lastUpdateDt;
 		String lastUpdateRedux = "";
 		try {
 			if (modifiedDate.equals("last_modified")) {
 				return false;
 			}
 			if (modifiedDate.length() != 19) {
 				modifiedDate = modifiedDate.substring(0, 19);
 			}
 			if (lastUpdate.length() != 19) {
 				lastUpdateRedux = lastUpdate.substring(0, 19);
 			} else {
 				lastUpdateRedux = lastUpdate;
 			}
 			modifiedDateDt = new SimpleDateFormat(DATE_FORMAT).parse(modifiedDate);
-			lastUpdateDt = new SimpleDateFormat(DATE_FORMAT).parse(lastUpdate);
+			lastUpdateDt = new SimpleDateFormat(DATE_FORMAT).parse(lastUpdateRedux);
 		} catch (Exception e) {
-			logger.info("[" + orcidId + "] Parsing date: ", e.getMessage());
+			throw new RuntimeException("[" + orcidId + "] modifiedDate <" + modifiedDate + "> lastUpdate <" + lastUpdate
-			return true;
+				+ "> Parsing date: " + e.getMessage());
 		}
 		return modifiedDateDt.after(lastUpdateDt);
 	}
--- a/dhp-workflows/dhp-doiboost/src/main/java/eu/dnetlib/doiboost/orcid/SparkDownloadOrcidWorks.java
+++ b/dhp-workflows/dhp-doiboost/src/main/java/eu/dnetlib/doiboost/orcid/SparkDownloadOrcidWorks.java
@ -0,0 +1,251 @@
 package eu.dnetlib.doiboost.orcid;
 import static eu.dnetlib.dhp.common.SparkSessionSupport.runWithSparkSession;
 import java.io.IOException;
 import java.text.SimpleDateFormat;
 import java.time.LocalDate;
 import java.time.format.DateTimeFormatter;
 import java.util.*;
 import org.apache.commons.io.IOUtils;
 import org.apache.commons.lang3.StringUtils;
 import org.apache.hadoop.io.Text;
 import org.apache.hadoop.io.compress.GzipCodec;
 import org.apache.hadoop.mapreduce.lib.output.SequenceFileOutputFormat;
 import org.apache.http.client.methods.CloseableHttpResponse;
 import org.apache.http.client.methods.HttpGet;
 import org.apache.http.impl.client.CloseableHttpClient;
 import org.apache.http.impl.client.HttpClients;
 import org.apache.spark.SparkConf;
 import org.apache.spark.api.java.JavaPairRDD;
 import org.apache.spark.api.java.JavaSparkContext;
 import org.apache.spark.api.java.function.FlatMapFunction;
 import org.apache.spark.api.java.function.Function;
 import org.apache.spark.util.LongAccumulator;
 import org.slf4j.Logger;
 import org.slf4j.LoggerFactory;
 import com.google.gson.JsonElement;
 import com.google.gson.JsonParser;
 import eu.dnetlib.dhp.application.ArgumentApplicationParser;
 import eu.dnetlib.doiboost.orcid.model.DownloadedRecordData;
 import eu.dnetlib.doiboost.orcid.util.HDFSUtil;
 import eu.dnetlib.doiboost.orcid.xml.XMLRecordParser;
 import scala.Tuple2;
 public class SparkDownloadOrcidWorks {
 	static Logger logger = LoggerFactory.getLogger(SparkDownloadOrcidWorks.class);
 	public static final String LAMBDA_FILE_DATE_FORMAT = "yyyy-MM-dd HH:mm:ss";
 	public static final DateTimeFormatter LAMBDA_FILE_DATE_FORMATTER = DateTimeFormatter
 		.ofPattern(LAMBDA_FILE_DATE_FORMAT);
 	public static final String ORCID_XML_DATETIME_FORMAT = "yyyy-MM-dd'T'HH:mm:ss.SSS'Z'";
 	public static final DateTimeFormatter ORCID_XML_DATETIMEFORMATTER = DateTimeFormatter
 		.ofPattern(ORCID_XML_DATETIME_FORMAT);
 	public static void main(String[] args) throws IOException, Exception {
 		final ArgumentApplicationParser parser = new ArgumentApplicationParser(
 			IOUtils
 				.toString(
 					SparkDownloadOrcidWorks.class
 						.getResourceAsStream(
 							"/eu/dnetlib/dhp/doiboost/download_orcid_data.json")));
 		parser.parseArgument(args);
 		Boolean isSparkSessionManaged = Optional
 			.ofNullable(parser.get("isSparkSessionManaged"))
 			.map(Boolean::valueOf)
 			.orElse(Boolean.TRUE);
 		logger.info("isSparkSessionManaged: {}", isSparkSessionManaged);
 		final String workingPath = parser.get("workingPath");
 		logger.info("workingPath: ", workingPath);
 		final String outputPath = parser.get("outputPath");
 		final String token = parser.get("token");
 		final String hdfsServerUri = parser.get("hdfsServerUri");
 		SparkConf conf = new SparkConf();
 		runWithSparkSession(
 			conf,
 			isSparkSessionManaged,
 			spark -> {
 				final String lastUpdateValue = HDFSUtil.readFromTextFile(hdfsServerUri, workingPath, "last_update.txt");
 				logger.info("lastUpdateValue: ", lastUpdateValue);
 				JavaSparkContext sc = JavaSparkContext.fromSparkContext(spark.sparkContext());
 				LongAccumulator updatedAuthorsAcc = spark.sparkContext().longAccumulator("updated_authors");
 				LongAccumulator parsedAuthorsAcc = spark.sparkContext().longAccumulator("parsed_authors");
 				LongAccumulator parsedWorksAcc = spark.sparkContext().longAccumulator("parsed_works");
 				LongAccumulator modifiedWorksAcc = spark.sparkContext().longAccumulator("modified_works");
 				LongAccumulator maxModifiedWorksLimitAcc = spark
 					.sparkContext()
 					.longAccumulator("max_modified_works_limit");
 				LongAccumulator errorCodeFoundAcc = spark.sparkContext().longAccumulator("error_code_found");
 				LongAccumulator errorLoadingJsonFoundAcc = spark
 					.sparkContext()
 					.longAccumulator("error_loading_json_found");
 				LongAccumulator errorLoadingXMLFoundAcc = spark
 					.sparkContext()
 					.longAccumulator("error_loading_xml_found");
 				LongAccumulator errorParsingXMLFoundAcc = spark
 					.sparkContext()
 					.longAccumulator("error_parsing_xml_found");
 				LongAccumulator downloadedRecordsAcc = spark.sparkContext().longAccumulator("downloaded_records");
 				LongAccumulator errorHTTP403Acc = spark.sparkContext().longAccumulator("error_HTTP_403");
 				LongAccumulator errorHTTP404Acc = spark.sparkContext().longAccumulator("error_HTTP_404");
 				LongAccumulator errorHTTP409Acc = spark.sparkContext().longAccumulator("error_HTTP_409");
 				LongAccumulator errorHTTP503Acc = spark.sparkContext().longAccumulator("error_HTTP_503");
 				LongAccumulator errorHTTP525Acc = spark.sparkContext().longAccumulator("error_HTTP_525");
 				LongAccumulator errorHTTPGenericAcc = spark.sparkContext().longAccumulator("error_HTTP_Generic");
 				JavaPairRDD<Text, Text> updatedAuthorsRDD = sc
 					.sequenceFile(workingPath + "downloads/updated_authors/*", Text.class, Text.class);
 				updatedAuthorsAcc.setValue(updatedAuthorsRDD.count());
 				FlatMapFunction<Tuple2<Text, Text>, String> retrieveWorkUrlFunction = data -> {
 					String orcidId = data._1().toString();
 					String jsonData = data._2().toString();
 					List<String> workIds = new ArrayList<>();
 					Map<String, String> workIdLastModifiedDate = new HashMap<>();
 					JsonElement jElement = new JsonParser().parse(jsonData);
 					String statusCode = getJsonValue(jElement, "statusCode");
 					if (statusCode.equals("200")) {
 						String compressedData = getJsonValue(jElement, "compressedData");
 						if (StringUtils.isEmpty(compressedData)) {
 							errorLoadingJsonFoundAcc.add(1);
 						} else {
 							String authorSummary = ArgumentApplicationParser.decompressValue(compressedData);
 							if (StringUtils.isEmpty(authorSummary)) {
 								errorLoadingXMLFoundAcc.add(1);
 							} else {
 								try {
 									workIdLastModifiedDate = XMLRecordParser
 										.retrieveWorkIdLastModifiedDate(authorSummary.getBytes());
 								} catch (Exception e) {
 									logger.error("parsing " + orcidId + " [" + jsonData + "]", e);
 									errorParsingXMLFoundAcc.add(1);
 								}
 							}
 						}
 					} else {
 						errorCodeFoundAcc.add(1);
 					}
 					parsedAuthorsAcc.add(1);
 					workIdLastModifiedDate.forEach((k, v) -> {
 						parsedWorksAcc.add(1);
 						if (isModified(orcidId, v, lastUpdateValue)) {
 							modifiedWorksAcc.add(1);
 							workIds.add(orcidId.concat("/work/").concat(k));
 						}
 					});
 					if (workIdLastModifiedDate.size() > 50) {
 						maxModifiedWorksLimitAcc.add(1);
 					}
 					return workIds.iterator();
 				};
 				Function<String, Tuple2<String, String>> downloadWorkFunction = data -> {
 					String relativeWorkUrl = data;
 					String orcidId = relativeWorkUrl.split("/")[0];
 					final DownloadedRecordData downloaded = new DownloadedRecordData();
 					downloaded.setOrcidId(orcidId);
 					downloaded.setLastModifiedDate(lastUpdateValue);
 					CloseableHttpClient client = HttpClients.createDefault();
 					HttpGet httpGet = new HttpGet("https://api.orcid.org/v3.0/" + relativeWorkUrl);
 					httpGet.addHeader("Accept", "application/vnd.orcid+xml");
 					httpGet.addHeader("Authorization", String.format("Bearer %s", token));
 					long startReq = System.currentTimeMillis();
 					CloseableHttpResponse response = client.execute(httpGet);
 					long endReq = System.currentTimeMillis();
 					long reqTime = endReq - startReq;
 					if (reqTime < 1000) {
 						Thread.sleep(1000 - reqTime);
 					}
 					int statusCode = response.getStatusLine().getStatusCode();
 					downloaded.setStatusCode(statusCode);
 					if (statusCode != 200) {
 						switch (statusCode) {
 							case 403:
 								errorHTTP403Acc.add(1);
 							case 404:
 								errorHTTP404Acc.add(1);
 							case 409:
 								errorHTTP409Acc.add(1);
 							case 503:
 								errorHTTP503Acc.add(1);
 							case 525:
 								errorHTTP525Acc.add(1);
 							default:
 								errorHTTPGenericAcc.add(1);
 								logger
 									.info(
 										"Downloading " + orcidId + " status code: "
 											+ response.getStatusLine().getStatusCode());
 						}
 						return downloaded.toTuple2();
 					}
 					downloadedRecordsAcc.add(1);
 					downloaded
 						.setCompressedData(
 							ArgumentApplicationParser
 								.compressArgument(IOUtils.toString(response.getEntity().getContent())));
 					client.close();
 					return downloaded.toTuple2();
 				};
 				updatedAuthorsRDD
 					.flatMap(retrieveWorkUrlFunction)
 					.repartition(100)
 					.map(downloadWorkFunction)
 					.mapToPair(t -> new Tuple2(new Text(t._1()), new Text(t._2())))
 					.saveAsTextFile(workingPath.concat(outputPath), GzipCodec.class);
 				logger.info("updatedAuthorsAcc: " + updatedAuthorsAcc.value().toString());
 				logger.info("parsedAuthorsAcc: " + parsedAuthorsAcc.value().toString());
 				logger.info("parsedWorksAcc: " + parsedWorksAcc.value().toString());
 				logger.info("modifiedWorksAcc: " + modifiedWorksAcc.value().toString());
 				logger.info("maxModifiedWorksLimitAcc: " + maxModifiedWorksLimitAcc.value().toString());
 				logger.info("errorCodeFoundAcc: " + errorCodeFoundAcc.value().toString());
 				logger.info("errorLoadingJsonFoundAcc: " + errorLoadingJsonFoundAcc.value().toString());
 				logger.info("errorLoadingXMLFoundAcc: " + errorLoadingXMLFoundAcc.value().toString());
 				logger.info("errorParsingXMLFoundAcc: " + errorParsingXMLFoundAcc.value().toString());
 				logger.info("downloadedRecordsAcc: " + downloadedRecordsAcc.value().toString());
 				logger.info("errorHTTP403Acc: " + errorHTTP403Acc.value().toString());
 				logger.info("errorHTTP409Acc: " + errorHTTP409Acc.value().toString());
 				logger.info("errorHTTP503Acc: " + errorHTTP503Acc.value().toString());
 				logger.info("errorHTTP525Acc: " + errorHTTP525Acc.value().toString());
 				logger.info("errorHTTPGenericAcc: " + errorHTTPGenericAcc.value().toString());
 			});
 	}
 	public static boolean isModified(String orcidId, String modifiedDateValue, String lastUpdateValue) {
 		LocalDate modifiedDate = null;
 		LocalDate lastUpdate = null;
 		try {
 			modifiedDate = LocalDate.parse(modifiedDateValue, SparkDownloadOrcidWorks.ORCID_XML_DATETIMEFORMATTER);
 			if (lastUpdateValue.length() != 19) {
 				lastUpdateValue = lastUpdateValue.substring(0, 19);
 			}
 			lastUpdate = LocalDate
 				.parse(lastUpdateValue, SparkDownloadOrcidWorks.LAMBDA_FILE_DATE_FORMATTER);
 		} catch (Exception e) {
 			logger.info("[" + orcidId + "] Parsing date: ", e.getMessage());
 			throw new RuntimeException("[" + orcidId + "] Parsing date: " + e.getMessage());
 		}
 		return modifiedDate.isAfter(lastUpdate);
 	}
 	private static String getJsonValue(JsonElement jElement, String property) {
 		if (jElement.getAsJsonObject().has(property)) {
 			JsonElement name = null;
 			name = jElement.getAsJsonObject().get(property);
 			if (name != null && !name.isJsonNull()) {
 				return name.getAsString();
 			}
 		}
 		return new String("");
 	}
 }
--- a/dhp-workflows/dhp-doiboost/src/main/java/eu/dnetlib/doiboost/orcid/SparkGenLastModifiedSeq.java
+++ b/dhp-workflows/dhp-doiboost/src/main/java/eu/dnetlib/doiboost/orcid/SparkGenLastModifiedSeq.java
@ -3,9 +3,7 @@ package eu.dnetlib.doiboost.orcid;
 import static eu.dnetlib.dhp.common.SparkSessionSupport.runWithSparkSession;
-import java.io.BufferedReader;
+import java.io.*;
 import java.io.IOException;
 import java.io.InputStreamReader;
 import java.net.URI;
 import java.util.Arrays;
 import java.util.List;
@ -17,6 +15,7 @@ import org.apache.commons.compress.compressors.gzip.GzipCompressorInputStream;
 import org.apache.commons.io.IOUtils;
 import org.apache.hadoop.conf.Configuration;
 import org.apache.hadoop.fs.FSDataInputStream;
 import org.apache.hadoop.fs.FSDataOutputStream;
 import org.apache.hadoop.fs.FileSystem;
 import org.apache.hadoop.fs.Path;
 import org.apache.hadoop.io.SequenceFile;
@ -26,6 +25,7 @@ import org.apache.spark.SparkConf;
 import org.mortbay.log.Log;
 import eu.dnetlib.dhp.application.ArgumentApplicationParser;
 import eu.dnetlib.doiboost.orcid.util.HDFSUtil;
 public class SparkGenLastModifiedSeq {
 	private static String hdfsServerUri;
@ -50,6 +50,7 @@ public class SparkGenLastModifiedSeq {
 		outputPath = parser.get("outputPath");
 		lambdaFileName = parser.get("lambdaFileName");
 		String lambdaFileUri = hdfsServerUri.concat(workingPath).concat(lambdaFileName);
 		String lastModifiedDateFromLambdaFileUri = "last_modified_date_from_lambda_file.txt";
 		SparkConf sparkConf = new SparkConf();
 		runWithSparkSession(
@ -57,6 +58,7 @@ public class SparkGenLastModifiedSeq {
 			isSparkSessionManaged,
 			spark -> {
 				int rowsNum = 0;
 				String lastModifiedAuthorDate = "";
 				Path output = new Path(
 					hdfsServerUri
 						.concat(workingPath)
@ -89,10 +91,17 @@ public class SparkGenLastModifiedSeq {
 								final Text value = new Text(recordInfo.get(3));
 								writer.append(key, value);
 								rowsNum++;
 								if (rowsNum == 2) {
 									lastModifiedAuthorDate = value.toString();
 								}
 							}
 						}
 					}
 				}
 				HDFSUtil
 					.writeToTextFile(
 						hdfsServerUri, workingPath, lastModifiedDateFromLambdaFileUri, lastModifiedAuthorDate);
 				Log.info("Saved rows from lamda csv tar file: " + rowsNum);
 			});
 	}
--- a/dhp-workflows/dhp-doiboost/src/main/java/eu/dnetlib/doiboost/orcid/SparkGenerateDoiAuthorList.java
+++ b/dhp-workflows/dhp-doiboost/src/main/java/eu/dnetlib/doiboost/orcid/SparkGenerateDoiAuthorList.java
@ -4,15 +4,13 @@ package eu.dnetlib.doiboost.orcid;
 import static eu.dnetlib.dhp.common.SparkSessionSupport.runWithSparkSession;
 import java.io.IOException;
-import java.util.Arrays;
+import java.util.*;
 import java.util.List;
 import java.util.Objects;
 import java.util.Optional;
 import java.util.stream.Collectors;
 import java.util.stream.Stream;
 import org.apache.commons.io.IOUtils;
 import org.apache.hadoop.io.Text;
 import org.apache.hadoop.io.compress.GzipCodec;
 import org.apache.spark.SparkConf;
 import org.apache.spark.api.java.JavaPairRDD;
 import org.apache.spark.api.java.JavaRDD;
@ -25,13 +23,15 @@ import org.slf4j.Logger;
 import org.slf4j.LoggerFactory;
 import com.esotericsoftware.minlog.Log;
 import com.fasterxml.jackson.databind.ObjectMapper;
 import com.google.gson.JsonElement;
 import com.google.gson.JsonParser;
 import eu.dnetlib.dhp.application.ArgumentApplicationParser;
 import eu.dnetlib.dhp.schema.orcid.AuthorData;
 import eu.dnetlib.dhp.schema.orcid.OrcidDOI;
 import eu.dnetlib.doiboost.orcid.model.WorkData;
 import eu.dnetlib.doiboost.orcid.xml.XMLRecordParser;
 import eu.dnetlib.doiboost.orcidnodoi.json.JsonWriter;
 import scala.Tuple2;
 public class SparkGenerateDoiAuthorList {
@ -56,6 +56,10 @@ public class SparkGenerateDoiAuthorList {
 		logger.info("workingPath: ", workingPath);
 		final String outputDoiAuthorListPath = parser.get("outputDoiAuthorListPath");
 		logger.info("outputDoiAuthorListPath: ", outputDoiAuthorListPath);
 		final String authorsPath = parser.get("authorsPath");
 		logger.info("authorsPath: ", authorsPath);
 		final String xmlWorksPath = parser.get("xmlWorksPath");
 		logger.info("xmlWorksPath: ", xmlWorksPath);
 		SparkConf conf = new SparkConf();
 		runWithSparkSession(
@ -65,17 +69,21 @@ public class SparkGenerateDoiAuthorList {
 				JavaSparkContext sc = JavaSparkContext.fromSparkContext(spark.sparkContext());
 				JavaPairRDD<Text, Text> summariesRDD = sc
-					.sequenceFile(workingPath + "../orcid_summaries/output/authors.seq", Text.class, Text.class);
+					.sequenceFile(workingPath.concat(authorsPath), Text.class, Text.class);
 				Dataset<AuthorData> summariesDataset = spark
 					.createDataset(
 						summariesRDD.map(seq -> loadAuthorFromJson(seq._1(), seq._2())).rdd(),
 						Encoders.bean(AuthorData.class));
-				JavaPairRDD<Text, Text> activitiesRDD = sc
+				JavaPairRDD<Text, Text> xmlWorksRDD = sc
-					.sequenceFile(workingPath + "/output/*.seq", Text.class, Text.class);
+					.sequenceFile(workingPath.concat(xmlWorksPath), Text.class, Text.class);
 				Dataset<WorkData> activitiesDataset = spark
 					.createDataset(
-						activitiesRDD.map(seq -> loadWorkFromJson(seq._1(), seq._2())).rdd(),
+						xmlWorksRDD
 							.map(seq -> XMLRecordParser.VTDParseWorkData(seq._2().toString().getBytes()))
 							.filter(work -> work != null && work.getErrorCode() == null && work.isDoiFound())
 							.rdd(),
 						Encoders.bean(WorkData.class));
 				Function<Tuple2<String, AuthorData>, Tuple2<String, List<AuthorData>>> toAuthorListFunction = data -> {
@ -135,13 +143,19 @@ public class SparkGenerateDoiAuthorList {
 						}
 						return null;
 					})
-					.mapToPair(
+					.mapToPair(s -> {
-						s -> {
+						List<AuthorData> authorList = s._2();
-							ObjectMapper mapper = new ObjectMapper();
+						Set<String> oidsAlreadySeen = new HashSet<>();
-							return new Tuple2<>(s._1(), mapper.writeValueAsString(s._2()));
+						authorList.removeIf(a -> !oidsAlreadySeen.add(a.getOid()));
-						})
+						return new Tuple2<>(s._1(), authorList);
-					.repartition(10)
+					})
-					.saveAsTextFile(workingPath + outputDoiAuthorListPath);
+					.map(s -> {
 						OrcidDOI orcidDOI = new OrcidDOI();
 						orcidDOI.setDoi(s._1());
 						orcidDOI.setAuthors(s._2());
 						return JsonWriter.create(orcidDOI);
 					})
 					.saveAsTextFile(workingPath + outputDoiAuthorListPath, GzipCodec.class);
 			});
 	}
--- a/dhp-workflows/dhp-doiboost/src/main/java/eu/dnetlib/doiboost/orcid/SparkUpdateOrcidAuthors.java
+++ b/dhp-workflows/dhp-doiboost/src/main/java/eu/dnetlib/doiboost/orcid/SparkUpdateOrcidAuthors.java
@ -0,0 +1,242 @@
 package eu.dnetlib.doiboost.orcid;
 import static eu.dnetlib.dhp.common.SparkSessionSupport.runWithSparkSession;
 import static org.apache.spark.sql.functions.*;
 import java.io.IOException;
 import java.util.List;
 import java.util.Objects;
 import java.util.Optional;
 import org.apache.commons.io.IOUtils;
 import org.apache.commons.lang3.StringUtils;
 import org.apache.hadoop.io.Text;
 import org.apache.hadoop.io.compress.GzipCodec;
 import org.apache.spark.SparkConf;
 import org.apache.spark.api.java.JavaRDD;
 import org.apache.spark.api.java.JavaSparkContext;
 import org.apache.spark.api.java.function.Function;
 import org.apache.spark.sql.Dataset;
 import org.apache.spark.sql.Encoders;
 import org.apache.spark.util.LongAccumulator;
 import org.slf4j.Logger;
 import org.slf4j.LoggerFactory;
 import com.fasterxml.jackson.annotation.JsonInclude;
 import com.fasterxml.jackson.databind.ObjectMapper;
 import com.google.gson.JsonElement;
 import com.google.gson.JsonParser;
 import eu.dnetlib.dhp.application.ArgumentApplicationParser;
 import eu.dnetlib.dhp.schema.orcid.AuthorSummary;
 import eu.dnetlib.doiboost.orcid.xml.XMLRecordParser;
 import scala.Tuple2;
 public class SparkUpdateOrcidAuthors {
 	private static final ObjectMapper OBJECT_MAPPER = new ObjectMapper()
 		.setSerializationInclusion(JsonInclude.Include.NON_NULL);
 	public static void main(String[] args) throws IOException, Exception {
 		Logger logger = LoggerFactory.getLogger(SparkUpdateOrcidAuthors.class);
 		final ArgumentApplicationParser parser = new ArgumentApplicationParser(
 			IOUtils
 				.toString(
 					SparkUpdateOrcidAuthors.class
 						.getResourceAsStream(
 							"/eu/dnetlib/dhp/doiboost/download_orcid_data.json")));
 		parser.parseArgument(args);
 		Boolean isSparkSessionManaged = Optional
 			.ofNullable(parser.get("isSparkSessionManaged"))
 			.map(Boolean::valueOf)
 			.orElse(Boolean.TRUE);
 		final String workingPath = parser.get("workingPath");
 //		final String outputPath = parser.get("outputPath");
 		SparkConf conf = new SparkConf();
 		runWithSparkSession(
 			conf,
 			isSparkSessionManaged,
 			spark -> {
 				JavaSparkContext sc = JavaSparkContext.fromSparkContext(spark.sparkContext());
 				LongAccumulator oldAuthorsFoundAcc = spark
 					.sparkContext()
 					.longAccumulator("old_authors_found");
 				LongAccumulator updatedAuthorsFoundAcc = spark
 					.sparkContext()
 					.longAccumulator("updated_authors_found");
 				LongAccumulator newAuthorsFoundAcc = spark
 					.sparkContext()
 					.longAccumulator("new_authors_found");
 				LongAccumulator errorCodeAuthorsFoundAcc = spark
 					.sparkContext()
 					.longAccumulator("error_code_authors_found");
 				LongAccumulator errorLoadingAuthorsJsonFoundAcc = spark
 					.sparkContext()
 					.longAccumulator("error_loading_authors_json_found");
 				LongAccumulator errorParsingAuthorsXMLFoundAcc = spark
 					.sparkContext()
 					.longAccumulator("error_parsing_authors_xml_found");
 				Function<Tuple2<Text, Text>, AuthorSummary> retrieveAuthorSummaryFunction = data -> {
 					AuthorSummary authorSummary = new AuthorSummary();
 					String orcidId = data._1().toString();
 					String jsonData = data._2().toString();
 					JsonElement jElement = new JsonParser().parse(jsonData);
 					String statusCode = getJsonValue(jElement, "statusCode");
 					String downloadDate = getJsonValue(jElement, "lastModifiedDate");
 					if (statusCode.equals("200")) {
 						String compressedData = getJsonValue(jElement, "compressedData");
 						if (StringUtils.isEmpty(compressedData)) {
 							errorLoadingAuthorsJsonFoundAcc.add(1);
 						} else {
 							String xmlAuthor = ArgumentApplicationParser.decompressValue(compressedData);
 							try {
 								authorSummary = XMLRecordParser
 									.VTDParseAuthorSummary(xmlAuthor.getBytes());
 								authorSummary.setStatusCode(statusCode);
 								authorSummary.setDownloadDate(Long.toString(System.currentTimeMillis()));
 								authorSummary.setBase64CompressData(compressedData);
 								return authorSummary;
 							} catch (Exception e) {
 								logger.error("parsing xml " + orcidId + " [" + jsonData + "]", e);
 								errorParsingAuthorsXMLFoundAcc.add(1);
 							}
 						}
 					} else {
 						authorSummary.setStatusCode(statusCode);
 						authorSummary.setDownloadDate(Long.toString(System.currentTimeMillis()));
 						errorCodeAuthorsFoundAcc.add(1);
 					}
 					return authorSummary;
 				};
 				Dataset<AuthorSummary> downloadedAuthorSummaryDS = spark
 					.createDataset(
 						sc
 							.sequenceFile(workingPath + "downloads/updated_authors/*", Text.class, Text.class)
 							.map(retrieveAuthorSummaryFunction)
 							.rdd(),
 						Encoders.bean(AuthorSummary.class));
 				Dataset<AuthorSummary> currentAuthorSummaryDS = spark
 					.createDataset(
 						sc
 							.textFile(workingPath.concat("orcid_dataset/authors/*"))
 							.map(item -> OBJECT_MAPPER.readValue(item, AuthorSummary.class))
 							.rdd(),
 						Encoders.bean(AuthorSummary.class));
 				Dataset<AuthorSummary> mergedAuthorSummaryDS = currentAuthorSummaryDS
 					.joinWith(
 						downloadedAuthorSummaryDS,
 						currentAuthorSummaryDS
 							.col("authorData.oid")
 							.equalTo(downloadedAuthorSummaryDS.col("authorData.oid")),
 						"full_outer")
 					.map(value -> {
 						Optional<AuthorSummary> opCurrent = Optional.ofNullable(value._1());
 						Optional<AuthorSummary> opDownloaded = Optional.ofNullable(value._2());
 						if (!opCurrent.isPresent()) {
 							newAuthorsFoundAcc.add(1);
 							return opDownloaded.get();
 						}
 						if (!opDownloaded.isPresent()) {
 							oldAuthorsFoundAcc.add(1);
 							return opCurrent.get();
 						}
 						if (opCurrent.isPresent() && opDownloaded.isPresent()) {
 							updatedAuthorsFoundAcc.add(1);
 							return opDownloaded.get();
 						}
 						return null;
 					},
 						Encoders.bean(AuthorSummary.class))
 					.filter(Objects::nonNull);
 				long mergedCount = mergedAuthorSummaryDS.count();
 				Dataset<AuthorSummary> base64DedupedDS = mergedAuthorSummaryDS.dropDuplicates("base64CompressData");
 				List<String> dupOids = base64DedupedDS
 					.groupBy("authorData.oid")
 					.agg(count("authorData.oid").alias("oidOccurrenceCount"))
 					.where("oidOccurrenceCount > 1")
 					.select("oid")
 					.toJavaRDD()
 					.map(row -> row.get(0).toString())
 					.collect();
 				JavaRDD<AuthorSummary> dupAuthors = base64DedupedDS
 					.toJavaRDD()
 					.filter(
 						authorSummary -> (Objects.nonNull(authorSummary.getAuthorData())
 							&& Objects.nonNull(authorSummary.getAuthorData().getOid())))
 					.filter(authorSummary -> dupOids.contains(authorSummary.getAuthorData().getOid()));
 				Dataset<AuthorSummary> dupAuthorSummaryDS = spark
 					.createDataset(
 						dupAuthors.rdd(),
 						Encoders.bean(AuthorSummary.class));
 				List<Tuple2<String, String>> lastModifiedAuthors = dupAuthorSummaryDS
 					.groupBy("authorData.oid")
 					.agg(array_max(collect_list("downloadDate")))
 					.map(
 						row -> new Tuple2<>(row.get(0).toString(), row.get(1).toString()),
 						Encoders.tuple(Encoders.STRING(), Encoders.STRING()))
 					.toJavaRDD()
 					.collect();
 				JavaRDD<AuthorSummary> lastDownloadedAuthors = base64DedupedDS
 					.toJavaRDD()
 					.filter(
 						authorSummary -> (Objects.nonNull(authorSummary.getAuthorData())
 							&& Objects.nonNull(authorSummary.getAuthorData().getOid())))
 					.filter(authorSummary -> {
 						boolean oidFound = lastModifiedAuthors
 							.stream()
 							.filter(a -> a._1().equals(authorSummary.getAuthorData().getOid()))
 							.count() == 1;
 						boolean tsFound = lastModifiedAuthors
 							.stream()
 							.filter(
 								a -> a._1().equals(authorSummary.getAuthorData().getOid()) &&
 									a._2().equals(authorSummary.getDownloadDate()))
 							.count() == 1;
 						return (oidFound && tsFound) || (!oidFound);
 					});
 				Dataset<AuthorSummary> cleanedDS = spark
 					.createDataset(
 						lastDownloadedAuthors.rdd(),
 						Encoders.bean(AuthorSummary.class))
 					.dropDuplicates("downloadDate", "authorData");
 				cleanedDS
 					.toJavaRDD()
 					.map(authorSummary -> OBJECT_MAPPER.writeValueAsString(authorSummary))
 					.saveAsTextFile(workingPath.concat("orcid_dataset/new_authors"), GzipCodec.class);
 				long cleanedDSCount = cleanedDS.count();
 				logger.info("report_oldAuthorsFoundAcc: " + oldAuthorsFoundAcc.value().toString());
 				logger.info("report_newAuthorsFoundAcc: " + newAuthorsFoundAcc.value().toString());
 				logger.info("report_updatedAuthorsFoundAcc: " + updatedAuthorsFoundAcc.value().toString());
 				logger.info("report_errorCodeFoundAcc: " + errorCodeAuthorsFoundAcc.value().toString());
 				logger.info("report_errorLoadingJsonFoundAcc: " + errorLoadingAuthorsJsonFoundAcc.value().toString());
 				logger.info("report_errorParsingXMLFoundAcc: " + errorParsingAuthorsXMLFoundAcc.value().toString());
 				logger.info("report_merged_count: " + mergedCount);
 				logger.info("report_cleaned_count: " + cleanedDSCount);
 			});
 	}
 	private static String getJsonValue(JsonElement jElement, String property) {
 		if (jElement.getAsJsonObject().has(property)) {
 			JsonElement name = null;
 			name = jElement.getAsJsonObject().get(property);
 			if (name != null && !name.isJsonNull()) {
 				return name.getAsString();
 			}
 		}
 		return "";
 	}
 }
--- a/dhp-workflows/dhp-doiboost/src/main/java/eu/dnetlib/doiboost/orcid/SparkUpdateOrcidWorks.java
+++ b/dhp-workflows/dhp-doiboost/src/main/java/eu/dnetlib/doiboost/orcid/SparkUpdateOrcidWorks.java
@ -0,0 +1,186 @@
 package eu.dnetlib.doiboost.orcid;
 import static eu.dnetlib.dhp.common.SparkSessionSupport.runWithSparkSession;
 import java.io.IOException;
 import java.util.Objects;
 import java.util.Optional;
 import org.apache.commons.io.IOUtils;
 import org.apache.commons.lang3.StringUtils;
 import org.apache.hadoop.io.compress.GzipCodec;
 import org.apache.spark.SparkConf;
 import org.apache.spark.api.java.JavaSparkContext;
 import org.apache.spark.api.java.function.Function;
 import org.apache.spark.sql.Dataset;
 import org.apache.spark.sql.Encoders;
 import org.apache.spark.util.LongAccumulator;
 import org.slf4j.Logger;
 import org.slf4j.LoggerFactory;
 import com.fasterxml.jackson.annotation.JsonInclude;
 import com.fasterxml.jackson.databind.ObjectMapper;
 import com.google.gson.JsonElement;
 import com.google.gson.JsonParser;
 import eu.dnetlib.dhp.application.ArgumentApplicationParser;
 import eu.dnetlib.dhp.schema.orcid.Work;
 import eu.dnetlib.dhp.schema.orcid.WorkDetail;
 import eu.dnetlib.doiboost.orcid.util.HDFSUtil;
 import eu.dnetlib.doiboost.orcidnodoi.xml.XMLRecordParserNoDoi;
 public class SparkUpdateOrcidWorks {
 	private static final ObjectMapper OBJECT_MAPPER = new ObjectMapper()
 		.setSerializationInclusion(JsonInclude.Include.NON_NULL);
 	public static void main(String[] args) throws IOException, Exception {
 		Logger logger = LoggerFactory.getLogger(SparkUpdateOrcidWorks.class);
 		final ArgumentApplicationParser parser = new ArgumentApplicationParser(
 			IOUtils
 				.toString(
 					SparkUpdateOrcidWorks.class
 						.getResourceAsStream(
 							"/eu/dnetlib/dhp/doiboost/download_orcid_data.json")));
 		parser.parseArgument(args);
 		Boolean isSparkSessionManaged = Optional
 			.ofNullable(parser.get("isSparkSessionManaged"))
 			.map(Boolean::valueOf)
 			.orElse(Boolean.TRUE);
 		final String workingPath = parser.get("workingPath");
 		final String hdfsServerUri = parser.get("hdfsServerUri");
 		SparkConf conf = new SparkConf();
 		runWithSparkSession(
 			conf,
 			isSparkSessionManaged,
 			spark -> {
 				JavaSparkContext sc = JavaSparkContext.fromSparkContext(spark.sparkContext());
 				LongAccumulator oldWorksFoundAcc = spark
 					.sparkContext()
 					.longAccumulator("old_works_found");
 				LongAccumulator updatedWorksFoundAcc = spark
 					.sparkContext()
 					.longAccumulator("updated_works_found");
 				LongAccumulator newWorksFoundAcc = spark
 					.sparkContext()
 					.longAccumulator("new_works_found");
 				LongAccumulator errorCodeWorksFoundAcc = spark
 					.sparkContext()
 					.longAccumulator("error_code_works_found");
 				LongAccumulator errorLoadingWorksJsonFoundAcc = spark
 					.sparkContext()
 					.longAccumulator("error_loading_works_json_found");
 				LongAccumulator errorParsingWorksXMLFoundAcc = spark
 					.sparkContext()
 					.longAccumulator("error_parsing_works_xml_found");
 				Function<String, Work> retrieveWorkFunction = jsonData -> {
 					Work work = new Work();
 					JsonElement jElement = new JsonParser().parse(jsonData);
 					String statusCode = getJsonValue(jElement, "statusCode");
 					work.setStatusCode(statusCode);
 					String downloadDate = getJsonValue(jElement, "lastModifiedDate");
 					work.setDownloadDate(Long.toString(System.currentTimeMillis()));
 					if (statusCode.equals("200")) {
 						String compressedData = getJsonValue(jElement, "compressedData");
 						if (StringUtils.isEmpty(compressedData)) {
 							errorLoadingWorksJsonFoundAcc.add(1);
 						} else {
 							String xmlWork = ArgumentApplicationParser.decompressValue(compressedData);
 							try {
 								WorkDetail workDetail = XMLRecordParserNoDoi
 									.VTDParseWorkData(xmlWork.getBytes());
 								work.setWorkDetail(workDetail);
 								work.setBase64CompressData(compressedData);
 								return work;
 							} catch (Exception e) {
 								logger.error("parsing xml [" + jsonData + "]", e);
 								errorParsingWorksXMLFoundAcc.add(1);
 							}
 						}
 					} else {
 						errorCodeWorksFoundAcc.add(1);
 					}
 					return work;
 				};
 				Dataset<Work> downloadedWorksDS = spark
 					.createDataset(
 						sc
 							.textFile(workingPath + "downloads/updated_works/*")
 							.map(s -> {
 								return s.substring(21, s.length() - 1);
 							})
 							.map(retrieveWorkFunction)
 							.rdd(),
 						Encoders.bean(Work.class));
 				Dataset<Work> currentWorksDS = spark
 					.createDataset(
 						sc
 							.textFile(workingPath.concat("orcid_dataset/works/*"))
 							.map(item -> OBJECT_MAPPER.readValue(item, Work.class))
 							.rdd(),
 						Encoders.bean(Work.class));
 				currentWorksDS
 					.joinWith(
 						downloadedWorksDS,
 						currentWorksDS
 							.col("workDetail.id")
 							.equalTo(downloadedWorksDS.col("workDetail.id"))
 							.and(
 								currentWorksDS
 									.col("workDetail.oid")
 									.equalTo(downloadedWorksDS.col("workDetail.oid"))),
 						"full_outer")
 					.map(value -> {
 						Optional<Work> opCurrent = Optional.ofNullable(value._1());
 						Optional<Work> opDownloaded = Optional.ofNullable(value._2());
 						if (!opCurrent.isPresent()) {
 							newWorksFoundAcc.add(1);
 							return opDownloaded.get();
 						}
 						if (!opDownloaded.isPresent()) {
 							oldWorksFoundAcc.add(1);
 							return opCurrent.get();
 						}
 						if (opCurrent.isPresent() && opDownloaded.isPresent()) {
 							updatedWorksFoundAcc.add(1);
 							return opDownloaded.get();
 						}
 						return null;
 					},
 						Encoders.bean(Work.class))
 					.filter(Objects::nonNull)
 					.toJavaRDD()
 					.map(work -> OBJECT_MAPPER.writeValueAsString(work))
 					.saveAsTextFile(workingPath.concat("orcid_dataset/new_works"), GzipCodec.class);
 				logger.info("oldWorksFoundAcc: " + oldWorksFoundAcc.value().toString());
 				logger.info("newWorksFoundAcc: " + newWorksFoundAcc.value().toString());
 				logger.info("updatedWorksFoundAcc: " + updatedWorksFoundAcc.value().toString());
 				logger.info("errorCodeWorksFoundAcc: " + errorCodeWorksFoundAcc.value().toString());
 				logger.info("errorLoadingJsonWorksFoundAcc: " + errorLoadingWorksJsonFoundAcc.value().toString());
 				logger.info("errorParsingXMLWorksFoundAcc: " + errorParsingWorksXMLFoundAcc.value().toString());
 				String lastModifiedDateFromLambdaFile = HDFSUtil
 					.readFromTextFile(hdfsServerUri, workingPath, "last_modified_date_from_lambda_file.txt");
 				HDFSUtil.writeToTextFile(hdfsServerUri, workingPath, "last_update.txt", lastModifiedDateFromLambdaFile);
 				logger.info("last_update file updated");
 			});
 	}
 	private static String getJsonValue(JsonElement jElement, String property) {
 		if (jElement.getAsJsonObject().has(property)) {
 			JsonElement name = null;
 			name = jElement.getAsJsonObject().get(property);
 			if (name != null && !name.isJsonNull()) {
 				return name.getAsString();
 			}
 		}
 		return "";
 	}
 }
--- a/dhp-workflows/dhp-doiboost/src/main/java/eu/dnetlib/doiboost/orcid/json/JsonHelper.java
+++ b/dhp-workflows/dhp-doiboost/src/main/java/eu/dnetlib/doiboost/orcid/json/JsonHelper.java
@ -3,11 +3,11 @@ package eu.dnetlib.doiboost.orcid.json;
 import com.google.gson.Gson;
-import eu.dnetlib.doiboost.orcidnodoi.model.WorkDataNoDoi;
+import eu.dnetlib.dhp.schema.orcid.WorkDetail;
 public class JsonHelper {
-	public static String createOidWork(WorkDataNoDoi workData) {
+	public static String createOidWork(WorkDetail workData) {
 		return new Gson().toJson(workData);
 	}
 }
--- a/dhp-workflows/dhp-doiboost/src/main/java/eu/dnetlib/doiboost/orcid/util/HDFSUtil.java
+++ b/dhp-workflows/dhp-doiboost/src/main/java/eu/dnetlib/doiboost/orcid/util/HDFSUtil.java
@ -0,0 +1,67 @@
 package eu.dnetlib.doiboost.orcid.util;
 import java.io.*;
 import java.net.URI;
 import java.nio.charset.StandardCharsets;
 import org.apache.commons.io.IOUtils;
 import org.apache.hadoop.conf.Configuration;
 import org.apache.hadoop.fs.FSDataInputStream;
 import org.apache.hadoop.fs.FSDataOutputStream;
 import org.apache.hadoop.fs.FileSystem;
 import org.apache.hadoop.fs.Path;
 import org.slf4j.Logger;
 import org.slf4j.LoggerFactory;
 import com.google.gson.Gson;
 import eu.dnetlib.doiboost.orcid.SparkDownloadOrcidAuthors;
 public class HDFSUtil {
 	static Logger logger = LoggerFactory.getLogger(HDFSUtil.class);
 	private static FileSystem getFileSystem(String hdfsServerUri) throws IOException {
 		Configuration conf = new Configuration();
 		conf.set("fs.defaultFS", hdfsServerUri);
 		FileSystem fileSystem = FileSystem.get(conf);
 		return fileSystem;
 	}
 	public static String readFromTextFile(String hdfsServerUri, String workingPath, String path) throws IOException {
 		FileSystem fileSystem = getFileSystem(hdfsServerUri);
 		Path toReadPath = new Path(workingPath.concat(path));
 		if (!fileSystem.exists(toReadPath)) {
 			throw new RuntimeException("File not exist: " + path);
 		}
 		logger.info("Last_update_path " + toReadPath.toString());
 		FSDataInputStream inputStream = new FSDataInputStream(fileSystem.open(toReadPath));
 		BufferedReader br = new BufferedReader(new InputStreamReader(inputStream));
 		StringBuffer sb = new StringBuffer();
 		try {
 			String line;
 			while ((line = br.readLine()) != null) {
 				sb.append(line);
 			}
 		} finally {
 			br.close();
 		}
 		String buffer = sb.toString();
 		logger.info("Last_update: " + buffer);
 		return buffer;
 	}
 	public static void writeToTextFile(String hdfsServerUri, String workingPath, String path, String text)
 		throws IOException {
 		FileSystem fileSystem = getFileSystem(hdfsServerUri);
 		Path toWritePath = new Path(workingPath.concat(path));
 		if (fileSystem.exists(toWritePath)) {
 			fileSystem.delete(toWritePath, true);
 		}
 		FSDataOutputStream os = fileSystem.create(toWritePath);
 		BufferedWriter br = new BufferedWriter(new OutputStreamWriter(os, "UTF-8"));
 		br.write(text);
 		br.close();
 	}
 }
--- a/dhp-workflows/dhp-doiboost/src/main/java/eu/dnetlib/doiboost/orcid/xml/XMLRecordParser.java
+++ b/dhp-workflows/dhp-doiboost/src/main/java/eu/dnetlib/doiboost/orcid/xml/XMLRecordParser.java
@ -1,22 +1,19 @@
 package eu.dnetlib.doiboost.orcid.xml;
-import java.util.Arrays;
+import java.io.IOException;
-import java.util.List;
+import java.util.*;
 import org.apache.commons.lang3.StringUtils;
 import org.mortbay.log.Log;
-import com.ximpleware.AutoPilot;
+import com.ximpleware.*;
 import com.ximpleware.EOFException;
 import com.ximpleware.EncodingException;
 import com.ximpleware.EntityException;
 import com.ximpleware.ParseException;
 import com.ximpleware.VTDGen;
 import com.ximpleware.VTDNav;
 import eu.dnetlib.dhp.parser.utility.VtdException;
 import eu.dnetlib.dhp.parser.utility.VtdUtilityParser;
 import eu.dnetlib.dhp.schema.orcid.AuthorData;
 import eu.dnetlib.dhp.schema.orcid.AuthorHistory;
 import eu.dnetlib.dhp.schema.orcid.AuthorSummary;
 import eu.dnetlib.doiboost.orcid.model.WorkData;
 public class XMLRecordParser {
@ -32,9 +29,12 @@ public class XMLRecordParser {
 	private static final String NS_RECORD_URL = "http://www.orcid.org/ns/record";
 	private static final String NS_RECORD = "record";
 	private static final String NS_ERROR_URL = "http://www.orcid.org/ns/error";
-
+	private static final String NS_ACTIVITIES = "activities";
 	private static final String NS_ACTIVITIES_URL = "http://www.orcid.org/ns/activities";
 	private static final String NS_WORK = "work";
 	private static final String NS_WORK_URL = "http://www.orcid.org/ns/work";
 	private static final String NS_HISTORY = "history";
 	private static final String NS_HISTORY_URL = "http://www.orcid.org/ns/history";
 	private static final String NS_ERROR = "error";
@ -51,6 +51,7 @@ public class XMLRecordParser {
 		ap.declareXPathNameSpace(NS_OTHER, NS_OTHER_URL);
 		ap.declareXPathNameSpace(NS_RECORD, NS_RECORD_URL);
 		ap.declareXPathNameSpace(NS_ERROR, NS_ERROR_URL);
 		ap.declareXPathNameSpace(NS_HISTORY, NS_HISTORY_URL);
 		AuthorData authorData = new AuthorData();
 		final List<String> errors = VtdUtilityParser.getTextValue(ap, vn, "//error:response-code");
@ -89,6 +90,46 @@ public class XMLRecordParser {
 			authorData.setOtherNames(otherNames);
 		}
 //		final String creationMethod = VtdUtilityParser.getSingleValue(ap, vn, "//history:creation-method");
 //		if (StringUtils.isNoneBlank(creationMethod)) {
 //			authorData.setCreationMethod(creationMethod);
 //		}
 //
 //		final String completionDate = VtdUtilityParser.getSingleValue(ap, vn, "//history:completion-date");
 //		if (StringUtils.isNoneBlank(completionDate)) {
 //			authorData.setCompletionDate(completionDate);
 //		}
 //
 //		final String submissionDate = VtdUtilityParser.getSingleValue(ap, vn, "//history:submission-date");
 //		if (StringUtils.isNoneBlank(submissionDate)) {
 //			authorData.setSubmissionDate(submissionDate);
 //		}
 //
 //		final String claimed = VtdUtilityParser.getSingleValue(ap, vn, "//history:claimed");
 //		if (StringUtils.isNoneBlank(claimed)) {
 //			authorData.setClaimed(Boolean.parseBoolean(claimed));
 //		}
 //
 //		final String verifiedEmail = VtdUtilityParser.getSingleValue(ap, vn, "//history:verified-email");
 //		if (StringUtils.isNoneBlank(verifiedEmail)) {
 //			authorData.setVerifiedEmail(Boolean.parseBoolean(verifiedEmail));
 //		}
 //
 //		final String verifiedPrimaryEmail = VtdUtilityParser.getSingleValue(ap, vn, "//history:verified-primary-email");
 //		if (StringUtils.isNoneBlank(verifiedPrimaryEmail)) {
 //			authorData.setVerifiedPrimaryEmail(Boolean.parseBoolean(verifiedPrimaryEmail));
 //		}
 //
 //		final String deactivationDate = VtdUtilityParser.getSingleValue(ap, vn, "//history:deactivation-date");
 //		if (StringUtils.isNoneBlank(deactivationDate)) {
 //			authorData.setDeactivationDate(deactivationDate);
 //		}
 //
 //		final String lastModifiedDate = VtdUtilityParser
 //			.getSingleValue(ap, vn, "//history:history/common:last-modified-date");
 //		if (StringUtils.isNoneBlank(lastModifiedDate)) {
 //			authorData.setLastModifiedDate(lastModifiedDate);
 //		}
 		return authorData;
 	}
@ -139,6 +180,12 @@ public class XMLRecordParser {
 		return retrieveOrcidId(bytes, defaultValue, NS_WORK, NS_WORK_URL, "//work:work", "put-code");
 	}
 	public static String retrieveWorkIdFromSummary(byte[] bytes, String defaultValue)
 		throws VtdException, ParseException {
 		return retrieveOrcidId(
 			bytes, defaultValue, NS_ACTIVITIES, NS_ACTIVITIES_URL, "//work:work-summary", "put-code");
 	}
 	private static String retrieveOrcidId(byte[] bytes, String defaultValue, String ns, String nsUrl, String xpath,
 		String idAttributeName)
 		throws VtdException, ParseException {
@ -148,6 +195,7 @@ public class XMLRecordParser {
 		final VTDNav vn = vg.getNav();
 		final AutoPilot ap = new AutoPilot(vn);
 		ap.declareXPathNameSpace(ns, nsUrl);
 		ap.declareXPathNameSpace(NS_WORK, NS_WORK_URL);
 		List<VtdUtilityParser.Node> recordNodes = VtdUtilityParser
 			.getTextValuesWithAttributes(
 				ap, vn, xpath, Arrays.asList(idAttributeName));
@ -157,4 +205,144 @@ public class XMLRecordParser {
 		Log.info("id not found - default: " + defaultValue);
 		return defaultValue;
 	}
 	public static Map<String, String> retrieveWorkIdLastModifiedDate(byte[] bytes)
 		throws ParseException, XPathParseException, NavException, XPathEvalException, IOException {
 		final VTDGen vg = new VTDGen();
 		vg.setDoc(bytes);
 		vg.parse(true);
 		final VTDNav vn = vg.getNav();
 		final AutoPilot ap = new AutoPilot(vn);
 		ap.declareXPathNameSpace(NS_WORK, NS_WORK_URL);
 		ap.declareXPathNameSpace(NS_COMMON, NS_COMMON_URL);
 		Map<String, String> workIdLastModifiedDate = new HashMap<>();
 		ap.selectXPath("//work:work-summary");
 		String workId = "";
 		while (ap.evalXPath() != -1) {
 			String lastModifiedDate = "";
 			int attr = vn.getAttrVal("put-code");
 			if (attr > -1) {
 				workId = vn.toNormalizedString(attr);
 			}
 			if (vn.toElement(VTDNav.FIRST_CHILD, "common:last-modified-date")) {
 				int val = vn.getText();
 				if (val != -1) {
 					lastModifiedDate = vn.toNormalizedString(val);
 					workIdLastModifiedDate.put(workId, lastModifiedDate);
 				}
 				vn.toElement(VTDNav.PARENT);
 			}
 		}
 		return workIdLastModifiedDate;
 	}
 	public static AuthorSummary VTDParseAuthorSummary(byte[] bytes)
 		throws VtdException, ParseException {
 		final VTDGen vg = new VTDGen();
 		vg.setDoc(bytes);
 		vg.parse(true);
 		final VTDNav vn = vg.getNav();
 		final AutoPilot ap = new AutoPilot(vn);
 		ap.declareXPathNameSpace(NS_COMMON, NS_COMMON_URL);
 		ap.declareXPathNameSpace(NS_PERSON, NS_PERSON_URL);
 		ap.declareXPathNameSpace(NS_DETAILS, NS_DETAILS_URL);
 		ap.declareXPathNameSpace(NS_OTHER, NS_OTHER_URL);
 		ap.declareXPathNameSpace(NS_RECORD, NS_RECORD_URL);
 		ap.declareXPathNameSpace(NS_ERROR, NS_ERROR_URL);
 		ap.declareXPathNameSpace(NS_HISTORY, NS_HISTORY_URL);
 		AuthorData authorData = retrieveAuthorData(ap, vn, bytes);
 		AuthorHistory authorHistory = retrieveAuthorHistory(ap, vn, bytes);
 		AuthorSummary authorSummary = new AuthorSummary();
 		authorSummary.setAuthorData(authorData);
 		authorSummary.setAuthorHistory(authorHistory);
 		return authorSummary;
 	}
 	private static AuthorData retrieveAuthorData(AutoPilot ap, VTDNav vn, byte[] bytes)
 		throws VtdException {
 		AuthorData authorData = new AuthorData();
 		final List<String> errors = VtdUtilityParser.getTextValue(ap, vn, "//error:response-code");
 		if (!errors.isEmpty()) {
 			authorData.setErrorCode(errors.get(0));
 			return authorData;
 		}
 		List<VtdUtilityParser.Node> recordNodes = VtdUtilityParser
 			.getTextValuesWithAttributes(
 				ap, vn, "//record:record", Arrays.asList("path"));
 		if (!recordNodes.isEmpty()) {
 			final String oid = (recordNodes.get(0).getAttributes().get("path")).substring(1);
 			authorData.setOid(oid);
 		} else {
 			return null;
 		}
 		final List<String> names = VtdUtilityParser.getTextValue(ap, vn, "//personal-details:given-names");
 		if (!names.isEmpty()) {
 			authorData.setName(names.get(0));
 		}
 		final List<String> surnames = VtdUtilityParser.getTextValue(ap, vn, "//personal-details:family-name");
 		if (!surnames.isEmpty()) {
 			authorData.setSurname(surnames.get(0));
 		}
 		final List<String> creditNames = VtdUtilityParser.getTextValue(ap, vn, "//personal-details:credit-name");
 		if (!creditNames.isEmpty()) {
 			authorData.setCreditName(creditNames.get(0));
 		}
 		final List<String> otherNames = VtdUtilityParser.getTextValue(ap, vn, "//other-name:content");
 		if (!otherNames.isEmpty()) {
 			authorData.setOtherNames(otherNames);
 		}
 		return authorData;
 	}
 	private static AuthorHistory retrieveAuthorHistory(AutoPilot ap, VTDNav vn, byte[] bytes)
 		throws VtdException {
 		AuthorHistory authorHistory = new AuthorHistory();
 		final String creationMethod = VtdUtilityParser.getSingleValue(ap, vn, "//history:creation-method");
 		if (StringUtils.isNoneBlank(creationMethod)) {
 			authorHistory.setCreationMethod(creationMethod);
 		}
 		final String completionDate = VtdUtilityParser.getSingleValue(ap, vn, "//history:completion-date");
 		if (StringUtils.isNoneBlank(completionDate)) {
 			authorHistory.setCompletionDate(completionDate);
 		}
 		final String submissionDate = VtdUtilityParser.getSingleValue(ap, vn, "//history:submission-date");
 		if (StringUtils.isNoneBlank(submissionDate)) {
 			authorHistory.setSubmissionDate(submissionDate);
 		}
 		final String claimed = VtdUtilityParser.getSingleValue(ap, vn, "//history:claimed");
 		if (StringUtils.isNoneBlank(claimed)) {
 			authorHistory.setClaimed(Boolean.parseBoolean(claimed));
 		}
 		final String verifiedEmail = VtdUtilityParser.getSingleValue(ap, vn, "//history:verified-email");
 		if (StringUtils.isNoneBlank(verifiedEmail)) {
 			authorHistory.setVerifiedEmail(Boolean.parseBoolean(verifiedEmail));
 		}
 		final String verifiedPrimaryEmail = VtdUtilityParser.getSingleValue(ap, vn, "//history:verified-primary-email");
 		if (StringUtils.isNoneBlank(verifiedPrimaryEmail)) {
 			authorHistory.setVerifiedPrimaryEmail(Boolean.parseBoolean(verifiedPrimaryEmail));
 		}
 		final String deactivationDate = VtdUtilityParser.getSingleValue(ap, vn, "//history:deactivation-date");
 		if (StringUtils.isNoneBlank(deactivationDate)) {
 			authorHistory.setDeactivationDate(deactivationDate);
 		}
 		final String lastModifiedDate = VtdUtilityParser
 			.getSingleValue(ap, vn, "//history:history/common:last-modified-date");
 		if (StringUtils.isNoneBlank(lastModifiedDate)) {
 			authorHistory.setLastModifiedDate(lastModifiedDate);
 		}
 		return authorHistory;
 	}
 }
--- a/dhp-workflows/dhp-doiboost/src/main/java/eu/dnetlib/doiboost/orcidnodoi/ActivitiesDumpReader.java
+++ b/dhp-workflows/dhp-doiboost/src/main/java/eu/dnetlib/doiboost/orcidnodoi/ActivitiesDumpReader.java
@ -19,8 +19,8 @@ import org.apache.hadoop.io.compress.CompressionCodec;
 import org.apache.hadoop.io.compress.CompressionCodecFactory;
 import org.mortbay.log.Log;
 import eu.dnetlib.dhp.schema.orcid.WorkDetail;
 import eu.dnetlib.doiboost.orcid.json.JsonHelper;
 import eu.dnetlib.doiboost.orcidnodoi.model.WorkDataNoDoi;
 import eu.dnetlib.doiboost.orcidnodoi.xml.XMLRecordParserNoDoi;
 /**
@ -87,29 +87,29 @@ public class ActivitiesDumpReader {
 							while ((line = br.readLine()) != null) {
 								buffer.append(line);
 							}
-							WorkDataNoDoi workDataNoDoi = XMLRecordParserNoDoi
+							WorkDetail workDetail = XMLRecordParserNoDoi
 								.VTDParseWorkData(buffer.toString().getBytes());
-							if (workDataNoDoi != null) {
+							if (workDetail != null) {
-								if (workDataNoDoi.getErrorCode() != null) {
+								if (workDetail.getErrorCode() != null) {
 									errorFromOrcidFound += 1;
 									Log
 										.debug(
 											"error from Orcid with code "
-												+ workDataNoDoi.getErrorCode()
+												+ workDetail.getErrorCode()
 												+ " for entry "
 												+ entry.getName());
 									continue;
 								}
-								boolean isDoiFound = workDataNoDoi
+								boolean isDoiFound = workDetail
 									.getExtIds()
 									.stream()
 									.filter(e -> e.getType() != null)
 									.anyMatch(e -> e.getType().equals("doi"));
 								if (!isDoiFound) {
-									String jsonData = JsonHelper.createOidWork(workDataNoDoi);
+									String jsonData = JsonHelper.createOidWork(workDetail);
-									Log.debug("oid: " + workDataNoDoi.getOid() + " data: " + jsonData);
+									Log.debug("oid: " + workDetail.getOid() + " data: " + jsonData);
-									final Text key = new Text(workDataNoDoi.getOid());
+									final Text key = new Text(workDetail.getOid());
 									final Text value = new Text(jsonData);
 									try {
--- a/dhp-workflows/dhp-doiboost/src/main/java/eu/dnetlib/doiboost/orcidnodoi/SparkGenEnrichedOrcidWorks.java
+++ b/dhp-workflows/dhp-doiboost/src/main/java/eu/dnetlib/doiboost/orcidnodoi/SparkGenEnrichedOrcidWorks.java
@ -4,10 +4,12 @@ package eu.dnetlib.doiboost.orcidnodoi;
 import static eu.dnetlib.dhp.common.SparkSessionSupport.runWithSparkSession;
 import java.io.IOException;
 import java.util.List;
 import java.util.Objects;
 import java.util.Optional;
 import org.apache.commons.io.IOUtils;
 import org.apache.commons.lang3.StringUtils;
 import org.apache.hadoop.io.Text;
 import org.apache.hadoop.mapreduce.lib.output.SequenceFileOutputFormat;
 import org.apache.spark.SparkConf;
@ -18,6 +20,7 @@ import org.apache.spark.api.java.function.MapFunction;
 import org.apache.spark.sql.Dataset;
 import org.apache.spark.sql.Encoders;
 import org.apache.spark.util.LongAccumulator;
 import org.mortbay.log.Log;
 import org.slf4j.Logger;
 import org.slf4j.LoggerFactory;
@ -30,14 +33,17 @@ import eu.dnetlib.dhp.application.ArgumentApplicationParser;
 import eu.dnetlib.dhp.schema.action.AtomicAction;
 import eu.dnetlib.dhp.schema.oaf.Publication;
 import eu.dnetlib.dhp.schema.orcid.AuthorData;
 import eu.dnetlib.dhp.schema.orcid.AuthorSummary;
 import eu.dnetlib.dhp.schema.orcid.Work;
 import eu.dnetlib.dhp.schema.orcid.WorkDetail;
 import eu.dnetlib.doiboost.orcid.json.JsonHelper;
-import eu.dnetlib.doiboost.orcidnodoi.model.WorkDataNoDoi;
+import eu.dnetlib.doiboost.orcid.util.HDFSUtil;
 import eu.dnetlib.doiboost.orcidnodoi.oaf.PublicationToOaf;
 import eu.dnetlib.doiboost.orcidnodoi.similarity.AuthorMatcher;
 import scala.Tuple2;
 /**
- * This spark job generates one parquet file, containing orcid publications dataset
+ * This spark job generates orcid publications no doi dataset
 */
 public class SparkGenEnrichedOrcidWorks {
@ -53,47 +59,65 @@ public class SparkGenEnrichedOrcidWorks {
 				.toString(
 					SparkGenEnrichedOrcidWorks.class
 						.getResourceAsStream(
-							"/eu/dnetlib/dhp/doiboost/gen_enriched_orcid_works_parameters.json")));
+							"/eu/dnetlib/dhp/doiboost/gen_orcid-no-doi_params.json")));
 		parser.parseArgument(args);
 		Boolean isSparkSessionManaged = Optional
 			.ofNullable(parser.get("isSparkSessionManaged"))
 			.map(Boolean::valueOf)
 			.orElse(Boolean.TRUE);
 		final String hdfsServerUri = parser.get("hdfsServerUri");
 		final String workingPath = parser.get("workingPath");
 		final String outputEnrichedWorksPath = parser.get("outputEnrichedWorksPath");
-		final String outputWorksPath = parser.get("outputWorksPath");
+		final String orcidDataFolder = parser.get("orcidDataFolder");
 		final String hdfsServerUri = parser.get("hdfsServerUri");
 		SparkConf conf = new SparkConf();
 		runWithSparkSession(
 			conf,
 			isSparkSessionManaged,
 			spark -> {
 				String lastUpdate = HDFSUtil.readFromTextFile(hdfsServerUri, workingPath, "last_update.txt");
 				if (StringUtils.isBlank(lastUpdate)) {
 					throw new RuntimeException("last update info not found");
 				}
 				final String dateOfCollection = lastUpdate.substring(0, 10);
 				JavaSparkContext sc = JavaSparkContext.fromSparkContext(spark.sparkContext());
-				JavaPairRDD<Text, Text> summariesRDD = sc
+				Dataset<AuthorData> authorDataset = spark
 					.sequenceFile(workingPath + "authors/authors.seq", Text.class, Text.class);
 				Dataset<AuthorData> summariesDataset = spark
 					.createDataset(
-						summariesRDD.map(seq -> loadAuthorFromJson(seq._1(), seq._2())).rdd(),
+						sc
 							.textFile(workingPath.concat(orcidDataFolder).concat("/authors/*"))
 							.map(item -> OBJECT_MAPPER.readValue(item, AuthorSummary.class))
 							.filter(authorSummary -> authorSummary.getAuthorData() != null)
 							.map(authorSummary -> authorSummary.getAuthorData())
 							.rdd(),
 						Encoders.bean(AuthorData.class));
-				logger.info("Authors data loaded: " + summariesDataset.count());
+				logger.info("Authors data loaded: " + authorDataset.count());
-				JavaPairRDD<Text, Text> activitiesRDD = sc
+				Dataset<WorkDetail> workDataset = spark
 					.sequenceFile(workingPath + outputWorksPath + "*.seq", Text.class, Text.class);
 				Dataset<WorkDataNoDoi> activitiesDataset = spark
 					.createDataset(
-						activitiesRDD.map(seq -> loadWorkFromJson(seq._1(), seq._2())).rdd(),
+						sc
-						Encoders.bean(WorkDataNoDoi.class));
+							.textFile(workingPath.concat(orcidDataFolder).concat("/works/*"))
-				logger.info("Works data loaded: " + activitiesDataset.count());
+							.map(item -> OBJECT_MAPPER.readValue(item, Work.class))
 							.filter(work -> work.getWorkDetail() != null)
 							.map(work -> work.getWorkDetail())
 							.filter(work -> work.getErrorCode() == null)
 							.filter(
 								work -> work
 									.getExtIds()
 									.stream()
 									.filter(e -> e.getType() != null)
 									.noneMatch(e -> e.getType().equalsIgnoreCase("doi")))
 							.rdd(),
 						Encoders.bean(WorkDetail.class));
 				logger.info("Works data loaded: " + workDataset.count());
-				JavaRDD<Tuple2<String, String>> enrichedWorksRDD = activitiesDataset
+				JavaRDD<Tuple2<String, String>> enrichedWorksRDD = workDataset
 					.joinWith(
-						summariesDataset,
+						authorDataset,
-						activitiesDataset.col("oid").equalTo(summariesDataset.col("oid")), "inner")
+						workDataset.col("oid").equalTo(authorDataset.col("oid")), "inner")
 					.map(
-						(MapFunction<Tuple2<WorkDataNoDoi, AuthorData>, Tuple2<String, String>>) value -> {
+						(MapFunction<Tuple2<WorkDetail, AuthorData>, Tuple2<String, String>>) value -> {
-							WorkDataNoDoi w = value._1;
+							WorkDetail w = value._1;
 							AuthorData a = value._2;
 							AuthorMatcher.match(a, w.getContributors());
 							return new Tuple2<>(a.getOid(), JsonHelper.createOidWork(w));
@ -113,13 +137,25 @@ public class SparkGenEnrichedOrcidWorks {
 					.sparkContext()
 					.longAccumulator("errorsNotFoundAuthors");
 				final LongAccumulator errorsInvalidType = spark.sparkContext().longAccumulator("errorsInvalidType");
 				final LongAccumulator otherTypeFound = spark.sparkContext().longAccumulator("otherTypeFound");
 				final LongAccumulator deactivatedAcc = spark.sparkContext().longAccumulator("deactivated_found");
 				final LongAccumulator titleNotProvidedAcc = spark
 					.sparkContext()
 					.longAccumulator("Title_not_provided_found");
 				final LongAccumulator noUrlAcc = spark.sparkContext().longAccumulator("no_url_found");
 				final PublicationToOaf publicationToOaf = new PublicationToOaf(
 					parsedPublications,
 					enrichedPublications,
 					errorsGeneric,
 					errorsInvalidTitle,
 					errorsNotFoundAuthors,
-					errorsInvalidType);
+					errorsInvalidType,
 					otherTypeFound,
 					deactivatedAcc,
 					titleNotProvidedAcc,
 					noUrlAcc,
 					dateOfCollection);
 				JavaRDD<Publication> oafPublicationRDD = enrichedWorksRDD
 					.map(
 						e -> {
@ -148,33 +184,10 @@ public class SparkGenEnrichedOrcidWorks {
 				logger.info("errorsInvalidTitle: " + errorsInvalidTitle.value().toString());
 				logger.info("errorsNotFoundAuthors: " + errorsNotFoundAuthors.value().toString());
 				logger.info("errorsInvalidType: " + errorsInvalidType.value().toString());
 				logger.info("otherTypeFound: " + otherTypeFound.value().toString());
 				logger.info("deactivatedAcc: " + deactivatedAcc.value().toString());
 				logger.info("titleNotProvidedAcc: " + titleNotProvidedAcc.value().toString());
 				logger.info("noUrlAcc: " + noUrlAcc.value().toString());
 			});
 	}
 	private static AuthorData loadAuthorFromJson(Text orcidId, Text json) {
 		AuthorData authorData = new AuthorData();
 		authorData.setOid(orcidId.toString());
 		JsonElement jElement = new JsonParser().parse(json.toString());
 		authorData.setName(getJsonValue(jElement, "name"));
 		authorData.setSurname(getJsonValue(jElement, "surname"));
 		authorData.setCreditName(getJsonValue(jElement, "creditname"));
 		return authorData;
 	}
 	private static WorkDataNoDoi loadWorkFromJson(Text orcidId, Text json) {
 		WorkDataNoDoi workData = new Gson().fromJson(json.toString(), WorkDataNoDoi.class);
 		return workData;
 	}
 	private static String getJsonValue(JsonElement jElement, String property) {
 		if (jElement.getAsJsonObject().has(property)) {
 			JsonElement name = null;
 			name = jElement.getAsJsonObject().get(property);
 			if (name != null && !name.isJsonNull()) {
 				return name.getAsString();
 			}
 		}
 		return new String("");
 	}
 }
--- a/dhp-workflows/dhp-doiboost/src/main/java/eu/dnetlib/doiboost/orcidnodoi/json/JsonWriter.java
+++ b/dhp-workflows/dhp-doiboost/src/main/java/eu/dnetlib/doiboost/orcidnodoi/json/JsonWriter.java
@ -22,6 +22,10 @@ public class JsonWriter {
 		return OBJECT_MAPPER.writeValueAsString(authorData);
 	}
 	public static String create(Object obj) throws JsonProcessingException {
 		return OBJECT_MAPPER.writeValueAsString(obj);
 	}
 	public static String create(WorkData workData) {
 		JsonObject work = new JsonObject();
 		work.addProperty("oid", workData.getOid());
--- a/dhp-workflows/dhp-doiboost/src/main/java/eu/dnetlib/doiboost/orcidnodoi/model/Contributor.java
+++ b/dhp-workflows/dhp-doiboost/src/main/java/eu/dnetlib/doiboost/orcidnodoi/model/Contributor.java
@ -1,58 +0,0 @@
 package eu.dnetlib.doiboost.orcidnodoi.model;
 import java.io.Serializable;
 import eu.dnetlib.dhp.schema.orcid.AuthorData;
 /**
 * This class models the data related to a contributor, that are retrieved from an orcid publication
 */
 public class Contributor extends AuthorData implements Serializable {
 	private String sequence;
 	private String role;
 	private transient boolean simpleMatch = false;
 	private transient Double score = 0.0;
 	private transient boolean bestMatch = false;
 	public String getSequence() {
 		return sequence;
 	}
 	public void setSequence(String sequence) {
 		this.sequence = sequence;
 	}
 	public String getRole() {
 		return role;
 	}
 	public void setRole(String role) {
 		this.role = role;
 	}
 	public boolean isSimpleMatch() {
 		return simpleMatch;
 	}
 	public void setSimpleMatch(boolean simpleMatch) {
 		this.simpleMatch = simpleMatch;
 	}
 	public Double getScore() {
 		return score;
 	}
 	public void setScore(Double score) {
 		this.score = score;
 	}
 	public boolean isBestMatch() {
 		return bestMatch;
 	}
 	public void setBestMatch(boolean bestMatch) {
 		this.bestMatch = bestMatch;
 	}
 }
--- a/dhp-workflows/dhp-doiboost/src/main/java/eu/dnetlib/doiboost/orcidnodoi/model/ExternalId.java
+++ b/dhp-workflows/dhp-doiboost/src/main/java/eu/dnetlib/doiboost/orcidnodoi/model/ExternalId.java
@ -1,36 +0,0 @@
 package eu.dnetlib.doiboost.orcidnodoi.model;
 /**
 * This class models the data related to external id, that are retrieved from an orcid publication
 */
 public class ExternalId {
 	private String type;
 	private String value;
 	private String relationShip;
 	public String getType() {
 		return type;
 	}
 	public void setType(String type) {
 		this.type = type;
 	}
 	public String getValue() {
 		return value;
 	}
 	public void setValue(String value) {
 		this.value = value;
 	}
 	public String getRelationShip() {
 		return relationShip;
 	}
 	public void setRelationShip(String relationShip) {
 		this.relationShip = relationShip;
 	}
 }
--- a/dhp-workflows/dhp-doiboost/src/main/java/eu/dnetlib/doiboost/orcidnodoi/model/PublicationDate.java
+++ b/dhp-workflows/dhp-doiboost/src/main/java/eu/dnetlib/doiboost/orcidnodoi/model/PublicationDate.java
@ -1,36 +0,0 @@
 package eu.dnetlib.doiboost.orcidnodoi.model;
 /**
 * This class models the data related to a publication date, that are retrieved from an orcid publication
 */
 public class PublicationDate {
 	private String year;
 	private String month;
 	private String day;
 	public String getYear() {
 		return year;
 	}
 	public void setYear(String year) {
 		this.year = year;
 	}
 	public String getMonth() {
 		return month;
 	}
 	public void setMonth(String month) {
 		this.month = month;
 	}
 	public String getDay() {
 		return day;
 	}
 	public void setDay(String day) {
 		this.day = day;
 	}
 }
--- a/dhp-workflows/dhp-doiboost/src/main/java/eu/dnetlib/doiboost/orcidnodoi/model/WorkDataNoDoi.java
+++ b/dhp-workflows/dhp-doiboost/src/main/java/eu/dnetlib/doiboost/orcidnodoi/model/WorkDataNoDoi.java
@ -1,104 +0,0 @@
 package eu.dnetlib.doiboost.orcidnodoi.model;
 import java.io.Serializable;
 import java.util.List;
 /**
 * This class models the data that are retrieved from orcid publication
 */
 public class WorkDataNoDoi implements Serializable {
 	private String oid;
 	private String id;
 	private String sourceName;
 	private String type;
 	private List<String> titles;
 	private List<String> urls;
 	List<ExternalId> extIds;
 	List<PublicationDate> publicationDates;
 	List<Contributor> contributors;
 	public String getOid() {
 		return oid;
 	}
 	public void setOid(String oid) {
 		this.oid = oid;
 	}
 	public String getErrorCode() {
 		return errorCode;
 	}
 	public void setErrorCode(String errorCode) {
 		this.errorCode = errorCode;
 	}
 	private String errorCode;
 	public String getId() {
 		return id;
 	}
 	public void setId(String id) {
 		this.id = id;
 	}
 	public List<String> getTitles() {
 		return titles;
 	}
 	public void setTitles(List<String> titles) {
 		this.titles = titles;
 	}
 	public String getSourceName() {
 		return sourceName;
 	}
 	public void setSourceName(String sourceName) {
 		this.sourceName = sourceName;
 	}
 	public String getType() {
 		return type;
 	}
 	public void setType(String type) {
 		this.type = type;
 	}
 	public List<String> getUrls() {
 		return urls;
 	}
 	public void setUrls(List<String> urls) {
 		this.urls = urls;
 	}
 	public List<ExternalId> getExtIds() {
 		return extIds;
 	}
 	public void setExtIds(List<ExternalId> extIds) {
 		this.extIds = extIds;
 	}
 	public List<PublicationDate> getPublicationDates() {
 		return publicationDates;
 	}
 	public void setPublicationDates(List<PublicationDate> publicationDates) {
 		this.publicationDates = publicationDates;
 	}
 	public List<Contributor> getContributors() {
 		return contributors;
 	}
 	public void setContributors(List<Contributor> contributors) {
 		this.contributors = contributors;
 	}
 }
--- a/dhp-workflows/dhp-doiboost/src/main/java/eu/dnetlib/doiboost/orcidnodoi/oaf/PublicationToOaf.java
+++ b/dhp-workflows/dhp-doiboost/src/main/java/eu/dnetlib/doiboost/orcidnodoi/oaf/PublicationToOaf.java
@ -30,17 +30,23 @@ public class PublicationToOaf implements Serializable {
 	static Logger logger = LoggerFactory.getLogger(PublicationToOaf.class);
 	public static final String ORCID = "ORCID";
 	public final static String orcidPREFIX = "orcid_______";
 	public static final String OPENAIRE_PREFIX = "openaire____";
 	public static final String SEPARATOR = "::";
 	public static final String DEACTIVATED_NAME = "Given Names Deactivated";
 	public static final String DEACTIVATED_SURNAME = "Family Name Deactivated";
 	private String dateOfCollection = "";
 	private final LongAccumulator parsedPublications;
 	private final LongAccumulator enrichedPublications;
 	private final LongAccumulator errorsGeneric;
 	private final LongAccumulator errorsInvalidTitle;
 	private final LongAccumulator errorsNotFoundAuthors;
 	private final LongAccumulator errorsInvalidType;
 	private final LongAccumulator otherTypeFound;
 	private final LongAccumulator deactivatedAcc;
 	private final LongAccumulator titleNotProvidedAcc;
 	private final LongAccumulator noUrlAcc;
 	public PublicationToOaf(
 		LongAccumulator parsedPublications,
@ -48,13 +54,23 @@ public class PublicationToOaf implements Serializable {
 		LongAccumulator errorsGeneric,
 		LongAccumulator errorsInvalidTitle,
 		LongAccumulator errorsNotFoundAuthors,
-		LongAccumulator errorsInvalidType) {
+		LongAccumulator errorsInvalidType,
 		LongAccumulator otherTypeFound,
 		LongAccumulator deactivatedAcc,
 		LongAccumulator titleNotProvidedAcc,
 		LongAccumulator noUrlAcc,
 		String dateOfCollection) {
 		this.parsedPublications = parsedPublications;
 		this.enrichedPublications = enrichedPublications;
 		this.errorsGeneric = errorsGeneric;
 		this.errorsInvalidTitle = errorsInvalidTitle;
 		this.errorsNotFoundAuthors = errorsNotFoundAuthors;
 		this.errorsInvalidType = errorsInvalidType;
 		this.otherTypeFound = otherTypeFound;
 		this.deactivatedAcc = deactivatedAcc;
 		this.titleNotProvidedAcc = titleNotProvidedAcc;
 		this.noUrlAcc = noUrlAcc;
 		this.dateOfCollection = dateOfCollection;
 	}
 	public PublicationToOaf() {
@ -64,12 +80,19 @@ public class PublicationToOaf implements Serializable {
 		this.errorsInvalidTitle = null;
 		this.errorsNotFoundAuthors = null;
 		this.errorsInvalidType = null;
 		this.otherTypeFound = null;
 		this.deactivatedAcc = null;
 		this.titleNotProvidedAcc = null;
 		this.noUrlAcc = null;
 		this.dateOfCollection = null;
 	}
 	private static Map<String, Pair<String, String>> datasources = new HashMap<String, Pair<String, String>>() {
 		{
-			put(ORCID.toLowerCase(), new Pair<>(ORCID, OPENAIRE_PREFIX + SEPARATOR + "orcid"));
+			put(
 				ModelConstants.ORCID,
 				new Pair<>(ModelConstants.ORCID.toUpperCase(), OPENAIRE_PREFIX + SEPARATOR + "orcid"));
 		}
 	};
@ -79,10 +102,10 @@ public class PublicationToOaf implements Serializable {
 		{
 			put("ark".toLowerCase(), new Pair<>("ark", "ark"));
-			put("arxiv".toLowerCase(), new Pair<>("arxiv", "arXiv"));
+			put("arxiv".toLowerCase(), new Pair<>("arXiv", "arXiv"));
-			put("pmc".toLowerCase(), new Pair<>("pmc", "pmc"));
+			put("pmc".toLowerCase(), new Pair<>("pmc", "PubMed Central ID"));
-			put("pmid".toLowerCase(), new Pair<>("pmid", "pmid"));
+			put("pmid".toLowerCase(), new Pair<>("pmid", "PubMed ID"));
-			put("source-work-id".toLowerCase(), new Pair<>("orcidworkid", "orcidworkid"));
+			put("source-work-id".toLowerCase(), new Pair<>("orcidworkid", "orcid workid"));
 			put("urn".toLowerCase(), new Pair<>("urn", "urn"));
 		}
 	};
@ -105,20 +128,12 @@ public class PublicationToOaf implements Serializable {
 	public static final String PID_TYPES = "dnet:pid_types";
 	public Oaf generatePublicationActionsFromJson(final String json) {
-		try {
+		if (parsedPublications != null) {
-			if (parsedPublications != null) {
+			parsedPublications.add(1);
 				parsedPublications.add(1);
 			}
 			JsonElement jElement = new JsonParser().parse(json);
 			JsonObject jObject = jElement.getAsJsonObject();
 			return generatePublicationActionsFromDump(jObject);
 		} catch (Throwable t) {
 			logger.error("creating publication: " + t.getMessage());
 			if (errorsGeneric != null) {
 				errorsGeneric.add(1);
 			}
 			return null;
 		}
 		JsonElement jElement = new JsonParser().parse(json);
 		JsonObject jObject = jElement.getAsJsonObject();
 		return generatePublicationActionsFromDump(jObject);
 	}
 	public Oaf generatePublicationActionsFromDump(final JsonObject rootElement) {
@ -144,7 +159,7 @@ public class PublicationToOaf implements Serializable {
 		publication.setLastupdatetimestamp(new Date().getTime());
-		publication.setDateofcollection("2020-10-14");
+		publication.setDateofcollection(dateOfCollection);
 		publication.setDateoftransformation(DumpToActionsUtility.now_ISO8601());
 		// Adding external ids
@ -152,14 +167,16 @@ public class PublicationToOaf implements Serializable {
 			.keySet()
 			.stream()
 			.forEach(jsonExtId -> {
-				final String classid = externalIds.get(jsonExtId.toLowerCase()).getValue();
+				final String classid = externalIds.get(jsonExtId.toLowerCase()).getKey();
-				final String classname = externalIds.get(jsonExtId.toLowerCase()).getKey();
+				final String classname = externalIds.get(jsonExtId.toLowerCase()).getValue();
 				final String extId = getStringValue(rootElement, jsonExtId);
 				if (StringUtils.isNotBlank(extId)) {
 					publication
 						.getExternalReference()
 						.add(
-							convertExtRef(extId, classid, classname, "dnet:pid_types", "dnet:pid_types"));
+							convertExtRef(
 								extId, classid, classname, ModelConstants.DNET_PID_TYPES,
 								ModelConstants.DNET_PID_TYPES));
 				}
 			});
@ -182,6 +199,12 @@ public class PublicationToOaf implements Serializable {
 			}
 			return null;
 		}
 		if (titles.stream().filter(t -> (t != null && t.equals("Title Not Supplied"))).count() > 0) {
 			if (titleNotProvidedAcc != null) {
 				titleNotProvidedAcc.add(1);
 			}
 			return null;
 		}
 		Qualifier q = mapQualifier("main title", "main title", "dnet:dataCite_title", "dnet:dataCite_title");
 		publication
 			.setTitle(
@ -216,8 +239,23 @@ public class PublicationToOaf implements Serializable {
 		if (StringUtils.isNotBlank(type)) {
 			publication.setResourcetype(mapQualifier(type, type, "dnet:dataCite_resource", "dnet:dataCite_resource"));
 			Map<String, String> publicationType = typologiesMapping.get(type);
 			if ((publicationType == null || publicationType.isEmpty()) && errorsInvalidType != null) {
 				errorsInvalidType.add(1);
 				logger.error("publication_type_not_found: " + type);
 				return null;
 			}
 			final String typeValue = typologiesMapping.get(type).get("value");
 			cobjValue = typologiesMapping.get(type).get("cobj");
 			// this dataset must contain only publication
 			if (cobjValue.equals("0020")) {
 				if (otherTypeFound != null) {
 					otherTypeFound.add(1);
 				}
 				return null;
 			}
 			final Instance instance = new Instance();
 			// Adding hostedby
@ -228,9 +266,14 @@ public class PublicationToOaf implements Serializable {
 			if (urls != null && !urls.isEmpty()) {
 				instance.setUrl(urls);
 			} else {
-				dataInfo.setInvisible(true);
+				if (noUrlAcc != null) {
 					noUrlAcc.add(1);
 				}
 				return null;
 			}
 			dataInfo.setInvisible(true);
 			final String pubDate = getPublicationDate(rootElement, "publicationDates");
 			if (StringUtils.isNotBlank(pubDate)) {
 				instance.setDateofacceptance(mapStringField(pubDate, null));
@ -257,12 +300,28 @@ public class PublicationToOaf implements Serializable {
 		// Adding authors
 		final List<Author> authors = createAuthors(rootElement);
 		if (authors != null && authors.size() > 0) {
-			publication.setAuthor(authors);
+			if (authors.stream().filter(a -> {
-		} else {
+				return ((Objects.nonNull(a.getName()) && a.getName().equals(DEACTIVATED_NAME)) ||
-			if (errorsNotFoundAuthors != null) {
+					(Objects.nonNull(a.getSurname()) && a.getSurname().equals(DEACTIVATED_SURNAME)));
-				errorsNotFoundAuthors.add(1);
+			}).count() > 0) {
 				if (deactivatedAcc != null) {
 					deactivatedAcc.add(1);
 				}
 				return null;
 			} else {
 				publication.setAuthor(authors);
 			}
 		} else {
 			if (authors == null) {
 				Gson gson = new GsonBuilder().setPrettyPrinting().create();
 				String json = gson.toJson(rootElement);
 				throw new RuntimeException("not_valid_authors: " + json);
 			} else {
 				if (errorsNotFoundAuthors != null) {
 					errorsNotFoundAuthors.add(1);
 				}
 				return null;
 			}
 			return null;
 		}
 		String classValue = getDefaultResulttype(cobjValue);
 		publication
@ -505,31 +564,28 @@ public class PublicationToOaf implements Serializable {
 	private KeyValue createCollectedFrom() {
 		KeyValue cf = new KeyValue();
-		cf.setValue(ORCID);
+		cf.setValue(ModelConstants.ORCID.toUpperCase());
 		cf.setKey("10|" + OPENAIRE_PREFIX + SEPARATOR + "806360c771262b4d6770e7cdf04b5c5a");
 		return cf;
 	}
 	private KeyValue createHostedBy() {
-		KeyValue hb = new KeyValue();
+		return ModelConstants.UNKNOWN_REPOSITORY;
 		hb.setValue("Unknown Repository");
 		hb.setKey("10|" + OPENAIRE_PREFIX + SEPARATOR + "55045bd2a65019fd8e6741a755395c8c");
 		return hb;
 	}
 	private StructuredProperty mapAuthorId(String orcidId) {
 		final StructuredProperty sp = new StructuredProperty();
 		sp.setValue(orcidId);
 		final Qualifier q = new Qualifier();
-		q.setClassid(ORCID.toLowerCase());
+		q.setClassid(ModelConstants.ORCID);
-		q.setClassname(ORCID.toLowerCase());
+		q.setClassname(ModelConstants.ORCID_CLASSNAME);
 		q.setSchemeid(ModelConstants.DNET_PID_TYPES);
 		q.setSchemename(ModelConstants.DNET_PID_TYPES);
 		sp.setQualifier(q);
 		final DataInfo dataInfo = new DataInfo();
 		dataInfo.setDeletedbyinference(false);
 		dataInfo.setInferred(false);
-		dataInfo.setTrust("0.9");
+		dataInfo.setTrust("0.91");
 		dataInfo
 			.setProvenanceaction(
 				mapQualifier(
--- a/dhp-workflows/dhp-doiboost/src/main/java/eu/dnetlib/doiboost/orcidnodoi/similarity/AuthorMatcher.java
+++ b/dhp-workflows/dhp-doiboost/src/main/java/eu/dnetlib/doiboost/orcidnodoi/similarity/AuthorMatcher.java
@ -19,8 +19,8 @@ import com.ximpleware.XPathParseException;
 import eu.dnetlib.dhp.parser.utility.VtdException;
 import eu.dnetlib.dhp.schema.orcid.AuthorData;
-import eu.dnetlib.doiboost.orcidnodoi.model.Contributor;
+import eu.dnetlib.dhp.schema.orcid.Contributor;
-import eu.dnetlib.doiboost.orcidnodoi.model.WorkDataNoDoi;
+import eu.dnetlib.dhp.schema.orcid.WorkDetail;
 /**
 * This class is used for searching from a list of publication contributors a
@ -209,7 +209,7 @@ public class AuthorMatcher {
 		}
 	}
-	private static String toJson(WorkDataNoDoi work) {
+	private static String toJson(WorkDetail work) {
 		GsonBuilder builder = new GsonBuilder();
 		Gson gson = builder.create();
 		return gson.toJson(work);
--- a/dhp-workflows/dhp-doiboost/src/main/java/eu/dnetlib/doiboost/orcidnodoi/xml/XMLRecordParserNoDoi.java
+++ b/dhp-workflows/dhp-doiboost/src/main/java/eu/dnetlib/doiboost/orcidnodoi/xml/XMLRecordParserNoDoi.java
@ -12,10 +12,10 @@ import com.ximpleware.*;
 import eu.dnetlib.dhp.parser.utility.VtdException;
 import eu.dnetlib.dhp.parser.utility.VtdUtilityParser;
-import eu.dnetlib.doiboost.orcidnodoi.model.Contributor;
+import eu.dnetlib.dhp.schema.orcid.Contributor;
-import eu.dnetlib.doiboost.orcidnodoi.model.ExternalId;
+import eu.dnetlib.dhp.schema.orcid.ExternalId;
-import eu.dnetlib.doiboost.orcidnodoi.model.PublicationDate;
+import eu.dnetlib.dhp.schema.orcid.PublicationDate;
-import eu.dnetlib.doiboost.orcidnodoi.model.WorkDataNoDoi;
+import eu.dnetlib.dhp.schema.orcid.WorkDetail;
 /**
 * This class is used for parsing xml data with vtd parser
@ -42,7 +42,7 @@ public class XMLRecordParserNoDoi {
 	private static final String NS_ERROR = "error";
-	public static WorkDataNoDoi VTDParseWorkData(byte[] bytes)
+	public static WorkDetail VTDParseWorkData(byte[] bytes)
 		throws VtdException, EncodingException, EOFException, EntityException, ParseException, XPathParseException,
 		NavException, XPathEvalException {
 		final VTDGen vg = new VTDGen();
@ -54,7 +54,7 @@ public class XMLRecordParserNoDoi {
 		ap.declareXPathNameSpace(NS_WORK, NS_WORK_URL);
 		ap.declareXPathNameSpace(NS_ERROR, NS_ERROR_URL);
-		WorkDataNoDoi workData = new WorkDataNoDoi();
+		WorkDetail workData = new WorkDetail();
 		final List<String> errors = VtdUtilityParser.getTextValue(ap, vn, "//error:response-code");
 		if (!errors.isEmpty()) {
 			workData.setErrorCode(errors.get(0));
--- a/dhp-workflows/dhp-doiboost/src/main/resources/eu/dnetlib/dhp/doiboost/gen_doi_author_list_orcid_parameters.json
+++ b/dhp-workflows/dhp-doiboost/src/main/resources/eu/dnetlib/dhp/doiboost/gen_doi_author_list_orcid_parameters.json
@ -1,3 +1,5 @@
 [{"paramName":"w",   "paramLongName":"workingPath",	"paramDescription": "the working path",	"paramRequired": true},
 {"paramName":"a",   "paramLongName":"authorsPath",	"paramDescription": "the path of the authors seq file",	"paramRequired": true},
 {"paramName":"xw",   "paramLongName":"xmlWorksPath",	"paramDescription": "the path of the works xml seq file",	"paramRequired": true},
 {"paramName":"o",   "paramLongName":"outputDoiAuthorListPath",	"paramDescription": "the relative folder of the sequencial file to write the data",	"paramRequired": true}
 ]
--- a/dhp-workflows/dhp-doiboost/src/main/resources/eu/dnetlib/dhp/doiboost/gen_enriched_orcid_works_parameters.json
+++ b/dhp-workflows/dhp-doiboost/src/main/resources/eu/dnetlib/dhp/doiboost/gen_enriched_orcid_works_parameters.json
@ -1,7 +1,6 @@
 [
 {"paramName":"n",   "paramLongName":"hdfsServerUri",	"paramDescription": "the server uri",   "paramRequired": true},
 {"paramName":"w",   "paramLongName":"workingPath",	"paramDescription": "the default work path",	"paramRequired": true},
- {"paramName":"f",   "paramLongName":"activitiesFileNameTarGz",	"paramDescription": "the name of the activities orcid file",	"paramRequired": true},
+ {"paramName":"i",   "paramLongName":"orcidDataFolder",	"paramDescription": "the folder of orcid data",	"paramRequired": true},
 {"paramName":"ow",   "paramLongName":"outputWorksPath",	"paramDescription": "the relative folder of the sequencial file to write",	"paramRequired": true},
 {"paramName":"oew",   "paramLongName":"outputEnrichedWorksPath",	"paramDescription": "the relative folder of the sequencial file to write the data",	"paramRequired": true}
 ]
--- a/dhp-workflows/dhp-doiboost/src/main/resources/eu/dnetlib/dhp/doiboost/orcid_activities/oozie_app/config-default.xml
+++ b/dhp-workflows/dhp-doiboost/src/main/resources/eu/dnetlib/dhp/doiboost/orcid_activities/oozie_app/config-default.xml
@ -1,31 +0,0 @@
 <configuration>
    <property>
        <name>oozie.action.sharelib.for.java</name>
        <value>spark2</value>
    </property>
    <property>
        <name>oozie.launcher.mapreduce.user.classpath.first</name>
        <value>true</value>
    </property>
    <property>
        <name>oozie.launcher.mapreduce.map.java.opts</name>
        <value>-Xmx2g</value>
    </property>
    <property>
        <name>jobTracker</name>
        <value>yarnRM</value>
    </property>
    <property>
        <name>nameNode</name>
        <value>hdfs://nameservice1</value>
    </property>
    <property>
        <name>oozie.use.system.libpath</name>
        <value>true</value>
    </property>
    <property>
        <name>oozie.action.sharelib.for.spark</name>
        <value>spark2</value>
    </property>
 </configuration>
--- a/dhp-workflows/dhp-doiboost/src/main/resources/eu/dnetlib/dhp/doiboost/orcid_activities/oozie_app/workflow.xml
+++ b/dhp-workflows/dhp-doiboost/src/main/resources/eu/dnetlib/dhp/doiboost/orcid_activities/oozie_app/workflow.xml
@ -1,542 +0,0 @@
 <workflow-app name="Gen Orcid Works-no-doi From Activities" xmlns="uri:oozie:workflow:0.5">
    <parameters>
        <property>
            <name>workingPath</name>
            <description>the working dir base path</description>
        </property>
        <property>
            <name>shell_cmd_0</name>
            <value>wget -O /tmp/ORCID_2020_10_activites_0.tar.gz https://orcid.figshare.com/ndownloader/files/25002232 ; hdfs dfs -copyFromLocal /tmp/ORCID_2020_10_activites_0.tar.gz /data/orcid_activities_2020/ORCID_2020_10_activites_0.tar.gz ; rm -f /tmp/ORCID_2020_10_activites_0.tar.gz
            </value>
            <description>the shell command that downloads and puts to hdfs orcid activity file 0</description>
        </property>
        <property>
            <name>shell_cmd_1</name>
            <value>wget -O /tmp/ORCID_2020_10_activites_1.tar.gz https://orcid.figshare.com/ndownloader/files/25002088 ; hdfs dfs -copyFromLocal /tmp/ORCID_2020_10_activites_1.tar.gz /data/orcid_activities_2020/ORCID_2020_10_activites_1.tar.gz ; rm -f /tmp/ORCID_2020_10_activites_1.tar.gz
            </value>
            <description>the shell command that downloads and puts to hdfs orcid activity file 1</description>
        </property>
        <property>
            <name>shell_cmd_2</name>
            <value>wget -O /tmp/ORCID_2020_10_activites_2.tar.gz https://orcid.figshare.com/ndownloader/files/25000596 ; hdfs dfs -copyFromLocal /tmp/ORCID_2020_10_activites_2.tar.gz /data/orcid_activities_2020/ORCID_2020_10_activites_2.tar.gz ; rm -f /tmp/ORCID_2020_10_activites_2.tar.gz
            </value>
            <description>the shell command that downloads and puts to hdfs orcid activity file 2</description>
        </property>
        <property>
            <name>shell_cmd_3</name>
            <value>wget -O /tmp/ORCID_2020_10_activites_3.tar.gz https://orcid.figshare.com/ndownloader/files/25015150 ; hdfs dfs -copyFromLocal /tmp/ORCID_2020_10_activites_3.tar.gz /data/orcid_activities_2020/ORCID_2020_10_activites_3.tar.gz ; rm -f /tmp/ORCID_2020_10_activites_3.tar.gz
            </value>
            <description>the shell command that downloads and puts to hdfs orcid activity file 3</description>
        </property>
        <property>
            <name>shell_cmd_4</name>
            <value>wget -O /tmp/ORCID_2020_10_activites_4.tar.gz https://orcid.figshare.com/ndownloader/files/25033643 ; hdfs dfs -copyFromLocal /tmp/ORCID_2020_10_activites_4.tar.gz /data/orcid_activities_2020/ORCID_2020_10_activites_4.tar.gz ; rm -f /tmp/ORCID_2020_10_activites_4.tar.gz
            </value>
            <description>the shell command that downloads and puts to hdfs orcid activity file 4</description>
        </property>
        <property>
            <name>shell_cmd_5</name>
            <value>wget -O /tmp/ORCID_2020_10_activites_5.tar.gz https://orcid.figshare.com/ndownloader/files/25005483 ; hdfs dfs -copyFromLocal /tmp/ORCID_2020_10_activites_5.tar.gz /data/orcid_activities_2020/ORCID_2020_10_activites_5.tar.gz ; rm -f /tmp/ORCID_2020_10_activites_5.tar.gz
            </value>
            <description>the shell command that downloads and puts to hdfs orcid activity file 5</description>
        </property>
        <property>
            <name>shell_cmd_6</name>
            <value>wget -O /tmp/ORCID_2020_10_activites_6.tar.gz https://orcid.figshare.com/ndownloader/files/25005425 ; hdfs dfs -copyFromLocal /tmp/ORCID_2020_10_activites_6.tar.gz /data/orcid_activities_2020/ORCID_2020_10_activites_6.tar.gz ; rm -f /tmp/ORCID_2020_10_activites_6.tar.gz
            </value>
            <description>the shell command that downloads and puts to hdfs orcid activity file 6</description>
        </property>
        <property>
            <name>shell_cmd_7</name>
            <value>wget -O /tmp/ORCID_2020_10_activites_7.tar.gz https://orcid.figshare.com/ndownloader/files/25012016 ; hdfs dfs -copyFromLocal /tmp/ORCID_2020_10_activites_7.tar.gz /data/orcid_activities_2020/ORCID_2020_10_activites_7.tar.gz ; rm -f /tmp/ORCID_2020_10_activites_7.tar.gz
            </value>
            <description>the shell command that downloads and puts to hdfs orcid activity file 7</description>
        </property>
        <property>
            <name>shell_cmd_8</name>
            <value>wget -O /tmp/ORCID_2020_10_activites_8.tar.gz https://orcid.figshare.com/ndownloader/files/25012079 ; hdfs dfs -copyFromLocal /tmp/ORCID_2020_10_activites_8.tar.gz /data/orcid_activities_2020/ORCID_2020_10_activites_8.tar.gz ; rm -f /tmp/ORCID_2020_10_activites_8.tar.gz
            </value>
            <description>the shell command that downloads and puts to hdfs orcid activity file 8</description>
        </property>
        <property>
            <name>shell_cmd_9</name>
            <value>wget -O /tmp/ORCID_2020_10_activites_9.tar.gz https://orcid.figshare.com/ndownloader/files/25010727 ; hdfs dfs -copyFromLocal /tmp/ORCID_2020_10_activites_9.tar.gz /data/orcid_activities_2020/ORCID_2020_10_activites_9.tar.gz ; rm -f /tmp/ORCID_2020_10_activites_9.tar.gz
            </value>
            <description>the shell command that downloads and puts to hdfs orcid activity file 9</description>
        </property>
        <property>
            <name>shell_cmd_X</name>
            <value>wget -O /tmp/ORCID_2020_10_activites_X.tar.gz https://orcid.figshare.com/ndownloader/files/25011025 ; hdfs dfs -copyFromLocal /tmp/ORCID_2020_10_activites_X.tar.gz /data/orcid_activities_2020/ORCID_2020_10_activites_X.tar.gz ; rm -f /tmp/ORCID_2020_10_activites_X.tar.gz
            </value>
            <description>the shell command that downloads and puts to hdfs orcid activity file X</description>
        </property>
    </parameters>
    <start to="ResetWorkingPath"/>
    <kill name="Kill">
        <message>Action failed, error message[${wf:errorMessage(wf:lastErrorNode())}]</message>
    </kill>
    <action name="ResetWorkingPath">
        <fs>
            <delete path='${workingPath}/no_doi_works/*'/>
        </fs>
        <ok to="fork_check_download_files"/>
        <error to="Kill"/>
    </action>
    <fork name = "fork_check_download_files">
      <path start = "check_exist_on_hdfs_activities_0"/>
      <path start = "check_exist_on_hdfs_activities_1"/>
      <path start = "check_exist_on_hdfs_activities_2"/>
 	  <path start = "check_exist_on_hdfs_activities_3"/>
 	  <path start = "check_exist_on_hdfs_activities_4"/>
 	  <path start = "check_exist_on_hdfs_activities_5"/>
 	  <path start = "check_exist_on_hdfs_activities_6"/>
 	  <path start = "check_exist_on_hdfs_activities_7"/>
 	  <path start = "check_exist_on_hdfs_activities_8"/>
 	  <path start = "check_exist_on_hdfs_activities_9"/>
 	  <path start = "check_exist_on_hdfs_activities_X"/>
   	</fork>
    <decision name="check_exist_on_hdfs_activities_0">
         <switch>
            <case to="wait_download_phase_node">
              ${fs:exists(concat(workingPath,'/ORCID_2020_10_activites_0.tar.gz'))}
            </case>
            <default to="Download_0" />
         </switch>
 	</decision>
    <action name="Download_0">
 		<shell xmlns="uri:oozie:shell-action:0.1">
 		<job-tracker>${jobTracker}</job-tracker>
 		<name-node>${nameNode}</name-node>
 		<exec>bash</exec>
 	    <argument>-c</argument>
 	    <argument>${shell_cmd_0}</argument>
 		<capture-output/>
 		</shell>
 	<ok to="wait_download_phase_node"/>
 	<error to="Kill"/>
 	</action>
 	<action name="GenOrcidAuthorWork_0">
        <java>
            <job-tracker>${jobTracker}</job-tracker>
            <name-node>${nameNode}</name-node>
            <main-class>eu.dnetlib.doiboost.orcidnodoi.GenOrcidAuthorWork</main-class>
            <arg>-w</arg><arg>${workingPath}/</arg>
            <arg>-n</arg><arg>${nameNode}</arg>
            <arg>-f</arg><arg>ORCID_2020_10_activites_0.tar.gz</arg>
            <arg>-ow</arg><arg>no_doi_works/works_0.seq</arg>
            <arg>-oew</arg><arg>no_doi_enriched_works/</arg>
        </java>
        <ok to="join_node"/>
        <error to="Kill"/>
    </action>
    <decision name="check_exist_on_hdfs_activities_1">
         <switch>
            <case to="wait_download_phase_node">
              ${fs:exists(concat(workingPath,'/ORCID_2020_10_activites_1.tar.gz'))}
            </case>
            <default to="Download_1" />
         </switch>
 	</decision>
    <action name="Download_1">
 		<shell xmlns="uri:oozie:shell-action:0.1">
 		<job-tracker>${jobTracker}</job-tracker>
 		<name-node>${nameNode}</name-node>
 		<exec>bash</exec>
 	    <argument>-c</argument>
 	    <argument>${shell_cmd_1}</argument>
 		<capture-output/>
 		</shell>
 	<ok to="wait_download_phase_node"/>
 	<error to="Kill"/>
 	</action>
 	<action name="GenOrcidAuthorWork_1">
        <java>
            <job-tracker>${jobTracker}</job-tracker>
            <name-node>${nameNode}</name-node>
            <main-class>eu.dnetlib.doiboost.orcidnodoi.GenOrcidAuthorWork</main-class>
            <arg>-w</arg><arg>${workingPath}/</arg>
            <arg>-n</arg><arg>${nameNode}</arg>
            <arg>-f</arg><arg>ORCID_2020_10_activites_1.tar.gz</arg>
            <arg>-ow</arg><arg>no_doi_works/works_1.seq</arg>
            <arg>-oew</arg><arg>no_doi_enriched_works/</arg>
        </java>
        <ok to="join_node"/>
        <error to="Kill"/>
    </action>
    <decision name="check_exist_on_hdfs_activities_2">
         <switch>
            <case to="wait_download_phase_node">
              ${fs:exists(concat(workingPath,'/ORCID_2020_10_activites_2.tar.gz'))}
            </case>
            <default to="Download_2" />
         </switch>
 	</decision>
    <action name="Download_2">
 		<shell xmlns="uri:oozie:shell-action:0.1">
 		<job-tracker>${jobTracker}</job-tracker>
 		<name-node>${nameNode}</name-node>
 		<exec>bash</exec>
 	    <argument>-c</argument>
 	    <argument>${shell_cmd_2}</argument>
 		<capture-output/>
 		</shell>
 	<ok to="wait_download_phase_node"/>
 	<error to="Kill"/>
 	</action>
 	<action name="GenOrcidAuthorWork_2">
        <java>
            <job-tracker>${jobTracker}</job-tracker>
            <name-node>${nameNode}</name-node>
            <main-class>eu.dnetlib.doiboost.orcidnodoi.GenOrcidAuthorWork</main-class>
            <arg>-w</arg><arg>${workingPath}/</arg>
            <arg>-n</arg><arg>${nameNode}</arg>
            <arg>-f</arg><arg>ORCID_2020_10_activites_2.tar.gz</arg>
            <arg>-ow</arg><arg>no_doi_works/works_2.seq</arg>
            <arg>-oew</arg><arg>no_doi_enriched_works/</arg>
        </java>
        <ok to="join_node"/>
        <error to="Kill"/>
    </action>
    <decision name="check_exist_on_hdfs_activities_3">
         <switch>
            <case to="wait_download_phase_node">
              ${fs:exists(concat(workingPath,'/ORCID_2020_10_activites_3.tar.gz'))}
            </case>
            <default to="Download_3" />
         </switch>
 	</decision>
    <action name="Download_3">
 		<shell xmlns="uri:oozie:shell-action:0.1">
 		<job-tracker>${jobTracker}</job-tracker>
 		<name-node>${nameNode}</name-node>
 		<exec>bash</exec>
 	    <argument>-c</argument>
 	    <argument>${shell_cmd_3}</argument>
 		<capture-output/>
 		</shell>
 	<ok to="wait_download_phase_node"/>
 	<error to="Kill"/>
 	</action>
 	<action name="GenOrcidAuthorWork_3">
        <java>
            <job-tracker>${jobTracker}</job-tracker>
            <name-node>${nameNode}</name-node>
            <main-class>eu.dnetlib.doiboost.orcidnodoi.GenOrcidAuthorWork</main-class>
            <arg>-w</arg><arg>${workingPath}/</arg>
            <arg>-n</arg><arg>${nameNode}</arg>
            <arg>-f</arg><arg>ORCID_2020_10_activites_3.tar.gz</arg>
            <arg>-ow</arg><arg>no_doi_works/works_3.seq</arg>
            <arg>-oew</arg><arg>no_doi_enriched_works/</arg>
        </java>
        <ok to="join_node"/>
        <error to="Kill"/>
    </action>
    <decision name="check_exist_on_hdfs_activities_4">
         <switch>
            <case to="wait_download_phase_node">
              ${fs:exists(concat(workingPath,'/ORCID_2020_10_activites_4.tar.gz'))}
            </case>
            <default to="Download_4" />
         </switch>
 	</decision>
    <action name="Download_4">
 		<shell xmlns="uri:oozie:shell-action:0.1">
 		<job-tracker>${jobTracker}</job-tracker>
 		<name-node>${nameNode}</name-node>
 		<exec>bash</exec>
 	    <argument>-c</argument>
 	    <argument>${shell_cmd_4}</argument>
 		<capture-output/>
 		</shell>
 	<ok to="wait_download_phase_node"/>
 	<error to="Kill"/>
 	</action>
 	<action name="GenOrcidAuthorWork_4">
        <java>
            <job-tracker>${jobTracker}</job-tracker>
            <name-node>${nameNode}</name-node>
            <main-class>eu.dnetlib.doiboost.orcidnodoi.GenOrcidAuthorWork</main-class>
            <arg>-w</arg><arg>${workingPath}/</arg>
            <arg>-n</arg><arg>${nameNode}</arg>
            <arg>-f</arg><arg>ORCID_2020_10_activites_4.tar.gz</arg>
            <arg>-ow</arg><arg>no_doi_works/works_4.seq</arg>
            <arg>-oew</arg><arg>no_doi_enriched_works/</arg>
        </java>
        <ok to="join_node"/>
        <error to="Kill"/>
    </action>
    <decision name="check_exist_on_hdfs_activities_5">
         <switch>
            <case to="wait_download_phase_node">
              ${fs:exists(concat(workingPath,'/ORCID_2020_10_activites_5.tar.gz'))}
            </case>
            <default to="Download_5" />
         </switch>
 	</decision>
    <action name="Download_5">
 		<shell xmlns="uri:oozie:shell-action:0.1">
 		<job-tracker>${jobTracker}</job-tracker>
 		<name-node>${nameNode}</name-node>
 		<exec>bash</exec>
 	    <argument>-c</argument>
 	    <argument>${shell_cmd_5}</argument>
 		<capture-output/>
 		</shell>
 	<ok to="wait_download_phase_node"/>
 	<error to="Kill"/>
 	</action>
 	<action name="GenOrcidAuthorWork_5">
        <java>
            <job-tracker>${jobTracker}</job-tracker>
            <name-node>${nameNode}</name-node>
            <main-class>eu.dnetlib.doiboost.orcidnodoi.GenOrcidAuthorWork</main-class>
            <arg>-w</arg><arg>${workingPath}/</arg>
            <arg>-n</arg><arg>${nameNode}</arg>
            <arg>-f</arg><arg>ORCID_2020_10_activites_5.tar.gz</arg>
            <arg>-ow</arg><arg>no_doi_works/works_5.seq</arg>
            <arg>-oew</arg><arg>no_doi_enriched_works/</arg>
        </java>
        <ok to="join_node"/>
        <error to="Kill"/>
    </action>
    <decision name="check_exist_on_hdfs_activities_6">
         <switch>
            <case to="wait_download_phase_node">
              ${fs:exists(concat(workingPath,'/ORCID_2020_10_activites_6.tar.gz'))}
            </case>
            <default to="Download_6" />
         </switch>
 	</decision>
    <action name="Download_6">
 		<shell xmlns="uri:oozie:shell-action:0.1">
 		<job-tracker>${jobTracker}</job-tracker>
 		<name-node>${nameNode}</name-node>
 		<exec>bash</exec>
 	    <argument>-c</argument>
 	    <argument>${shell_cmd_6}</argument>
 		<capture-output/>
 		</shell>
 	<ok to="wait_download_phase_node"/>
 	<error to="Kill"/>
 	</action>
 	<action name="GenOrcidAuthorWork_6">
        <java>
            <job-tracker>${jobTracker}</job-tracker>
            <name-node>${nameNode}</name-node>
            <main-class>eu.dnetlib.doiboost.orcidnodoi.GenOrcidAuthorWork</main-class>
            <arg>-w</arg><arg>${workingPath}/</arg>
            <arg>-n</arg><arg>${nameNode}</arg>
            <arg>-f</arg><arg>ORCID_2020_10_activites_6.tar.gz</arg>
            <arg>-ow</arg><arg>no_doi_works/works_6.seq</arg>
            <arg>-oew</arg><arg>no_doi_enriched_works/</arg>
        </java>
        <ok to="join_node"/>
        <error to="Kill"/>
    </action>
    <decision name="check_exist_on_hdfs_activities_7">
         <switch>
            <case to="wait_download_phase_node">
              ${fs:exists(concat(workingPath,'/ORCID_2020_10_activites_7.tar.gz'))}
            </case>
            <default to="Download_7" />
         </switch>
 	</decision>
    <action name="Download_7">
 		<shell xmlns="uri:oozie:shell-action:0.1">
 		<job-tracker>${jobTracker}</job-tracker>
 		<name-node>${nameNode}</name-node>
 		<exec>bash</exec>
 	    <argument>-c</argument>
 	    <argument>${shell_cmd_7}</argument>
 		<capture-output/>
 		</shell>
 	<ok to="wait_download_phase_node"/>
 	<error to="Kill"/>
 	</action>
 	<action name="GenOrcidAuthorWork_7">
        <java>
            <job-tracker>${jobTracker}</job-tracker>
            <name-node>${nameNode}</name-node>
            <main-class>eu.dnetlib.doiboost.orcidnodoi.GenOrcidAuthorWork</main-class>
            <arg>-w</arg><arg>${workingPath}/</arg>
            <arg>-n</arg><arg>${nameNode}</arg>
            <arg>-f</arg><arg>ORCID_2020_10_activites_7.tar.gz</arg>
            <arg>-ow</arg><arg>no_doi_works/works_7.seq</arg>
            <arg>-oew</arg><arg>no_doi_enriched_works/</arg>
        </java>
        <ok to="join_node"/>
        <error to="Kill"/>
    </action>
    <decision name="check_exist_on_hdfs_activities_8">
         <switch>
            <case to="wait_download_phase_node">
              ${fs:exists(concat(workingPath,'/ORCID_2020_10_activites_8.tar.gz'))}
            </case>
            <default to="Download_8" />
         </switch>
 	</decision>
    <action name="Download_8">
 		<shell xmlns="uri:oozie:shell-action:0.1">
 		<job-tracker>${jobTracker}</job-tracker>
 		<name-node>${nameNode}</name-node>
 		<exec>bash</exec>
 	    <argument>-c</argument>
 	    <argument>${shell_cmd_8}</argument>
 		<capture-output/>
 		</shell>
 	<ok to="wait_download_phase_node"/>
 	<error to="Kill"/>
 	</action>
 	<action name="GenOrcidAuthorWork_8">
        <java>
            <job-tracker>${jobTracker}</job-tracker>
            <name-node>${nameNode}</name-node>
            <main-class>eu.dnetlib.doiboost.orcidnodoi.GenOrcidAuthorWork</main-class>
            <arg>-w</arg><arg>${workingPath}/</arg>
            <arg>-n</arg><arg>${nameNode}</arg>
            <arg>-f</arg><arg>ORCID_2020_10_activites_8.tar.gz</arg>
            <arg>-ow</arg><arg>no_doi_works/works_8.seq</arg>
            <arg>-oew</arg><arg>no_doi_enriched_works/</arg>
        </java>
        <ok to="join_node"/>
        <error to="Kill"/>
    </action>
    <decision name="check_exist_on_hdfs_activities_9">
         <switch>
            <case to="wait_download_phase_node">
              ${fs:exists(concat(workingPath,'/ORCID_2020_10_activites_9.tar.gz'))}
            </case>
            <default to="Download_9" />
         </switch>
 	</decision>
    <action name="Download_9">
 		<shell xmlns="uri:oozie:shell-action:0.1">
 		<job-tracker>${jobTracker}</job-tracker>
 		<name-node>${nameNode}</name-node>
 		<exec>bash</exec>
 	    <argument>-c</argument>
 	    <argument>${shell_cmd_9}</argument>
 		<capture-output/>
 		</shell>
 	<ok to="wait_download_phase_node"/>
 	<error to="Kill"/>
 	</action>
 	<action name="GenOrcidAuthorWork_9">
        <java>
            <job-tracker>${jobTracker}</job-tracker>
            <name-node>${nameNode}</name-node>
            <main-class>eu.dnetlib.doiboost.orcidnodoi.GenOrcidAuthorWork</main-class>
            <arg>-w</arg><arg>${workingPath}/</arg>
            <arg>-n</arg><arg>${nameNode}</arg>
            <arg>-f</arg><arg>ORCID_2020_10_activites_9.tar.gz</arg>
            <arg>-ow</arg><arg>no_doi_works/works_9.seq</arg>
            <arg>-oew</arg><arg>no_doi_enriched_works/</arg>
        </java>
        <ok to="join_node"/>
        <error to="Kill"/>
    </action>
    <decision name="check_exist_on_hdfs_activities_X">
         <switch>
            <case to="wait_download_phase_node">
              ${fs:exists(concat(workingPath,'/ORCID_2020_10_activites_X.tar.gz'))}
            </case>
            <default to="Download_X" />
         </switch>
 	</decision>
    <action name="Download_X">
 		<shell xmlns="uri:oozie:shell-action:0.1">
 		<job-tracker>${jobTracker}</job-tracker>
 		<name-node>${nameNode}</name-node>
 		<exec>bash</exec>
 	    <argument>-c</argument>
 	    <argument>${shell_cmd_X}</argument>
 		<capture-output/>
 		</shell>
 	<ok to="wait_download_phase_node"/>
 	<error to="Kill"/>
 	</action>
 	<action name="GenOrcidAuthorWork_X">
        <java>
            <job-tracker>${jobTracker}</job-tracker>
            <name-node>${nameNode}</name-node>
            <main-class>eu.dnetlib.doiboost.orcidnodoi.GenOrcidAuthorWork</main-class>
            <arg>-w</arg><arg>${workingPath}/</arg>
            <arg>-n</arg><arg>${nameNode}</arg>
            <arg>-f</arg><arg>ORCID_2020_10_activites_X.tar.gz</arg>
            <arg>-ow</arg><arg>no_doi_works/works_X.seq</arg>
            <arg>-oew</arg><arg>no_doi_enriched_works/</arg>
        </java>
        <ok to="join_node"/>
        <error to="Kill"/>
    </action>
    <join name = "wait_download_phase_node" to = "fork_gen_orcid_author_work"/>
    <fork name = "fork_gen_orcid_author_work">
        <path start = "GenOrcidAuthorWork_0"/>
        <path start = "GenOrcidAuthorWork_1"/>
        <path start = "GenOrcidAuthorWork_2"/>
        <path start = "GenOrcidAuthorWork_3"/>
        <path start = "GenOrcidAuthorWork_4"/>
        <path start = "GenOrcidAuthorWork_5"/>
        <path start = "GenOrcidAuthorWork_6"/>
        <path start = "GenOrcidAuthorWork_7"/>
        <path start = "GenOrcidAuthorWork_8"/>
        <path start = "GenOrcidAuthorWork_9"/>
        <path start = "GenOrcidAuthorWork_X"/>
    </fork>
    <join name = "join_node" to = "End"/>
 <!--    <join name = "join_node" to = "fork_gen_orcid_author_work_2"/>-->
 <!--    <fork name = "fork_gen_orcid_author_work_2">-->
 <!--        <path start = "GenOrcidAuthorWork_6"/>-->
 <!--        <path start = "GenOrcidAuthorWork_7"/>-->
 <!--        <path start = "GenOrcidAuthorWork_8"/>-->
 <!--        <path start = "GenOrcidAuthorWork_9"/>-->
 <!--        <path start = "GenOrcidAuthorWork_X"/>-->
 <!--    </fork>-->
 <!--    <join name = "join_node_2" to = "End"/>-->
   <end name="End"/>
 </workflow-app>
--- a/dhp-workflows/dhp-doiboost/src/main/resources/eu/dnetlib/dhp/doiboost/orcid_authors_dois_data/oozie_app/config-default.xml
+++ b/dhp-workflows/dhp-doiboost/src/main/resources/eu/dnetlib/dhp/doiboost/orcid_authors_dois_data/oozie_app/config-default.xml
@ -1,22 +0,0 @@
 <configuration>
    <property>
        <name>jobTracker</name>
        <value>yarnRM</value>
    </property>
    <property>
        <name>nameNode</name>
        <value>hdfs://nameservice1</value>
    </property>
    <property>
        <name>oozie.action.sharelib.for.java</name>
        <value>spark2</value>
    </property>
    <property>
        <name>oozie.launcher.mapreduce.user.classpath.first</name>
        <value>true</value>
    </property>
    <property>
      <name>oozie.launcher.mapreduce.map.java.opts</name>
      <value>-Xmx4g</value>
    </property>
 </configuration>
--- a/dhp-workflows/dhp-doiboost/src/main/resources/eu/dnetlib/dhp/doiboost/orcid_authors_dois_data/oozie_app/workflow.xml
+++ b/dhp-workflows/dhp-doiboost/src/main/resources/eu/dnetlib/dhp/doiboost/orcid_authors_dois_data/oozie_app/workflow.xml
@ -1,505 +0,0 @@
 <workflow-app name="Gen Orcid Authors DOIs" xmlns="uri:oozie:workflow:0.5">
    <parameters>
        <property>
            <name>workingPath_activities</name>
            <description>the working dir base path</description>
        </property>
        <property>
            <name>shell_cmd_0</name>
            <value>wget -O /tmp/ORCID_2019_activites_0.tar.gz https://orcid.figshare.com/ndownloader/files/18017660 ; hdfs dfs -copyFromLocal /tmp/ORCID_2019_activites_0.tar.gz /data/orcid_activities/ORCID_2019_activites_0.tar.gz
            </value>
            <description>the shell command that downloads and puts to hdfs orcid activity file 0</description>
        </property>
        <property>
            <name>shell_cmd_1</name>
            <value>wget -O /tmp/ORCID_2019_activites_1.tar.gz https://orcid.figshare.com/ndownloader/files/18017675 ; hdfs dfs -copyFromLocal /tmp/ORCID_2019_activites_1.tar.gz /data/orcid_activities/ORCID_2019_activites_1.tar.gz
            </value>
            <description>the shell command that downloads and puts to hdfs orcid activity file 1</description>
        </property>
        <property>
            <name>shell_cmd_2</name>
            <value>wget -O /tmp/ORCID_2019_activites_2.tar.gz https://orcid.figshare.com/ndownloader/files/18017717 ; hdfs dfs -copyFromLocal /tmp/ORCID_2019_activites_2.tar.gz /data/orcid_activities/ORCID_2019_activites_2.tar.gz
            </value>
            <description>the shell command that downloads and puts to hdfs orcid activity file 2</description>
        </property>
        <property>
            <name>shell_cmd_3</name>
            <value>wget -O /tmp/ORCID_2019_activites_3.tar.gz https://orcid.figshare.com/ndownloader/files/18017765 ; hdfs dfs -copyFromLocal /tmp/ORCID_2019_activites_3.tar.gz /data/orcid_activities/ORCID_2019_activites_3.tar.gz
            </value>
            <description>the shell command that downloads and puts to hdfs orcid activity file 3</description>
        </property> 
        <property>
            <name>shell_cmd_4</name>
            <value>wget -O /tmp/ORCID_2019_activites_4.tar.gz https://orcid.figshare.com/ndownloader/files/18017831 ; hdfs dfs -copyFromLocal /tmp/ORCID_2019_activites_4.tar.gz /data/orcid_activities/ORCID_2019_activites_4.tar.gz
            </value>
            <description>the shell command that downloads and puts to hdfs orcid activity file 4</description>
        </property> 
        <property>
            <name>shell_cmd_5</name>
            <value>wget -O /tmp/ORCID_2019_activites_5.tar.gz https://orcid.figshare.com/ndownloader/files/18017987 ; hdfs dfs -copyFromLocal /tmp/ORCID_2019_activites_5.tar.gz /data/orcid_activities/ORCID_2019_activites_5.tar.gz
            </value>
            <description>the shell command that downloads and puts to hdfs orcid activity file 5</description>
        </property>  
        <property>
            <name>shell_cmd_6</name>
            <value>wget -O /tmp/ORCID_2019_activites_6.tar.gz https://orcid.figshare.com/ndownloader/files/18018053 ; hdfs dfs -copyFromLocal /tmp/ORCID_2019_activites_6.tar.gz /data/orcid_activities/ORCID_2019_activites_6.tar.gz
            </value>
            <description>the shell command that downloads and puts to hdfs orcid activity file 6</description>
        </property>
        <property>
            <name>shell_cmd_7</name>
            <value>wget -O /tmp/ORCID_2019_activites_7.tar.gz https://orcid.figshare.com/ndownloader/files/18018023 ; hdfs dfs -copyFromLocal /tmp/ORCID_2019_activites_7.tar.gz /data/orcid_activities/ORCID_2019_activites_7.tar.gz
            </value>
            <description>the shell command that downloads and puts to hdfs orcid activity file 7</description>
        </property>
        <property>
            <name>shell_cmd_8</name>
            <value>wget -O /tmp/ORCID_2019_activites_8.tar.gz https://orcid.figshare.com/ndownloader/files/18018248 ; hdfs dfs -copyFromLocal /tmp/ORCID_2019_activites_8.tar.gz /data/orcid_activities/ORCID_2019_activites_8.tar.gz
            </value>
            <description>the shell command that downloads and puts to hdfs orcid activity file 8</description>
        </property>
        <property>
            <name>shell_cmd_9</name>
            <value>wget -O /tmp/ORCID_2019_activites_9.tar.gz https://orcid.figshare.com/ndownloader/files/18018029 ; hdfs dfs -copyFromLocal /tmp/ORCID_2019_activites_9.tar.gz /data/orcid_activities/ORCID_2019_activites_9.tar.gz
            </value>
            <description>the shell command that downloads and puts to hdfs orcid activity file 9</description>
        </property> 
        <property>
            <name>shell_cmd_X</name>
            <value>wget -O /tmp/ORCID_2019_activites_X.tar.gz https://orcid.figshare.com/ndownloader/files/18018182 ; hdfs dfs -copyFromLocal /tmp/ORCID_2019_activites_X.tar.gz /data/orcid_activities/ORCID_2019_activites_X.tar.gz
            </value>
            <description>the shell command that downloads and puts to hdfs orcid activity file X</description>
        </property>  
    </parameters>
    <start to="ResetWorkingPath"/>
    <kill name="Kill">
        <message>Action failed, error message[${wf:errorMessage(wf:lastErrorNode())}]</message>
    </kill>
    <action name="ResetWorkingPath">
        <fs>
            <delete path='${workingPath_activities}/output'/>
            <mkdir path='${workingPath_activities}/output'/>
        </fs>
        <ok to="fork_gen_orcid_authors_dois"/>
        <error to="Kill"/>
    </action>
    <fork name = "fork_gen_orcid_authors_dois">
      <path start = "check_exist_on_hdfs_activities_0"/>
      <path start = "check_exist_on_hdfs_activities_1"/>
      <path start = "check_exist_on_hdfs_activities_2"/>
 	  <path start = "check_exist_on_hdfs_activities_3"/>
 	  <path start = "check_exist_on_hdfs_activities_4"/>
 	  <path start = "check_exist_on_hdfs_activities_5"/>
 	  <path start = "check_exist_on_hdfs_activities_6"/>
 	  <path start = "check_exist_on_hdfs_activities_7"/>
 	  <path start = "check_exist_on_hdfs_activities_8"/>
 	  <path start = "check_exist_on_hdfs_activities_9"/>
 	  <path start = "check_exist_on_hdfs_activities_X"/>
   	</fork>
    <decision name="check_exist_on_hdfs_activities_0">
         <switch>
            <case to="Gen_Orcid_Authors_DOIs_0">
              ${fs:exists(concat(workingPath_activities,'/ORCID_2019_activites_0.tar.gz'))}
            </case>
            <default to="Download_0" />
         </switch>
 	</decision>
    <action name="Download_0">
 		<shell xmlns="uri:oozie:shell-action:0.1">
 		<job-tracker>${jobTracker}</job-tracker>
 		<name-node>${nameNode}</name-node>
 		<exec>bash</exec>
 	    <argument>-c</argument>
 	    <argument>${shell_cmd_0}</argument>
 		<capture-output/>
 		</shell>
 	<ok to="Gen_Orcid_Authors_DOIs_0"/>
 	<error to="Kill"/>
 	</action>
 	<action name="Gen_Orcid_Authors_DOIs_0">
        <java>
            <job-tracker>${jobTracker}</job-tracker>
            <name-node>${nameNode}</name-node>
            <main-class>eu.dnetlib.doiboost.orcid.OrcidAuthorsDOIsDataGen</main-class>
            <arg>-d</arg><arg>${workingPath_activities}/</arg>
            <arg>-n</arg><arg>${nameNode}</arg>
            <arg>-f</arg><arg>ORCID_2019_activites_0.tar.gz</arg>
            <arg>-o</arg><arg>output/authors_dois_0.seq</arg>
        </java>
        <ok to="join_node"/>
        <error to="Kill"/>
    </action>
    <decision name="check_exist_on_hdfs_activities_1">
         <switch>
            <case to="Gen_Orcid_Authors_DOIs_1">
              ${fs:exists(concat(workingPath_activities,'/ORCID_2019_activites_1.tar.gz'))}
            </case>
            <default to="Download_1" />
         </switch>
 	</decision>
    <action name="Download_1">
 		<shell xmlns="uri:oozie:shell-action:0.1">
 		<job-tracker>${jobTracker}</job-tracker>
 		<name-node>${nameNode}</name-node>
 		<exec>bash</exec>
 	    <argument>-c</argument>
 	    <argument>${shell_cmd_1}</argument>
 		<capture-output/>
 		</shell>
 	<ok to="Gen_Orcid_Authors_DOIs_1"/>
 	<error to="Kill"/>
 	</action>
 	<action name="Gen_Orcid_Authors_DOIs_1">
        <java>
            <job-tracker>${jobTracker}</job-tracker>
            <name-node>${nameNode}</name-node>
            <main-class>eu.dnetlib.doiboost.orcid.OrcidAuthorsDOIsDataGen</main-class>
            <arg>-d</arg><arg>${workingPath_activities}/</arg>
            <arg>-n</arg><arg>${nameNode}</arg>
            <arg>-f</arg><arg>ORCID_2019_activites_1.tar.gz</arg>
            <arg>-o</arg><arg>output/authors_dois_1.seq</arg>
        </java>
        <ok to="join_node"/>
        <error to="Kill"/>
    </action>
    <decision name="check_exist_on_hdfs_activities_2">
         <switch>
            <case to="Gen_Orcid_Authors_DOIs_2">
              ${fs:exists(concat(workingPath_activities,'/ORCID_2019_activites_2.tar.gz'))}
            </case>
            <default to="Download_2" />
         </switch>
 	</decision>
    <action name="Download_2">
 		<shell xmlns="uri:oozie:shell-action:0.1">
 		<job-tracker>${jobTracker}</job-tracker>
 		<name-node>${nameNode}</name-node>
 		<exec>bash</exec>
 	    <argument>-c</argument>
 	    <argument>${shell_cmd_2}</argument>
 		<capture-output/>
 		</shell>
 	<ok to="Gen_Orcid_Authors_DOIs_2"/>
 	<error to="Kill"/>
 	</action>
 	<action name="Gen_Orcid_Authors_DOIs_2">
        <java>
            <job-tracker>${jobTracker}</job-tracker>
            <name-node>${nameNode}</name-node>
            <main-class>eu.dnetlib.doiboost.orcid.OrcidAuthorsDOIsDataGen</main-class>
            <arg>-d</arg><arg>${workingPath_activities}/</arg>
            <arg>-n</arg><arg>${nameNode}</arg>
            <arg>-f</arg><arg>ORCID_2019_activites_2.tar.gz</arg>
            <arg>-o</arg><arg>output/authors_dois_2.seq</arg>
        </java>
        <ok to="join_node"/>
        <error to="Kill"/>
    </action>
    <decision name="check_exist_on_hdfs_activities_3">
         <switch>
            <case to="Gen_Orcid_Authors_DOIs_3">
              ${fs:exists(concat(workingPath_activities,'/ORCID_2019_activites_3.tar.gz'))}
            </case>
            <default to="Download_3" />
         </switch>
 	</decision>
    <action name="Download_3">
 		<shell xmlns="uri:oozie:shell-action:0.1">
 		<job-tracker>${jobTracker}</job-tracker>
 		<name-node>${nameNode}</name-node>
 		<exec>bash</exec>
 	    <argument>-c</argument>
 	    <argument>${shell_cmd_3}</argument>
 		<capture-output/>
 		</shell>
 	<ok to="Gen_Orcid_Authors_DOIs_3"/>
 	<error to="Kill"/>
 	</action>
 	<action name="Gen_Orcid_Authors_DOIs_3">
        <java>
            <job-tracker>${jobTracker}</job-tracker>
            <name-node>${nameNode}</name-node>
            <main-class>eu.dnetlib.doiboost.orcid.OrcidAuthorsDOIsDataGen</main-class>
            <arg>-d</arg><arg>${workingPath_activities}/</arg>
            <arg>-n</arg><arg>${nameNode}</arg>
            <arg>-f</arg><arg>ORCID_2019_activites_3.tar.gz</arg>
            <arg>-o</arg><arg>output/authors_dois_3.seq</arg>
        </java>
        <ok to="join_node"/>
        <error to="Kill"/>
    </action>
    <decision name="check_exist_on_hdfs_activities_4">
         <switch>
            <case to="Gen_Orcid_Authors_DOIs_4">
              ${fs:exists(concat(workingPath_activities,'/ORCID_2019_activites_4.tar.gz'))}
            </case>
            <default to="Download_4" />
         </switch>
 	</decision>
    <action name="Download_4">
 		<shell xmlns="uri:oozie:shell-action:0.1">
 		<job-tracker>${jobTracker}</job-tracker>
 		<name-node>${nameNode}</name-node>
 		<exec>bash</exec>
 	    <argument>-c</argument>
 	    <argument>${shell_cmd_4}</argument>
 		<capture-output/>
 		</shell>
 	<ok to="Gen_Orcid_Authors_DOIs_4"/>
 	<error to="Kill"/>
 	</action>
 	<action name="Gen_Orcid_Authors_DOIs_4">
        <java>
            <job-tracker>${jobTracker}</job-tracker>
            <name-node>${nameNode}</name-node>
            <main-class>eu.dnetlib.doiboost.orcid.OrcidAuthorsDOIsDataGen</main-class>
            <arg>-d</arg><arg>${workingPath_activities}/</arg>
            <arg>-n</arg><arg>${nameNode}</arg>
            <arg>-f</arg><arg>ORCID_2019_activites_4.tar.gz</arg>
            <arg>-o</arg><arg>output/authors_dois_4.seq</arg>
        </java>
        <ok to="join_node"/>
        <error to="Kill"/>
    </action>
    <decision name="check_exist_on_hdfs_activities_5">
         <switch>
            <case to="Gen_Orcid_Authors_DOIs_5">
              ${fs:exists(concat(workingPath_activities,'/ORCID_2019_activites_5.tar.gz'))}
            </case>
            <default to="Download_5" />
         </switch>
 	</decision>
    <action name="Download_5">
 		<shell xmlns="uri:oozie:shell-action:0.1">
 		<job-tracker>${jobTracker}</job-tracker>
 		<name-node>${nameNode}</name-node>
 		<exec>bash</exec>
 	    <argument>-c</argument>
 	    <argument>${shell_cmd_5}</argument>
 		<capture-output/>
 		</shell>
 	<ok to="Gen_Orcid_Authors_DOIs_5"/>
 	<error to="Kill"/>
 	</action>
 	<action name="Gen_Orcid_Authors_DOIs_5">
        <java>
            <job-tracker>${jobTracker}</job-tracker>
            <name-node>${nameNode}</name-node>
            <main-class>eu.dnetlib.doiboost.orcid.OrcidAuthorsDOIsDataGen</main-class>
            <arg>-d</arg><arg>${workingPath_activities}/</arg>
            <arg>-n</arg><arg>${nameNode}</arg>
            <arg>-f</arg><arg>ORCID_2019_activites_5.tar.gz</arg>
            <arg>-o</arg><arg>output/authors_dois_5.seq</arg>
        </java>
        <ok to="join_node"/>
        <error to="Kill"/>
    </action>
    <decision name="check_exist_on_hdfs_activities_6">
         <switch>
            <case to="Gen_Orcid_Authors_DOIs_6">
              ${fs:exists(concat(workingPath_activities,'/ORCID_2019_activites_6.tar.gz'))}
            </case>
            <default to="Download_6" />
         </switch>
 	</decision>
    <action name="Download_6">
 		<shell xmlns="uri:oozie:shell-action:0.1">
 		<job-tracker>${jobTracker}</job-tracker>
 		<name-node>${nameNode}</name-node>
 		<exec>bash</exec>
 	    <argument>-c</argument>
 	    <argument>${shell_cmd_6}</argument>
 		<capture-output/>
 		</shell>
 	<ok to="Gen_Orcid_Authors_DOIs_6"/>
 	<error to="Kill"/>
 	</action>
 	<action name="Gen_Orcid_Authors_DOIs_6">
        <java>
            <job-tracker>${jobTracker}</job-tracker>
            <name-node>${nameNode}</name-node>
            <main-class>eu.dnetlib.doiboost.orcid.OrcidAuthorsDOIsDataGen</main-class>
            <arg>-d</arg><arg>${workingPath_activities}/</arg>
            <arg>-n</arg><arg>${nameNode}</arg>
            <arg>-f</arg><arg>ORCID_2019_activites_6.tar.gz</arg>
            <arg>-o</arg><arg>output/authors_dois_6.seq</arg>
        </java>
        <ok to="join_node"/>
        <error to="Kill"/>
    </action>
    <decision name="check_exist_on_hdfs_activities_7">
         <switch>
            <case to="Gen_Orcid_Authors_DOIs_7">
              ${fs:exists(concat(workingPath_activities,'/ORCID_2019_activites_7.tar.gz'))}
            </case>
            <default to="Download_7" />
         </switch>
 	</decision>
    <action name="Download_7">
 		<shell xmlns="uri:oozie:shell-action:0.1">
 		<job-tracker>${jobTracker}</job-tracker>
 		<name-node>${nameNode}</name-node>
 		<exec>bash</exec>
 	    <argument>-c</argument>
 	    <argument>${shell_cmd_7}</argument>
 		<capture-output/>
 		</shell>
 	<ok to="Gen_Orcid_Authors_DOIs_7"/>
 	<error to="Kill"/>
 	</action>
 	<action name="Gen_Orcid_Authors_DOIs_7">
        <java>
            <job-tracker>${jobTracker}</job-tracker>
            <name-node>${nameNode}</name-node>
            <main-class>eu.dnetlib.doiboost.orcid.OrcidAuthorsDOIsDataGen</main-class>
            <arg>-d</arg><arg>${workingPath_activities}/</arg>
            <arg>-n</arg><arg>${nameNode}</arg>
            <arg>-f</arg><arg>ORCID_2019_activites_7.tar.gz</arg>
            <arg>-o</arg><arg>output/authors_dois_7.seq</arg>
        </java>
        <ok to="join_node"/>
        <error to="Kill"/>
    </action>
    <decision name="check_exist_on_hdfs_activities_8">
         <switch>
            <case to="Gen_Orcid_Authors_DOIs_8">
              ${fs:exists(concat(workingPath_activities,'/ORCID_2019_activites_8.tar.gz'))}
            </case>
            <default to="Download_8" />
         </switch>
 	</decision>
    <action name="Download_8">
 		<shell xmlns="uri:oozie:shell-action:0.1">
 		<job-tracker>${jobTracker}</job-tracker>
 		<name-node>${nameNode}</name-node>
 		<exec>bash</exec>
 	    <argument>-c</argument>
 	    <argument>${shell_cmd_8}</argument>
 		<capture-output/>
 		</shell>
 	<ok to="Gen_Orcid_Authors_DOIs_8"/>
 	<error to="Kill"/>
 	</action>
 	<action name="Gen_Orcid_Authors_DOIs_8">
        <java>
            <job-tracker>${jobTracker}</job-tracker>
            <name-node>${nameNode}</name-node>
            <main-class>eu.dnetlib.doiboost.orcid.OrcidAuthorsDOIsDataGen</main-class>
            <arg>-d</arg><arg>${workingPath_activities}/</arg>
            <arg>-n</arg><arg>${nameNode}</arg>
            <arg>-f</arg><arg>ORCID_2019_activites_8.tar.gz</arg>
            <arg>-o</arg><arg>output/authors_dois_8.seq</arg>
        </java>
        <ok to="join_node"/>
        <error to="Kill"/>
    </action>
    <decision name="check_exist_on_hdfs_activities_9">
         <switch>
            <case to="Gen_Orcid_Authors_DOIs_9">
              ${fs:exists(concat(workingPath_activities,'/ORCID_2019_activites_9.tar.gz'))}
            </case>
            <default to="Download_9" />
         </switch>
 	</decision>
    <action name="Download_9">
 		<shell xmlns="uri:oozie:shell-action:0.1">
 		<job-tracker>${jobTracker}</job-tracker>
 		<name-node>${nameNode}</name-node>
 		<exec>bash</exec>
 	    <argument>-c</argument>
 	    <argument>${shell_cmd_9}</argument>
 		<capture-output/>
 		</shell>
 	<ok to="Gen_Orcid_Authors_DOIs_9"/>
 	<error to="Kill"/>
 	</action>
 	<action name="Gen_Orcid_Authors_DOIs_9">
        <java>
            <job-tracker>${jobTracker}</job-tracker>
            <name-node>${nameNode}</name-node>
            <main-class>eu.dnetlib.doiboost.orcid.OrcidAuthorsDOIsDataGen</main-class>
            <arg>-d</arg><arg>${workingPath_activities}/</arg>
            <arg>-n</arg><arg>${nameNode}</arg>
            <arg>-f</arg><arg>ORCID_2019_activites_9.tar.gz</arg>
            <arg>-o</arg><arg>output/authors_dois_9.seq</arg>
        </java>
        <ok to="join_node"/>
        <error to="Kill"/>
    </action>
    <decision name="check_exist_on_hdfs_activities_X">
         <switch>
            <case to="Gen_Orcid_Authors_DOIs_X">
              ${fs:exists(concat(workingPath_activities,'/ORCID_2019_activites_X.tar.gz'))}
            </case>
            <default to="Download_X" />
         </switch>
 	</decision>
    <action name="Download_X">
 		<shell xmlns="uri:oozie:shell-action:0.1">
 		<job-tracker>${jobTracker}</job-tracker>
 		<name-node>${nameNode}</name-node>
 		<exec>bash</exec>
 	    <argument>-c</argument>
 	    <argument>${shell_cmd_X}</argument>
 		<capture-output/>
 		</shell>
 	<ok to="Gen_Orcid_Authors_DOIs_X"/>
 	<error to="Kill"/>
 	</action>
 	<action name="Gen_Orcid_Authors_DOIs_X">
        <java>
            <job-tracker>${jobTracker}</job-tracker>
            <name-node>${nameNode}</name-node>
            <main-class>eu.dnetlib.doiboost.orcid.OrcidAuthorsDOIsDataGen</main-class>
            <arg>-d</arg><arg>${workingPath_activities}/</arg>
            <arg>-n</arg><arg>${nameNode}</arg>
            <arg>-f</arg><arg>ORCID_2019_activites_X.tar.gz</arg>
            <arg>-o</arg><arg>output/authors_dois_X.seq</arg>
        </java>
        <ok to="join_node"/>
        <error to="Kill"/>
    </action>
    <join name = "join_node" to = "End"/>
   <end name="End"/>
 </workflow-app>
--- a/dhp-workflows/dhp-doiboost/src/main/resources/eu/dnetlib/dhp/doiboost/orcid_doi_author_list/oozie_app/config-default.xml
+++ b/dhp-workflows/dhp-doiboost/src/main/resources/eu/dnetlib/dhp/doiboost/orcid_doi_author_list/oozie_app/config-default.xml
@ -1,18 +0,0 @@
 <configuration>
    <property>
            <name>jobTracker</name>
            <value>hadoop-rm3.garr-pa1.d4science.org:8032</value>
    </property>
    <property>
            <name>nameNode</name>
            <value>hdfs://hadoop-rm1.garr-pa1.d4science.org:8020</value>
    </property>
    <property>
            <name>queueName</name>
            <value>default</value>
    </property>
    <property>
        <name>oozie.action.sharelib.for.spark</name>
        <value>spark2</value>
    </property>
 </configuration>
--- a/dhp-workflows/dhp-doiboost/src/main/resources/eu/dnetlib/dhp/doiboost/orcid_doi_author_list/oozie_app/workflow.xml
+++ b/dhp-workflows/dhp-doiboost/src/main/resources/eu/dnetlib/dhp/doiboost/orcid_doi_author_list/oozie_app/workflow.xml
@ -1,55 +0,0 @@
 <workflow-app name="Gen_Doi_Author_List_WF" xmlns="uri:oozie:workflow:0.5">
    <parameters>
        <property>
            <name>workingPath</name>
            <description>the working dir base path</description>
        </property>
        <property>
            <name>sparkDriverMemory</name>
            <description>memory for driver process</description>
        </property>
        <property>
            <name>sparkExecutorMemory</name>
            <description>memory for individual executor</description>
        </property>
        <property>
            <name>sparkExecutorCores</name>
            <description>number of cores used by single executor</description>
        </property>
    </parameters>
    <start to="ResetWorkingPath"/>
    <kill name="Kill">
        <message>Action failed, error message[${wf:errorMessage(wf:lastErrorNode())}]</message>
    </kill>
    <action name="ResetWorkingPath">
        <fs>
            <delete path='${workingPath_activities}/doi_author_list'/>
        </fs>
        <ok to="Gen_Doi_Author_List"/>
        <error to="Kill"/>
    </action>
 	<action name="Gen_Doi_Author_List">
        <spark xmlns="uri:oozie:spark-action:0.2">
        	<job-tracker>${jobTracker}</job-tracker>
            <name-node>${nameNode}</name-node>
            <master>yarn</master>
            <mode>cluster</mode>
            <name>Gen_Doi_Author_List</name>
            <class>eu.dnetlib.doiboost.orcid.SparkGenerateDoiAuthorList</class>
            <jar>dhp-doiboost-1.2.1-SNAPSHOT.jar</jar>
            <spark-opts>--num-executors 10 --conf spark.yarn.jars=&quot;hdfs://hadoop-rm1.garr-pa1.d4science.org:8020/user/oozie/share/lib/lib_20180405103059/spark2&quot; --executor-memory=${sparkExecutorMemory} --executor-cores=${sparkExecutorCores} --driver-memory=${sparkDriverMemory}
            </spark-opts>
            <arg>-w</arg><arg>${workingPath}/</arg>
            <arg>-o</arg><arg>doi_author_list/</arg>
        </spark>
        <ok to="End"/>
        <error to="Kill"/>
    </action>
   <end name="End"/>
 </workflow-app>
--- a/dhp-workflows/dhp-doiboost/src/main/resources/eu/dnetlib/dhp/doiboost/orcid_extract_xml_activities/oozie_app/workflow.xml
+++ b/dhp-workflows/dhp-doiboost/src/main/resources/eu/dnetlib/dhp/doiboost/orcid_extract_xml_activities/oozie_app/workflow.xml
@ -1,232 +0,0 @@
 <workflow-app name="Extract Orcid XML Works From Activities" xmlns="uri:oozie:workflow:0.5">
    <parameters>
        <property>
            <name>workingPath</name>
            <description>the working dir base path</description>
        </property>
    </parameters>
    <global>
        <job-tracker>${jobTracker}</job-tracker>
        <name-node>${nameNode}</name-node>
        <configuration>
            <property>
                <name>oozie.action.sharelib.for.java</name>
                <value>${oozieActionShareLibForSpark2}</value>
            </property>
            <property>
                <name>oozie.launcher.mapreduce.user.classpath.first</name>
                <value>true</value>
            </property>
            <property>
                <name>oozie.launcher.mapreduce.map.java.opts</name>
                <value>-Xmx2g</value>
            </property>
            <property>
                <name>oozie.use.system.libpath</name>
                <value>true</value>
            </property>
        </configuration>
    </global>
    <start to="ResetWorkingPath"/>
    <kill name="Kill">
        <message>Action failed, error message[${wf:errorMessage(wf:lastErrorNode())}]</message>
    </kill>
    <action name="ResetWorkingPath">
        <fs>
            <delete path='${workingPath}/xml/works'/>
            <mkdir path='${workingPath}/xml/works'/>
        </fs>
        <ok to="fork_node"/>
        <error to="Kill"/>
    </action>
    <fork name = "fork_node">
        <path start = "ExtractXMLWorkActivities_0"/>
        <path start = "ExtractXMLWorkActivities_1"/>
        <path start = "ExtractXMLWorkActivities_2"/>
        <path start = "ExtractXMLWorkActivities_3"/>
        <path start = "ExtractXMLWorkActivities_4"/>
        <path start = "ExtractXMLWorkActivities_5"/>
        <path start = "ExtractXMLWorkActivities_6"/>
        <path start = "ExtractXMLWorkActivities_7"/>
        <path start = "ExtractXMLWorkActivities_8"/>
        <path start = "ExtractXMLWorkActivities_9"/>
        <path start = "ExtractXMLWorkActivities_X"/>
    </fork>
    <action name="ExtractXMLWorkActivities_0">
        <java>
            <job-tracker>${jobTracker}</job-tracker>
            <name-node>${nameNode}</name-node>
            <main-class>eu.dnetlib.doiboost.orcid.ExtractXMLActivitiesData</main-class>
            <arg>-w</arg><arg>${workingPath}/</arg>
            <arg>-n</arg><arg>${nameNode}</arg>
            <arg>-f</arg><arg>ORCID_2020_10_activites_0.tar.gz</arg>
            <arg>-ow</arg><arg>xml/works/xml_works_0.seq</arg>
            <arg>-oew</arg><arg>---</arg>
        </java>
        <ok to="join_node"/>
        <error to="Kill"/>
    </action>
    <action name="ExtractXMLWorkActivities_1">
        <java>
            <job-tracker>${jobTracker}</job-tracker>
            <name-node>${nameNode}</name-node>
            <main-class>eu.dnetlib.doiboost.orcid.ExtractXMLActivitiesData</main-class>
            <arg>-w</arg><arg>${workingPath}/</arg>
            <arg>-n</arg><arg>${nameNode}</arg>
            <arg>-f</arg><arg>ORCID_2020_10_activites_1.tar.gz</arg>
            <arg>-ow</arg><arg>xml/works/xml_works_1.seq</arg>
            <arg>-oew</arg><arg>---</arg>
        </java>
        <ok to="join_node"/>
        <error to="Kill"/>
    </action>
    <action name="ExtractXMLWorkActivities_2">
        <java>
            <job-tracker>${jobTracker}</job-tracker>
            <name-node>${nameNode}</name-node>
            <main-class>eu.dnetlib.doiboost.orcid.ExtractXMLActivitiesData</main-class>
            <arg>-w</arg><arg>${workingPath}/</arg>
            <arg>-n</arg><arg>${nameNode}</arg>
            <arg>-f</arg><arg>ORCID_2020_10_activites_2.tar.gz</arg>
            <arg>-ow</arg><arg>xml/works/xml_works_2.seq</arg>
            <arg>-oew</arg><arg>---</arg>
        </java>
        <ok to="join_node"/>
        <error to="Kill"/>
    </action>
    <action name="ExtractXMLWorkActivities_3">
        <java>
            <job-tracker>${jobTracker}</job-tracker>
            <name-node>${nameNode}</name-node>
            <main-class>eu.dnetlib.doiboost.orcid.ExtractXMLActivitiesData</main-class>
            <arg>-w</arg><arg>${workingPath}/</arg>
            <arg>-n</arg><arg>${nameNode}</arg>
            <arg>-f</arg><arg>ORCID_2020_10_activites_3.tar.gz</arg>
            <arg>-ow</arg><arg>xml/works/xml_works_3.seq</arg>
            <arg>-oew</arg><arg>---</arg>
        </java>
        <ok to="join_node"/>
        <error to="Kill"/>
    </action>
    <action name="ExtractXMLWorkActivities_4">
        <java>
            <job-tracker>${jobTracker}</job-tracker>
            <name-node>${nameNode}</name-node>
            <main-class>eu.dnetlib.doiboost.orcid.ExtractXMLActivitiesData</main-class>
            <arg>-w</arg><arg>${workingPath}/</arg>
            <arg>-n</arg><arg>${nameNode}</arg>
            <arg>-f</arg><arg>ORCID_2020_10_activites_4.tar.gz</arg>
            <arg>-ow</arg><arg>xml/works/xml_works_4.seq</arg>
            <arg>-oew</arg><arg>---</arg>
        </java>
        <ok to="join_node"/>
        <error to="Kill"/>
    </action>
    <action name="ExtractXMLWorkActivities_5">
        <java>
            <job-tracker>${jobTracker}</job-tracker>
            <name-node>${nameNode}</name-node>
            <main-class>eu.dnetlib.doiboost.orcid.ExtractXMLActivitiesData</main-class>
            <arg>-w</arg><arg>${workingPath}/</arg>
            <arg>-n</arg><arg>${nameNode}</arg>
            <arg>-f</arg><arg>ORCID_2020_10_activites_5.tar.gz</arg>
            <arg>-ow</arg><arg>xml/works/xml_works_5.seq</arg>
            <arg>-oew</arg><arg>---</arg>
        </java>
        <ok to="join_node"/>
        <error to="Kill"/>
    </action>
    <action name="ExtractXMLWorkActivities_6">
        <java>
            <job-tracker>${jobTracker}</job-tracker>
            <name-node>${nameNode}</name-node>
            <main-class>eu.dnetlib.doiboost.orcid.ExtractXMLActivitiesData</main-class>
            <arg>-w</arg><arg>${workingPath}/</arg>
            <arg>-n</arg><arg>${nameNode}</arg>
            <arg>-f</arg><arg>ORCID_2020_10_activites_6.tar.gz</arg>
            <arg>-ow</arg><arg>xml/works/xml_works_6.seq</arg>
            <arg>-oew</arg><arg>---</arg>
        </java>
        <ok to="join_node"/>
        <error to="Kill"/>
    </action>
    <action name="ExtractXMLWorkActivities_7">
        <java>
            <job-tracker>${jobTracker}</job-tracker>
            <name-node>${nameNode}</name-node>
            <main-class>eu.dnetlib.doiboost.orcid.ExtractXMLActivitiesData</main-class>
            <arg>-w</arg><arg>${workingPath}/</arg>
            <arg>-n</arg><arg>${nameNode}</arg>
            <arg>-f</arg><arg>ORCID_2020_10_activites_7.tar.gz</arg>
            <arg>-ow</arg><arg>xml/works/xml_works_7.seq</arg>
            <arg>-oew</arg><arg>---</arg>
        </java>
        <ok to="join_node"/>
        <error to="Kill"/>
    </action>
    <action name="ExtractXMLWorkActivities_8">
        <java>
            <job-tracker>${jobTracker}</job-tracker>
            <name-node>${nameNode}</name-node>
            <main-class>eu.dnetlib.doiboost.orcid.ExtractXMLActivitiesData</main-class>
            <arg>-w</arg><arg>${workingPath}/</arg>
            <arg>-n</arg><arg>${nameNode}</arg>
            <arg>-f</arg><arg>ORCID_2020_10_activites_8.tar.gz</arg>
            <arg>-ow</arg><arg>xml/works/xml_works_8.seq</arg>
            <arg>-oew</arg><arg>---</arg>
        </java>
        <ok to="join_node"/>
        <error to="Kill"/>
    </action>
    <action name="ExtractXMLWorkActivities_9">
        <java>
            <job-tracker>${jobTracker}</job-tracker>
            <name-node>${nameNode}</name-node>
            <main-class>eu.dnetlib.doiboost.orcid.ExtractXMLActivitiesData</main-class>
            <arg>-w</arg><arg>${workingPath}/</arg>
            <arg>-n</arg><arg>${nameNode}</arg>
            <arg>-f</arg><arg>ORCID_2020_10_activites_9.tar.gz</arg>
            <arg>-ow</arg><arg>xml/works/xml_works_9.seq</arg>
            <arg>-oew</arg><arg>---</arg>
        </java>
        <ok to="join_node"/>
        <error to="Kill"/>
    </action>
    <action name="ExtractXMLWorkActivities_X">
        <java>
            <job-tracker>${jobTracker}</job-tracker>
            <name-node>${nameNode}</name-node>
            <main-class>eu.dnetlib.doiboost.orcid.ExtractXMLActivitiesData</main-class>
            <arg>-w</arg><arg>${workingPath}/</arg>
            <arg>-n</arg><arg>${nameNode}</arg>
            <arg>-f</arg><arg>ORCID_2020_10_activites_X.tar.gz</arg>
            <arg>-ow</arg><arg>xml/works/xml_works_X.seq</arg>
            <arg>-oew</arg><arg>---</arg>
        </java>
        <ok to="join_node"/>
        <error to="Kill"/>
    </action>
    <join name = "join_node" to = "End"/>
    <end name="End"/>
 </workflow-app>
--- a/dhp-workflows/dhp-doiboost/src/main/resources/eu/dnetlib/dhp/doiboost/orcid_extract_xml_summaries/oozie_app/config-default.xml
+++ b/dhp-workflows/dhp-doiboost/src/main/resources/eu/dnetlib/dhp/doiboost/orcid_extract_xml_summaries/oozie_app/config-default.xml
@ -1,26 +0,0 @@
 <configuration>
    <property>
        <name>jobTracker</name>
        <value>yarnRM</value>
    </property>
    <property>
        <name>nameNode</name>
        <value>hdfs://nameservice1</value>
    </property>
    <property>
        <name>oozie.use.system.libpath</name>
        <value>true</value>
    </property>
    <property>
        <name>oozie.action.sharelib.for.spark</name>
        <value>spark2</value>
    </property>
    <property>
        <name>oozie.launcher.mapreduce.user.classpath.first</name>
        <value>true</value>
    </property>
    <property>
        <name>oozie.launcher.mapreduce.map.java.opts</name>
        <value>-Xmx8g</value>
    </property>
 </configuration>
--- a/dhp-workflows/dhp-doiboost/src/main/resources/eu/dnetlib/dhp/doiboost/orcid_extract_xml_summaries/oozie_app/workflow.xml
+++ b/dhp-workflows/dhp-doiboost/src/main/resources/eu/dnetlib/dhp/doiboost/orcid_extract_xml_summaries/oozie_app/workflow.xml
@ -1,40 +0,0 @@
 <workflow-app name="Extract Orcid XML Authors From Summaries" xmlns="uri:oozie:workflow:0.5">
    <parameters>
        <property>
            <name>workingPath</name>
            <description>the working dir base path</description>
        </property>
    </parameters>
    <start to="ResetWorkingPath"/>
    <kill name="Kill">
        <message>Action failed, error message[${wf:errorMessage(wf:lastErrorNode())}]</message>
    </kill>
    <action name="ResetWorkingPath">
        <fs>
            <delete path='${workingPath}/xml/authors'/>
            <mkdir path='${workingPath}/xml/authors'/>
        </fs>
        <ok to="ExtractXMLAuthorsSummaries"/>
        <error to="Kill"/>
    </action>
    <action name="ExtractXMLAuthorsSummaries">
        <java>
            <job-tracker>${jobTracker}</job-tracker>
            <name-node>${nameNode}</name-node>
            <main-class>eu.dnetlib.doiboost.orcid.ExtractXMLSummariesData</main-class>
            <arg>-w</arg><arg>${workingPath}/</arg>
            <arg>-n</arg><arg>${nameNode}</arg>
            <arg>-f</arg><arg>ORCID_2020_10_summaries.tar.gz</arg>
            <arg>-o</arg><arg>xml/authors/</arg>
        </java>
        <ok to="End"/>
        <error to="Kill"/>
    </action>
    <end name="End"/>
 </workflow-app>
--- a/dhp-workflows/dhp-doiboost/src/main/resources/eu/dnetlib/dhp/doiboost/orcid_summaries/oozie_app/config-default.xml
+++ b/dhp-workflows/dhp-doiboost/src/main/resources/eu/dnetlib/dhp/doiboost/orcid_summaries/oozie_app/config-default.xml
@ -1,26 +0,0 @@
 <configuration>
    <property>
        <name>jobTracker</name>
        <value>yarnRM</value>
    </property>
    <property>
        <name>nameNode</name>
        <value>hdfs://nameservice1</value>
    </property>
    <property>
        <name>oozie.use.system.libpath</name>
        <value>true</value>
    </property>
    <property>
        <name>oozie.action.sharelib.for.spark</name>
        <value>spark2</value>
    </property>
    <property>
        <name>oozie.launcher.mapreduce.user.classpath.first</name>
        <value>true</value>
    </property>
    <property>
        <name>oozie.launcher.mapreduce.map.java.opts</name>
        <value>-Xmx8g</value>
    </property>
 </configuration>
--- a/dhp-workflows/dhp-doiboost/src/main/resources/eu/dnetlib/dhp/doiboost/orcid_summaries/oozie_app/workflow.xml
+++ b/dhp-workflows/dhp-doiboost/src/main/resources/eu/dnetlib/dhp/doiboost/orcid_summaries/oozie_app/workflow.xml
@ -1,68 +0,0 @@
 <workflow-app name="Gen Orcid Authors From Summaries" xmlns="uri:oozie:workflow:0.5">
    <parameters>
        <property>
            <name>workingPath</name>
            <description>the working dir base path</description>
        </property>
        <property>
            <name>shell_cmd_0</name>
            <value>wget -O /tmp/ORCID_2020_10_summaries.tar.gz https://orcid.figshare.com/ndownloader/files/25032905 ; hdfs dfs -copyFromLocal /tmp/ORCID_2020_10_summaries.tar.gz /data/orcid_activities_2020/ORCID_2020_10_summaries.tar.gz ; rm -f /tmp/ORCID_2020_10_summaries.tar.gz
            </value>
            <description>the shell command that downloads and puts to hdfs orcid summaries</description>
        </property>
    </parameters>
    <start to="ResetWorkingPath"/>
    <kill name="Kill">
        <message>Action failed, error message[${wf:errorMessage(wf:lastErrorNode())}]</message>
    </kill>
    <action name="ResetWorkingPath">
        <fs>
            <delete path='${workingPath}/authors'/>
            <mkdir path='${workingPath}/authors'/>
        </fs>
        <ok to="check_exist_on_hdfs_summaries"/>
        <error to="Kill"/>
    </action>
    <decision name="check_exist_on_hdfs_summaries">
        <switch>
            <case to="ImportOrcidSummaries">
                ${fs:exists(concat(workingPath,'/ORCID_2020_10_summaries.tar.gz'))}
            </case>
            <default to="DownloadSummaries" />
        </switch>
    </decision>
    <action name="DownloadSummaries">
        <shell xmlns="uri:oozie:shell-action:0.1">
            <job-tracker>${jobTracker}</job-tracker>
            <name-node>${nameNode}</name-node>
            <exec>bash</exec>
            <argument>-c</argument>
            <argument>${shell_cmd_0}</argument>
            <capture-output/>
        </shell>
        <ok to="ImportOrcidSummaries"/>
        <error to="Kill"/>
    </action>
    <action name="ImportOrcidSummaries">
        <java>
            <job-tracker>${jobTracker}</job-tracker>
            <name-node>${nameNode}</name-node>
            <main-class>eu.dnetlib.doiboost.orcid.OrcidDSManager</main-class>
            <arg>-w</arg><arg>${workingPath}/</arg>
            <arg>-n</arg><arg>${nameNode}</arg>
            <arg>-f</arg><arg>ORCID_2020_10_summaries.tar.gz</arg>
            <arg>-o</arg><arg>authors/</arg>
        </java>
        <ok to="End"/>
        <error to="Kill"/>
    </action>
    <end name="End"/>
 </workflow-app>
--- a/dhp-workflows/dhp-doiboost/src/main/resources/eu/dnetlib/dhp/doiboost/orcid_updates_download/oozie_app/config-default.xml
+++ b/dhp-workflows/dhp-doiboost/src/main/resources/eu/dnetlib/dhp/doiboost/orcid_updates_download/oozie_app/config-default.xml
@ -1,22 +0,0 @@
 <configuration>
    <property>
        <name>jobTracker</name>
        <value>yarnRM</value>
    </property>
    <property>
        <name>nameNode</name>
        <value>hdfs://nameservice1</value>
    </property>
    <property>
        <name>oozie.action.sharelib.for.java</name>
        <value>spark2</value>
    </property>
    <property>
        <name>oozie.launcher.mapreduce.user.classpath.first</name>
        <value>true</value>
    </property>
    <property>
      <name>oozie.launcher.mapreduce.map.java.opts</name>
      <value>-Xmx4g</value>
    </property>
 </configuration>
--- a/dhp-workflows/dhp-doiboost/src/main/resources/eu/dnetlib/dhp/doiboost/orcid_updates_download/oozie_app/workflow.xml
+++ b/dhp-workflows/dhp-doiboost/src/main/resources/eu/dnetlib/dhp/doiboost/orcid_updates_download/oozie_app/workflow.xml
@ -1,9 +1,25 @@
 <workflow-app name="Orcid Updates Download" xmlns="uri:oozie:workflow:0.5">
    <parameters>
        <property>
            <name>spark2UpdateStepMaxExecutors</name>
            <value>50</value>
        </property>
        <property>
            <name>workingPath</name>
            <description>the working dir base path</description>
        </property>
        <property>
            <name>oozie.action.sharelib.for.java</name>
            <value>spark2</value>
        </property>
        <property>
            <name>oozie.launcher.mapreduce.user.classpath.first</name>
            <value>true</value>
        </property>
        <property>
            <name>oozie.launcher.mapreduce.map.java.opts</name>
            <value>-Xmx4g</value>
        </property>
        <property>
            <name>token</name>
            <description>access token</description>
@ -30,7 +46,7 @@
            <description>number of cores used by single executor</description>
        </property>
        <property>
-            <name>spark2MaxExecutors</name>
+            <name>spark2DownloadingMaxExecutors</name>
            <value>10</value>
        </property>
        <property>
@ -58,6 +74,8 @@
    </parameters>
    <global>
        <job-tracker>${jobTracker}</job-tracker>
        <name-node>${nameNode}</name-node>
        <configuration>
            <property>
                <name>oozie.action.sharelib.for.spark</name>
@ -66,18 +84,16 @@
        </configuration>
    </global>
-    <start to="DownloadOrcidAuthors"/>
+    <start to="ResetLambda"/>
    <kill name="Kill">
        <message>Action failed, error message[${wf:errorMessage(wf:lastErrorNode())}]</message>
    </kill>
-    <action name="ResetWorkingPath">
+    <action name="ResetLambda">
        <fs>
            <delete path='${workingPath}/downloads'/>
            <delete path='${workingPath}/last_modified.csv.tar'/>
-            <mkdir path='${workingPath}/downloads'/>
+            <delete path='${workingPath}/last_modified.seq'/>
        </fs>
        <ok to="DownloadLambdaFile"/>
        <error to="Kill"/>
@ -92,22 +108,7 @@
            <argument>${shell_cmd}</argument>
            <capture-output/>
        </shell>
-        <ok to="DownloadUpdatedXMLAuthors"/>
+        <ok to="GenLastModifiedSeq"/>
        <error to="Kill"/>
    </action>
 	<action name="DownloadUpdatedXMLAuthors">
        <java>
            <job-tracker>${jobTracker}</job-tracker>
            <name-node>${nameNode}</name-node>
            <main-class>eu.dnetlib.doiboost.orcid.OrcidDownloader</main-class>
            <arg>-w</arg><arg>${workingPath}/</arg>
            <arg>-n</arg><arg>${nameNode}</arg>
            <arg>-f</arg><arg>last_modified.csv.tar</arg>
            <arg>-o</arg><arg>downloads/</arg>
            <arg>-t</arg><arg>${token}</arg>
        </java>
        <ok to="End"/>
        <error to="Kill"/>
    </action>
@ -133,7 +134,16 @@
            <arg>-o</arg><arg>last_modified.seq</arg>
            <arg>-t</arg><arg>-</arg>
        </spark>
-        <ok to="End"/>
+        <ok to="ResetDownloads"/>
        <error to="Kill"/>
    </action>
    <action name="ResetDownloads">
        <fs>
            <delete path='${workingPath}/downloads/updated_authors'/>
            <delete path='${workingPath}/downloads/updated_works'/>
        </fs>
        <ok to="DownloadOrcidAuthors"/>
        <error to="Kill"/>
    </action>
@ -146,7 +156,7 @@
            <jar>dhp-doiboost-${projectVersion}.jar</jar>
            <spark-opts>
                --conf spark.dynamicAllocation.enabled=true
-                --conf spark.dynamicAllocation.maxExecutors=${spark2MaxExecutors}
+                --conf spark.dynamicAllocation.maxExecutors=${spark2DownloadingMaxExecutors}
                --executor-memory=${sparkExecutorMemory}
                --driver-memory=${sparkDriverMemory}
                --conf spark.extraListeners=${spark2ExtraListeners}
@ -160,6 +170,148 @@
            <arg>-o</arg><arg>downloads/updated_authors</arg>
            <arg>-t</arg><arg>${token}</arg>
        </spark>
        <ok to="DownloadOrcidWorks"/>
        <error to="Kill"/>
    </action>
    <action name="DownloadOrcidWorks">
        <spark xmlns="uri:oozie:spark-action:0.2">
            <master>yarn-cluster</master>
            <mode>cluster</mode>
            <name>DownloadOrcidWorks</name>
            <class>eu.dnetlib.doiboost.orcid.SparkDownloadOrcidWorks</class>
            <jar>dhp-doiboost-${projectVersion}.jar</jar>
            <spark-opts>
                --conf spark.dynamicAllocation.enabled=true
                --conf spark.dynamicAllocation.maxExecutors=${spark2DownloadingMaxExecutors}
                --executor-memory=${sparkExecutorMemory}
                --driver-memory=${sparkDriverMemory}
                --conf spark.extraListeners=${spark2ExtraListeners}
                --conf spark.yarn.historyServer.address=${spark2YarnHistoryServerAddress}
                --conf spark.eventLog.dir=${nameNode}${spark2EventLogDir}
                --conf spark.sql.queryExecutionListeners=${spark2SqlQueryExecutionListeners}
            </spark-opts>
            <arg>-w</arg><arg>${workingPath}/</arg>
            <arg>-n</arg><arg>${nameNode}</arg>
            <arg>-f</arg><arg>-</arg>
            <arg>-o</arg><arg>downloads/updated_works</arg>
            <arg>-t</arg><arg>${token}</arg>
        </spark>
        <ok to="UpdateOrcidAuthors"/>
        <error to="Kill"/>
    </action>
    <action name="UpdateOrcidAuthors">
        <spark xmlns="uri:oozie:spark-action:0.2">
            <master>yarn-cluster</master>
            <mode>cluster</mode>
            <name>UpdateOrcidAuthors</name>
            <class>eu.dnetlib.doiboost.orcid.SparkUpdateOrcidAuthors</class>
            <jar>dhp-doiboost-${projectVersion}.jar</jar>
            <spark-opts>
                --conf spark.dynamicAllocation.enabled=true
                --conf spark.dynamicAllocation.maxExecutors=${spark2UpdateStepMaxExecutors}
                --executor-memory=${sparkExecutorMemory}
                --driver-memory=${sparkDriverMemory}
                --conf spark.extraListeners=${spark2ExtraListeners}
                --conf spark.yarn.historyServer.address=${spark2YarnHistoryServerAddress}
                --conf spark.eventLog.dir=${nameNode}${spark2EventLogDir}
                --conf spark.sql.queryExecutionListeners=${spark2SqlQueryExecutionListeners}
            </spark-opts>
            <arg>-w</arg><arg>${workingPath}/</arg>
            <arg>-n</arg><arg>${nameNode}</arg>
            <arg>-f</arg><arg>-</arg>
            <arg>-o</arg><arg>-</arg>
            <arg>-t</arg><arg>-</arg>
        </spark>
        <ok to="UpdateOrcidWorks"/>
        <error to="Kill"/>
    </action>
    <action name="UpdateOrcidWorks">
        <spark xmlns="uri:oozie:spark-action:0.2">
            <master>yarn-cluster</master>
            <mode>cluster</mode>
            <name>UpdateOrcidWorks</name>
            <class>eu.dnetlib.doiboost.orcid.SparkUpdateOrcidWorks</class>
            <jar>dhp-doiboost-${projectVersion}.jar</jar>
            <spark-opts>
                --conf spark.dynamicAllocation.enabled=true
                --conf spark.dynamicAllocation.maxExecutors=${spark2UpdateStepMaxExecutors}
                --executor-memory=${sparkExecutorMemory}
                --driver-memory=${sparkDriverMemory}
                --conf spark.extraListeners=${spark2ExtraListeners}
                --conf spark.yarn.historyServer.address=${spark2YarnHistoryServerAddress}
                --conf spark.eventLog.dir=${nameNode}${spark2EventLogDir}
                --conf spark.sql.queryExecutionListeners=${spark2SqlQueryExecutionListeners}
            </spark-opts>
            <arg>-w</arg><arg>${workingPath}/</arg>
            <arg>-n</arg><arg>${nameNode}</arg>
            <arg>-f</arg><arg>-</arg>
            <arg>-o</arg><arg>-</arg>
            <arg>-t</arg><arg>-</arg>
        </spark>
        <ok to="promoteOrcidAuthorsDataset"/>
        <error to="Kill"/>
    </action>
    <action name="promoteOrcidAuthorsDataset">
        <distcp xmlns="uri:oozie:distcp-action:0.2">
            <prepare>
                <delete path="${workingPath}/orcid_dataset/authors"/>
                <mkdir path="${workingPath}/orcid_dataset/authors"/>
            </prepare>
            <arg>${workingPath}/orcid_dataset/new_authors/*</arg>
            <arg>${workingPath}/orcid_dataset/authors</arg>
        </distcp>
        <ok to="promoteOrcidWorksDataset"/>
        <error to="Kill"/>
    </action>
    <action name="promoteOrcidWorksDataset">
        <distcp xmlns="uri:oozie:distcp-action:0.2">
            <prepare>
                <delete path="${workingPath}/orcid_dataset/works"/>
                <mkdir path="${workingPath}/orcid_dataset/works"/>
            </prepare>
            <arg>${workingPath}/orcid_dataset/new_works/*</arg>
            <arg>${workingPath}/orcid_dataset/works</arg>
        </distcp>
        <ok to="CleanWorkingPath"/>
        <error to="Kill"/>
    </action>
    <action name="CleanWorkingPath">
        <fs>
            <delete path='${workingPath}/orcid_dataset/new_authors'/>
            <delete path='${workingPath}/orcid_dataset/new_works'/>
        </fs>
        <ok to="updateLastOrcidAuthorsDataset"/>
        <error to="Kill"/>
    </action>
    <action name="updateLastOrcidAuthorsDataset">
        <distcp xmlns="uri:oozie:distcp-action:0.2">
            <prepare>
                <delete path="${workingPath}/last_orcid_dataset/authors"/>
                <mkdir path="${workingPath}/last_orcid_dataset/authors"/>
            </prepare>
            <arg>${workingPath}/orcid_dataset/authors/*</arg>
            <arg>${workingPath}/last_orcid_dataset/authors</arg>
        </distcp>
        <ok to="updateLastOrcidWorksDataset"/>
        <error to="Kill"/>
    </action>
    <action name="updateLastOrcidWorksDataset">
        <distcp xmlns="uri:oozie:distcp-action:0.2">
            <prepare>
                <delete path="${workingPath}/last_orcid_dataset/works"/>
                <mkdir path="${workingPath}/last_orcid_dataset/works"/>
            </prepare>
            <arg>${workingPath}/orcid_dataset/works/*</arg>
            <arg>${workingPath}/last_orcid_dataset/works</arg>
        </distcp>
        <ok to="End"/>
        <error to="Kill"/>
    </action>
--- a/dhp-workflows/dhp-doiboost/src/main/resources/eu/dnetlib/dhp/doiboost/orcidnodoi/mappings/typologies.json
+++ b/dhp-workflows/dhp-doiboost/src/main/resources/eu/dnetlib/dhp/doiboost/orcidnodoi/mappings/typologies.json
@ -1,19 +1,9 @@
 {
  "reference-entry":      {"cobj":"0013", "value":	"Part of book or chapter of book"},
  "report":               {"cobj":"0017", "value":	"Report"},
  "dataset":              {"cobj":"0021", "value":	"Dataset"},
  "journal-article":      {"cobj":"0001", "value":	"Article"},
  "reference-book":       {"cobj":"0002", "value":	"Book"},
  "other":                {"cobj":"0020", "value":	"Other ORP type"},
  "proceedings-article":  {"cobj":"0004", "value":	"Conference object"},
  "standard":             {"cobj":"0038", "value":	"Other literature type"},
  "book-part":            {"cobj":"0002", "value":	"Book"},
  "monograph":            {"cobj":"0002", "value":	"Book"},
  "report-series":        {"cobj":"0017", "value":	"Report"},
  "book":                 {"cobj":"0002", "value":	"Book"},
  "book-chapter":         {"cobj":"0013", "value":	"Part of book or chapter of book"},
  "peer-review":          {"cobj":"0015", "value":	"Review"},
  "book-section":         {"cobj":"0013", "value":	"Part of book or chapter of book"},
  "book-review":          {"cobj":"0015", "value":	"Review"},
  "conference-abstract":  {"cobj":"0004", "value":	"Conference object"},
  "conference-paper":     {"cobj":"0004", "value":	"Conference object"},
@ -21,7 +11,7 @@
  "data-set":             {"cobj":"0021", "value":	"Dataset"},
  "dictionary-entry":     {"cobj":"0038", "value":	"Other literature type"},
  "disclosure":           {"cobj":"0038", "value":	"Other literature type"},
-  "dissertation":         {"cobj":"0006", "value":	"Doctoral thesis"},
+  "dissertation-thesis":         {"cobj":"0006", "value":	"Doctoral thesis"},
  "edited-book":          {"cobj":"0002", "value":	"Book"},
  "encyclopedia-entry":   {"cobj":"0038", "value":	"Other literature type"},
  "lecture-speech":       {"cobj":"0010", "value":	"Lecture"},
@ -37,5 +27,17 @@
  "supervised-student-publication": {"cobj":"0001", "value":	"Article"},
  "technical-standard":   {"cobj":"0038", "value":	"Other literature type"},
  "website":              {"cobj":"0020", "value":	"Other ORP type"},
-  "working-paper":        {"cobj":"0014", "value":	"Research"}
+  "working-paper":        {"cobj":"0014", "value":	"Research"},
  "annotation":           {"cobj":"0018", "value":	"Annotation"},
  "physical-object":      {"cobj":"0028", "value":	"PhysicalObject"},
  "preprint":             {"cobj":"0016", "value":	"Preprint"},
  "software":             {"cobj":"0029", "value":	"Software"},
  "journal-issue":        {"cobj":"0001", "value":	"Article"},
  "translation":          {"cobj":"0038", "value":	"Other literature type"},
  "artistic-performance": {"cobj":"0020", "value":	"Other ORP type"},
  "online-resource":      {"cobj":"0020", "value":	"Other ORP type"},
  "registered-copyright": {"cobj":"0020", "value":	"Other ORP type"},
  "trademark":            {"cobj":"0020", "value":	"Other ORP type"},
  "invention":            {"cobj":"0020", "value":	"Other ORP type"},
  "spin-off-company":     {"cobj":"0020", "value":	"Other ORP type"}
 }
--- a/dhp-workflows/dhp-doiboost/src/main/resources/eu/dnetlib/dhp/doiboost/orcidnodoi/oozie_app/workflow.xml
+++ b/dhp-workflows/dhp-doiboost/src/main/resources/eu/dnetlib/dhp/doiboost/orcidnodoi/oozie_app/workflow.xml
@ -1,17 +1,33 @@
 <workflow-app name="gen_orcid_no_doi_dataset" xmlns="uri:oozie:workflow:0.5">
    <parameters>
        <property>
            <name>workingPath</name>
            <value>/data/orcid_activities_2020</value>
            <description>path where the collection workflow stores the ORCID data</description>
        </property>
        <property>
            <name>outputPath</name>
            <value>/data/orcid_activities_2020/no_doi_dataset_prod/</value>
            <description>path where to store the action set</description>
        </property>
        <property>
            <name>processOutputFolder</name>
            <value>process_no_doi_dataset_prod</value>
            <description>temporary path where to store the action set</description>
        </property>
        <property>
            <name>spark2GenNoDoiDatasetMaxExecutors</name>
            <value>40</value>
        </property>
        <property>
            <name>sparkDriverMemory</name>
            <description>memory for driver process</description>
        </property>
        <property>
-            <name>sparkExecutorMemory</name>
+            <name>spark2GenNoDoiDatasetExecutorMemory</name>
            <value>2G</value>
            <description>memory for individual executor</description>
        </property>
        <property>
            <name>sparkExecutorCores</name>
            <description>number of cores used by single executor</description>
        </property>
        <property>
            <name>oozieActionShareLibForSpark2</name>
            <description>oozie action sharelib for spark 2.*</description>
@ -34,10 +50,6 @@
            <name>spark2EventLogDir</name>
            <description>spark 2.* event log dir location</description>
        </property>
        <property>
            <name>workingPath</name>
            <description>the working dir base path</description>
        </property>
    </parameters>
    <global>
@ -59,7 +71,7 @@
    <action name="ResetWorkingPath">
        <fs>
-            <delete path='${workingPath}/no_doi_dataset'/>
+            <delete path='${workingPath}/${processOutputFolder}'/>
        </fs>
        <ok to="GenOrcidNoDoiDataset"/>
        <error to="Kill"/>
@ -73,20 +85,29 @@
            <class>eu.dnetlib.doiboost.orcidnodoi.SparkGenEnrichedOrcidWorks</class>
            <jar>dhp-doiboost-${projectVersion}.jar</jar>
            <spark-opts>
-                --executor-memory=${sparkExecutorMemory}
+                --conf spark.dynamicAllocation.enabled=true
-                --executor-cores=${sparkExecutorCores}
+                --conf spark.dynamicAllocation.maxExecutors=${spark2GenNoDoiDatasetMaxExecutors}
                --executor-memory=${spark2GenNoDoiDatasetExecutorMemory}
                --driver-memory=${sparkDriverMemory}
                --conf spark.extraListeners=${spark2ExtraListeners}
                --conf spark.yarn.historyServer.address=${spark2YarnHistoryServerAddress}
                --conf spark.eventLog.dir=${nameNode}${spark2EventLogDir}
                --conf spark.sql.queryExecutionListeners=${spark2SqlQueryExecutionListeners}
            </spark-opts>
-            <arg>-w</arg><arg>${workingPath}/</arg>
+            <arg>--workingPath</arg><arg>${workingPath}/</arg>
-            <arg>-n</arg><arg>${nameNode}</arg>
+            <arg>--hdfsServerUri</arg><arg>${nameNode}</arg>
-            <arg>-f</arg><arg>-</arg>
+            <arg>--orcidDataFolder</arg><arg>last_orcid_dataset</arg>
-            <arg>-ow</arg><arg>no_doi_works/</arg>
+            <arg>--outputEnrichedWorksPath</arg><arg>${processOutputFolder}</arg>
            <arg>-oew</arg><arg>no_doi_dataset</arg>
        </spark>
        <ok to="importOrcidNoDoi"/>
        <error to="Kill"/>
    </action>
    <action name="importOrcidNoDoi">
        <distcp xmlns="uri:oozie:distcp-action:0.2">
            <arg>${workingPath}/${processOutputFolder}/*</arg>
            <arg>${outputPath}</arg>
        </distcp>
        <ok to="End"/>
        <error to="Kill"/>
    </action>
--- a/dhp-workflows/dhp-doiboost/src/test/java/eu/dnetlib/doiboost/orcid/OrcidClientTest.java
+++ b/dhp-workflows/dhp-doiboost/src/test/java/eu/dnetlib/doiboost/orcid/OrcidClientTest.java
@ -10,30 +10,28 @@ import java.nio.file.Paths;
 import java.nio.file.StandardOpenOption;
 import java.text.ParseException;
 import java.text.SimpleDateFormat;
-import java.time.Duration;
+import java.util.*;
 import java.time.LocalDateTime;
 import java.time.temporal.TemporalUnit;
 import java.util.Arrays;
 import java.util.Date;
 import java.util.List;
 import org.apache.commons.compress.archivers.tar.TarArchiveEntry;
 import org.apache.commons.compress.archivers.tar.TarArchiveInputStream;
 import org.apache.commons.compress.compressors.gzip.GzipCompressorInputStream;
 import org.apache.commons.compress.utils.Lists;
 import org.apache.commons.io.FileUtils;
 import org.apache.commons.io.IOUtils;
 import org.apache.http.client.methods.CloseableHttpResponse;
 import org.apache.http.client.methods.HttpGet;
 import org.apache.http.impl.client.CloseableHttpClient;
 import org.apache.http.impl.client.HttpClients;
-import org.apache.spark.sql.catalyst.expressions.objects.AssertNotNull;
+import org.junit.jupiter.api.BeforeAll;
 import org.junit.jupiter.api.Disabled;
 import org.junit.jupiter.api.Test;
 import org.mortbay.log.Log;
 import eu.dnetlib.dhp.application.ArgumentApplicationParser;
 import eu.dnetlib.dhp.schema.orcid.AuthorData;
 import eu.dnetlib.doiboost.orcid.xml.XMLRecordParserTest;
 import jdk.nashorn.internal.ir.annotations.Ignore;
 public class OrcidClientTest {
 	final String orcidId = "0000-0001-7291-3210";
 	final int REQ_LIMIT = 24;
 	final int REQ_MAX_TEST = 100;
 	final int RECORD_DOWNLOADED_COUNTER_LOG_INTERVAL = 10;
@ -42,69 +40,45 @@ public class OrcidClientTest {
 	String toNotRetrieveDate = "2019-09-29 23:59:59.000000";
 	String lastUpdate = "2019-09-30 00:00:00";
 	String shortDate = "2020-05-06 16:06:11";
 	final String REQUEST_TYPE_RECORD = "record";
 	final String REQUEST_TYPE_WORK = "work/47652866";
 	final String REQUEST_TYPE_WORKS = "works";
 	private static Path testPath;
 	@BeforeAll
 	private static void setUp() throws IOException {
 		testPath = Files.createTempDirectory(XMLRecordParserTest.class.getName());
 		System.out.println("using test path: " + testPath);
 	}
 //	curl -i -H "Accept: application/vnd.orcid+xml"
 //	-H 'Authorization: Bearer 78fdb232-7105-4086-8570-e153f4198e3d'
 //	'https://api.orcid.org/v3.0/0000-0001-7291-3210/record'
 	@Test
-	private void multipleDownloadTest() throws Exception {
+	public void downloadTest() throws Exception {
-		int toDownload = 10;
+		final String orcid = "0000-0001-7291-3210";
-		long start = System.currentTimeMillis();
+		String record = testDownloadRecord(orcid, REQUEST_TYPE_RECORD);
-		OrcidDownloader downloader = new OrcidDownloader();
+		String filename = testPath + "/downloaded_record_".concat(orcid).concat(".xml");
 		TarArchiveInputStream input = new TarArchiveInputStream(
 			new GzipCompressorInputStream(new FileInputStream("/tmp/last_modified.csv.tar")));
 		TarArchiveEntry entry = input.getNextTarEntry();
 		BufferedReader br = null;
 		StringBuilder sb = new StringBuilder();
 		int rowNum = 0;
 		int entryNum = 0;
 		int modified = 0;
 		while (entry != null) {
 			br = new BufferedReader(new InputStreamReader(input)); // Read directly from tarInput
 			String line;
 			while ((line = br.readLine()) != null) {
 				String[] values = line.toString().split(",");
 				List<String> recordInfo = Arrays.asList(values);
 				String orcidId = recordInfo.get(0);
 				if (downloader.isModified(orcidId, recordInfo.get(3))) {
 					slowedDownDownload(orcidId);
 					modified++;
 				}
 				rowNum++;
 				if (modified > toDownload) {
 					break;
 				}
 			}
 			entryNum++;
 			entry = input.getNextTarEntry();
 		}
 		long end = System.currentTimeMillis();
 		logToFile("start test: " + new Date(start).toString());
 		logToFile("end test: " + new Date(end).toString());
 	}
 	@Test
 	private void downloadTest(String orcid) throws Exception {
 		String record = testDownloadRecord(orcid);
 		String filename = "/tmp/downloaded_".concat(orcid).concat(".xml");
 		File f = new File(filename);
 		OutputStream outStream = new FileOutputStream(f);
 		IOUtils.write(record.getBytes(), outStream);
 	}
-	private String testDownloadRecord(String orcidId) throws Exception {
+	private String testDownloadRecord(String orcidId, String dataType) throws Exception {
 		try (CloseableHttpClient client = HttpClients.createDefault()) {
-			HttpGet httpGet = new HttpGet("https://api.orcid.org/v3.0/" + orcidId + "/record");
+			HttpGet httpGet = new HttpGet("https://api.orcid.org/v3.0/" + orcidId + "/" + dataType);
 			httpGet.addHeader("Accept", "application/vnd.orcid+xml");
 			httpGet.addHeader("Authorization", "Bearer 78fdb232-7105-4086-8570-e153f4198e3d");
-			logToFile("start connection: " + new Date(System.currentTimeMillis()).toString());
+			long start = System.currentTimeMillis();
 			CloseableHttpResponse response = client.execute(httpGet);
-			logToFile("end connection: " + new Date(System.currentTimeMillis()).toString());
+			long end = System.currentTimeMillis();
 			if (response.getStatusLine().getStatusCode() != 200) {
-				System.out
+				logToFile(
-					.println("Downloading " + orcidId + " status code: " + response.getStatusLine().getStatusCode());
+					testPath, "Downloading " + orcidId + " status code: " + response.getStatusLine().getStatusCode());
 			}
 			logToFile(testPath, orcidId + " " + dataType + " " + (end - start) / 1000 + " seconds");
 			return IOUtils.toString(response.getEntity().getContent());
 		} catch (Throwable e) {
 			e.printStackTrace();
@ -129,7 +103,7 @@ public class OrcidClientTest {
 				}
 				String[] values = line.split(",");
 				List<String> recordInfo = Arrays.asList(values);
-				testDownloadRecord(recordInfo.get(0));
+				testDownloadRecord(recordInfo.get(0), REQUEST_TYPE_RECORD);
 				long endReq = System.currentTimeMillis();
 				nReqTmp++;
 				if (nReqTmp == REQ_LIMIT) {
@ -189,20 +163,24 @@ public class OrcidClientTest {
 		final String base64CompressedRecord = IOUtils
 			.toString(getClass().getResourceAsStream("0000-0003-3028-6161.compressed.base64"));
 		final String recordFromSeqFile = ArgumentApplicationParser.decompressValue(base64CompressedRecord);
-		logToFile("\n\ndownloaded \n\n" + recordFromSeqFile);
+		logToFile(testPath, "\n\ndownloaded \n\n" + recordFromSeqFile);
-		final String downloadedRecord = testDownloadRecord("0000-0003-3028-6161");
+		final String downloadedRecord = testDownloadRecord("0000-0003-3028-6161", REQUEST_TYPE_RECORD);
 		assertTrue(recordFromSeqFile.equals(downloadedRecord));
 	}
 	@Test
-	private void lambdaFileReaderTest() throws Exception {
+	@Disabled
 	public void lambdaFileReaderTest() throws Exception {
 		String last_update = "2021-01-12 00:00:06.685137";
 		TarArchiveInputStream input = new TarArchiveInputStream(
-			new GzipCompressorInputStream(new FileInputStream("/develop/last_modified.csv.tar")));
+			new GzipCompressorInputStream(new FileInputStream("/tmp/last_modified.csv.tar")));
 		TarArchiveEntry entry = input.getNextTarEntry();
 		BufferedReader br = null;
 		StringBuilder sb = new StringBuilder();
-		int rowNum = 0;
+		int rowNum = 1;
 		int modifiedNum = 1;
 		int entryNum = 0;
 		boolean firstNotModifiedFound = false;
 		while (entry != null) {
 			br = new BufferedReader(new InputStreamReader(input)); // Read directly from tarInput
 			String line;
@ -210,59 +188,44 @@ public class OrcidClientTest {
 				String[] values = line.toString().split(",");
 				List<String> recordInfo = Arrays.asList(values);
 				assertTrue(recordInfo.size() == 4);
-
+				String orcid = recordInfo.get(0);
 				String modifiedDate = recordInfo.get(3);
 				rowNum++;
-				if (rowNum == 1) {
+				if (rowNum == 2) {
 					assertTrue(recordInfo.get(3).equals("last_modified"));
-				} else if (rowNum == 2) {
+				} else {
-					assertTrue(recordInfo.get(0).equals("0000-0002-0499-7333"));
+//					SparkDownloadOrcidAuthors.lastUpdate = last_update;
 //					boolean isModified = SparkDownloadOrcidAuthors.isModified(orcid, modifiedDate);
 //					if (isModified) {
 //						modifiedNum++;
 //					} else {
 //						if (!firstNotModifiedFound) {
 //							firstNotModifiedFound = true;
 //							logToFile(orcid + " - " + modifiedDate + " > " + isModified);
 //						}
 //					}
 				}
 			}
 			entryNum++;
 			assertTrue(entryNum == 1);
 			entry = input.getNextTarEntry();
 		}
 		logToFile(testPath, "modifiedNum : " + modifiedNum + " / " + rowNum);
 	}
-	@Test
+	public static void logToFile(Path basePath, String log) throws IOException {
 	private void lambdaFileCounterTest() throws Exception {
 		final String lastUpdate = "2020-09-29 00:00:00";
 		OrcidDownloader downloader = new OrcidDownloader();
 		TarArchiveInputStream input = new TarArchiveInputStream(
 			new GzipCompressorInputStream(new FileInputStream("/tmp/last_modified.csv.tar")));
 		TarArchiveEntry entry = input.getNextTarEntry();
 		BufferedReader br = null;
 		StringBuilder sb = new StringBuilder();
 		int rowNum = 0;
 		int entryNum = 0;
 		int modified = 0;
 		while (entry != null) {
 			br = new BufferedReader(new InputStreamReader(input)); // Read directly from tarInput
 			String line;
 			while ((line = br.readLine()) != null) {
 				String[] values = line.toString().split(",");
 				List<String> recordInfo = Arrays.asList(values);
 				String orcidId = recordInfo.get(0);
 				if (downloader.isModified(orcidId, recordInfo.get(3))) {
 					modified++;
 				}
 				rowNum++;
 			}
 			entryNum++;
 			entry = input.getNextTarEntry();
 		}
 		logToFile("rowNum: " + rowNum);
 		logToFile("modified: " + modified);
 	}
 	private void logToFile(String log)
 		throws IOException {
 		log = log.concat("\n");
-		Path path = Paths.get("/tmp/orcid_log.txt");
+		Path path = basePath.resolve("orcid_log.txt");
 		if (!Files.exists(path)) {
 			Files.createFile(path);
 		}
 		Files.write(path, log.getBytes(), StandardOpenOption.APPEND);
 	}
 	@Test
 	@Disabled
 	private void slowedDownDownloadTest() throws Exception {
 		String orcid = "0000-0001-5496-1243";
 		String record = slowedDownDownload(orcid);
@ -281,16 +244,17 @@ public class OrcidClientTest {
 			CloseableHttpResponse response = client.execute(httpGet);
 			long endReq = System.currentTimeMillis();
 			long reqSessionDuration = endReq - start;
-			logToFile("req time (millisec): " + reqSessionDuration);
+			logToFile(testPath, "req time (millisec): " + reqSessionDuration);
 			if (reqSessionDuration < 1000) {
-				logToFile("wait ....");
+				logToFile(testPath, "wait ....");
 				Thread.sleep(1000 - reqSessionDuration);
 			}
 			long end = System.currentTimeMillis();
 			long total = end - start;
-			logToFile("total time (millisec): " + total);
+			logToFile(testPath, "total time (millisec): " + total);
 			if (response.getStatusLine().getStatusCode() != 200) {
-				logToFile("Downloading " + orcidId + " status code: " + response.getStatusLine().getStatusCode());
+				logToFile(
 					testPath, "Downloading " + orcidId + " status code: " + response.getStatusLine().getStatusCode());
 			}
 			return IOUtils.toString(response.getEntity().getContent());
 		} catch (Throwable e) {
@ -298,4 +262,89 @@ public class OrcidClientTest {
 		}
 		return new String("");
 	}
 	@Test
 	public void downloadWorkTest() throws Exception {
 		String orcid = "0000-0003-0015-1952";
 		String record = testDownloadRecord(orcid, REQUEST_TYPE_WORK);
 		String filename = "/tmp/downloaded_work_".concat(orcid).concat(".xml");
 		File f = new File(filename);
 		OutputStream outStream = new FileOutputStream(f);
 		IOUtils.write(record.getBytes(), outStream);
 	}
 	@Test
 	public void downloadRecordTest() throws Exception {
 		String orcid = "0000-0001-5004-5918";
 		String record = testDownloadRecord(orcid, REQUEST_TYPE_RECORD);
 		String filename = "/tmp/downloaded_record_".concat(orcid).concat(".xml");
 		File f = new File(filename);
 		OutputStream outStream = new FileOutputStream(f);
 		IOUtils.write(record.getBytes(), outStream);
 	}
 	@Test
 	public void downloadWorksTest() throws Exception {
 		String orcid = "0000-0001-5004-5918";
 		String record = testDownloadRecord(orcid, REQUEST_TYPE_WORKS);
 		String filename = "/tmp/downloaded_works_".concat(orcid).concat(".xml");
 		File f = new File(filename);
 		OutputStream outStream = new FileOutputStream(f);
 		IOUtils.write(record.getBytes(), outStream);
 	}
 	@Test
 	public void downloadSingleWorkTest() throws Exception {
 		String orcid = "0000-0001-5004-5918";
 		String record = testDownloadRecord(orcid, REQUEST_TYPE_WORK);
 		String filename = "/tmp/downloaded_work_47652866_".concat(orcid).concat(".xml");
 		File f = new File(filename);
 		OutputStream outStream = new FileOutputStream(f);
 		IOUtils.write(record.getBytes(), outStream);
 	}
 	@Test
 	public void cleanAuthorListTest() throws Exception {
 		AuthorData a1 = new AuthorData();
 		a1.setOid("1");
 		a1.setName("n1");
 		a1.setSurname("s1");
 		a1.setCreditName("c1");
 		AuthorData a2 = new AuthorData();
 		a2.setOid("1");
 		a2.setName("n1");
 		a2.setSurname("s1");
 		a2.setCreditName("c1");
 		AuthorData a3 = new AuthorData();
 		a3.setOid("3");
 		a3.setName("n3");
 		a3.setSurname("s3");
 		a3.setCreditName("c3");
 		List<AuthorData> list = Lists.newArrayList();
 		list.add(a1);
 		list.add(a2);
 		list.add(a3);
 		Set<String> namesAlreadySeen = new HashSet<>();
 		assertTrue(list.size() == 3);
 		list.removeIf(a -> !namesAlreadySeen.add(a.getOid()));
 		assertTrue(list.size() == 2);
 	}
 	@Test
 	@Ignore
 	public void testUpdatedRecord() throws Exception {
 		final String base64CompressedRecord = IOUtils
 			.toString(getClass().getResourceAsStream("0000-0003-3028-6161.compressed.base64"));
 		final String record = ArgumentApplicationParser.decompressValue(base64CompressedRecord);
 		logToFile(testPath, "\n\nrecord updated \n\n" + record);
 	}
 	@Test
 	@Ignore
 	private void testUpdatedWork() throws Exception {
 		final String base64CompressedWork = "H4sIAAAAAAAAAM1XS2/jNhC+51cQOuxJsiXZSR03Vmq0G6Bo013E6R56oyXaZiOJWpKy4y783zvUg5Ksh5uiCJogisX5Zjj85sHx3f1rFKI94YKyeGE4I9tAJPZZQOPtwvj9+cGaGUhIHAc4ZDFZGEcijHvv6u7A+MtcPVCSSgsUQObYzuzaccBEguVuYYxt+LHgbwKP6a11M3WnY6UzrpB7KuiahlQeF0aSrkPqGwhcisWcxpLwGIcLYydlMh+PD4fDiHGfBvDcjmMxLhGlBglSH8vsIH0qGlLqBFRIGvvDWjWQ1iMJJ2CKBANqGlNqMbkj3IpxRPq1KkypFZFoDRHa0aRfq8JoNjhnfIAJJS6xPouiIQJyeYmGQzE+cO5cXqITcItBlKyASExD0a93jiwtvJDjYXDDAqBPHoH2wMmVWGNf8xyyaEBiSTeUDHHWBpd2Nmmc10yfbgHQrHCyIRxKjQwRUoFKPRwEnIgBnQJQVdGeQgJaCRN0OMnPkaUFVbD9WkpaIndQJowf+8EFoIpTErJjBFQOBavElFpfUxwC9ZcqvQErdQXhe+oPFF8BaObupYzVsYEOARzSoZBWmKqaBMHcV0Wf8oG0beIqD+Gdkz0lhyE3NajUW6fhQFSV9Nw/MCBYyofYa0EN7wrBz13eP+Y+J6obWgE8Pdd2JpYD94P77Ezmjj13b0bu5PqPu3EXumEnxEJaEVxSUIHammsra+53z44zt2/m1/bItaeVtQ6dhs3c4XytvW75IYUchMKvEHVUyqmnWBFAS0VJrqSvQde6vp251ux2NtFuKcVOi+oK9YY0M0Cn6o4J6WkvtEK2XJ1vfPGAZxSoK8lb+SxJBbLQx1CohOLndjJUywQWUFmqEi3G6Zaqf/7buOyYJd5IYpfmf0XipfP18pDR9cQCeEuJQI/Lx36bFbVnpBeL2UwmqQw7ApAvf4GeGGQdEbENgolui/wdpjHaYCmPCIPPAmGBIsxfoLUhyRCB0SeCakEBJRKBtfJ+UBbI15TG4PaGBAhWthx8DmFYtHZQujv1CWbLLdzmmUKmHEOWCe1/zdu78bn/+YH+hCOqOzcXfFwuP6OVT/P710crwqGXFrpNaM2GT3MXarw01i15TIi3pmtJXgtbTVGf3h6HKfF+wBAnPyTfdCChudlm5gZaoG//F9pPZsGQcqqbyZN5hBau5OoIJ3PPwjTKDuG4s5MZp2rMzF5PZoK34IT6PIFOPrk+mTiVO5aJH2C+JJRjE/06eoRfpJxa4VgyYaLlaJUv/EhCfATMU/76gEOfmehL/qbJNNHjaFna+CQYB8wvo9PpPFJ5MOrJ1Ix7USBZqBl7KRNOx1d3jex7SG6zuijqCMWRusBsncjZSrM2u82UJmqzpGhvUJN2t6caIM9QQgO9c0t40UROnWsJd2Rbs+nsxpna9u30ttNkjechmzHjEST+X5CkkuNY0GzQkzyFseAf7lSZuLwdh1xSXKvvQJ4g4abTYgPV7uMt3rskohlJmMa82kQkshtyBEIYqQ+YB8X3oRHg7iFKi/bZP+Ao+T6BJhIT/vNPi8ffZs+flk+r2v0WNroZiyWn6xRmadHqTJXsjLJczElAZX6TnJdoWTM1SI2gfutv3rjeBt5t06rVvNuWup29246tlvluO+u2/G92bK9DXheL6uFd/Q3EaRDZqBIAAA==";
 		final String work = ArgumentApplicationParser.decompressValue(base64CompressedWork);
 		logToFile(testPath, "\n\nwork updated \n\n" + work);
 	}
 }
--- a/dhp-workflows/dhp-doiboost/src/test/java/eu/dnetlib/doiboost/orcid/xml/XMLRecordParserTest.java
+++ b/dhp-workflows/dhp-doiboost/src/test/java/eu/dnetlib/doiboost/orcid/xml/XMLRecordParserTest.java
@ -1,20 +1,44 @@
 package eu.dnetlib.doiboost.orcid.xml;
-import static org.junit.jupiter.api.Assertions.assertNotNull;
+import static org.junit.jupiter.api.Assertions.*;
-import static org.junit.jupiter.api.Assertions.assertTrue;
+
 import java.io.IOException;
 import java.nio.file.Files;
 import java.nio.file.Path;
 import org.apache.commons.io.IOUtils;
 import org.junit.jupiter.api.BeforeAll;
 import org.junit.jupiter.api.Test;
 import com.fasterxml.jackson.databind.ObjectMapper;
 import eu.dnetlib.dhp.application.ArgumentApplicationParser;
 import eu.dnetlib.dhp.schema.orcid.AuthorData;
 import eu.dnetlib.dhp.schema.orcid.AuthorSummary;
 import eu.dnetlib.dhp.schema.orcid.Work;
 import eu.dnetlib.dhp.schema.orcid.WorkDetail;
 import eu.dnetlib.doiboost.orcid.OrcidClientTest;
 import eu.dnetlib.doiboost.orcid.model.WorkData;
 import eu.dnetlib.doiboost.orcidnodoi.json.JsonWriter;
 import eu.dnetlib.doiboost.orcidnodoi.xml.XMLRecordParserNoDoi;
 public class XMLRecordParserTest {
 	private static final String NS_WORK = "work";
 	private static final String NS_WORK_URL = "http://www.orcid.org/ns/work";
 	private static final String NS_COMMON_URL = "http://www.orcid.org/ns/common";
 	private static final String NS_COMMON = "common";
 	private static final ObjectMapper OBJECT_MAPPER = new ObjectMapper();
 	private static Path testPath;
 	@BeforeAll
 	private static void setUp() throws IOException {
 		testPath = Files.createTempDirectory(XMLRecordParserTest.class.getName());
 	}
 	@Test
-	private void testOrcidAuthorDataXMLParser() throws Exception {
+	public void testOrcidAuthorDataXMLParser() throws Exception {
 		String xml = IOUtils.toString(this.getClass().getResourceAsStream("summary_0000-0001-6828-479X.xml"));
@ -26,10 +50,11 @@ public class XMLRecordParserTest {
 		System.out.println("name: " + authorData.getName());
 		assertNotNull(authorData.getSurname());
 		System.out.println("surname: " + authorData.getSurname());
 		OrcidClientTest.logToFile(testPath, OBJECT_MAPPER.writeValueAsString(authorData));
 	}
 	@Test
-	private void testOrcidXMLErrorRecordParser() throws Exception {
+	public void testOrcidXMLErrorRecordParser() throws Exception {
 		String xml = IOUtils.toString(this.getClass().getResourceAsStream("summary_error.xml"));
@ -42,7 +67,7 @@ public class XMLRecordParserTest {
 	}
 	@Test
-	private void testOrcidWorkDataXMLParser() throws Exception {
+	public void testOrcidWorkDataXMLParser() throws Exception {
 		String xml = IOUtils
 			.toString(
@ -54,8 +79,7 @@ public class XMLRecordParserTest {
 		assertNotNull(workData);
 		assertNotNull(workData.getOid());
 		System.out.println("oid: " + workData.getOid());
-		assertNotNull(workData.getDoi());
+		assertNull(workData.getDoi());
 		System.out.println("doi: " + workData.getDoi());
 	}
 	@Test
@ -64,9 +88,6 @@ public class XMLRecordParserTest {
 		String xml = IOUtils
 			.toString(
 				this.getClass().getResourceAsStream("summary_0000-0001-5109-1000_othername.xml"));
 		XMLRecordParser p = new XMLRecordParser();
 		AuthorData authorData = XMLRecordParser.VTDParseAuthorData(xml.getBytes());
 		assertNotNull(authorData);
 		assertNotNull(authorData.getOtherNames());
@ -74,4 +95,43 @@ public class XMLRecordParserTest {
 		String jsonData = JsonWriter.create(authorData);
 		assertNotNull(jsonData);
 	}
 //	@Test
 //	private void testWorkIdLastModifiedDateXMLParser() throws Exception {
 //		String xml = IOUtils
 //			.toString(
 //				this.getClass().getResourceAsStream("record_0000-0001-5004-5918.xml"));
 //		Map<String, String> workIdLastModifiedDate = XMLRecordParser.retrieveWorkIdLastModifiedDate(xml.getBytes());
 //		workIdLastModifiedDate.forEach((k, v) -> {
 //			try {
 //				OrcidClientTest
 //					.logToFile(
 //						k + " " + v + " isModified after " + SparkDownloadOrcidWorks.lastUpdateValue + ": "
 //							+ SparkDownloadOrcidWorks.isModified("0000-0001-5004-5918", v));
 //			} catch (IOException e) {
 //			}
 //		});
 //	}
 	@Test
 	public void testAuthorSummaryXMLParser() throws Exception {
 		String xml = IOUtils
 			.toString(
 				this.getClass().getResourceAsStream("record_0000-0001-5004-5918.xml"));
 		AuthorSummary authorSummary = XMLRecordParser.VTDParseAuthorSummary(xml.getBytes());
 		authorSummary.setBase64CompressData(ArgumentApplicationParser.compressArgument(xml));
 		OrcidClientTest.logToFile(testPath, JsonWriter.create(authorSummary));
 	}
 	@Test
 	public void testWorkDataXMLParser() throws Exception {
 		String xml = IOUtils
 			.toString(
 				this.getClass().getResourceAsStream("activity_work_0000-0003-2760-1191.xml"));
 		WorkDetail workDetail = XMLRecordParserNoDoi.VTDParseWorkData(xml.getBytes());
 		Work work = new Work();
 		work.setWorkDetail(workDetail);
 		work.setBase64CompressData(ArgumentApplicationParser.compressArgument(xml));
 		OrcidClientTest.logToFile(testPath, JsonWriter.create(work));
 	}
 }
--- a/dhp-workflows/dhp-doiboost/src/test/java/eu/dnetlib/doiboost/orcidnodoi/xml/OrcidNoDoiTest.java
+++ b/dhp-workflows/dhp-doiboost/src/test/java/eu/dnetlib/doiboost/orcidnodoi/xml/OrcidNoDoiTest.java
@ -21,8 +21,8 @@ import com.ximpleware.XPathParseException;
 import eu.dnetlib.dhp.parser.utility.VtdException;
 import eu.dnetlib.dhp.schema.orcid.AuthorData;
-import eu.dnetlib.doiboost.orcidnodoi.model.Contributor;
+import eu.dnetlib.dhp.schema.orcid.Contributor;
-import eu.dnetlib.doiboost.orcidnodoi.model.WorkDataNoDoi;
+import eu.dnetlib.dhp.schema.orcid.WorkDetail;
 import eu.dnetlib.doiboost.orcidnodoi.similarity.AuthorMatcher;
 public class OrcidNoDoiTest {
@ -48,7 +48,7 @@ public class OrcidNoDoiTest {
 		if (p == null) {
 			logger.info("XMLRecordParserNoDoi null");
 		}
-		WorkDataNoDoi workData = null;
+		WorkDetail workData = null;
 		try {
 			workData = p.VTDParseWorkData(xml.getBytes());
 		} catch (Exception e) {
@ -105,7 +105,7 @@ public class OrcidNoDoiTest {
 		if (p == null) {
 			logger.info("XMLRecordParserNoDoi null");
 		}
-		WorkDataNoDoi workData = null;
+		WorkDetail workData = null;
 		try {
 			workData = p.VTDParseWorkData(xml.getBytes());
 		} catch (Exception e) {
@ -136,7 +136,7 @@ public class OrcidNoDoiTest {
 		if (p == null) {
 			logger.info("XMLRecordParserNoDoi null");
 		}
-		WorkDataNoDoi workData = null;
+		WorkDetail workData = null;
 		try {
 			workData = p.VTDParseWorkData(xml.getBytes());
 		} catch (Exception e) {
@ -179,7 +179,7 @@ public class OrcidNoDoiTest {
 		if (p == null) {
 			logger.info("XMLRecordParserNoDoi null");
 		}
-		WorkDataNoDoi workData = null;
+		WorkDetail workData = null;
 		try {
 			workData = p.VTDParseWorkData(xml.getBytes());
 		} catch (Exception e) {
@ -308,7 +308,7 @@ public class OrcidNoDoiTest {
 		if (p == null) {
 			logger.info("XMLRecordParserNoDoi null");
 		}
-		WorkDataNoDoi workData = null;
+		WorkDetail workData = null;
 		try {
 			workData = p.VTDParseWorkData(xml.getBytes());
 		} catch (Exception e) {
--- a/dhp-workflows/dhp-doiboost/src/test/resources/eu/dnetlib/doiboost/orcid/0000-0002-6664-7451_work.compressed.base64
+++ b/dhp-workflows/dhp-doiboost/src/test/resources/eu/dnetlib/doiboost/orcid/0000-0002-6664-7451_work.compressed.base64
@ -0,0 +1 @@
 H4sIAAAAAAAAAO1c63LbNhb+n6fA6EebTE2JulpyYnXVpE2a1Jus7V5mO/0BkZCImCJVgLSidjqzf/cJ9oH2TfZJ9jsASVESLWdsddNulJlcDJxzcO4XEJMnn7+bhexaKC3j6LTWrLs1JiIv9mU0Pa19e/mV068xnfDI52EcidPaUuja58MHTxaxujqhP9g8TRwgYK/Xb/Z7TbdZY3OeBKe1hotfDn63nF6v13GOO91mg3AaK8hrqeVYhjJZntbm6TiUXo2BpUifyCgRKuLhaS1IkvlJo7FYLOqx8qSPP6eNSDdyiBxD+KnHEyPITSgFSI7jS53IyNuNVQIq8MRcCZAS/g60AibHipNAKCfiM3Ez1gomx5qJ2RgWCuT8ZqwVTKENpWK1QxO0ncN68Wy2SwF2P4eGULHaIbfdz6HnYCuGlRxfJFyG+ma8TcicwpVYLnYemAEUks+AvUNy2i5g31kfcqQvokROpNils23gnM4kjWzM3ISbARRaUWIiFEJN7FLICijH476vhN6BkwGsouhawgGdeazlbiffhMwpUMDejEW7OWSAMInV8mbgDGBlp3kYL2dQ5S5j5TA51s8pD6H62yJ9DSzH1UJdS29H8GUA6757m8cWtkGGgA7lLpOuYFbRpAVXHgV9qna47TrcikP8rMS1FItdbBZAOd44DXdYlXY3+QMBHadql/a2QGvDBwy/ntj8ceIpQdnQ8fHnsOW2UByaTtu9bLVOOv2TJqpPx/37k0YV9BqdkOvEmaFIIQLL1Jqu02pdus0T1z1xe/VOu7+iVoGzRtMybNe21x0vlPBBBP4KogyVKjkkrWioZaUSi9QYvXnjdH948bfLL1vtN98evx5dXA4KvgizkiTV0OFOVANRiRvEOhkWfBQIZnklYeNWETeUQEVp+ApZ7FPNnsZhKKaCfRNHfhxt0jKQDypOyRZN+5DIJKzQuF2+iD3JQ/aF4jJiX6W2+mLhjCepMkHNsPFXsRjHKmJfRxMeJZp9L5OAoVsx/4jThHH2FZ/JcMle2NzD4gkbpYnUM3YxF16i0hl7JjWqh1AFqyXGnjQ2WbW8v4U0VAnsxsvR2Qi8JKYhiuciytDWoUroOohVgjqnPSXnJMzwkzB5PP9kmjz+ejbHHkfSP2HfBzxhUkNShD1lZxYrxr2fU6nwb8gfiVSh97oWYTynJAkFeTCISeCa6dSDNjTjVmCdC+xnArOHo4tnj+iAKCZVTeQ7OiJNoAdxxMbQn4x0IrhPMJxdp2EkFLf9GktiLBU0odcEtkr0ERO0CONB69paEVGHVJyGlPfq7GtbPZdwJIZmh41lHMZTpOqQzYQX8AjM4jhtkEnoBVl1/XAljBI0C+P4ighBTOQeHAmtIPELWkApQ3cZkihiEithTzMeBXl0wOcgPl4SXBLxZOP8yEcoGxTxDolemjpMcobI4DjRcIVtLTLJ62wUyRmo6CT1ISn0P50KnQAIZtSp9gRsvdJehfFyy+B4JTVILAIRsamIRCK9nCWBSq3iKEMB3JVmE8sqeCnZn4foV6gZp7bFsK6XkRcAN051poisIBm9kawkqdUF/Sv2rRskKN0sgEojsKugTnAl3iGyIuuHQTrj5I0I0QQmJmduGG8u3Pr1+K2go+DVlzEZF00KSUfdrmU0slENLiercJ+twp3Yt+5kOfek8lKo3fjmhrPAl23YB6Wwv3hmQ8akjEomnwktp9ERuxAJGv7pkUklb7iC8uWcEswJMo1VhhdTCBtTG+rtXiF+xkJkebFZqJKdoxUKukOhFrAoJJ5aa1MRjSgPMDjV1Ph4wi4SdhnEM1jiRaznkuwEmWwSPmJfRtMQ5x6xVBt45gtfmgkkO6lQXk5SLxHfMxg0WZBNX6aRYK32EWu5za4Vf5ROU/hw06z160hza1IiaShNqWyqhADPIScj203S+MPzzx4ZOmRoG4V5JIfC5BBKTiSvDSIDu6bJSgU+PHcesQUo4khPpSY3ZjFgbVJnFyVfp1CD7GVnt3pQYmpCJZTRFUiAn8zHch9kC07Gns05Um6Vz5wRmdc2Z1ruzwTXKax3ws4z6vhhjr8pFxkut84gQbQIESG5Bxetv82zZjbWAXZnGI4cjthYaqlzzbKQ0shmhBfiEkVwKbgXZBIbsVINelQfQNSwbLJb7JVYswUlEiXF8YwEtuCJMSUn2slZqrPnKk7nJudnw8sR0UgUOgZyOaMA8Q7ehfYBLj2WKgmKn7THI+t4U0Pm3/8yO2bW54YlkDP6yvNPlVHOhUa1gQUuoZuJJF7R8qFciYR4AZummE5Ys8/OPwN12z48bLYRf6F4DIX4EhntR8WjqfjJVAjkW41SR25UZrXTqg/a7MeOW3ddp9Op93s/gT9xpa3b0wHOfQ/ouuzH9qDeGtAB3X5+QDkYg9hqBdIEqNeUx8z4EyUmaqaUZo2TbNWBzQqgAJwYhqgAKLiClrDZjD1M/vOPf57id6ve6T9mb7Kf0LVbUUMxAR4Kl7B9CKVNsFagteuD3jpandIpJlZTr45sijCeycsC3OgJuV8T1zzK2NViSpXRNCQmMCami0lDXubEbVcI4ME9AZeIEvNWGzn1E1Yi4ZZJgJ45ahuyVe83NyA3VFyGPT6uoloJ2u2ugVptrrz56DZ7+4JGLMoBMRX19oBSTadrnevTbZc8onpNGNXkstNklFOFZUqub84w6RmzQdZcVIXu0zjywlTbBgZGOUdavLbt8EWl1+q8GfSZj2kKGWa9aVilMkRClsxMQTTtOvLVJdVzW8gncWoSKrXdRatguxvoM+DXtqzeUvOMB290JFshuDvPkuT+Uq9LYlx/JYG6obrMVQzXNR2APdWx3X5WdWAQRLMhWtJ/NrFsDyalqcVDv7Fa2153kuVcDMdynIh3Gb31rZvwrnmYiuFfTKMVil87/nG33ez1B72+3/EHYtxqdwb+2D9u9pu+N3aPQMeMVIbWKat9gGGxRkzwMaIDnmiYOAxuh8Htzz64/fGmtMNIdhjJdo5kh/nrQ89fh2HrMGwdhq0//rB1mKz+h5OVnQ9S1EqVDSkv0Vsm7KnkSqF6c8PIS8ooaFzZ60/PoGgvQCuccJC2BuIhYhIjx0wie19blGd8gj6XfUGdQyjM0jeph940Zk8NN7HzHHnOt1ujCBxES/ZGIcLMypczMPwiBffWCy4SIaOFQGf168sYrERYfxXyVP+WcUhrnL1C6uQ6o0Bl/41QympztBRoydlLfk3lDAvfhdwHz4qDeIwKFIiM93MevYUORldxKK64sudTqQ7Yd9JLYpUdqcU8YC/4WzKekVl4aKLYWarmwTLTwrUEJ/6CK99ydYlaeCXZCIIG0qw8p3YCzdOZNwqpbTMmWULDLJ8b0T4NzOoM9THIVvlc0ZIfS1YANt1603Wbjbcc/mrdmz7z1YlAvdnv9Q0V8DhNKW0SCjV+6BjMxnUcpjORH2qWsk+DmWtsfj80IFLraMVq97jjtPtu12zl7YiirREsSrkbjY9vhrFRFiH08oGgo5QeB2WEOlj6bXM6twN4+Yvn+qyffbClGT7/ppkN6/kH0mK8L75fm9dclvzqc3sZgkwxJA0WH17NyhacMc7Q7RRgdmELzufLodstoOjH9U/Q1Szl6KXXPXqbeGm3+pt7CcBedmSfwkk9WCuY2IK7lZo1Tn4p4tCtiEPXIg7dizjli5HKQ0q23XVKRKkrlL9Qy438oaV5l4N6JGp3P3tF9HYGbLZHug3kfIhmfFJJcQ1q+y1DpZnubsP5bA+Wa7uDbrPZ6/xe1tlJ/89uAbEHA7Qc3aq7Tr/r9jrtVrvd7f5epnjPk/7sRkFtvLdRbi2pv5eN7nbwhzdZ1Y5eL2GpCotnaFdeOEdrVcffde7V06uGuZ4OGyJqlAqhbtjm1TGXL86qa3ZWHbKDjaxjd7IJw6HW20GX5WT3QQ537H2Qk90HOfHEsffXTn7X7OS3pA/fp6A8qgfJLCw9lAvXvkXQjYYcpziqXK0396qNVQJwzDO5dbB1ldqXfWsP+/KH7U3neNBpOt1W2y3xKW+mZp7s7cKueNPXeD+mM9ExrMnEvr/bHDjO4uiXOH+aVgasolM6jCf2n0JXCLYFrdDbD+3gkx+1ubsh33sduA32wazecvpuu+30Bt0dzzhvtHoV9l6tftNIeTD8/Q3fG7htRO3gLuFehb1Pw2/eFhzsfV97t52WOzh2BseDH+5g7yrsfdp7/SLoI7T2lsDV92AHzYjh2jXgQSFiWLoF/QjVsfe62G73eo47aLfuVBe3sffaELFXxSX3R2jrigaxfKN/0Aglg+KDxkeojr3PxL1O59jptbp3aZqqsPeZDMrfqj5CW28JXPWp7qAXGqbWvlR+hCrZe4/QbTc7znGv1btTj7CNvc+0sPYR+mDs+xu71Ru4Trcz6N7J2NvY+70hK70vOBh7D7di+f/ucrdbsS3svd6S2Kcjz7PHIwdz3/9SrNOnTxdu7y6JvAp7r/1ddtGx9j7oYPQ9TPjdrus00ZzfbcLfwt6n0deefh2MfX9jdzq9ntNqd9p3MvY29j6Nvfmq7//M3tvrG9/480eG5j9dG4rVf72yvvEgI0R/DB/8F4+Tql7oTQAA
--- a/dhp-workflows/dhp-doiboost/src/test/resources/eu/dnetlib/doiboost/orcid/0000-0003-3028-6161.compressed.base64
+++ b/dhp-workflows/dhp-doiboost/src/test/resources/eu/dnetlib/doiboost/orcid/0000-0003-3028-6161.compressed.base64
--- a/dhp-workflows/dhp-doiboost/src/test/resources/eu/dnetlib/doiboost/orcid/xml/record_0000-0001-5004-5918.xml
+++ b/dhp-workflows/dhp-doiboost/src/test/resources/eu/dnetlib/doiboost/orcid/xml/record_0000-0001-5004-5918.xml
--- a/dhp-workflows/dhp-doiboost/src/test/resources/eu/dnetlib/doiboost/orcid/xml/record_8888-8888-8888-8880.xml
+++ b/dhp-workflows/dhp-doiboost/src/test/resources/eu/dnetlib/doiboost/orcid/xml/record_8888-8888-8888-8880.xml
@ -732,7 +732,7 @@
                        <common:external-id-relationship>part-of</common:external-id-relationship>
                    </common:external-id>
                </common:external-ids>
-                <work:work-summary put-code="0" visibility="private">
+                <work:work-summary put-code="123456" visibility="private">
                    <common:created-date>2001-12-31T12:00:00</common:created-date>
                    <common:last-modified-date>2001-12-31T12:00:00</common:last-modified-date>
                    <common:source>
		`@ -0,0 +1 @@`
							H4sIAAAAAAAAAO1c63LbNhb+n6fA6EebTE2JulpyYnXVpE2a1Jus7V5mO/0BkZCImCJVgLSidjqzf/cJ9oH2TfZJ9jsASVESLWdsddNulJlcDJxzcO4XEJMnn7+bhexaKC3j6LTWrLs1JiIv9mU0Pa19e/mV068xnfDI52EcidPaUuja58MHTxaxujqhP9g8TRwgYK/Xb/Z7TbdZY3OeBKe1hotfDn63nF6v13GOO91mg3AaK8hrqeVYhjJZntbm6TiUXo2BpUifyCgRKuLhaS1IkvlJo7FYLOqx8qSPP6eNSDdyiBxD+KnHEyPITSgFSI7jS53IyNuNVQIq8MRcCZAS/g60AibHipNAKCfiM3Ez1gomx5qJ2RgWCuT8ZqwVTKENpWK1QxO0ncN68Wy2SwF2P4eGULHaIbfdz6HnYCuGlRxfJFyG+ma8TcicwpVYLnYemAEUks+AvUNy2i5g31kfcqQvokROpNils23gnM4kjWzM3ISbARRaUWIiFEJN7FLICijH476vhN6BkwGsouhawgGdeazlbiffhMwpUMDejEW7OWSAMInV8mbgDGBlp3kYL2dQ5S5j5TA51s8pD6H62yJ9DSzH1UJdS29H8GUA6757m8cWtkGGgA7lLpOuYFbRpAVXHgV9qna47TrcikP8rMS1FItdbBZAOd44DXdYlXY3+QMBHadql/a2QGvDBwy/ntj8ceIpQdnQ8fHnsOW2UByaTtu9bLVOOv2TJqpPx/37k0YV9BqdkOvEmaFIIQLL1Jqu02pdus0T1z1xe/VOu7+iVoGzRtMybNe21x0vlPBBBP4KogyVKjkkrWioZaUSi9QYvXnjdH948bfLL1vtN98evx5dXA4KvgizkiTV0OFOVANRiRvEOhkWfBQIZnklYeNWETeUQEVp+ApZ7FPNnsZhKKaCfRNHfhxt0jKQDypOyRZN+5DIJKzQuF2+iD3JQ/aF4jJiX6W2+mLhjCepMkHNsPFXsRjHKmJfRxMeJZp9L5OAoVsx/4jThHH2FZ/JcMle2NzD4gkbpYnUM3YxF16i0hl7JjWqh1AFqyXGnjQ2WbW8v4U0VAnsxsvR2Qi8JKYhiuciytDWoUroOohVgjqnPSXnJMzwkzB5PP9kmjz+ejbHHkfSP2HfBzxhUkNShD1lZxYrxr2fU6nwb8gfiVSh97oWYTynJAkFeTCISeCa6dSDNjTjVmCdC+xnArOHo4tnj+iAKCZVTeQ7OiJNoAdxxMbQn4x0IrhPMJxdp2EkFLf9GktiLBU0odcEtkr0ERO0CONB69paEVGHVJyGlPfq7GtbPZdwJIZmh41lHMZTpOqQzYQX8AjM4jhtkEnoBVl1/XAljBI0C+P4ighBTOQeHAmtIPELWkApQ3cZkihiEithTzMeBXl0wOcgPl4SXBLxZOP8yEcoGxTxDolemjpMcobI4DjRcIVtLTLJ62wUyRmo6CT1ISn0P50KnQAIZtSp9gRsvdJehfFyy+B4JTVILAIRsamIRCK9nCWBSq3iKEMB3JVmE8sqeCnZn4foV6gZp7bFsK6XkRcAN051poisIBm9kawkqdUF/Sv2rRskKN0sgEojsKugTnAl3iGyIuuHQTrj5I0I0QQmJmduGG8u3Pr1+K2go+DVlzEZF00KSUfdrmU0slENLiercJ+twp3Yt+5kOfek8lKo3fjmhrPAl23YB6Wwv3hmQ8akjEomnwktp9ERuxAJGv7pkUklb7iC8uWcEswJMo1VhhdTCBtTG+rtXiF+xkJkebFZqJKdoxUKukOhFrAoJJ5aa1MRjSgPMDjV1Ph4wi4SdhnEM1jiRaznkuwEmWwSPmJfRtMQ5x6xVBt45gtfmgkkO6lQXk5SLxHfMxg0WZBNX6aRYK32EWu5za4Vf5ROU/hw06z160hza1IiaShNqWyqhADPIScj203S+MPzzx4ZOmRoG4V5JIfC5BBKTiSvDSIDu6bJSgU+PHcesQUo4khPpSY3ZjFgbVJnFyVfp1CD7GVnt3pQYmpCJZTRFUiAn8zHch9kC07Gns05Um6Vz5wRmdc2Z1ruzwTXKax3ws4z6vhhjr8pFxkut84gQbQIESG5Bxetv82zZjbWAXZnGI4cjthYaqlzzbKQ0shmhBfiEkVwKbgXZBIbsVINelQfQNSwbLJb7JVYswUlEiXF8YwEtuCJMSUn2slZqrPnKk7nJudnw8sR0UgUOgZyOaMA8Q7ehfYBLj2WKgmKn7THI+t4U0Pm3/8yO2bW54YlkDP6yvNPlVHOhUa1gQUuoZuJJF7R8qFciYR4AZummE5Ys8/OPwN12z48bLYRf6F4DIX4EhntR8WjqfjJVAjkW41SR25UZrXTqg/a7MeOW3ddp9Op93s/gT9xpa3b0wHOfQ/ouuzH9qDeGtAB3X5+QDkYg9hqBdIEqNeUx8z4EyUmaqaUZo2TbNWBzQqgAJwYhqgAKLiClrDZjD1M/vOPf57id6ve6T9mb7Kf0LVbUUMxAR4Kl7B9CKVNsFagteuD3jpandIpJlZTr45sijCeycsC3OgJuV8T1zzK2NViSpXRNCQmMCami0lDXubEbVcI4ME9AZeIEvNWGzn1E1Yi4ZZJgJ45ahuyVe83NyA3VFyGPT6uoloJ2u2ugVptrrz56DZ7+4JGLMoBMRX19oBSTadrnevTbZc8onpNGNXkstNklFOFZUqub84w6RmzQdZcVIXu0zjywlTbBgZGOUdavLbt8EWl1+q8GfSZj2kKGWa9aVilMkRClsxMQTTtOvLVJdVzW8gncWoSKrXdRatguxvoM+DXtqzeUvOMB290JFshuDvPkuT+Uq9LYlx/JYG6obrMVQzXNR2APdWx3X5WdWAQRLMhWtJ/NrFsDyalqcVDv7Fa2153kuVcDMdynIh3Gb31rZvwrnmYiuFfTKMVil87/nG33ez1B72+3/EHYtxqdwb+2D9u9pu+N3aPQMeMVIbWKat9gGGxRkzwMaIDnmiYOAxuh8Htzz64/fGmtMNIdhjJdo5kh/nrQ89fh2HrMGwdhq0//rB1mKz+h5OVnQ9S1EqVDSkv0Vsm7KnkSqF6c8PIS8ooaFzZ60/PoGgvQCuccJC2BuIhYhIjx0wie19blGd8gj6XfUGdQyjM0jeph940Zk8NN7HzHHnOt1ujCBxES/ZGIcLMypczMPwiBffWCy4SIaOFQGf168sYrERYfxXyVP+WcUhrnL1C6uQ6o0Bl/41QympztBRoydlLfk3lDAvfhdwHz4qDeIwKFIiM93MevYUORldxKK64sudTqQ7Yd9JLYpUdqcU8YC/4WzKekVl4aKLYWarmwTLTwrUEJ/6CK99ydYlaeCXZCIIG0qw8p3YCzdOZNwqpbTMmWULDLJ8b0T4NzOoM9THIVvlc0ZIfS1YANt1603Wbjbcc/mrdmz7z1YlAvdnv9Q0V8DhNKW0SCjV+6BjMxnUcpjORH2qWsk+DmWtsfj80IFLraMVq97jjtPtu12zl7YiirREsSrkbjY9vhrFRFiH08oGgo5QeB2WEOlj6bXM6twN4+Yvn+qyffbClGT7/ppkN6/kH0mK8L75fm9dclvzqc3sZgkwxJA0WH17NyhacMc7Q7RRgdmELzufLodstoOjH9U/Q1Szl6KXXPXqbeGm3+pt7CcBedmSfwkk9WCuY2IK7lZo1Tn4p4tCtiEPXIg7dizjli5HKQ0q23XVKRKkrlL9Qy438oaV5l4N6JGp3P3tF9HYGbLZHug3kfIhmfFJJcQ1q+y1DpZnubsP5bA+Wa7uDbrPZ6/xe1tlJ/89uAbEHA7Qc3aq7Tr/r9jrtVrvd7f5epnjPk/7sRkFtvLdRbi2pv5eN7nbwhzdZ1Y5eL2GpCotnaFdeOEdrVcffde7V06uGuZ4OGyJqlAqhbtjm1TGXL86qa3ZWHbKDjaxjd7IJw6HW20GX5WT3QQ537H2Qk90HOfHEsffXTn7X7OS3pA/fp6A8qgfJLCw9lAvXvkXQjYYcpziqXK0396qNVQJwzDO5dbB1ldqXfWsP+/KH7U3neNBpOt1W2y3xKW+mZp7s7cKueNPXeD+mM9ExrMnEvr/bHDjO4uiXOH+aVgasolM6jCf2n0JXCLYFrdDbD+3gkx+1ubsh33sduA32wazecvpuu+30Bt0dzzhvtHoV9l6tftNIeTD8/Q3fG7htRO3gLuFehb1Pw2/eFhzsfV97t52WOzh2BseDH+5g7yrsfdp7/SLoI7T2lsDV92AHzYjh2jXgQSFiWLoF/QjVsfe62G73eo47aLfuVBe3sffaELFXxSX3R2jrigaxfKN/0Aglg+KDxkeojr3PxL1O59jptbp3aZqqsPeZDMrfqj5CW28JXPWp7qAXGqbWvlR+hCrZe4/QbTc7znGv1btTj7CNvc+0sPYR+mDs+xu71Ru4Trcz6N7J2NvY+70hK70vOBh7D7di+f/ucrdbsS3svd6S2Kcjz7PHIwdz3/9SrNOnTxdu7y6JvAp7r/1ddtGx9j7oYPQ9TPjdrus00ZzfbcLfwt6n0deefh2MfX9jdzq9ntNqd9p3MvY29j6Nvfmq7//M3tvrG9/480eG5j9dG4rVf72yvvEgI0R/DB/8F4+Tql7oTQAA