#Parser to convert the Datini onomastics CSV file into TTL format

# Utilities to read/write csv files
import csv
# Utilities to handle character encodings
import unicodedata
# Ordered Dicts
from collections import OrderedDict

import json
import re


# OPZIONAL IMPORTS

# For timestamping/simple speed tests
from datetime import datetime
# Random number generator
from random import *
# System & command line utilities
import sys
# Json for the dictionary
import json

import_dir = '/Users/federicaspinelli/TEAMOVI/Parser/DATA/ASPO/CSV/datini/'
export_dir = '/Users/federicaspinelli/TEAMOVI/Parser/DATA/ASPO/RDF/datini/'

# Custom class to store URIs + related infos for the ontologies/repositories

class RDFcoords:
    def __init__(self, uri, prefix, code = None):
        self.uri = uri
        self.prefix = prefix
        self.code = code

# Repositories
aspoCoords = RDFcoords('<http://www.archiviodistato.prato.it/accedi-e-consulta/aspoMV001/scheda/>', 'aspo:')
foafCoords = RDFcoords('<http://xmlns.com/foaf/0.1/>', 'foaf:')
cidocCoords = RDFcoords('<http://www.cidoc-crm.org/cidoc-crm/>', 'crm:')
schemaCoords = RDFcoords('<http://schema.org/>', 'schema:')
personCoords = RDFcoords('<http://www.w3.org/ns/person#>', 'person:')
nsCoords = RDFcoords('<http://www.w3.org/1999/02/22-rdf-syntax-ns#>', 'rdf:')
rdfsCoords = RDFcoords('<http://www.w3.org/2000/01/rdf-schema#>', 'rdfs:')
owlCoords = RDFcoords('<http://www.w3.org/2002/07/owl#>', 'owl:')

# Basic functions for triples / shortened triples in TTL format

def triple(subject, predicate, object1):
    line = subject + ' ' + predicate + ' ' + object1
    return line

def doublet(predicate, object1):
    line = '    ' + predicate + ' ' + object1
    return line

def singlet(object1):
    line = '        ' + object1
    return line

# Line endings in TTL format
continueLine1 = ' ;\n'
continueLine2 = ' ,\n'
closeLine = ' .\n'

def writeTTLHeader(output):
    output.write('@prefix ' + aspoCoords.prefix + ' ' + aspoCoords.uri + closeLine)
    output.write('@prefix ' + foafCoords.prefix + ' ' + foafCoords.uri + closeLine)
    output.write('@prefix ' + cidocCoords.prefix + ' ' + cidocCoords.uri + closeLine)
    output.write('@prefix ' + personCoords.prefix + ' ' + personCoords.uri + closeLine)
    output.write('@prefix ' + schemaCoords.prefix + ' ' + schemaCoords.uri + closeLine)
    output.write('@prefix ' + nsCoords.prefix + ' ' + nsCoords.uri + closeLine)
    output.write('@prefix ' + rdfsCoords.prefix + ' ' + rdfsCoords.uri + closeLine)
    output.write('@prefix ' + owlCoords.prefix + ' ' + owlCoords.uri + closeLine)
    output.write('\n')


filePrefix = 'DATINI - onomastica '
fileType = '- persone singole'
max_entries = 10000000000000

with open(import_dir + filePrefix + fileType + '.csv', newline="") as csv_file, open(
        export_dir + filePrefix + fileType + '.ttl', 'w') as output:
    reader = csv.DictReader(csv_file)
    writeTTLHeader(output)
    first = True
    ii = 0
    for row in reader:
        # The index ii is used to process a limited number of entries for testing purposes
        ii = ii + 1
        if row['entityType'] == 'person':
            id_aspo = row['recordId']
            aspoPlaceHolder = aspoCoords.prefix + id_aspo
            line = triple(aspoPlaceHolder, 
                          nsCoords.prefix + 'type', 
                          cidocCoords.prefix + 'E21_Person') + closeLine
            output.write(line)

            line = triple(aspoPlaceHolder, 
                          nsCoords.prefix + 'type', 
                          personCoords.prefix + 'Person') + closeLine
            output.write(line)

            line = triple(aspoPlaceHolder,
                          nsCoords.prefix + 'type',
                          foafCoords.prefix + 'person') + closeLine
            output.write(line)

            line = triple(aspoPlaceHolder,
                          cidocCoords.prefix + 'P1_is_identified_by',
                          aspoPlaceHolder + "_E42") + closeLine
            output.write(line)

            line = triple(aspoPlaceHolder + "_E42",
                          nsCoords.prefix + 'type',
                          cidocCoords.prefix + 'E42_Identifier') + closeLine
            output.write(line)
            line = triple(aspoPlaceHolder + "_E42",
                          rdfsCoords.prefix + 'label',
                          '\"' + id_aspo + '\"') + closeLine
            output.write(line)

            line = triple(aspoPlaceHolder,
                          foafCoords.prefix + 'name',
                          '\"' + row['nameEntry@normal'] + '\"') + closeLine
            output.write(line)

            line = triple(aspoPlaceHolder,
                          rdfsCoords.prefix + 'label',
                          '\"' + row['nameEntry@normal'] + '\"') + closeLine
            output.write(line)

            if row['nome proprio'] != '':
                #Remove all white-space characters:
                txt = row['nome proprio']
                x = re.sub(" \n", "", txt)
                y = re.sub("\s\s", "", x)
                name = re.sub("\n", "", y)
                line = triple(aspoPlaceHolder,
                              foafCoords.prefix + 'givenName',
                              '\"' + name + '\"') + closeLine
                output.write(line)

            if row['nome di famiglia'] != '':
                #Remove all white-space characters:
                txt = row['nome di famiglia']
                x = re.sub("\n", " ", txt)
                y = re.sub("\s\s", "", x)
                line = triple(aspoPlaceHolder,
                              foafCoords.prefix + 'familyName',
                              '\"' + y + '\"') + closeLine
                output.write(line)
            
            if row['Alias'] != '' and row['Alias'] != ' ':
                #Remove all white-space characters:
                txt = row['Alias']
                x = re.sub("\n", " ", txt)
                y = re.sub("\s\s", "", x)
                line = triple(aspoPlaceHolder,
                              schemaCoords.prefix + 'alternateName',
                              '\"' + y + '\"') + closeLine
                output.write(line)

            if row['genere'] != '':
                #Remove all white-space characters:
                txt = row['genere']
                x = re.sub("\n", " ", txt)
                y = re.sub("\s\s", "", x)
                line = triple(aspoPlaceHolder,
                              foafCoords.prefix + 'gender',
                              '\"' + y + '\"') + closeLine
                output.write(line)

            if row['patronimico/matronimico'] != '':
                #Remove all white-space characters:
                txt = row['patronimico/matronimico']
                x = re.sub("\n", " ", txt)
                y = re.sub("\s\s", "", x)
                line = triple(aspoPlaceHolder,
                              personCoords.prefix + 'patronymicName',
                              '\"' + y + '\"') + closeLine
                output.write(line)

            # if row['occupation_1'] != '' and row['occupation_1'] != ' ' :
            #     occupazioni = []
            #     pipe = "|"
            #     if pipe in row['occupation_1']:
            #         occupazioni = row['occupation_1'].split('|') 
            #         for occupazione in occupazioni:
            #             #Remove all white-space characters:
            #             txt = occupazione
            #             x = re.sub("\n", " ", txt)
            #             y = re.sub("\s\s", "", x)
            #             occ = re.sub(r'[^A-Za-z]','', y)
            #             occupationPlaceHolder = '<http://www.archiviodistato.prato.it/' + occ.replace(" ","_") + '>'
            #             line = triple(aspoPlaceHolder,
            #                         schemaCoords.prefix + 'hasOccupation',
            #                         occupationPlaceHolder) + closeLine
            #             output.write(line)
            #             line = triple(occupationPlaceHolder,
            #                         nsCoords.prefix + 'type',
            #                         schemaCoords.prefix + 'Occupation') + closeLine
            #             output.write(line)
            #             line = triple(occupationPlaceHolder,
            #                         rdfsCoords.prefix + 'label',
            #                         '\"' + y + '\"') + closeLine
            #             output.write(line)

            #             if row['place occupation 1 ENTE'] != '':
            #                 placeoccupazioni = []
            #                 pipe = "|"
            #                 if pipe in row['place occupation 1 ENTE']:
            #                     placeoccupazioni = row['place occupation 1 ENTE'].split('|') 
            #                     for placeoccupazione in placeoccupazioni:
            #                         #Remove all white-space characters:
            #                         txt = row['place occupation 1 ENTE']
            #                         x = re.sub("\n", " ", txt)
            #                         y = re.sub("\s\s", "", x)
            #                         placeoccupationPlaceHolder = '<http://www.archiviodistato.prato.it/' + y.replace(" ","_").replace("'","").replace('\\','\\\\').replace('"','\\"') + '>'
            #                         line = triple(aspoPlaceHolder,
            #                                     schemaCoords.prefix + 'workLocation',
            #                                     placeoccupationPlaceHolder) + closeLine
            #                         output.write(line)
            #                         line = triple(occupationPlaceHolder,
            #                                     schemaCoords.prefix + 'occupationLocation',
            #                                     placeoccupationPlaceHolder) + closeLine
            #                         output.write(line)
            #                         line = triple(placeoccupationPlaceHolder,
            #                         rdfsCoords.prefix + 'label',
            #                         '\"' + y + '\"') + closeLine
            #                         output.write(line)
            #                         line = triple(placeoccupationPlaceHolder,
            #                         nsCoords.prefix + 'type',
            #                         cidocCoords.prefix + 'E53_Place') + closeLine
            #                         output.write(line)
            #                         line = triple(aspoPlaceHolder,
            #                         schemaCoords.prefix + 'jobTitle',
            #                         '\"' + row['occupation_1'].lower() + ' presso ' + row['place occupation 1 ENTE'].lower() + '\"') + closeLine
            #                         output.write(line)
            #                 else: 
            #                     placeoccupazioni = row['place occupation 1 ENTE'].split('|') 
            #                     txt = row['place occupation 1 ENTE']
            #                     x = re.sub("\n", " ", txt)
            #                     y = re.sub("\s\s", "", x)
            #                     placeoccupationPlaceHolder = '<http://www.archiviodistato.prato.it/' + y.replace(" ","_").replace("'","").replace('\\','\\\\').replace('"','\\"') + '>'
            #                     line = triple(aspoPlaceHolder,
            #                                     schemaCoords.prefix + 'workLocation',
            #                                     placeoccupationPlaceHolder) + closeLine
            #                     output.write(line)
            #                     line = triple(occupationPlaceHolder,
            #                                     schemaCoords.prefix + 'occupationLocation',
            #                                     placeoccupationPlaceHolder) + closeLine
            #                     output.write(line)
            #                     line = triple(placeoccupationPlaceHolder,
            #                         rdfsCoords.prefix + 'label',
            #                         '\"' + y + '\"') + closeLine
            #                     output.write(line)
            #                     line = triple(placeoccupationPlaceHolder,
            #                         nsCoords.prefix + 'type',
            #                         cidocCoords.prefix + 'E53_Place') + closeLine
            #                     output.write(line)
            #                     line = triple(aspoPlaceHolder,
            #                         schemaCoords.prefix + 'jobTitle',
            #                         '\"' + row['occupation_1'].lower() + ' presso ' + row['place occupation 1 ENTE'].lower() + '\"') + closeLine
            #                     output.write(line)              
            #     else:
            #         #Remove all white-space characters:
            #         txt = row['occupation_1']
            #         x = re.sub("\n", " ", txt)
            #         y = re.sub("\s\s", "", x)
            #         occ = re.sub(r'[^A-Za-z]','', y)
            #         occupationPlaceHolder = '<http://www.archiviodistato.prato.it/' + occ.replace(" ","_") + '>'
            #         line = triple(aspoPlaceHolder,
            #                     schemaCoords.prefix + 'hasOccupation',
            #                     occupationPlaceHolder) + closeLine
            #         output.write(line)
            #         line = triple(occupationPlaceHolder,
            #                     nsCoords.prefix + 'type',
            #                     schemaCoords.prefix + 'Occupation') + closeLine
            #         output.write(line)
            #         line = triple(occupationPlaceHolder,
            #                     rdfsCoords.prefix + 'label',
            #                     '\"' + y + '\"') + closeLine
            #         output.write(line)
                    
            #         if row['place occupation 1 ENTE'] != '':
            #                 placeoccupazioni = []
            #                 pipe = "|"
            #                 if pipe in row['place occupation 1 ENTE']:
            #                     placeoccupazioni = row['place occupation 1 ENTE'].split('|') 
            #                     for placeoccupazione in placeoccupazioni:
            #                         #Remove all white-space characters:
            #                         txt = row['place occupation 1 ENTE']
            #                         x = re.sub("\n", " ", txt)
            #                         y = re.sub("\s\s", "", x)
            #                         placeoccupationPlaceHolder = '<http://www.archiviodistato.prato.it/' + y.replace(" ","_").replace("'","").replace('\\','\\\\').replace('"','\\"') + '>'
            #                         line = triple(aspoPlaceHolder,
            #                                     schemaCoords.prefix + 'workLocation',
            #                                     placeoccupationPlaceHolder) + closeLine
            #                         output.write(line)
            #                         line = triple(occupationPlaceHolder,
            #                                     schemaCoords.prefix + 'occupationLocation',
            #                                     placeoccupationPlaceHolder) + closeLine
            #                         output.write(line)
            #                         line = triple(placeoccupationPlaceHolder,
            #                         rdfsCoords.prefix + 'label',
            #                         '\"' + y + '\"') + closeLine
            #                         output.write(line)
            #                         line = triple(placeoccupationPlaceHolder,
            #                         nsCoords.prefix + 'type',
            #                         cidocCoords.prefix + 'E53_Place') + closeLine
            #                         output.write(line)
            #                         line = triple(aspoPlaceHolder,
            #                         schemaCoords.prefix + 'jobTitle',
            #                         '\"' + row['occupation_1'].lower() + ' presso ' + row['place occupation 1 ENTE'].lower() + '\"') + closeLine
            #                         output.write(line)
            #                 else: 
            #                     placeoccupazioni = row['place occupation 1 ENTE'].split('|') 
            #                     txt = row['place occupation 1 ENTE']
            #                     x = re.sub("\n", " ", txt)
            #                     y = re.sub("\s\s", "", x)
            #                     placeoccupationPlaceHolder = '<http://www.archiviodistato.prato.it/' + y.replace(" ","_").replace("'","").replace('\\','\\\\').replace('"','\\"') + '>'
            #                     line = triple(aspoPlaceHolder,
            #                                     schemaCoords.prefix + 'workLocation',
            #                                     placeoccupationPlaceHolder) + closeLine
            #                     output.write(line)
            #                     line = triple(occupationPlaceHolder,
            #                                     schemaCoords.prefix + 'occupationLocation',
            #                                     placeoccupationPlaceHolder) + closeLine
            #                     output.write(line)
            #                     line = triple(placeoccupationPlaceHolder,
            #                         rdfsCoords.prefix + 'label',
            #                         '\"' + y + '\"') + closeLine
            #                     output.write(line)
            #                     line = triple(placeoccupationPlaceHolder,
            #                         nsCoords.prefix + 'type',
            #                         cidocCoords.prefix + 'E53_Place') + closeLine
            #                     output.write(line)
            #                     line = triple(aspoPlaceHolder,
            #                         schemaCoords.prefix + 'jobTitle',
            #                         '\"' + row['occupation_1'].lower() + ' presso ' + row['place occupation 1 ENTE'].lower() + '\"') + closeLine
            #                     output.write(line)              
            
            # if row['occupation_2'] != '' and row['occupation_2'] != ' ' :
            #     occupazioni = []
            #     pipe = "|"
            #     if pipe in row['occupation_2']:
            #         occupazioni = row['occupation_2'].split('|') 
            #         for occupazione in occupazioni:
            #             #Remove all white-space characters:
            #             txt = occupazione
            #             x = re.sub("\n", " ", txt)
            #             y = re.sub("\s\s", "", x)
            #             occ = re.sub(r'[^A-Za-z]','', y)
            #             occupationPlaceHolder = '<http://www.archiviodistato.prato.it/' + occ.replace(" ","_") + '>'
            #             line = triple(aspoPlaceHolder,
            #                         schemaCoords.prefix + 'hasOccupation',
            #                         occupationPlaceHolder) + closeLine
            #             output.write(line)
            #             line = triple(occupationPlaceHolder,
            #                         nsCoords.prefix + 'type',
            #                         schemaCoords.prefix + 'Occupation') + closeLine
            #             output.write(line)
            #             line = triple(occupationPlaceHolder,
            #                         rdfsCoords.prefix + 'label',
            #                         '\"' + y + '\"') + closeLine
            #             output.write(line)

            #             if row['place occupation 2 ENTE'] != '':
            #                 placeoccupazioni = []
            #                 pipe = "|"
            #                 if pipe in row['place occupation 2 ENTE']:
            #                     placeoccupazioni = row['place occupation 2 ENTE'].split('|') 
            #                     for placeoccupazione in placeoccupazioni:
            #                         #Remove all white-space characters:
            #                         txt = row['place occupation 2 ENTE']
            #                         x = re.sub("\n", " ", txt)
            #                         y = re.sub("\s\s", "", x)
            #                         placeoccupationPlaceHolder = '<http://www.archiviodistato.prato.it/' + y.replace(" ","_").replace("'","").replace('\\','\\\\').replace('"','\\"') + '>'
            #                         line = triple(aspoPlaceHolder,
            #                                     schemaCoords.prefix + 'workLocation',
            #                                     placeoccupationPlaceHolder) + closeLine
            #                         output.write(line)
            #                         line = triple(occupationPlaceHolder,
            #                                     schemaCoords.prefix + 'occupationLocation',
            #                                     placeoccupationPlaceHolder) + closeLine
            #                         output.write(line)
            #                         line = triple(placeoccupationPlaceHolder,
            #                         rdfsCoords.prefix + 'label',
            #                         '\"' + y + '\"') + closeLine
            #                         output.write(line)
            #                         line = triple(placeoccupationPlaceHolder,
            #                         nsCoords.prefix + 'type',
            #                         cidocCoords.prefix + 'E53_Place') + closeLine
            #                         output.write(line)
            #                         line = triple(aspoPlaceHolder,
            #                         schemaCoords.prefix + 'jobTitle',
            #                         '\"' + row['occupation_2'].lower() + ' presso ' + row['place occupation 2 ENTE'].lower() + '\"') + closeLine
            #                         output.write(line)
            #                 else: 
            #                     placeoccupazioni = row['place occupation 2 ENTE'].split('|') 
            #                     txt = row['place occupation 2 ENTE']
            #                     x = re.sub("\n", " ", txt)
            #                     y = re.sub("\s\s", "", x)
            #                     placeoccupationPlaceHolder = '<http://www.archiviodistato.prato.it/' + y.replace(" ","_").replace("'","").replace('\\','\\\\').replace('"','\\"') + '>'
            #                     line = triple(aspoPlaceHolder,
            #                                     schemaCoords.prefix + 'workLocation',
            #                                     placeoccupationPlaceHolder) + closeLine
            #                     output.write(line)
            #                     line = triple(occupationPlaceHolder,
            #                                     schemaCoords.prefix + 'occupationLocation',
            #                                     placeoccupationPlaceHolder) + closeLine
            #                     output.write(line)
            #                     line = triple(placeoccupationPlaceHolder,
            #                         rdfsCoords.prefix + 'label',
            #                         '\"' + y + '\"') + closeLine
            #                     output.write(line)
            #                     line = triple(placeoccupationPlaceHolder,
            #                         nsCoords.prefix + 'type',
            #                         cidocCoords.prefix + 'E53_Place') + closeLine
            #                     output.write(line)
            #                     line = triple(aspoPlaceHolder,
            #                         schemaCoords.prefix + 'jobTitle',
            #                         '\"' + row['occupation_2'].lower() + ' presso ' + row['place occupation 2 ENTE'].lower() + '\"') + closeLine
            #                     output.write(line)              
            #     else:
            #         #Remove all white-space characters:
            #         txt = row['occupation_2']
            #         x = re.sub("\n", " ", txt)
            #         y = re.sub("\s\s", "", x)
            #         occ = re.sub(r'[^A-Za-z]','', y)
            #         occupationPlaceHolder = '<http://www.archiviodistato.prato.it/' + occ.replace(" ","_") + '>'
            #         line = triple(aspoPlaceHolder,
            #                     schemaCoords.prefix + 'hasOccupation',
            #                     occupationPlaceHolder) + closeLine
            #         output.write(line)
            #         line = triple(occupationPlaceHolder,
            #                     nsCoords.prefix + 'type',
            #                     schemaCoords.prefix + 'Occupation') + closeLine
            #         output.write(line)
            #         line = triple(occupationPlaceHolder,
            #                     rdfsCoords.prefix + 'label',
            #                     '\"' + y + '\"') + closeLine
            #         output.write(line)
                    
            #         if row['place occupation 2 ENTE'] != '':
            #                 placeoccupazioni = []
            #                 pipe = "|"
            #                 if pipe in row['place occupation 2 ENTE']:
            #                     placeoccupazioni = row['place occupation 2 ENTE'].split('|') 
            #                     for placeoccupazione in placeoccupazioni:
            #                         #Remove all white-space characters:
            #                         txt = row['place occupation 2 ENTE']
            #                         x = re.sub("\n", " ", txt)
            #                         y = re.sub("\s\s", "", x)
            #                         placeoccupationPlaceHolder = '<http://www.archiviodistato.prato.it/' + y.replace(" ","_").replace("'","").replace('\\','\\\\').replace('"','\\"') + '>'
            #                         line = triple(aspoPlaceHolder,
            #                                     schemaCoords.prefix + 'workLocation',
            #                                     placeoccupationPlaceHolder) + closeLine
            #                         output.write(line)
            #                         line = triple(occupationPlaceHolder,
            #                                     schemaCoords.prefix + 'occupationLocation',
            #                                     placeoccupationPlaceHolder) + closeLine
            #                         output.write(line)
            #                         line = triple(placeoccupationPlaceHolder,
            #                         rdfsCoords.prefix + 'label',
            #                         '\"' + y + '\"') + closeLine
            #                         output.write(line)
            #                         line = triple(placeoccupationPlaceHolder,
            #                         nsCoords.prefix + 'type',
            #                         cidocCoords.prefix + 'E53_Place') + closeLine
            #                         output.write(line)
            #                         line = triple(aspoPlaceHolder,
            #                         schemaCoords.prefix + 'jobTitle',
            #                         '\"' + row['occupation_2'].lower() + ' presso ' + row['place occupation 2 ENTE'].lower() + '\"') + closeLine
            #                         output.write(line)
            #                 else: 
            #                     placeoccupazioni = row['place occupation 2 ENTE'].split('|') 
            #                     txt = row['place occupation 2 ENTE']
            #                     x = re.sub("\n", " ", txt)
            #                     y = re.sub("\s\s", "", x)
            #                     placeoccupationPlaceHolder = '<http://www.archiviodistato.prato.it/' + y.replace(" ","_").replace("'","").replace('\\','\\\\').replace('"','\\"') + '>'
            #                     line = triple(aspoPlaceHolder,
            #                                     schemaCoords.prefix + 'workLocation',
            #                                     placeoccupationPlaceHolder) + closeLine
            #                     output.write(line)
            #                     line = triple(occupationPlaceHolder,
            #                                     schemaCoords.prefix + 'occupationLocation',
            #                                     placeoccupationPlaceHolder) + closeLine
            #                     output.write(line)
            #                     line = triple(placeoccupationPlaceHolder,
            #                         rdfsCoords.prefix + 'label',
            #                         '\"' + y + '\"') + closeLine
            #                     output.write(line)
            #                     line = triple(placeoccupationPlaceHolder,
            #                         nsCoords.prefix + 'type',
            #                         cidocCoords.prefix + 'E53_Place') + closeLine
            #                     output.write(line)
            #                     line = triple(aspoPlaceHolder,
            #                         schemaCoords.prefix + 'jobTitle',
            #                         '\"' + row['occupation_2'].lower() + ' presso ' + row['place occupation 2 ENTE'].lower() + '\"') + closeLine
            #                     output.write(line)              
            
            if (row['avo 1'] != ''):
                id = row['avo 1']
                E13placeHolder = '<http://www.archiviodistato.prato.it/accedi-e-consulta/aspoMV001/scheda/' + row['avo 1'].replace(' ', '_') + '_AVO1_' + row['recordId'] + ">"
                line = triple(E13placeHolder, 
                nsCoords.prefix + 'type', 
                cidocCoords.prefix + 'E13_Attribute_Assignment') + closeLine
                output.write(line)
                line = triple(E13placeHolder, cidocCoords.prefix + 'P141_assigned', aspoPlaceHolder) + closeLine
                output.write(line)
                line = triple(E13placeHolder,
                                    rdfsCoords.prefix + 'label',
                                    '\"Relazione: ' + row['avo 1'] + ' avo di secondo grado di ' + row['recordId'] + '\"') + closeLine
                output.write(line)
                if re.match(r'IT-ASPO', id):
                    relazioneid = '<http://www.archiviodistato.prato.it/accedi-e-consulta/aspoMV001/scheda/' + row['avo 1']+ ">"
                    #line = triple(aspoPlaceHolder, schemaCoords.prefix + 'relatedTo', relazioneid) + closeLine
                    #output.write(line)
                    line = triple(relazioneid, cidocCoords.prefix + 'P141_assigned', E13placeHolder) + closeLine
                    output.write(line)
                else:
                    relazionenoid = '<http://www.archiviodistato.prato.it/accedi-e-consulta/aspoMV001/scheda/' + row['avo 1'].replace(' ', '_').lower()+ ">"
                    #line = triple(aspoPlaceHolder, schemaCoords.prefix + 'relatedTo', relazionenoid) + closeLine
                    #output.write(line)
                    line = triple(relazionenoid, cidocCoords.prefix + 'P141_assigned', E13placeHolder ) + closeLine
                    output.write(line)
                    line = triple(relazionenoid,
                                    rdfsCoords.prefix + 'label',
                                    '\"' + row['avo 1'] + '\"') + closeLine
                    output.write(line)
                    line = triple(relazionenoid, 
                          nsCoords.prefix + 'type', 
                          cidocCoords.prefix + 'E21_Person') + closeLine
                    output.write(line)

                    line = triple(relazionenoid, 
                                nsCoords.prefix + 'type', 
                                personCoords.prefix + 'Person') + closeLine
                    output.write(line)

                    line = triple(relazionenoid,
                                nsCoords.prefix + 'type',
                                foafCoords.prefix + 'person') + closeLine
                    output.write(line)
                E55placeHolder = '<http://www.archiviodistato.prato.it/avo_secondo_grado>'
                line = triple(E13placeHolder, cidocCoords.prefix + 'P42_assigned', E55placeHolder) + closeLine
                output.write(line)
                line = triple(E55placeHolder,
                                            rdfsCoords.prefix + 'label',
                                            '\"Avo di secondo grado\"') + closeLine
                output.write(line)      

            if (row['avo 2'] != ''):
                id = row['avo 2']
                E13placeHolder = '<http://www.archiviodistato.prato.it/accedi-e-consulta/aspoMV001/scheda/' + row['avo 2'].replace(' ', '_') + '_AVO2_' + row['recordId'] + ">"
                line = triple(E13placeHolder, 
                nsCoords.prefix + 'type', 
                cidocCoords.prefix + 'E13_Attribute_Assignment') + closeLine
                output.write(line)
                line = triple(E13placeHolder, cidocCoords.prefix + 'P141_assigned', aspoPlaceHolder) + closeLine
                output.write(line)
                line = triple(E13placeHolder,
                                    rdfsCoords.prefix + 'label',
                                    '\"Relazione: ' + row['avo 2'] + ' avo di terzo grado di ' + row['recordId'] + '\"') + closeLine
                output.write(line)
                if re.match(r'IT-ASPO', id):
                    relazioneid = '<http://www.archiviodistato.prato.it/accedi-e-consulta/aspoMV001/scheda/' + row['avo 2']+ ">"
                    #line = triple(aspoPlaceHolder, schemaCoords.prefix + 'relatedTo', relazioneid) + closeLine
                    #output.write(line)
                    line = triple(relazioneid, cidocCoords.prefix + 'P141_assigned', E13placeHolder) + closeLine
                    output.write(line)
                else:
                    relazionenoid = '<http://www.archiviodistato.prato.it/accedi-e-consulta/aspoMV001/scheda/' + row['avo 2'].replace(' ', '_').lower()+ ">"
                    #line = triple(aspoPlaceHolder, schemaCoords.prefix + 'relatedTo', relazionenoid) + closeLine
                    #output.write(line)
                    line = triple(relazionenoid, cidocCoords.prefix + 'P141_assigned', E13placeHolder ) + closeLine
                    output.write(line)
                    line = triple(relazionenoid,
                                    rdfsCoords.prefix + 'label',
                                    '\"' + row['avo 2'] + '\"') + closeLine
                    output.write(line)
                    line = triple(relazionenoid, 
                          nsCoords.prefix + 'type', 
                          cidocCoords.prefix + 'E21_Person') + closeLine
                    output.write(line)

                    line = triple(relazionenoid, 
                                nsCoords.prefix + 'type', 
                                personCoords.prefix + 'Person') + closeLine
                    output.write(line)

                    line = triple(relazionenoid,
                                nsCoords.prefix + 'type',
                                foafCoords.prefix + 'person') + closeLine
                    output.write(line)
                E55placeHolder = '<http://www.archiviodistato.prato.it/avo_terzo_grado>'
                line = triple(E13placeHolder, cidocCoords.prefix + 'P42_assigned', E55placeHolder) + closeLine
                output.write(line)
                line = triple(E55placeHolder,
                                            rdfsCoords.prefix + 'label',
                                            '\"Avo di terzo grado\"') + closeLine
                output.write(line)      

            if row['Qualifica'] != '':
                qualifiche = []
                pipe = "|"
                if pipe in row['Qualifica']:
                    qualifiche = row['Qualifica'].split('|') 
                    for qualifica in qualifiche:
                        #Remove all white-space characters:
                        txt = qualifica
                        x = re.sub("\n", " ", txt)
                        y = re.sub("\s\s", " ", x)
                        line = triple(aspoPlaceHolder, schemaCoords.prefix + 'honorificPrefix', '\"' + str(y) + '\"') + closeLine
                        output.write(line)
                else:
                #Remove all white-space characters:
                    txt = row['Qualifica']
                    x = re.sub("\n", " ", txt)
                    y = re.sub("\s\s", " ", x)
                    line = triple(aspoPlaceHolder, schemaCoords.prefix + 'honorificPrefix', '\"' + y + '\"') + closeLine
                    output.write(line)

            # if row['place_occupation_Qualifica'] != '':
            #     #Remove all white-space characters:
            #     txt = row['place_occupation_Qualifica']
            #     x = re.sub("\n", " ", txt)
            #     y = re.sub("\s\s", "", x)
            #     line = triple(aspoPlaceHolder,
            #                   schemaCoords.prefix + 'workLocation',
            #                   '\"' + row['place_occupation_Qualifica'].replace('\\','\\\\').replace('"','\\"') + '\"') + closeLine
            #     output.write(line)

            if row['biogHist p'] != '':
                #Remove all white-space characters:
                txt = row['biogHist p']
                x = re.sub("\n", " ", txt)
                y = re.sub("\s\s", " ", x)
                note = re.sub("\"", "", x)
                line = triple(aspoPlaceHolder,
                              cidocCoords.prefix + 'P3_has_note',
                              '\"' + note + '\"') + closeLine
                output.write(line)
            
            if row['Variante'] != '': 
                varianti = []
                pipe = "|"
                if pipe in row['Variante']:
                    varianti = row['Variante'].split('|')
                    for variante in varianti: 
                        line = triple(aspoPlaceHolder,
                        owlCoords.prefix + 'sameAs',
                        aspoCoords.prefix + str(variante)) + closeLine
                        output.write(line)
                else:
                    line = triple(aspoPlaceHolder,
                    owlCoords.prefix + 'sameAs',
                    aspoCoords.prefix + row['Variante']) + closeLine
                    output.write(line)
          
            if (row['recordID relazione'] != ''):
                relazioni = []
                pipe = "|"
                if pipe in row['recordID relazione']:
                    relazioni = row['recordID relazione'].split('|')
                    for relazione in relazioni:
                        id = relazione
                        E13placeHolder = '<http://www.archiviodistato.prato.it/accedi-e-consulta/aspoMV001/scheda/' + relazione.replace(' ', '_') + '_R_' + row['recordId'] + ">"
                        line = triple(E13placeHolder, 
                        nsCoords.prefix + 'type', 
                        cidocCoords.prefix + 'E13_Attribute_Assignment') + closeLine
                        output.write(line)
                        line = triple(E13placeHolder, cidocCoords.prefix + 'P141_assigned', aspoPlaceHolder) + closeLine
                        output.write(line)
                        line = triple(E13placeHolder,
                                            rdfsCoords.prefix + 'label',
                                            '\"Relazione: di ' + relazione + ' ' + ' con ' + row['recordId'] + '\"') + closeLine
                        output.write(line)
                        if re.match(r'IT-ASPO', id):
                            relazioneid = '<http://www.archiviodistato.prato.it/accedi-e-consulta/aspoMV001/scheda/' + relazione + ">"
                            #line = triple(aspoPlaceHolder, schemaCoords.prefix + 'relatedTo', relazioneid) + closeLine
                            #output.write(line)
                            line = triple(relazioneid, cidocCoords.prefix + 'P141_assigned', E13placeHolder) + closeLine
                            output.write(line)
                        else:
                            relazionenoid = '<http://www.archiviodistato.prato.it/accedi-e-consulta/aspoMV001/scheda/' + relazione.replace(' ', '_').lower()+ ">"
                            #line = triple(aspoPlaceHolder, schemaCoords.prefix + 'relatedTo', relazionenoid) + closeLine
                            #output.write(line)
                            line = triple(relazionenoid, cidocCoords.prefix + 'P141_assigned', E13placeHolder ) + closeLine
                            output.write(line)
                            cleanlabel = relazione.rstrip()
                            line = triple(relazionenoid,
                                            rdfsCoords.prefix + 'label',
                                            '\"' + cleanlabel + '\"') + closeLine
                            output.write(line)
                            line = triple(relazionenoid, 
                                nsCoords.prefix + 'type', 
                                cidocCoords.prefix + 'E21_Person') + closeLine
                            output.write(line)

                            line = triple(relazionenoid, 
                                        nsCoords.prefix + 'type', 
                                        personCoords.prefix + 'Person') + closeLine
                            output.write(line)

                            line = triple(relazionenoid,
                                        nsCoords.prefix + 'type',
                                        foafCoords.prefix + 'person') + closeLine
                            output.write(line)
                        if (row['nome relazione'] != ''):      
                                relazioni = []
                                pipe = "|" 
                                if pipe in row['nome relazione']:
                                    relazioni = row['nome relazione'].split('|') 
                                    for relazione in relazioni:
                                        #Remove all white-space characters:
                                        txt = relazione
                                        x = re.sub("\n", " ", txt)
                                        y = re.sub("\s\s", "", x)
                                        rel = re.sub(r'[^A-Za-z]','', y)
                                        cleanlabel = rel.rstrip().lstrip()
                                        E55placeHolder = '<http://www.archiviodistato.prato.it/relation_' + cleanlabel.replace(" ","") + '>'
                                        line = triple(E13placeHolder, cidocCoords.prefix + 'P42_assigned', E55placeHolder) + closeLine
                                        output.write(line)
                                        line = triple(E55placeHolder,
                                                    rdfsCoords.prefix + 'label',
                                                    '\"' + cleanlabel + '\"') + closeLine
                                        output.write(line)
                                else:
                                    cleanlabel = row['nome relazione'].rstrip().lstrip()
                                    E55placeHolder = '<http://www.archiviodistato.prato.it/relation_' + cleanlabel.replace(' ', '') + '>'
                                    line = triple(E13placeHolder, cidocCoords.prefix + 'P42_assigned', E55placeHolder) + closeLine
                                    output.write(line)
                                    line = triple(E55placeHolder,
                                                rdfsCoords.prefix + 'label',
                                                '\"' + cleanlabel + '\"') + closeLine
                                    output.write(line)

                else:
                        relazione = row['recordID relazione']
                        id = relazione
                        E13placeHolder = '<http://www.archiviodistato.prato.it/accedi-e-consulta/aspoMV001/scheda/' + relazione.replace(' ', '_') + '_R_' + row['recordId'] + ">"
                        line = triple(E13placeHolder, 
                        nsCoords.prefix + 'type', 
                        cidocCoords.prefix + 'E13_Attribute_Assignment') + closeLine
                        output.write(line)
                        line = triple(E13placeHolder, cidocCoords.prefix + 'P141_assigned', aspoPlaceHolder) + closeLine
                        output.write(line)
                        line = triple(E13placeHolder,
                                            rdfsCoords.prefix + 'label',
                                            '\"Relazione: di ' + relazione + ' ' + ' con ' + row['recordId'] + '\"') + closeLine
                        output.write(line)
                        if re.match(r'IT-ASPO', id):
                            relazioneid = '<http://www.archiviodistato.prato.it/accedi-e-consulta/aspoMV001/scheda/' + relazione + ">"
                            #line = triple(aspoPlaceHolder, schemaCoords.prefix + 'relatedTo', relazioneid) + closeLine
                            #output.write(line)
                            line = triple(relazioneid, cidocCoords.prefix + 'P141_assigned', E13placeHolder) + closeLine
                            output.write(line)
                        else:
                            relazionenoid = '<http://www.archiviodistato.prato.it/accedi-e-consulta/aspoMV001/scheda/' + relazione.replace(' ', '_').lower()+ ">"
                            #line = triple(aspoPlaceHolder, schemaCoords.prefix + 'relatedTo', relazionenoid) + closeLine
                            #output.write(line)
                            line = triple(relazionenoid, cidocCoords.prefix + 'P141_assigned', E13placeHolder ) + closeLine
                            output.write(line)
                            cleanlabel = relazione.rstrip()
                            line = triple(relazionenoid,
                                            rdfsCoords.prefix + 'label',
                                            '\"' + cleanlabel + '\"') + closeLine
                            output.write(line)
                            line = triple(relazionenoid, 
                                nsCoords.prefix + 'type', 
                                cidocCoords.prefix + 'E21_Person') + closeLine
                            output.write(line)

                            line = triple(relazionenoid, 
                                        nsCoords.prefix + 'type', 
                                        personCoords.prefix + 'Person') + closeLine
                            output.write(line)

                            line = triple(relazionenoid,
                                        nsCoords.prefix + 'type',
                                        foafCoords.prefix + 'person') + closeLine
                            output.write(line)
                        if (row['nome relazione'] != ''):      
                                relazioni = []
                                pipe = "|" 
                                if pipe in row['nome relazione']:
                                    relazioni = row['nome relazione'].split('|') 
                                    for relazione in relazioni:
                                        #Remove all white-space characters:
                                        txt = relazione
                                        x = re.sub("\n", " ", txt)
                                        y = re.sub("\s\s", "", x)
                                        rel = re.sub(r'[^A-Za-z]','', y)
                                        cleanlabel = rel.rstrip().lstrip()
                                        E55placeHolder = '<http://www.archiviodistato.prato.it/relation_' + cleanlabel.replace(" ","") + '>'
                                        line = triple(E13placeHolder, cidocCoords.prefix + 'P42_assigned', E55placeHolder) + closeLine
                                        output.write(line)
                                        line = triple(E55placeHolder,
                                                    rdfsCoords.prefix + 'label',
                                                    '\"' + cleanlabel + '\"') + closeLine
                                        output.write(line)
                                else:
                                    cleanlabel = row['nome relazione'].rstrip().lstrip()
                                    E55placeHolder = '<http://www.archiviodistato.prato.it/relation_' + cleanlabel.replace(' ', '') + '>'
                                    line = triple(E13placeHolder, cidocCoords.prefix + 'P42_assigned', E55placeHolder) + closeLine
                                    output.write(line)
                                    line = triple(E55placeHolder,
                                                rdfsCoords.prefix + 'label',
                                                '\"' + cleanlabel + '\"') + closeLine
                                    output.write(line)

            if (row['recordID relazione2'] != ''):
                id = row['recordID relazione2']
                E13placeHolder = '<http://www.archiviodistato.prato.it/accedi-e-consulta/aspoMV001/scheda/' + row['recordID relazione2'].replace(' ', '_') + '_R_' + row['recordId'] + ">"
                line = triple(E13placeHolder, 
                nsCoords.prefix + 'type', 
                cidocCoords.prefix + 'E13_Attribute_Assignment') + closeLine
                output.write(line)
                line = triple(E13placeHolder, cidocCoords.prefix + 'P141_assigned', aspoPlaceHolder) + closeLine
                output.write(line)
                line = triple(E13placeHolder, rdfsCoords.prefix + 'label', '\"Relazione: ' + row['recordID relazione2']  + ' ' + row['nome relazione2'] + ' di ' + row['recordId'] + '\"') + closeLine
                output.write(line)
                if re.match(r'IT-ASPO', id):
                    relazioneid = '<http://www.archiviodistato.prato.it/accedi-e-consulta/aspoMV001/scheda/' + row['recordID relazione2']+ ">"
                    #line = triple(aspoPlaceHolder, schemaCoords.prefix + 'relatedTo', relazioneid) + closeLine
                    #output.write(line)
                    line = triple(relazioneid, cidocCoords.prefix + 'P141_assigned', E13placeHolder ) + closeLine
                    output.write(line)
                else:
                    relazionenoid = '<http://www.archiviodistato.prato.it/accedi-e-consulta/aspoMV001/scheda/' + row['recordID relazione2'].replace(' ', '_').lower()+ ">"
                    #line = triple(aspoPlaceHolder,schemaCoords.prefix + 'relatedTo', relazionenoid) + closeLine
                    #output.write(line)
                    line = triple(relazionenoid, cidocCoords.prefix + 'P141_assigned', E13placeHolder ) + closeLine
                    output.write(line)
                    line = triple(relazionenoid,
                                    rdfsCoords.prefix + 'label',
                                    '\"' + row['recordID relazione2'] + '\"') + closeLine
                    output.write(line)
                    line = triple(relazionenoid, 
                          nsCoords.prefix + 'type', 
                          cidocCoords.prefix + 'E21_Person') + closeLine
                    output.write(line)

                    line = triple(relazionenoid, 
                                nsCoords.prefix + 'type', 
                                personCoords.prefix + 'Person') + closeLine
                    output.write(line)

                    line = triple(relazionenoid,
                                nsCoords.prefix + 'type',
                                foafCoords.prefix + 'person') + closeLine
                    output.write(line)
                if (row['nome relazione2'] != ''):
                        tipologie = []
                        pipe = "|" 
                        if pipe in row['nome relazione2']:
                            relazioni = row['nome relazione2'].split('|') 
                            for relazione in relazioni:
                                #Remove all white-space characters:
                                txt = relazione
                                x = re.sub("\n", " ", txt)
                                y = re.sub("\s\s", "", x)
                                rel = re.sub(r'[^A-Za-z]','', y)
                                cleanlabel = rel.rstrip().lstrip()
                                E55placeHolder = '<http://www.archiviodistato.prato.it/relation_' + cleanlabel.replace(" ","") + '>'
                                line = triple(E13placeHolder, cidocCoords.prefix + 'P42_assigned', E55placeHolder) + closeLine
                                output.write(line)
                                line = triple(E55placeHolder,
                                            rdfsCoords.prefix + 'label',
                                            '\"' + cleanlabel + '\"') + closeLine
                                output.write(line)
                        else:
                            cleanlabel = row['nome relazione2'].rstrip().lstrip()
                            E55placeHolder = '<http://www.archiviodistato.prato.it/relation_' + cleanlabel.replace(' ', '') + '>'
                            line = triple(E13placeHolder, cidocCoords.prefix + 'P42_assigned', E55placeHolder) + closeLine
                            output.write(line)
                            line = triple(E55placeHolder,
                                        rdfsCoords.prefix + 'label',
                                        '\"' + cleanlabel + '\"') + closeLine
                            output.write(line)
            
            if row['Riferimenti di attribuzione'] != '':
               #Remove all white-space characters:
                txt = row['Riferimenti di attribuzione']
                x = re.sub(" \n", "", txt)
                y = re.sub("\s\s", "", x)
                note = re.sub("\"", "", x)
                e62placeHolder = '<http://www.archiviodistato.prato.it/accedi-e-consulta/aspoMV001/scheda/' + row['recordId'] + "/E62" + ">" 
                line = triple(aspoPlaceHolder,  cidocCoords.prefix + 'P3_has_note', e62placeHolder) + closeLine
                output.write(line)
                line = triple(e62placeHolder, rdfsCoords.prefix + 'label', '\"' + note.replace('\\','\\\\').replace('"','\\"')+ '\"') + closeLine
                output.write(line)
                line = triple(e62placeHolder, nsCoords.prefix + 'type', cidocCoords.prefix + 'E62_String') + closeLine
                output.write(line)
                e55placeHolder = '<http://www.archiviodistato.prato.it/accedi-e-consulta/aspoMV001/scheda/' + row['recordId'] + "/E62_E55" + ">" 
                line = triple(e62placeHolder, cidocCoords.prefix + 'P2_has_type', e55placeHolder) + closeLine
                output.write(line)
                line = triple(e55placeHolder, rdfsCoords.prefix + 'label', '\"Riferimenti di attribuzione\"') + closeLine
                output.write(line)
            
            output.write('\n')
        #
        # Limit number of entries processed (if desired)
        if (ii > max_entries):
            break