|
@@ -9,7 +9,7 @@
|
|
},
|
|
},
|
|
{
|
|
{
|
|
"cell_type": "code",
|
|
"cell_type": "code",
|
|
- "execution_count": 1,
|
|
+ "execution_count": 27,
|
|
"metadata": {},
|
|
"metadata": {},
|
|
"outputs": [],
|
|
"outputs": [],
|
|
"source": [
|
|
"source": [
|
|
@@ -50,7 +50,7 @@
|
|
},
|
|
},
|
|
{
|
|
{
|
|
"cell_type": "code",
|
|
"cell_type": "code",
|
|
- "execution_count": 2,
|
|
+ "execution_count": 28,
|
|
"metadata": {},
|
|
"metadata": {},
|
|
"outputs": [],
|
|
"outputs": [],
|
|
"source": [
|
|
"source": [
|
|
@@ -77,7 +77,7 @@
|
|
},
|
|
},
|
|
{
|
|
{
|
|
"cell_type": "code",
|
|
"cell_type": "code",
|
|
- "execution_count": 3,
|
|
+ "execution_count": 29,
|
|
"metadata": {},
|
|
"metadata": {},
|
|
"outputs": [],
|
|
"outputs": [],
|
|
"source": [
|
|
"source": [
|
|
@@ -118,7 +118,7 @@
|
|
},
|
|
},
|
|
{
|
|
{
|
|
"cell_type": "code",
|
|
"cell_type": "code",
|
|
- "execution_count": 4,
|
|
+ "execution_count": 30,
|
|
"metadata": {},
|
|
"metadata": {},
|
|
"outputs": [],
|
|
"outputs": [],
|
|
"source": [
|
|
"source": [
|
|
@@ -135,14 +135,14 @@
|
|
},
|
|
},
|
|
{
|
|
{
|
|
"cell_type": "code",
|
|
"cell_type": "code",
|
|
- "execution_count": 5,
|
|
+ "execution_count": 31,
|
|
"metadata": {},
|
|
"metadata": {},
|
|
"outputs": [
|
|
"outputs": [
|
|
{
|
|
{
|
|
"name": "stdout",
|
|
"name": "stdout",
|
|
"output_type": "stream",
|
|
"output_type": "stream",
|
|
"text": [
|
|
"text": [
|
|
- "1.2158260345458984\n"
|
|
+ "1.2808301448822021\n"
|
|
]
|
|
]
|
|
}
|
|
}
|
|
],
|
|
],
|
|
@@ -166,14 +166,14 @@
|
|
},
|
|
},
|
|
{
|
|
{
|
|
"cell_type": "code",
|
|
"cell_type": "code",
|
|
- "execution_count": 6,
|
|
+ "execution_count": 32,
|
|
"metadata": {},
|
|
"metadata": {},
|
|
"outputs": [
|
|
"outputs": [
|
|
{
|
|
{
|
|
"name": "stdout",
|
|
"name": "stdout",
|
|
"output_type": "stream",
|
|
"output_type": "stream",
|
|
"text": [
|
|
"text": [
|
|
- "{'otherlevel', 'fonds', 'series', 'collection', 'subfonds', 'file', 'subgrp', 'recordgrp', 'subseries'}\n"
|
|
+ "{'subfonds', 'recordgrp', 'subgrp', 'otherlevel', 'collection', 'fonds', 'subseries', 'file', 'series'}\n"
|
|
]
|
|
]
|
|
}
|
|
}
|
|
],
|
|
],
|
|
@@ -193,24 +193,24 @@
|
|
},
|
|
},
|
|
{
|
|
{
|
|
"cell_type": "code",
|
|
"cell_type": "code",
|
|
- "execution_count": 7,
|
|
+ "execution_count": 33,
|
|
"metadata": {},
|
|
"metadata": {},
|
|
"outputs": [
|
|
"outputs": [
|
|
{
|
|
{
|
|
"name": "stdout",
|
|
"name": "stdout",
|
|
"output_type": "stream",
|
|
"output_type": "stream",
|
|
"text": [
|
|
"text": [
|
|
- "# di tag \"c\", livello otherlevel, primo passaggio: 321\n",
|
|
|
|
- "# di tag \"c\", livello fonds, primo passaggio: 1\n",
|
|
|
|
- "# di tag \"c\", livello series, primo passaggio: 254\n",
|
|
|
|
- "# di tag \"c\", livello collection, primo passaggio: 1\n",
|
|
|
|
"# di tag \"c\", livello subfonds, primo passaggio: 3\n",
|
|
"# di tag \"c\", livello subfonds, primo passaggio: 3\n",
|
|
- "# di tag \"c\", livello file, primo passaggio: 7199\n",
|
|
|
|
- "# di tag \"c\", livello subgrp, primo passaggio: 10\n",
|
|
|
|
"# di tag \"c\", livello recordgrp, primo passaggio: 7\n",
|
|
"# di tag \"c\", livello recordgrp, primo passaggio: 7\n",
|
|
|
|
+ "# di tag \"c\", livello subgrp, primo passaggio: 10\n",
|
|
|
|
+ "# di tag \"c\", livello otherlevel, primo passaggio: 321\n",
|
|
|
|
+ "# di tag \"c\", livello collection, primo passaggio: 1\n",
|
|
|
|
+ "# di tag \"c\", livello fonds, primo passaggio: 1\n",
|
|
"# di tag \"c\", livello subseries, primo passaggio: 151\n",
|
|
"# di tag \"c\", livello subseries, primo passaggio: 151\n",
|
|
|
|
+ "# di tag \"c\", livello file, primo passaggio: 7199\n",
|
|
|
|
+ "# di tag \"c\", livello series, primo passaggio: 254\n",
|
|
"\n",
|
|
"\n",
|
|
- "Tempo trascorso: 0.6825399398803711\n"
|
|
+ "Tempo trascorso: 0.8034629821777344\n"
|
|
]
|
|
]
|
|
}
|
|
}
|
|
],
|
|
],
|
|
@@ -244,33 +244,33 @@
|
|
},
|
|
},
|
|
{
|
|
{
|
|
"cell_type": "code",
|
|
"cell_type": "code",
|
|
- "execution_count": 8,
|
|
+ "execution_count": 34,
|
|
"metadata": {},
|
|
"metadata": {},
|
|
"outputs": [
|
|
"outputs": [
|
|
{
|
|
{
|
|
"name": "stdout",
|
|
"name": "stdout",
|
|
"output_type": "stream",
|
|
"output_type": "stream",
|
|
"text": [
|
|
"text": [
|
|
- "# di tag \"c\", livello otherlevel, primo passaggio: 321\n",
|
|
|
|
- "# di tag \"c\", livello otherlevel, totali: 321\n",
|
|
|
|
- "# di tag \"c\", livello fonds, primo passaggio: 1\n",
|
|
|
|
- "# di tag \"c\", livello fonds, totali: 11\n",
|
|
|
|
- "# di tag \"c\", livello series, primo passaggio: 254\n",
|
|
|
|
- "# di tag \"c\", livello series, totali: 254\n",
|
|
|
|
- "# di tag \"c\", livello collection, primo passaggio: 1\n",
|
|
|
|
- "# di tag \"c\", livello collection, totali: 1\n",
|
|
|
|
"# di tag \"c\", livello subfonds, primo passaggio: 3\n",
|
|
"# di tag \"c\", livello subfonds, primo passaggio: 3\n",
|
|
"# di tag \"c\", livello subfonds, totali: 3\n",
|
|
"# di tag \"c\", livello subfonds, totali: 3\n",
|
|
- "# di tag \"c\", livello file, primo passaggio: 7199\n",
|
|
|
|
- "# di tag \"c\", livello file, totali: 7199\n",
|
|
|
|
- "# di tag \"c\", livello subgrp, primo passaggio: 10\n",
|
|
|
|
- "# di tag \"c\", livello subgrp, totali: 10\n",
|
|
|
|
"# di tag \"c\", livello recordgrp, primo passaggio: 7\n",
|
|
"# di tag \"c\", livello recordgrp, primo passaggio: 7\n",
|
|
"# di tag \"c\", livello recordgrp, totali: 7\n",
|
|
"# di tag \"c\", livello recordgrp, totali: 7\n",
|
|
|
|
+ "# di tag \"c\", livello subgrp, primo passaggio: 10\n",
|
|
|
|
+ "# di tag \"c\", livello subgrp, totali: 10\n",
|
|
|
|
+ "# di tag \"c\", livello otherlevel, primo passaggio: 321\n",
|
|
|
|
+ "# di tag \"c\", livello otherlevel, totali: 321\n",
|
|
|
|
+ "# di tag \"c\", livello collection, primo passaggio: 1\n",
|
|
|
|
+ "# di tag \"c\", livello collection, totali: 1\n",
|
|
|
|
+ "# di tag \"c\", livello fonds, primo passaggio: 1\n",
|
|
|
|
+ "# di tag \"c\", livello fonds, totali: 11\n",
|
|
"# di tag \"c\", livello subseries, primo passaggio: 151\n",
|
|
"# di tag \"c\", livello subseries, primo passaggio: 151\n",
|
|
"# di tag \"c\", livello subseries, totali: 163\n",
|
|
"# di tag \"c\", livello subseries, totali: 163\n",
|
|
|
|
+ "# di tag \"c\", livello file, primo passaggio: 7199\n",
|
|
|
|
+ "# di tag \"c\", livello file, totali: 7199\n",
|
|
|
|
+ "# di tag \"c\", livello series, primo passaggio: 254\n",
|
|
|
|
+ "# di tag \"c\", livello series, totali: 254\n",
|
|
"\n",
|
|
"\n",
|
|
- "Tempo trascorso: 1.0391268730163574\n"
|
|
+ "Tempo trascorso: 1.3189809322357178\n"
|
|
]
|
|
]
|
|
}
|
|
}
|
|
],
|
|
],
|
|
@@ -314,7 +314,7 @@
|
|
},
|
|
},
|
|
{
|
|
{
|
|
"cell_type": "code",
|
|
"cell_type": "code",
|
|
- "execution_count": 9,
|
|
+ "execution_count": 35,
|
|
"metadata": {
|
|
"metadata": {
|
|
"tags": []
|
|
"tags": []
|
|
},
|
|
},
|
|
@@ -436,7 +436,7 @@
|
|
},
|
|
},
|
|
{
|
|
{
|
|
"cell_type": "code",
|
|
"cell_type": "code",
|
|
- "execution_count": 10,
|
|
+ "execution_count": 36,
|
|
"metadata": {},
|
|
"metadata": {},
|
|
"outputs": [],
|
|
"outputs": [],
|
|
"source": [
|
|
"source": [
|
|
@@ -709,7 +709,7 @@
|
|
},
|
|
},
|
|
{
|
|
{
|
|
"cell_type": "code",
|
|
"cell_type": "code",
|
|
- "execution_count": 11,
|
|
+ "execution_count": 37,
|
|
"metadata": {
|
|
"metadata": {
|
|
"tags": []
|
|
"tags": []
|
|
},
|
|
},
|
|
@@ -764,16 +764,30 @@
|
|
},
|
|
},
|
|
{
|
|
{
|
|
"cell_type": "code",
|
|
"cell_type": "code",
|
|
- "execution_count": null,
|
|
+ "execution_count": 44,
|
|
"metadata": {},
|
|
"metadata": {},
|
|
"outputs": [],
|
|
"outputs": [],
|
|
- "source": []
|
|
+ "source": [
|
|
|
|
+ "translatorHelper = {\"first\": [], \"all\": []}\n",
|
|
|
|
+ "\n",
|
|
|
|
+ "translatorHelper['all'].append({\"check\": {\"tag\": \"repository\"}, \"get\": {\"text\"}})"
|
|
|
|
+ ]
|
|
},
|
|
},
|
|
{
|
|
{
|
|
"cell_type": "code",
|
|
"cell_type": "code",
|
|
"execution_count": null,
|
|
"execution_count": null,
|
|
"metadata": {},
|
|
"metadata": {},
|
|
"outputs": [],
|
|
"outputs": [],
|
|
|
|
+ "source": [
|
|
|
|
+ " # tags = [ a.tag for a in node['a_par'] ].append(node['child'].tag)\n",
|
|
|
|
+ " # attributes = [ a.attrib for a in node['a_par'] ].append(node['child'].attrib)"
|
|
|
|
+ ]
|
|
|
|
+ },
|
|
|
|
+ {
|
|
|
|
+ "cell_type": "code",
|
|
|
|
+ "execution_count": 71,
|
|
|
|
+ "metadata": {},
|
|
|
|
+ "outputs": [],
|
|
"source": [
|
|
"source": [
|
|
"def traduttoreNew(elem):\n",
|
|
"def traduttoreNew(elem):\n",
|
|
" # Variabile che contiene l'output della traduzione:\n",
|
|
" # Variabile che contiene l'output della traduzione:\n",
|
|
@@ -789,12 +803,14 @@
|
|
" csvProt[key] = par_attributes[ii]['id']\n",
|
|
" csvProt[key] = par_attributes[ii]['id']\n",
|
|
"\n",
|
|
"\n",
|
|
" # Processo i nodi-child di 'elem'\n",
|
|
" # Processo i nodi-child di 'elem'\n",
|
|
- " childrenNodes = traceElems(elem['child'], isLeafOrC)\n",
|
|
+ " toProc = traceElems(elem['child'], isLeafOrC)\n",
|
|
|
|
+ "\n",
|
|
" first = True\n",
|
|
" first = True\n",
|
|
- " for node in childrenNodes:\n",
|
|
+ " for node in toProc:\n",
|
|
- " tags = [ a.tag for a in node['a_par'] ].append(node['child'].tag)\n",
|
|
+ " tags = [ a.tag for a in node['a_par'] ] + [node['child'].tag]\n",
|
|
- " attributes = [ a.attrib for a in node['a_par'] ].append(node['child'].attrib)\n",
|
|
+ " attributes = [ a.attrib for a in node['a_par'] ] + [node['child'].attrib]\n",
|
|
- " nodeContent = node['child'].text\n",
|
|
+ "\n",
|
|
|
|
+ " content = node['child'].text\n",
|
|
"\n",
|
|
"\n",
|
|
" # Da controllare solo per il primo nodo\n",
|
|
" # Da controllare solo per il primo nodo\n",
|
|
" # (informazioni a livello del nodo, uguali per tutti i figli)\n",
|
|
" # (informazioni a livello del nodo, uguali per tutti i figli)\n",
|
|
@@ -816,13 +832,13 @@
|
|
" # La 'ciccia': si processa il contenuto vero e proprio\n",
|
|
" # La 'ciccia': si processa il contenuto vero e proprio\n",
|
|
" # e4 Repository (qui dovrebbe essere sempre l'Archivio di Prato)\n",
|
|
" # e4 Repository (qui dovrebbe essere sempre l'Archivio di Prato)\n",
|
|
" if('repository' in tags):\n",
|
|
" if('repository' in tags):\n",
|
|
- " csvProt['repository'] = nodeContent \n",
|
|
+ " csvProt['repository'] = content \n",
|
|
"\n",
|
|
"\n",
|
|
" # e8 Tipologia\n",
|
|
" # e8 Tipologia\n",
|
|
" try:\n",
|
|
" try:\n",
|
|
" ii = tags.index('materialspec')\n",
|
|
" ii = tags.index('materialspec')\n",
|
|
" if(attributes[ii]['label']=='tipologia'): \n",
|
|
" if(attributes[ii]['label']=='tipologia'): \n",
|
|
- " csvProt['tipologia'] = nodeContent\n",
|
|
+ " csvProt['tipologia'] = content\n",
|
|
" except:\n",
|
|
" except:\n",
|
|
" pass\n",
|
|
" pass\n",
|
|
"\n",
|
|
"\n",
|
|
@@ -831,12 +847,12 @@
|
|
" ii = tags.index('num')\n",
|
|
" ii = tags.index('num')\n",
|
|
" type1 = attributes[ii]['type']\n",
|
|
" type1 = attributes[ii]['type']\n",
|
|
" if(type1=='nuovo ordinamento'):\n",
|
|
" if(type1=='nuovo ordinamento'):\n",
|
|
- " csvProt['segnatura_attuale'] = nodeContent\n",
|
|
+ " csvProt['segnatura_attuale'] = content\n",
|
|
" except:\n",
|
|
" except:\n",
|
|
" pass\n",
|
|
" pass\n",
|
|
- " # e9 Segnatura precedente ('odd')\n",
|
|
+ " # e9 Segnatura precedente (Odd)\n",
|
|
" if('odd' in tags):\n",
|
|
" if('odd' in tags):\n",
|
|
- " csvProt['segnatura_precedente'] = nodeContent \n",
|
|
+ " csvProt['segnatura_precedente'] = content \n",
|
|
" \n",
|
|
" \n",
|
|
" # e11 Il titolo da unittitle\n",
|
|
" # e11 Il titolo da unittitle\n",
|
|
" try:\n",
|
|
" try:\n",
|
|
@@ -847,14 +863,14 @@
|
|
" try:\n",
|
|
" try:\n",
|
|
" csvProt['titolo_aspo'] = str(node['a_par'][ii].text).replace('\\t','').replace('\\n','').strip()\n",
|
|
" csvProt['titolo_aspo'] = str(node['a_par'][ii].text).replace('\\t','').replace('\\n','').strip()\n",
|
|
" except:\n",
|
|
" except:\n",
|
|
- " csvProt['titolo_aspo'] = str(nodeContent).replace('\\t','').replace('\\n','').strip()\n",
|
|
+ " csvProt['titolo_aspo'] = str(content).replace('\\t','').replace('\\n','').strip()\n",
|
|
" except:\n",
|
|
" except:\n",
|
|
" pass\n",
|
|
" pass\n",
|
|
" \n",
|
|
" \n",
|
|
" # e12 Scope-content head & body\n",
|
|
" # e12 Scope-content head & body\n",
|
|
" if('scopecontent' in tags):\n",
|
|
" if('scopecontent' in tags):\n",
|
|
" if('p' in tags):\n",
|
|
" if('p' in tags):\n",
|
|
- " csvProt['scope-content_body'] = nodeContent\n",
|
|
+ " csvProt['scope-content_body'] = content\n",
|
|
"\n",
|
|
"\n",
|
|
" # e14 Nome della compagnia\n",
|
|
" # e14 Nome della compagnia\n",
|
|
" try:\n",
|
|
" try:\n",
|
|
@@ -862,9 +878,9 @@
|
|
" if(attributes[ii]['authfilenumber']):\n",
|
|
" if(attributes[ii]['authfilenumber']):\n",
|
|
" try:\n",
|
|
" try:\n",
|
|
" authId = attributes[ii]['authfilenumber']\n",
|
|
" authId = attributes[ii]['authfilenumber']\n",
|
|
- " csvProt['compagnia'] = '{\"nome\": ' + \"\\\"\" + nodeContent + \"\\\"\" + ', \"authID\": ' + \"\\\"\" + authId + \"\\\"\" + '}'\n",
|
|
+ " csvProt['compagnia'] = '{\"nome\": ' + \"\\\"\" + content + \"\\\"\" + ', \"authID\": ' + \"\\\"\" + authId + \"\\\"\" + '}'\n",
|
|
" except:\n",
|
|
" except:\n",
|
|
- " csvProt['compagnia'] = '{\"nome\": ' + \"\\\"\" + nodeContent + \"\\\"\" + '}'\n",
|
|
+ " csvProt['compagnia'] = '{\"nome\": ' + \"\\\"\" + content + \"\\\"\" + '}'\n",
|
|
" except:\n",
|
|
" except:\n",
|
|
" pass\n",
|
|
" pass\n",
|
|
" \n",
|
|
" \n",
|
|
@@ -875,49 +891,49 @@
|
|
" key='persona' \n",
|
|
" key='persona' \n",
|
|
" authId = attributes[ii]['authfilenumber']\n",
|
|
" authId = attributes[ii]['authfilenumber']\n",
|
|
" try: \n",
|
|
" try: \n",
|
|
- " csvProt[key] = csvProt[key] + ' | {\"nome\": ' + \"\\\"\" + nodeContent + \"\\\"\" + ', \"authID\": ' + \"\\\"\" + authId + \"\\\"\" +'}'\n",
|
|
+ " csvProt[key] = csvProt[key] + ' | {\"nome\": ' + \"\\\"\" + content + \"\\\"\" + ', \"authID\": ' + \"\\\"\" + authId + \"\\\"\" +'}'\n",
|
|
" except: \n",
|
|
" except: \n",
|
|
- " csvProt[key] = '{\"nome\": ' + \"\\\"\" + nodeContent + \"\\\"\" + ', \"authID\": ' + \"\\\"\" + authId + \"\\\"\" +'}'\n",
|
|
+ " csvProt[key] = '{\"nome\": ' + \"\\\"\" + content + \"\\\"\" + ', \"authID\": ' + \"\\\"\" + authId + \"\\\"\" +'}'\n",
|
|
" except: \n",
|
|
" except: \n",
|
|
" try:\n",
|
|
" try:\n",
|
|
- " csvProt[key] = csvProt[key] + ' | {\"nome\": ' + \"\\\"\" + nodeContent + \"\\\"\" + '}'\n",
|
|
+ " csvProt[key] = csvProt[key] + ' | {\"nome\": ' + \"\\\"\" + content + \"\\\"\" + '}'\n",
|
|
" except:\n",
|
|
" except:\n",
|
|
- " csvProt[key] = '{\"nome\": ' + \"\\\"\" + nodeContent + \"\\\"\" + '}'\n",
|
|
+ " csvProt[key] = '{\"nome\": ' + \"\\\"\" + content + \"\\\"\" + '}'\n",
|
|
"\n",
|
|
"\n",
|
|
" # e17 Date\n",
|
|
" # e17 Date\n",
|
|
" if ('unittitle' in tags):\n",
|
|
" if ('unittitle' in tags):\n",
|
|
" try:\n",
|
|
" try:\n",
|
|
" ii = tags.index('date')\n",
|
|
" ii = tags.index('date')\n",
|
|
" key = 'data'\n",
|
|
" key = 'data'\n",
|
|
- " csvProt[key] = nodeContent\n",
|
|
+ " csvProt[key] = content\n",
|
|
" except:\n",
|
|
" except:\n",
|
|
" pass\n",
|
|
" pass\n",
|
|
" \n",
|
|
" \n",
|
|
" # e18 Data 1: periodo\n",
|
|
" # e18 Data 1: periodo\n",
|
|
" if('unitdate' in tags):\n",
|
|
" if('unitdate' in tags):\n",
|
|
- " csvProt['data_periodo'] = nodeContent\n",
|
|
+ " csvProt['data_periodo'] = content\n",
|
|
" \n",
|
|
" \n",
|
|
" # e20 Supporto fisico\n",
|
|
" # e20 Supporto fisico\n",
|
|
" try:\n",
|
|
" try:\n",
|
|
" ii = tags.index('physfacet')\n",
|
|
" ii = tags.index('physfacet')\n",
|
|
" if(attributes[ii]['type']=='supporto'):\n",
|
|
" if(attributes[ii]['type']=='supporto'):\n",
|
|
- " csvProt['supporto'] = nodeContent\n",
|
|
+ " csvProt['supporto'] = content\n",
|
|
" except:\n",
|
|
" except:\n",
|
|
" pass\n",
|
|
" pass\n",
|
|
"\n",
|
|
"\n",
|
|
" # e21 Physdesc \n",
|
|
" # e21 Physdesc \n",
|
|
" if('extent' in tags):\n",
|
|
" if('extent' in tags):\n",
|
|
- " csvProt['numero'] = nodeContent\n",
|
|
+ " csvProt['numero'] = content\n",
|
|
" if('genreform' in tags):\n",
|
|
" if('genreform' in tags):\n",
|
|
- " csvProt['genere'] = nodeContent\n",
|
|
+ " csvProt['genere'] = content\n",
|
|
" \n",
|
|
" \n",
|
|
" # e21 Dimensions\n",
|
|
" # e21 Dimensions\n",
|
|
" try:\n",
|
|
" try:\n",
|
|
" ii = tags.index('dimensions')\n",
|
|
" ii = tags.index('dimensions')\n",
|
|
" try:\n",
|
|
" try:\n",
|
|
- " csvProt['dimensione_altezza_larghezza_spessore'] = csvProt['dimensione_altezza_larghezza_spessore'] + ' | ' + nodeContent\n",
|
|
+ " csvProt['dimensione_altezza_larghezza_spessore'] = csvProt['dimensione_altezza_larghezza_spessore'] + ' | ' + content\n",
|
|
" except:\n",
|
|
" except:\n",
|
|
- " csvProt['dimensione_altezza_larghezza_spessore'] = nodeContent\n",
|
|
+ " csvProt['dimensione_altezza_larghezza_spessore'] = content\n",
|
|
" except:\n",
|
|
" except:\n",
|
|
" pass\n",
|
|
" pass\n",
|
|
" \n",
|
|
" \n",
|
|
@@ -925,15 +941,15 @@
|
|
" try:\n",
|
|
" try:\n",
|
|
" ii = tags.index('phystech')\n",
|
|
" ii = tags.index('phystech')\n",
|
|
" try:\n",
|
|
" try:\n",
|
|
- " csvProt['conservazione'] = csvProt['conservazione'] + ' | ' + nodeContent\n",
|
|
+ " csvProt['conservazione'] = csvProt['conservazione'] + ' | ' + content\n",
|
|
" except:\n",
|
|
" except:\n",
|
|
- " csvProt['conservazione'] = nodeContent\n",
|
|
+ " csvProt['conservazione'] = content\n",
|
|
" except:\n",
|
|
" except:\n",
|
|
" pass\n",
|
|
" pass\n",
|
|
" \n",
|
|
" \n",
|
|
" # e24 Note\n",
|
|
" # e24 Note\n",
|
|
" if('note' in tags):\n",
|
|
" if('note' in tags):\n",
|
|
- " csvProt['nota'] = nodeContent\n",
|
|
+ " csvProt['nota'] = content\n",
|
|
" \n",
|
|
" \n",
|
|
" # e26 Oggetto digitale allegato (nome)\n",
|
|
" # e26 Oggetto digitale allegato (nome)\n",
|
|
" try:\n",
|
|
" try:\n",
|
|
@@ -1035,7 +1051,7 @@
|
|
},
|
|
},
|
|
{
|
|
{
|
|
"cell_type": "code",
|
|
"cell_type": "code",
|
|
- "execution_count": 12,
|
|
+ "execution_count": 72,
|
|
"metadata": {},
|
|
"metadata": {},
|
|
"outputs": [
|
|
"outputs": [
|
|
{
|
|
{
|
|
@@ -1073,7 +1089,7 @@
|
|
],
|
|
],
|
|
"source": [
|
|
"source": [
|
|
"test = allCs2['file'][0]\n",
|
|
"test = allCs2['file'][0]\n",
|
|
- "toShow = traduttoreItem(test)\n",
|
|
+ "toShow = traduttoreNew(test)\n",
|
|
"for key in toShow.keys():\n",
|
|
"for key in toShow.keys():\n",
|
|
" print(key + ': ' + str(toShow[key]))\n",
|
|
" print(key + ': ' + str(toShow[key]))\n",
|
|
" print()"
|
|
" print()"
|
|
@@ -1092,7 +1108,7 @@
|
|
},
|
|
},
|
|
{
|
|
{
|
|
"cell_type": "code",
|
|
"cell_type": "code",
|
|
- "execution_count": 12,
|
|
+ "execution_count": null,
|
|
"metadata": {},
|
|
"metadata": {},
|
|
"outputs": [
|
|
"outputs": [
|
|
{
|
|
{
|
|
@@ -1123,6 +1139,34 @@
|
|
"\n",
|
|
"\n",
|
|
"print('Tempo trascorso:', datetime.timestamp(datetime.now()) - ts1)"
|
|
"print('Tempo trascorso:', datetime.timestamp(datetime.now()) - ts1)"
|
|
]
|
|
]
|
|
|
|
+ },
|
|
|
|
+ {
|
|
|
|
+ "cell_type": "code",
|
|
|
|
+ "execution_count": null,
|
|
|
|
+ "metadata": {},
|
|
|
|
+ "outputs": [],
|
|
|
|
+ "source": []
|
|
|
|
+ },
|
|
|
|
+ {
|
|
|
|
+ "cell_type": "code",
|
|
|
|
+ "execution_count": null,
|
|
|
|
+ "metadata": {},
|
|
|
|
+ "outputs": [],
|
|
|
|
+ "source": []
|
|
|
|
+ },
|
|
|
|
+ {
|
|
|
|
+ "cell_type": "code",
|
|
|
|
+ "execution_count": null,
|
|
|
|
+ "metadata": {},
|
|
|
|
+ "outputs": [],
|
|
|
|
+ "source": []
|
|
|
|
+ },
|
|
|
|
+ {
|
|
|
|
+ "cell_type": "code",
|
|
|
|
+ "execution_count": null,
|
|
|
|
+ "metadata": {},
|
|
|
|
+ "outputs": [],
|
|
|
|
+ "source": []
|
|
}
|
|
}
|
|
],
|
|
],
|
|
"metadata": {
|
|
"metadata": {
|