123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778798081828384858687888990919293949596979899100101102103104105106 |
- import sqlite3
- import pandas as pd
- import dtale
- import unicodedata
- from simple_query_test_pandas import ricercaforme
- from simple_query_test_pandas import ricercalemmi
- from simple_query_test_pandas import ricercaformelemmi
- from simple_query_test_pandas import ricercalemmiforme
- from simple_query_test_pandas import inizialeraddoppiata
- from simple_query_test_pandas import interpreter
- from simple_query_test_pandas import counter
- from test_occorrenzario_pandas import findbib, findcontexts, findtexts
- import json
- import os
- def df_to_json_records(df):
- return df.to_dict(orient='records')
- def write_to_json_results(data, filename):
- with open(filename, 'w') as f:
- json.dump(data, f, indent=4)
- def write_to_json_searches(data, filename):
- with open(filename, 'w') as f:
- json.dump(data, f, indent=4)
-
- def read_from_json(filename):
- if not os.path.isfile(filename):
- return []
- with open(filename, 'r') as f:
- content = f.read()
- if content:
- return json.loads(content)
- else:
- return []
- all_results = []
- all_searches = []
- search_entries = [
- {"tipo_ricerca": "forme e lemmi", "parola_cercata": "pro*", "path_db": "/Users/federicaspinelli/TEAMOVI/Ricerche/db/first_db", "ricerca_espansa": 1, "iniziali_raddoppiate": 0},
- {"tipo_ricerca": "forme", "parola_cercata": "prov*", "path_db": "/Users/federicaspinelli/TEAMOVI/Ricerche/db/first_db", "ricerca_espansa": 1, "iniziali_raddoppiate": 0},
- {"tipo_ricerca": "lemmi", "parola_cercata": "prova", "path_db": "/Users/federicaspinelli/TEAMOVI/Ricerche/db/first_db", "ricerca_espansa": 1, "iniziali_raddoppiate": 0}
- ]
- filename_results = 'results.json'
- filename_searches = 'searches.json'
- for entry_info in search_entries:
- print ("Ricerca di: " + entry_info["parola_cercata"])
-
- tipo_ricerca = entry_info["tipo_ricerca"]
- parola_cercata = entry_info["parola_cercata"]
- path_db = entry_info["path_db"]
- ricerca_espansa = entry_info["ricerca_espansa"]
- iniziali_raddoppiate = entry_info["iniziali_raddoppiate"]
- search_info = {"tipo_ricerca": tipo_ricerca, "parola_cercata": parola_cercata, "ricerca_espansa": ricerca_espansa, "iniziali_raddoppiate": iniziali_raddoppiate}
-
- if tipo_ricerca == "forme e lemmi":
- df = ricercaformelemmi(interpreter(parola_cercata), path_db, ricerca_espansa, iniziali_raddoppiate)
- elif tipo_ricerca == "forme":
- df = ricercaforme(interpreter(parola_cercata), path_db, ricerca_espansa, iniziali_raddoppiate)
- else:
- df = ricercalemmi(interpreter(parola_cercata), path_db, ricerca_espansa, iniziali_raddoppiate)
- results = df_to_json_records(df)
-
- for r in results:
- r.update(search_info)
- all_results.extend(results)
- all_searches.append(search_info)
- path = "test_data/"
- previous_results = read_from_json(os.path.join(path, filename_results))
- previous_results.extend(all_results)
- if all(isinstance(item, dict) for item in previous_results):
- write_to_json_results(previous_results, os.path.join(path, filename_results))
- print("Risultati della ricerca salvati nel file JSON "+ filename_results)
- else:
- print("La lista non è una lista di dizionari e non può essere convertita in JSON")
-
- if all(isinstance(item, dict) for item in all_searches):
- write_to_json_searches(all_searches, os.path.join(path, filename_searches))
- print("Ricerche salvate nel file JSON " + filename_searches)
- else:
- print("La lista non è una lista di dizionari e non può essere convertita in JSON")
|