results_output_JSON.py 4.2 KB

123456789101112131415161718192021222324252627282930313233343536373839404142434445464748495051525354555657585960616263646566676869707172737475767778798081828384858687888990919293949596979899100101
  1. # Notebook Jupyter per la produzione semi-automatica dei test
  2. # definire le ricerche da effettuare e il nome del file dove visualizzare i risultati
  3. # %%
  4. # Test code using Jupyter -- produce a JSON of queries and results
  5. # %%
  6. from simple_query_test_pandas import ricercaforme
  7. from simple_query_test_pandas import ricercalemmi
  8. from simple_query_test_pandas import ricercaformelemmi
  9. from simple_query_test_pandas import interpreter
  10. import json
  11. import os
  12. # Definisco la funzione per convertire il DataFrame in formato JSON
  13. def df_to_json_records(df):
  14. return df.to_dict(orient='records')
  15. # Definisco la funzione per scrivere i risultati in un file JSON
  16. def write_to_json_results(data, filename):
  17. with open(filename, 'w') as f:
  18. json.dump(data, f, indent=4) # aggiungi indentazione di 4 spazi
  19. # Definisco la funzione per scrivere le ricerche in un file JSON
  20. def write_to_json_searches(data, filename):
  21. with open(filename, 'w') as f:
  22. json.dump(data, f, indent=4) # aggiungi indentazione di 4 spazi
  23. # Definisco la funzione per leggere i risultati da un file JSON
  24. def read_from_json(filename):
  25. if not os.path.isfile(filename):
  26. return []
  27. with open(filename, 'r') as f:
  28. content = f.read()
  29. if content:
  30. return json.loads(content)
  31. else:
  32. return []
  33. # Creo una lista vuota per i risultati
  34. all_results = []
  35. # Creo una lista vuota per le ricerche
  36. all_searches = []
  37. # Definisco gli esempi di ricerca da fare
  38. path_db_0 = "../../db/first_db"
  39. search_entries = [
  40. {"tipo_ricerca": "forme e lemmi", "parola_cercata": "pro*", "path_db": path_db_0, "ricerca_espansa": 1, "iniziali_raddoppiate": 0},
  41. {"tipo_ricerca": "forme", "parola_cercata": "prov*", "path_db": path_db_0, "ricerca_espansa": 1, "iniziali_raddoppiate": 0},
  42. {"tipo_ricerca": "lemmi", "parola_cercata": "prova", "path_db": path_db_0, "ricerca_espansa": 1, "iniziali_raddoppiate": 0}
  43. ]
  44. # Definisco il nome del file per i risultati
  45. filename_results = 'results.json'
  46. # Definisco il nome del file per le ricerche
  47. filename_searches = 'searches.json'
  48. # Eseguo le ricerche
  49. for entry_info in search_entries:
  50. print ("Ricerca di: " + entry_info["parola_cercata"])
  51. # Definisco il tipo di ricerca, la parola cercata e le altre informazioni richieste
  52. tipo_ricerca = entry_info["tipo_ricerca"]
  53. parola_cercata = entry_info["parola_cercata"]
  54. path_db = entry_info["path_db"]
  55. ricerca_espansa = entry_info["ricerca_espansa"]
  56. iniziali_raddoppiate = entry_info["iniziali_raddoppiate"]
  57. search_info = {"tipo_ricerca": tipo_ricerca, "parola_cercata": parola_cercata, "ricerca_espansa": ricerca_espansa, "iniziali_raddoppiate": iniziali_raddoppiate}
  58. # Eseguo la ricerca
  59. if tipo_ricerca == "forme e lemmi":
  60. df = ricercaformelemmi(interpreter(parola_cercata), path_db, ricerca_espansa, iniziali_raddoppiate)
  61. elif tipo_ricerca == "forme":
  62. df = ricercaforme(interpreter(parola_cercata), path_db, ricerca_espansa, iniziali_raddoppiate)
  63. else:
  64. df = ricercalemmi(interpreter(parola_cercata), path_db, ricerca_espansa, iniziali_raddoppiate)
  65. results = df_to_json_records(df)
  66. # Salvo i risultati nella lista di tutti i risultati
  67. for r in results:
  68. r.update(search_info)
  69. all_results.extend(results)
  70. all_searches.append(search_info)
  71. # Leggo i risultati precedenti dal file JSON
  72. path = "test_data/"
  73. previous_results = read_from_json(os.path.join(path, filename_results))
  74. # Aggiungo i nuovi risultati alla lista dei risultati precedenti
  75. previous_results.extend(all_results)
  76. # Scrivo tutti i risultati della ricerca nel file JSON
  77. if all(isinstance(item, dict) for item in previous_results):
  78. write_to_json_results(previous_results, os.path.join(path, filename_results))
  79. print("Risultati della ricerca salvati nel file JSON "+ filename_results)
  80. else:
  81. print("La lista non è una lista di dizionari e non può essere convertita in JSON")
  82. # Scrivo tutte le ricerche eseguite nel file JSON
  83. if all(isinstance(item, dict) for item in all_searches):
  84. write_to_json_searches(all_searches, os.path.join(path, filename_searches))
  85. print("Ricerche salvate nel file JSON " + filename_searches)
  86. else:
  87. print("La lista non è una lista di dizionari e non può essere convertita in JSON")
  88. # %%