Leonardo Canova 2 лет назад
Родитель
Сommit
d85b109eed

+ 1 - 1
flask_be/engine/test/simple_query_test_pandas.py

@@ -284,7 +284,7 @@ def ricercalemmiforme (entries, path, espansa, raddoppiata):
 #%% 
 entry = "proferire*"
 print ("Ricerca di: " + entry)
-df=ricercalemmiforme(interpreter(entry), "../", 0, 0)
+df=ricercalemmiforme(interpreter(entry), "/Users/leonardocanova/Library/CloudStorage/OneDrive-ConsiglioNazionaledelleRicerche/TIGRO/Ricerche/flask_be", 0, 0)
 print (counter(df))
 dtale.show(df)
 # %%

+ 16 - 16
flask_be/engine/test/test_cooccorrenze.py

@@ -39,19 +39,19 @@ def ricerca_cooccorrenze (listaricerche, intervallo, periodo, ordinate, path):
                 for index1, row1 in listatesti.iterrows():
                     for index2, row2 in textlist.iterrows():
                         if ordinate == 0:
-                            if row1['ntx'] == row2['ntx'] and (row1['mappa'] - row2['mappa']) in range(-intervallo,intervallo):
+                            if row1['ntx'] == row2['ntx'] and ((row1['mappa'] - row2['mappa']) != 0) and ((row1['mappa'] - row2['mappa']) in range(-intervallo,intervallo)):
                                 df_new = pd.concat([df_new, row1.to_frame().T])
                         elif ordinate == 1:
-                            if row1['ntx'] == row2['ntx'] and (row1['mappa'] - row2['mappa']) in range(intervallo):
+                            if row1['ntx'] == row2['ntx'] and ((row2['mappa'] - row1['mappa']) > 0) and ((row2['mappa'] - row1['mappa']) <= intervallo):
                                 df_new = pd.concat([df_new, row1.to_frame().T])
             elif periodo == 1: 
                 for index1, row1 in listatesti.iterrows():
                     for index2, row2 in textlist.iterrows():
                         if ordinate == 0:
-                            if row1['ntx'] == row2['ntx'] and row1['numperiod'] == row2['numperiod'] and (row1['mappa'] - row2['mappa']) in range(-intervallo,intervallo):
+                            if row1['ntx'] == row2['ntx'] and row1['numperiod'] == row2['numperiod'] and ((row1['mappa'] - row2['mappa']) != 0) and ((row1['mappa'] - row2['mappa']) in range(-intervallo,intervallo)):
                                 df_new = pd.concat([df_new, row1.to_frame().T])
                         elif ordinate == 1:
-                            if row1['ntx'] == row2['ntx'] and row1['numperiod'] == row2['numperiod'] and (row1['mappa'] - row2['mappa']) in range(intervallo):
+                            if row1['ntx'] == row2['ntx'] and row1['numperiod'] == row2['numperiod'] and ((row2['mappa'] - row1['mappa']) > 0) and ((row2['mappa'] - row1['mappa']) <= intervallo):
                                 df_new = pd.concat([df_new, row1.to_frame().T])
             listatesti = df_new
         elif tipo == "1":
@@ -62,19 +62,19 @@ def ricerca_cooccorrenze (listaricerche, intervallo, periodo, ordinate, path):
                 for index1, row1 in listatesti.iterrows():
                     for index2, row2 in textlist.iterrows():
                         if ordinate == 0:
-                            if row1['ntx'] == row2['ntx'] and (row1['mappa'] - row2['mappa']) in range(-intervallo,intervallo):
+                            if row1['ntx'] == row2['ntx'] and ((row1['mappa'] - row2['mappa']) != 0) and ((row1['mappa'] - row2['mappa']) in range(-intervallo,intervallo)):
                                 df_new = pd.concat([df_new, row1.to_frame().T])
                         if ordinate == 1:
-                            if row1['ntx'] == row2['ntx'] and (row1['mappa'] - row2['mappa']) in range(intervallo):
+                            if row1['ntx'] == row2['ntx'] and ((row2['mappa'] - row1['mappa']) > 0) and ((row2['mappa'] - row1['mappa']) <= intervallo):
                                 df_new = pd.concat([df_new, row1.to_frame().T])
             elif periodo == 1: 
                 for index1, row1 in listatesti.iterrows():
                     for index2, row2 in textlist.iterrows():
                         if ordinate == 0:
-                            if row1['ntx'] == row2['ntx'] and row1['numperiod'] == row2['numperiod'] and (row1['mappa'] - row2['mappa']) in range(-intervallo,intervallo):
+                            if row1['ntx'] == row2['ntx'] and row1['numperiod'] == row2['numperiod'] and ((row1['mappa'] - row2['mappa']) != 0) and ((row1['mappa'] - row2['mappa']) in range(-intervallo,intervallo)):
                                 df_new = pd.concat([df_new, row1.to_frame().T])
                         if ordinate == 1:
-                            if row1['ntx'] == row2['ntx'] and row1['numperiod'] == row2['numperiod'] and (row1['mappa'] - row2['mappa']) in range(intervallo):
+                            if row1['ntx'] == row2['ntx'] and row1['numperiod'] == row2['numperiod'] and ((row2['mappa'] - row1['mappa']) > 0) and ((row2['mappa'] - row1['mappa']) <= intervallo):
                                 df_new = pd.concat([df_new, row1.to_frame().T])
             listatesti = df_new
         elif tipo == "2":
@@ -85,30 +85,30 @@ def ricerca_cooccorrenze (listaricerche, intervallo, periodo, ordinate, path):
                 for index1, row1 in listatesti.iterrows():
                     for index2, row2 in textlist.iterrows():
                         if ordinate == 0:
-                            if row1['ntx'] == row2['ntx'] and (row1['mappa'] - row2['mappa']) in range(-intervallo,intervallo):
+                            if row1['ntx'] == row2['ntx'] and ((row1['mappa'] - row2['mappa']) != 0) and ((row1['mappa'] - row2['mappa']) in range(-intervallo,intervallo)):
                                 df_new = pd.concat([df_new, row1.to_frame().T])
                         if ordinate == 1:
-                            if row1['ntx'] == row2['ntx'] and (row1['mappa'] - row2['mappa']) in range(intervallo):
+                            if row1['ntx'] == row2['ntx'] and ((row2['mappa'] - row1['mappa']) > 0) and ((row2['mappa'] - row1['mappa']) <= intervallo):
                                 df_new = pd.concat([df_new, row1.to_frame().T])
             elif periodo == 1: 
                 for index1, row1 in listatesti.iterrows():
                     for index2, row2 in textlist.iterrows():
                         if ordinate == 0:
-                            if row1['ntx'] == row2['ntx'] and row1['numperiod'] == row2['numperiod'] and (row1['mappa'] - row2['mappa']) in range(-intervallo,intervallo):
+                            if row1['ntx'] == row2['ntx'] and row1['numperiod'] == row2['numperiod'] and ((row1['mappa'] - row2['mappa']) != 0) and ((row1['mappa'] - row2['mappa']) in range(-intervallo,intervallo)):
                                 df_new = pd.concat([df_new, row1.to_frame().T])
                         if ordinate == 1:
-                            if row1['ntx'] == row2['ntx'] and row1['numperiod'] == row2['numperiod'] and (row1['mappa'] - row2['mappa']) in range(intervallo):
+                            if row1['ntx'] == row2['ntx'] and row1['numperiod'] == row2['numperiod'] and ((row2['mappa'] - row1['mappa']) > 0) and ((row2['mappa'] - row1['mappa']) <= intervallo):
                                 df_new = pd.concat([df_new, row1.to_frame().T])
             listatesti = df_new
     contexts = findcontexts(listatesti, 30, 0, listOcc, path)
     bibliocontexts = findbib(contexts, path)
-    clean = bibliocontexts.drop_duplicates()         
+    clean = bibliocontexts.drop_duplicates(subset="contesto")         
     return clean
 
 
 # %%
-ricerca = [["mezzo", "2", 1, 0], ["gent*", "0", 0, 0]]
-cooccorrenze = ricerca_cooccorrenze(ricerca, 10, 1, 1, "../")
+ricerca = [["dovere", "1", 0, 0], ["avere", "1", 0, 0]]
+cooccorrenze = ricerca_cooccorrenze(ricerca, 1, 1, 1, "/Users/leonardocanova/Library/CloudStorage/OneDrive-ConsiglioNazionaledelleRicerche/TIGRO/Ricerche/flask_be/")
 dtale.show(cooccorrenze)
-# %%
 
+# %%

+ 5 - 5
flask_be/engine/test/test_occorrenzario_pandas.py

@@ -66,7 +66,7 @@ def findbib(contexts, path):
     infobib = pd.DataFrame()
     rif_org = pd.DataFrame()
     for ind, row in contexts.iterrows():
-        con = sqlite3.connect(f"file:{path}db/bibliografia/BiblioTLIO.db?mode=ro", uri=True)
+        con = sqlite3.connect(f"file:{path}/db/bibliografia/BiblioTLIO.db?mode=ro", uri=True)
         Query = f"SELECT [Anno iniziale], [Titolo Abbreviato], IQ FROM datibib WHERE Sigla='{row['sigla']}'"
         bib = pd.read_sql(Query, con)
         infobib = pd.concat([infobib, bib])
@@ -97,10 +97,10 @@ parola = "divelle"
 type= 0
 numeroparole = 30
 listOcc = ["occ00001", "occ00002", "occ00003"]
-search=ricercaforme(interpreter(parola), "../", 0, 0)
-textlist=findtexts(type, search, listOcc, "../")
-contexts = findcontexts(textlist, numeroparole, 0, listOcc, "../")
-bibliocontexts = findbib(contexts,"../")
+search=ricercaforme(interpreter(parola), "/Users/leonardocanova/Library/CloudStorage/OneDrive-ConsiglioNazionaledelleRicerche/TIGRO/Ricerche/flask_be", 0, 0)
+textlist=findtexts(type, search, listOcc, "/Users/leonardocanova/Library/CloudStorage/OneDrive-ConsiglioNazionaledelleRicerche/TIGRO/Ricerche/flask_be")
+contexts = findcontexts(textlist, numeroparole, 0, listOcc, "/Users/leonardocanova/Library/CloudStorage/OneDrive-ConsiglioNazionaledelleRicerche/TIGRO/Ricerche/flask_be")
+bibliocontexts = findbib(contexts,"/Users/leonardocanova/Library/CloudStorage/OneDrive-ConsiglioNazionaledelleRicerche/TIGRO/Ricerche/flask_be")
 dtale.show(bibliocontexts)
 # %%