{ "cells": [ { "attachments": {}, "cell_type": "markdown", "metadata": {}, "source": [ "

Funzionamento della funzione ricerca co-occorrenze

\n", "\n", "- ricerca per forme\n", "\n", "- ricerca per lemmi (L)\n", "\n", "- ricerca per lemmi (con non lemmatizzate G)\n", "\n", "- ricerca per categoria grammaticale (C)\n", "\n", "Inoltre supporta le funzioni di:\n", "\n", "- ricerca con caratteri jolly\n", "\n", "- ricerca all'interno di un periodo (cercare soltanto all'interno dello stesso periodo (0/1))\n", "\n", "- ricerca con personalizzazione della distanza tra le parole (definire l'intervallo di ricerca in numero di parole)\n", "\n", "- ricerca co occorrenze ordinate (cercare le occorrenze in modo ordinato (0/1))" ] }, { "cell_type": "code", "execution_count": null, "metadata": {}, "outputs": [], "source": [ "import sqlite3\n", "import pandas as pd\n", "import dtale\n", "import unicodedata\n", "from simple_query_test_pandas import ricercaforme\n", "from simple_query_test_pandas import ricercalemmi\n", "from simple_query_test_pandas import ricercaformelemmi \n", "from simple_query_test_pandas import ricercalemmiforme\n", "from simple_query_test_pandas import inizialeraddoppiata\n", "from simple_query_test_pandas import interpreter\n", "from test_occorrenzario_pandas import findtexts\n", "from test_occorrenzario_pandas import findcontexts\n", "from test_occorrenzario_pandas import findbib\n", "from test_cooccorrenze import ricerca_cooccorrenze\n", "import warnings\n", "warnings.simplefilter(action='ignore', category=FutureWarning)" ] }, { "attachments": {}, "cell_type": "markdown", "metadata": {}, "source": [ "

Ricerca di cooccorrenze

" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "ricerca di: cavaliere corte" ] }, { "attachments": {}, "cell_type": "markdown", "metadata": {}, "source": [ "![](img/coocco1.png)\n", "\n", "![](img/coocco1.1.png)" ] }, { "cell_type": "code", "execution_count": null, "metadata": {}, "outputs": [], "source": [ "# (forma/lemma_cercati, tipo_ricerca, ricerca_espansa, iniziale_raddoppiata)\n", "# tipo_ricerca (0 per forme, 1 per lemmi, 2 per lemmi con opzione \"mostra occorrenze non lemmatizzate\", 3 per categoria grammaticale)\n", "ricerca = [[\"cavaliere\", \"0\", 0, 0], [\"corte\", \"0\", 0, 0]]\n", "# (lista ricerche, intervallo, periodo, ordinate)\n", "cooccorrenze = ricerca_cooccorrenze(ricerca, 10, 1, 0, \"/Users/leonardocanova/Library/CloudStorage/OneDrive-ConsiglioNazionaledelleRicerche/TIGRO/Ricerche/db/first_db\")\n", "dtale.show(cooccorrenze)" ] }, { "attachments": {}, "cell_type": "markdown", "metadata": {}, "source": [ "ricerca di: don* gent*" ] }, { "attachments": {}, "cell_type": "markdown", "metadata": {}, "source": [ "![](img/coocco2.png)\n", "\n", "![](img/coocco2.1.png)" ] }, { "cell_type": "code", "execution_count": null, "metadata": {}, "outputs": [], "source": [ "ricerca = [[\"don*\", \"0\", 0, 0], [\"gent*\", \"0\", 0, 0]]\n", "# (lista ricerche, intervallo, periodo, ordinate)\n", "cooccorrenze = ricerca_cooccorrenze(ricerca, 10, 1, 0, \"/Users/leonardocanova/Library/CloudStorage/OneDrive-ConsiglioNazionaledelleRicerche/TIGRO/Ricerche/db/first_db\")\n", "dtale.show(cooccorrenze)" ] }, { "attachments": {}, "cell_type": "markdown", "metadata": {}, "source": [ "ricerca di: don* gent* (entro 3 parole di testo)" ] }, { "attachments": {}, "cell_type": "markdown", "metadata": {}, "source": [ "![](img/coocco2.0.png)\n", "\n", "![](img/coocco2.2.png)" ] }, { "cell_type": "code", "execution_count": null, "metadata": {}, "outputs": [], "source": [ "ricerca = [[\"don*\", \"0\", 0, 0], [\"gent*\", \"0\", 0, 0]]\n", "# (lista ricerche, intervallo, periodo, ordinate)\n", "# intervallo di ricerca in numero di parole (3)\n", "# soltanto all'interno dello stesso periodo \n", "cooccorrenze = ricerca_cooccorrenze(ricerca, 3, 1, 0, \"/Users/leonardocanova/Library/CloudStorage/OneDrive-ConsiglioNazionaledelleRicerche/TIGRO/Ricerche/db/first_db\")\n", "dtale.show(cooccorrenze)" ] }, { "attachments": {}, "cell_type": "markdown", "metadata": {}, "source": [ "ricerca di: \" * m? sav *\" (nota usa di “”)" ] }, { "attachments": {}, "cell_type": "markdown", "metadata": {}, "source": [ "![](img/coocco3.0.png)![](img/coocco3.1.png)" ] }, { "cell_type": "code", "execution_count": null, "metadata": {}, "outputs": [], "source": [ "ricerca = [[\"*m?\", \"0\", 0, 0], [\"sav*\", \"0\", 0, 0]]\n", "# (lista ricerche, intervallo, periodo, ordinate)\n", "# intervallo di ricerca in numero di parole (10)\n", "# soltanto all'interno dello stesso periodo\n", "cooccorrenze = ricerca_cooccorrenze(ricerca, 1, 1, 0, \"/Users/leonardocanova/Library/CloudStorage/OneDrive-ConsiglioNazionaledelleRicerche/TIGRO/Ricerche/db/first_db\")\n", "dtale.show(cooccorrenze)" ] }, { "attachments": {}, "cell_type": "markdown", "metadata": {}, "source": [ "ricerca di: \"de* av?re\"\n", "\n", "![](img/coocco4.0.png)\n", "\n", "![](img/coocco4.1.png)" ] }, { "cell_type": "code", "execution_count": null, "metadata": {}, "outputs": [], "source": [ "ricerca = [[\"de*\", \"0\", 0, 0], [\"av?re\", \"0\", 0, 0]]\n", "# (lista ricerche, intervallo, periodo, ordinate)\n", "# intervallo di ricerca in numero di parole (10)\n", "# soltanto all'interno dello stesso periodo\n", "cooccorrenze = ricerca_cooccorrenze(ricerca, 1, 1, 0, \"/Users/leonardocanova/Library/CloudStorage/OneDrive-ConsiglioNazionaledelleRicerche/TIGRO/Ricerche/db/first_db\")\n", "dtale.show(cooccorrenze)" ] }, { "attachments": {}, "cell_type": "markdown", "metadata": {}, "source": [ "ricerca di “Gsavio Guomo” (per G vedi l’esempio casa Grestare => attenzione perché per questa ricerca occorre avere un corpus contenente i soli filgat del corpus di prova)\n", "\n", "![](img/coocco5.0.png)\n", "\n", "![](img/coocco5.1.png)" ] }, { "cell_type": "code", "execution_count": null, "metadata": {}, "outputs": [], "source": [ "# (forma/lemma_cercati, tipo_ricerca, ricerca_espansa, iniziale_raddoppiata)\n", "# tipo_ricerca # 2 per lemmi con opzione \"mostra occorrenze non lemmatizzate\"\n", "ricerca = [[\"savio\", \"2\", 0, 0], [\"uomo\", \"2\", 0, 0]]\n", "# (lista ricerche, intervallo, periodo, ordinate)\n", "# intervallo di ricerca in numero di parole (10)\n", "# soltanto all'interno dello stesso periodo\n", "cooccorrenze = ricerca_cooccorrenze(ricerca, 1, 1, 0, \"/Users/leonardocanova/Library/CloudStorage/OneDrive-ConsiglioNazionaledelleRicerche/TIGRO/Ricerche/db/first_db\")\n", "dtale.show(cooccorrenze)" ] }, { "attachments": {}, "cell_type": "markdown", "metadata": {}, "source": [ "ricerca di: “Ldovere Lavere” \n", "\n", "![](img/coocco6.0.png)\n", "\n", "![](img/coocco6.1.png)" ] }, { "cell_type": "code", "execution_count": null, "metadata": {}, "outputs": [], "source": [ "# (forma/lemma_cercati, tipo_ricerca, ricerca_espansa, iniziale_raddoppiata)\n", "# tipo_ricerca 1 per lemmi\n", "ricerca = [[\"dovere\", \"1\", 0, 0], [\"avere\", \"1\", 0, 0]]\n", "# (lista ricerche, intervallo, periodo, ordinate)\n", "cooccorrenze = ricerca_cooccorrenze(ricerca, 1, 1, 0, \"/Users/leonardocanova/Library/CloudStorage/OneDrive-ConsiglioNazionaledelleRicerche/TIGRO/Ricerche/db/first_db\")\n", "dtale.show(cooccorrenze)" ] }, { "attachments": {}, "cell_type": "markdown", "metadata": {}, "source": [ "ricerca di: \"Gdovere Gavere\"\n", "\n", "![](img/coocco7.0.png)\n", "\n", "![](img/coocco7.1.png)" ] }, { "cell_type": "code", "execution_count": null, "metadata": {}, "outputs": [], "source": [ "# (forma/lemma_cercati, tipo_ricerca, ricerca_espansa, iniziale_raddoppiata)\n", "# tipo_ricerca # 2 per lemmi con opzione \"mostra occorrenze non lemmatizzate\"\n", "ricerca = [[\"dovere\", \"2\", 0, 0], [\"avere\", \"2\", 0, 0]]\n", "cooccorrenze = ricerca_cooccorrenze(ricerca, 1, 1, 0, \"/Users/leonardocanova/Library/CloudStorage/OneDrive-ConsiglioNazionaledelleRicerche/TIGRO/Ricerche/db/first_db\")\n", "dtale.show(cooccorrenze)" ] } ], "metadata": { "kernelspec": { "display_name": "Python 3 (ipykernel)", "language": "python", "name": "python3" }, "language_info": { "codemirror_mode": { "name": "ipython", "version": 3 }, "file_extension": ".py", "mimetype": "text/x-python", "name": "python", "nbconvert_exporter": "python", "pygments_lexer": "ipython3", "version": "3.10.4" }, "vscode": { "interpreter": { "hash": "aee8b7b246df8f9039afb4144a1f6fd8d2ca17a180786b69acc140d282b71a49" } } }, "nbformat": 4, "nbformat_minor": 2 }