GRAFO DI CONOSCENZA · ANATOMIA DEL MOTORE

Una rappresentazione deterministica dell'impresa.

NODI

38.412

ARCHI

218.490

ENTITÀ-CLASSI

LATENZA-QUERY

< 200ms

Il grafo di conoscenza di Lemnia è una struttura deterministica estesa all'intera organizzazione: documenti, argomenti, processi ed entità esterne (clienti, fornitori, prodotti) con le loro relazioni. Viene costruito mentre l'azienda lavora, aggiornato di continuo man mano che l'azienda cambia, citato a ogni risposta e salvato sui server dell'azienda. Il dossier per cliente è una delle proiezioni di questo grafo.

Questa pagina presenta Lemnia su due piani di lettura. Il primo è in italiano corrente, accessibile anche a chi non ha una formazione tecnica. Il secondo, espandibile a richiesta sotto ogni paragrafo, raccoglie il dettaglio architetturale destinato a CTO, DPO, commercialisti e consulenti.

§ 01ESPLORATORE INTERATTIVO

DATI DEMO · CLIENTE BIANCHI

Un click su un nodo apre le citazioni di provenienza. Il trascinamento riposiziona la vista e la rotellina del mouse regola lo zoom. Il dataset è dimostrativo: il grafo reale di un'azienda viene costruito sui dati che l'azienda sceglie di collegare.

ARCHITETTURA DELL'ESPLORATORE

Rendering via @xyflow/react 12.10 con layout statico precomputato (mulberry32 seed deterministico per riproducibilità tra reload). Il dataset di esempio è statico e annotato a mano. Nel prodotto reale il grafo è popolato dal motore di ingestione e la navigazione consulta direttamente lo storage SQLite + sqlite-vec via gRPC mTLS LAN.

§ 02PIPELINE · SEI FASI

DAL CONNETTORE ALLA CITAZIONE

FASE 01

Connessione

Lemnia legge i sistemi presenti in azienda (gestionali, ecommerce, posta, calendario, supporto, repository documentali come Google Drive, OneDrive, SharePoint e cartelle di rete, oltre ai server MCP esterni) usando soltanto le credenziali necessarie alla lettura. La scrittura richiede sempre il consenso esplicito dell'amministratore.

APPROFONDIMENTO TECNICO

Connettori firmati conformi ai protocolli pubblicati dei sistemi origine (OAuth2 per Microsoft 365 / Google Workspace, API REST per Zucchetti TeamSystem SAP B1, WhatsApp Business Cloud API, IMAP IDLE per posta, connettori file-share e cloud-drive per Google Drive / OneDrive / SharePoint / cartelle di rete, e il Model Context Protocol per i server MCP esterni). Ogni connettore eredita le ACL a livello di documento del sistema d'origine: quel set di permessi viene rispecchiato nel grafo e applicato al recupero, prima del ranking, così che nessun risultato, snippet o citazione raggiunga un utente privo del permesso nel sistema sorgente. CST.494

Le credenziali sono custodite in keychain di sistema (Keychain Access su macOS, Credential Manager su Windows). Mai persistite in chiaro su disco applicativo. Refresh token ruotati ogni 24h. CST.375

FASE 02

Estrazione

Lettura periodica o on-demand. Documenti, righe di registro, messaggi, ordini. Tutto pseudonimizzato in transito e cifrato in archiviazione.

APPROFONDIMENTO TECNICO

Ingestione streaming per i sistemi che supportano webhook + IMAP IDLE; batch polling per gli altri (intervallo configurabile, default 5 min). Sub-5min p95 dal segnale alla visibilità nel dossier. CST.269

Cifratura at-rest AES-256-GCM con DEK per-tenant, KEK custodito da Keychain. Pseudonimizzazione opzionale dei PII durante l'ingestione per categorie configurate dal DPO.

FASE 03

Comprensione

Modelli locali addestrati sull'italiano identificano le entità (clienti, fornitori, prodotti, pratiche, documenti) e le relazioni tra loro (fattura → ordine → cliente). Sui casi limite la disambiguazione è assistita.

APPROFONDIMENTO TECNICO

NER + RE addestrati su corpus italiano (medico + business + tributario). Backbone Qwen3.5-4B Q4 per intent comprehension, mDeBERTa-v3-base-italian-NLI per consistency check. CST.333

Disambiguazione via embedding Qwen3-Embedding-0.6B su contesto locale, con fallback su HITL (human-in-the-loop) modal per i casi con confidence < 0.7. Le decisioni di disambiguazione diventano dati di training continuo per il tenant.

Riferimenti SOTA: ATOM(arXiv 2510.22590) per l'estrazione di fatti atomici in 5-tuple, l'unità di fatto del grafo al momento dell'ingestione; HippoRAG 2 per il ranking via PageRank personalizzato sul grafo.

FASE 04

Memorizzazione

Il grafo locale è firmato. Ciascun nodo, arco e proprietà conserva una citazione di provenienza che indica il documento, la riga e il timestamp da cui proviene il fatto.

APPROFONDIMENTO TECNICO

Schema dual-node: Entity (cliente, fornitore, prodotto, pratica) + Source (documento, email, riga di registro). Ogni arco di tipo SUPPORTS collega un fact a una source con range char-level (offset_start, offset_end) e hash BLAKE3 del contenuto sorgente. CST.30

Storage backend: SQLite con sqlite-vec 0.1.9 per embeddings, rusqlite per tabelle relazionali, RocksDB per il blob store dei documenti originali. Append-only log con sigillo BLAKE3 per ogni transazione, esportabile come prova per audit Art. 30 GDPR.

Community detection: algoritmo Leiden per cluster analysis su entità frequentemente co-occorrenti. Refresh PageRank batched, configurabile per dimensione del grafo. CST.129

FASE 05

Recupero

All'interrogazione Lemnia percorre il grafo per un massimo di 3 passi e 8 secondi. Il recupero è deterministico: nessun agente che si auto-organizza, nessun comportamento imprevedibile.

APPROFONDIMENTO TECNICO

Pipeline ibrida BM25 + densi: query parsing → seed nodes via embedding similarity → multi-hop traversal con PPR weighting → cross-encoder reranking (mDeBERTa). Cap di profondità: 3 hop default biz, 2 medico. Cap di tempo: 8s totali, fallback a top-3 evidence se timeout.CST.389

Multi-entity seed weighting: ogni seed pesato per (confidence, PageRank_prior, freshness). La query passa per un classifier deterministico di route (FetchTimeline | FetchMultiHopChain | FetchAggregate | FetchSummary); un router TF-IDF + SVM invia le query a fatto singolo direttamente a un percorso FTS5, saltando la traversata del grafo. Nessuna agentic loop sul modello locale.

Riferimento SOTA: HippoRAG 2 (arXiv 2502.14802) fornisce il ranker a PageRank personalizzato per la traversata multi-hop. La generazione resta deterministica, vincolata al cite-or-refuse.

FASE 06

Citazione

La risposta viene generata con ogni frase agganciata a un passaggio di documento sorgente. Se la fonte non esiste, Lemnia lo dichiara e rifiuta di inventare.

APPROFONDIMENTO TECNICO

Cite-or-refuse pipeline a 5 step: (1) decomposizione della risposta in claim atomici; (2) substring match contro evidence set; (3) mDeBERTa-NLI per entailment verification; (4) KG-consistency check via traversal; (5) strip-and-replace per i claim non entailed. CST.82

Whitelist hedging per pack: verosimilmente, presumibilmente, si stima, pare. Questi termini sono esenti dalla verifica entailment, ma restano limitati ai paragrafi marcati come dossier hedged. Le sezioni strict (dunning, preventivo, supplier-risk) non ammettono hedging.

Registro di elaborazione firmato BLAKE3 per ogni risposta. Esportabile come prova in giudizio o per il DPO. Ancoraggio normativo: Trib. Siracusa 338/2026 Art. 96 c.p.c.

§ 03ITALIANO → GRAFO → CITAZIONE

NESSUN LINGUAGGIO DA IMPARARE

IT  cosa è successo con il cliente Bianchi quest'anno?
──────────────────────────────────────────────────────
DSL
    MATCH (c:Cliente {nome: "Bianchi"})
          -[r:HA_GENERATO|HA_RICEVUTO|HA_INVIATO]-(e)
    WHERE r.timestamp >= "2026-01-01"
    RETURN e ORDERED BY r.timestamp
    LIMIT 50
──────────────────────────────────────────────────────
RISPOSTA CITATA
    «Nel 2026 il cliente Bianchi ha ricevuto 3 ordini
     (12 feb, 4 mag, 8 ago), tutti pagati. L'ultima
     fattura è del 12 nov [F-2026-247].»

Lemnia non richiede l'apprendimento di un linguaggio nuovo. L'operatore scrive in italiano e Lemnia traduce la richiesta in una query strutturata sul grafo, la esegue e restituisce una risposta citata.

Il modello che effettua la traduzione gira sull'hardware dell'azienda. Al momento dell'esecuzione nessun dato lascia la LAN.

DAL NATURAL LANGUAGE AL DSL

Il parser IT→DSL è un classifier deterministico che mappa la query in una delle 4 forme di retrieval (Timeline, MultiHopChain, Aggregate, Summary). Backbone Qwen3.5-4B Q4 per intent + slot filling, validatori algoritmici per scadenze (cf, p.iva, IBAN), fallback HITL su confidence < 0.7.

Nessuna esecuzione di codice generato dall'LLM. Il DSL intermedio è semplicemente un AST tipizzato che il graph engine esegue. L'LLM non ha accesso al disco né alla rete.

§ 04SCHEMA E-R · QUATTORDICI ENTITÀ

ONTOLOGIA GENERICA · ADATTABILE PER NICHE

Cliente

Fornitore

Prodotto

Ordine

Fattura

DDT

Pratica

Documento

Messaggio

Ticket

Dipendente

Decisione

Sede

Quattordici classi-entità di base coprono l'intera organizzazione (documenti, argomenti, processi ed entità esterne come clienti, fornitori e prodotti, con le loro relazioni) in un unico grafo di conoscenza aggiornato di continuo. La vista per cliente ne è una proiezione. Ogni verticale (micro-impresa, multi-canale, studio professionale, PMI) eredita queste classi e ne aggiunge altre specifiche. Le relazioni canoniche sono circa 28 e ogni arco è annotato con metadata di provenienza e cardinalità.

ESTENSIONE DELL'ONTOLOGIA PER NICHE

Lo schema base risiede in crates/lemnia-pack-business come Rust types. Ogni niche (T1-T4) può aggiungere classi via feature flag Cargo: per esempio T2 multi-canale aggiunge SkuVariante, RecensioneEsterna, Reso; T3 studio professionale aggiunge Pratica, Atto, UdienzaCalendario.

Le 28 relazioni canoniche includono GENERATA_DA, RICEVE, INVIA, MENZIONA, RISPONDE_A, CONTIENE, FATTURA_PER, COLLEGA_A. Ogni relazione carica metadata di confidenza (0-1), cardinalità (1-1, 1-N, N-N) e una citazione di provenienza puntando al source che l'ha generata.

§ 05TRE TOPOLOGIE DI INSTALLAZIONE

LOCAL-FIRST · SEMPRE

Solo

Lemnia desktop sul portatile del titolare. Modello Qwen3.5-4B in locale, ~5 GB di footprint, zero traffico in uscita al momento della ricerca. Adatto a micro-imprese, botteghe, artigiani.

APPROFONDIMENTO TECNICO

Stack: Tauri V2 + Rust workspace, llama.cpp per inferenza Qwen3.5-4B Q4_K_XL (~2.8 GB), sqlite-vec per embeddings locali. Single-user, single-tenant. Ingestion via webhook locale o polling. CST.333

Studio

Mac mini o NUC con il servizio Lemnia headless sulla LAN. Tutti i collaboratori vedono lo stesso dossier dai loro client. Le query restano sempre locali. Adatto a studi professionali e ecommerce multi-canale.

APPROFONDIMENTO TECNICO

Architettura T2: lemnia-server(binario gRPC mTLS) + desktop client tauri-business + mobile-business. Pairing iniziale via QR code, certificati tenant-scoped, ruoli RBAC eredati dal sistema d'origine. Multi-seat (default 3-10 utenti). CST.403

Sync intra-LAN, mai cloud. La modalità Pro (cloud-burst ingest) richiede consenso esplicito per batch e mantiene un audit log firmato.

PMI Sovereign

Apparecchio GPU dedicato in sede dell'azienda. L'intero stack gira sull'hardware dell'impresa. Utenti illimitati. Adatto a PMI €5-50M, 50-249 dipendenti, contesti regolamentati.

APPROFONDIMENTO TECNICO

T3 mono-tenant on-prem: server x86_64 con NVIDIA RTX 6000 Ada o equivalente, vLLM 0.19+ per modello Qwen3.6-35B-A3B-FP8 locale + DFlash drafter (2.5-2.9× speedup), Linux SEV-SNP per attestazione hardware.CST.335

Conformità: registro AVR (Authorized Vendor Register), DPIA pre-firmata per niche, esportazione automatica artefatti GDPR Art. 30. NIS2 ready: log accessi, gestione patch, separation of duties, esercizio BCP/DR.

§ 06FONDAMENTA TECNICHE

LA LETTERATURA CHE LEMNIA RIASSORBE

Lemnia non inventa una nuova metodologia. Lemnia integra il meglio della ricerca pubblicata su KG-RAG, recupero deterministico e cite-or-refuse, ottimizzandolo per il caso italiano (italiano-nativo, local-first, conforme).

RIFERIMENTI BIBLIOGRAFICI

HIPPORAG 2 · ARXIV 2502.14802 · OSU-NLP
PageRank personalizzato su un grafo di conoscenza dual-node (chunk + entità). Lemnia riprende il PPR weighting come ranker tra hop; scarta l'agenticità.
LAZYGRAPHRAG / BENCHMARKQED · MICROSOFT 2026
Summarizzazione delle comunità a query-time. Lemnia la adotta come cache di sintesi per comunità, in sostituzione della summarizzazione cloud-side eager all'ingestione.
GRAPHRAG-BENCH · 2026
Router di query (TF-IDF + SVM) che classifica le query a fatto singolo. Lemnia lo usa per instradarle a un percorso FTS5 diretto, saltando la traversata del grafo.
ATOM · ARXIV 2510.22590 · EACL 2026
Estrazione di fatti atomici in 5-tuple. Lemnia adotta la 5-tupla come unità di fatto al momento dell'ingestione, ogni atomo vincolato al cite-or-refuse.

CIÒ CHE LEMNIA AGGIUNGE

Italiano nativo
NER, RE e parsing addestrati su corpus italiano (business + tributario + medico). Mai inglese-via-traduzione.
Citazione obbligatoria
Pipeline a 5 passaggi: decomposizione → substring match → entailment NLI → coerenza sul grafo → strip-and-replace. Whitelist di hedging per pacchetto. Allucinazioni mai tollerate.
Locale al momento della ricerca
Cloud-burst opzionale solo per ingest pesante e generazione lunga. Ricerca query-time sempre on-prem.
Conformità incorporata
Registro firmato BLAKE3 per ogni interrogazione. DPIA pre-firmata per niche. Allegato V iperammortamento 2026 eligibile.

AI ACT ART. 50 · GDPR · NIS2 · GARANTE PROVV. 474/2025 · UE HOSTED

Richiedi un pilot →← Torna alla panoramica

PROGRAMMA FONDATORI · POSTI LIMITATI

Lemnia in funzione sui dati di un'azienda reale.

Una dimostrazione di trenta minuti, calibrata sul settore dell'azienda. Lemnia compone la scheda di un cliente reale, cita le fonti riga per riga e presenta il registro firmato pronto per il DPO.

Richiedi un pilot→Scarica il dossier tecnico