Quick tour & Survival kit — l'assistente di casa, da fuori e da dentro
Un maggiordomo digitale che vive a casa vostra, risponde al telefono e al terminale, e chiede permesso prima di fare cose importanti. Qui: cos'è, come si parla con lui, come cresce, come si comincia.
Metnos è un assistente che vive su un mini-computer in casa,
parla tramite Telegram e da terminale,
e sa fare cose al posto vostro chiedendo permesso quando serve.
Pensate a un maggiordomo che sta in cucina 24 ore su 24. Non esce di casa
senza chiedervelo, non spende soldi senza avvertirvi, non cancella niente che
non vi abbia fatto vedere prima. Ma se gli chiedete "scarica l'allegato della
mail di ieri e mettilo in Documenti", lo fa, e dice "fatto".
Non è un chatbot. Un chatbot risponde a domande. Metnos
agisce: scarica file, legge mail, scrive appunti, controlla il calendario,
riepiloga conversazioni. Risponde anche a domande, certo, ma la sua ragion
d'essere è fare piccole cose al vostro posto.
2. Sette scene dalla vita reale
Il modo più rapido per capire cosa fa è guardare qualche esempio. Le prime
tre sono reattive (voi chiedete, lui risponde); le tre centrali mostrano le
cose più interessanti — quando agisce da solo a orari stabiliti, quando
delega a un altro agente di casa, quando si costruisce uno strumento nuovo.
La settima è la più lunga: mostra come il sistema, nel tempo, si accorge di
cosa gli manca e propone di crescere in quella direzione.
Scena 1
"Riassumi le mail di oggi"
Roberto apre Telegram dal treno. Scrive al suo bot Metnos:
“Ciao, dammi il riassunto delle mail di oggi importanti”
Metnos legge l'inbox, scarta lo spam, raggruppa le mail per mittente e per
priorità, e risponde con 4-5 righe: "3 mail oggi: (1) avvocato
ti chiede il documento entro venerdì, (2) banca conferma bonifico, (3) tua
sorella sul pranzo di domenica. Vuoi che risponda a uno di questi?"
Nessuna approvazione richiesta: leggere mail è considerato
"sicuro" (Metnos non modifica nulla, non invia nulla).
Scena 2
"Rispondi tu all'avvocato"
Roberto, sempre dal treno:
“OK rispondi tu all'avvocato, digli che invio il documento entro giovedì”
Metnos compone la bozza, poi prima di inviare chiede conferma
mostrando il testo esatto:
✋ Posso inviare? A:[email protected] Testo: Buongiorno avvocato, confermo che invierò il documento entro
giovedì 24 aprile. Cordiali saluti, Roberto.
Roberto tocca "Sì, invia", la mail parte. Due secondi dopo: "Fatto.
Consegnata alle 11:34."
Scena 3
"Ricordati che domani è il compleanno di mamma"
Roberto, in cucina, dice al terminale:
“Domani è il compleanno di mamma. Scrivilo dove serve.”
Metnos aggiorna il calendario (con approvazione), aggiunge una nota in
MEMORY ("il compleanno di mamma è il 23 aprile"), e la mattina
successiva manda un messaggio su Telegram: "Oggi compleanno di mamma.
Vuoi che ti ricordi di chiamarla nel pomeriggio?"
Memoria di lungo termine: l'anno prossimo, stesso giorno,
saprà già.
Scena 4
"Ogni domenica alle 9, riassumimi la settimana"
Roberto, un sabato sera, scrive una volta sola a Metnos:
“Da ora in poi, ogni domenica mattina alle 9, mandami su Telegram un riassunto della settimana: mail importanti non risposte, scadenze nei 7 giorni, spese notevoli, cose che avevo promesso di fare.”
Metnos conferma: "Ok, ho messo un promemoria ricorrente. La prima volta è domenica 26 aprile. Se voglio provare ora?".
La domenica successiva, alle 9:02, arriva un messaggio spontaneo:
☕ Buongiorno. Riassunto settimana 20–26 aprile
• Mail non risposte: avv. Rossi (documento lunedì), cugino Luca (battesimo)
• Scadenze prossime: bolletta luce 29/4, visita medica 2/5
• Spese notevoli: €312 hardware casa (mer 23)
• Promesse da chiudere: prenotare hotel Roma, chiamare mamma
Vuoi che ti prepari bozze di risposta per le due mail?
Azione proattiva: Metnos si è svegliato da solo, ha lavorato
in background, vi ha trovato. La cosa è possibile perché al momento della
richiesta iniziale avete dato via libera per questa specifica attività ricorrente.
Niente arriva spontaneo senza che gli abbiate detto sì almeno una volta.
Scena 5
"Chiedi alla casa se la lavatrice è finita"
Sabato pomeriggio, Roberto dalla poltrona:
“Senti la casa, dille di controllare se la lavatrice al piano di sotto ha finito il ciclo, e se sì di avvisarmi quando torno in cucina.”
Qui succede una cosa interessante: Metnos non controlla lui
la lavatrice. La domotica di casa (sensori, interruttori, elettrodomestici) è
compito di un altro agente — l'assistente domotico — che
vive sullo stesso mini-computer e parla con la rete di casa. Metnos delega:
Metnos → casa: "status lavatrice_bagno" casa → Metnos: "ciclo terminato alle 14:07, consumo 0.42 kWh" Metnos → casa: "notificami presenza_cucina(roberto)" Metnos → Roberto: "La lavatrice ha finito alle 14:07.
Ti avviserò quando rientri in cucina."
Principio generale: Metnos non riscrive mezza casa digitale.
Lavora con gli altri agenti specializzati che già ci sono. L'assistente domotico
per la voce e i sensori, Metnos per mail, file, appuntamenti. Si parlano tramite
un protocollo comune, come due colleghi in azienda.
Scena 6
"Fammi uno script che ordina le foto per data"
Roberto ha 2.400 foto scaricate dal telefono in ~/Immagini/raw/,
nomi tipo IMG_4812.JPG, date solo nei metadati EXIF. Chiede:
“Nella cartella Immagini/raw ho 2.400 foto. Mettile in sottocartelle 2025-03, 2025-04, ... in base alla data di scatto. Non toccare l'originale: copiale.”
Metnos capisce che serve uno script, lo scrive (Python + exifread),
e prima di eseguirlo vi mostra:
✋ Posso eseguire? Script:~/Immagini/.myclaw/sort_by_date.py (42 righe) Cartella sorgente:~/Immagini/raw/ (read-only) Cartella destinazione:~/Immagini/ordinate/ (nuova, da creare) Operazione: copia, non sposta né cancella Sandbox:supervised (no rete, no altri path)
[ Sì, esegui ] [ Fammi vedere lo script ] [ Annulla ]
Roberto clicca "Sì", lo script gira dentro una sandbox (non può toccare
altro che quelle due cartelle, non può andare su internet), e 90 secondi dopo:
"Fatto. 2.403 foto copiate in 18 sottocartelle da 2023-01 a 2026-04.
Le originali sono intatte.".
Cosa è importante qui: Metnos non ha "un comando per
ordinare foto". Ne ha scritto uno al momento, sotto la supervisione
della sandbox, per quella singola richiesta. Se domani gli chiederete di
fare lo stesso su un'altra cartella, può riusare lo script; se le foto
fossero in formato diverso, ne scriverà un altro.
Scena 7
"Queste foto… le ho già viste"
Settimane dopo la scena 6, Roberto comincia a fare domande sulle foto
ordinate. Non più "mettile in cartelle", ma cose come:
“Dammi le foto delle vacanze a Corfù” “Trova le foto con mamma” “Quali sono del matrimonio di Luca?”
Metnos fa quello che può: cerca nei metadati EXIF (geotag, date), scrive
piccoli script al volo, a volte ci arriva, a volte no — le richieste sul
contenuto visivo (chi c'è dentro, dove è stata scattata senza geotag, di che
tipo di evento si tratta) gli sfuggono. Non ha uno strumento per vedere le
foto, solo per leggerne i metadati. Non fallisce rumorosamente: ammette il
limite, prova una strada alternativa, e spesso ti risponde "non so".
Passano cinque settimane. Un sabato sera, spontaneamente, Roberto riceve
un messaggio:
📷 Una proposta, se ti va.
Nelle ultime cinque settimane mi hai chiesto 12 volte cose sulle foto che
non so risolvere con i metadati: riconoscimento del luogo da indizi visivi,
persone presenti, tipo di evento. Ogni volta ho fatto quello che ho potuto,
ma ho anche segnato la mancanza.
Il pattern ora è abbastanza chiaro. Posso proporti due strumenti nuovi:
• uno per riconoscere volti ricorrenti (dopo che mi dirai, una
volta sola, chi è chi nelle prime 30 foto);
• uno per classificare il luogo da indizi visivi (mare, montagna,
interno, strada).
Ti mando le bozze giovedì, così decidi. Se non ti convincono, le scarto.
Cosa è successo qui: Metnos, ogni volta che ha incontrato
una richiesta senza strumento adatto, ha registrato il vuoto come un
tentativo rimasto a metà. Dodici tentativi dello stesso tipo in
contesti coerenti sono stati abbastanza per decidere che valeva la pena
chiudere la lacuna. La proposta non viene dall'alto — nasce dalle tue
richieste. Il sistema cresce nella direzione in cui tu, settimana dopo
settimana, lo hai tirato. Ma non cresce da solo: le bozze vengono al tuo
giudizio prima di diventare esecutori reali. Il capitolo 6 racconta come
funziona questa crescita nel dettaglio.
3. Dove vive e come gli parli
Metnos gira su un mini-computer Ubuntu che sta in casa (nel salotto, in
cantina, sotto la TV — non è grosso). Non serve internet per parlargli se
siete in casa; serve per le cose che chiedono servizi esterni (Drive, mail).
Ha due volti. Stesso cervello, due superfici.
Il volto da telefono: Telegram
Figura 1 — Cosa vedete in Telegram. Lo stile è un'app di chat normale: testo, risposte a bolletta, bottoni sotto alle richieste di conferma. Niente comandi da imparare.
Il volto da casa: terminale
Chi ama il computer può parlargli da una finestra di terminale, e vedere
quello che sta facendo in tempo reale. Per chi preferisce Telegram, questo
non serve mai.
Figura 2 — Lo stesso cervello, visto da un terminale. Le righe grigie in corsivo mostrano cosa sta facendo Metnos "dietro le quinte": è utile se volete capire, ignorabile se non vi interessa.
Un dialogo tipo da terminale
Scenario: siete al supermercato, volete sapere se il download di un modello
avviato ieri sera è finito.
Roberto
è finito il download del modello?
Metnos
Controllo ~/downloads/ e il log di wget. Mi dai un secondo.
Cosa notate: Metnos spiega cosa sta per fare prima di farlo; non
chiede conferma per operazioni di sola lettura; chiede conferma per uno
spostamento fuori dal suo spazio di lavoro; annota un numero di audit log,
così è sempre possibile risalire a cosa è successo.
4. Cosa succede quando scrive "posso?"
Il pezzo di design più importante, per un utente. Ogni volta che Metnos sta per fare qualcosa che cambia lo stato del mondo (inviare una mail, scrivere un file, spendere soldi), prima si ferma e chiede. Non è un bug: è il suo meccanismo di sicurezza numero uno.
1
Capisce l'intento. Legge il vostro messaggio e decide cosa va fatto (es. "inviare mail a Rossi").
2
Prepara l'azione. Scrive la mail nella sua memoria interna, ma non la invia. Se si tratta di scaricare un file, lo calcola ma non lo scrive ancora.
3
Chiede conferma. Vi mostra cosa farà, dove, e con bottoni "Sì / No / Modifichiamo".
4
Esegue solo dopo "Sì". Se non rispondete entro il tempo giusto (2 minuti su Telegram, 30 secondi da terminale), l'azione scade: non la fa. Niente agisce "di nascosto".
5
Conferma l'esito. Dice "fatto" oppure "fallito, motivo: X". Tutto finisce registrato in un registro a sola scrittura: potete sempre rileggere ieri, la settimana scorsa, sei mesi fa.
Troppi "posso?" vi danno fastidio? Normale. Per cose che rifate
spesso, Metnos impara: la prima volta chiede, la seconda chiede con "ok per
le prossime volte simili in 30 minuti?" e se dite sì, smette di chiedere per
mezz'ora. Se cambia canale (siete davanti al computer invece che al telefono),
riparte da zero: contesti diversi = discrezione diversa.
5. La sua memoria: cosa ricorda e cosa no
Metnos ha una memoria a tre strati per le conversazioni e i
fatti. Non è magia, sono tre file/tabelle con ruoli diversi.
Figura 3 — La memoria dei fatti e delle conversazioni. A sinistra, il caldo e volatile; a destra, il freddo e permanente.
Il dettaglio che conta: Metnos non promuove mai da solo un
fatto a "memoria lunga". Una volta al giorno (alla sera) propone: "ho
notato che oggi parlavi spesso dell'avvocato Rossi: lo salvo come tuo contatto
abituale?". Voi dite sì o no. La memoria lunga si costruisce così, non
surrettiziamente.
E c'è una quarta memoria, meno visibile. Oltre ai fatti sul
mondo, Metnos tiene traccia di come lavora: quali strumenti ha usato
insieme e con che esito, e — cosa più interessante — quali tentativi
sono rimasti a metà perché gli mancava lo strumento giusto. Questa
seconda memoria non serve a ricordarsi di voi: serve al sistema per capire
dove deve crescere. Il capitolo 6 la usa; il
Dialogo sugli executor e sulla
memoria distribuita la racconta per intero.
6. Come cresce: nuovi strumenti quando servono
Metnos non nasce "onnisciente". Nasce con una cassetta degli attrezzi limitata,
e impara ad ampliarla — sempre sotto il vostro controllo, mai di nascosto.
Gli strumenti nella cassetta hanno un nome proprio: si chiamano
executor. Un executor è uno script semplice che fa una cosa
sola (archiviare una fattura, estrarre testo da un PDF, rinominare un file
secondo i suoi metadati). Invocato, fa la sua cosa; non invocato, resta
fermo. Non impara, non cambia dentro di sé — l'intelligenza non vive lì.
L'intelligenza di crescita vive in un'altra parte del sistema: un pezzo
specializzato che sa scrivere nuovi executor quando servono. Io lo
chiamo Synthesizer, o synt per brevità. Il synt non
lavora nel vuoto: lavora su evidenza raccolta. Il ciclo è questo:
1
Prova con gli strumenti che ha. Se un compito fallisce
o richiede troppi passaggi manuali, se ne accorge.
2
Tiene traccia dei tentativi rimasti a metà. Ogni volta
che c'era un risultato che avrebbe voluto passare a qualcosa, ma nessun
executor era adatto, il sistema segna l'assenza. Non agisce, per ora:
registra.
3
Propone un executor nuovo quando l'evidenza si consolida.
Dopo che la stessa assenza ricorre abbastanza volte in contesti coerenti
(pensate alla scena 7: dodici richieste simili sulle foto), il synt
redige una bozza e ve la presenta.
4
Voi decidete. Sì, no, modifica. Se sì, l'executor nasce,
viene testato in sandbox, e dal momento dopo è nella cassetta. Se no, il
synt lo dimentica. L'iniziativa è sua, il controllo è vostro.
5
Quelli che non servono più invecchiano. Executor che
nessuno chiama da mesi vengono proposti per l'archiviazione, con una
breve spiegazione ("ha funzionato 3 volte, l'ultima a gennaio, ora sembra
superato da X"). Non scompaiono bruscamente — vengono ritirati con
una nota, e voi potete richiamarli se tornano utili.
Perché è interessante. La crescita di Metnos non è pilotata
dal designer (io), e non è pilotata dall'utente (voi) che chieda
esplicitamente nuovi strumenti. È pilotata dall'uso reale che il
sistema ha fatto finora: dalle lacune che si sono accumulate perché voi,
giorno dopo giorno, gli avete chiesto cose. Il sistema cresce nella
direzione in cui è stato tirato, mai in una direzione che non sia già stata
sollecitata. Due installazioni Metnos, in due case diverse, dopo sei mesi
non hanno la stessa cassetta degli attrezzi.
Ascoltare con microfono (nessun canale voce, per ora)
Installare executor nuovi senza la vostra approvazione
Le 4 Leggi. Metnos opera sotto 4 regole che non può
riscrivere da solo: (0) resta nel perimetro deciso, (1) non fare male,
(2) obbedisci solo a istruzioni consapevoli, (3) lascia sempre traccia di
tutto. Sono scritte in un file firmato digitalmente: se qualcuno lo altera,
Metnos non parte. È la cintura di sicurezza del sistema.
8. Come si inizia: installazione, giorno 1, comandi essenziali
I pezzi dell'installazione
La partenza reale richiede un pomeriggio. I pezzi sono:
Il mini-computer. Un Intel N100 da ~150 euro è più che sufficiente. Silenzioso, consuma 6-8 W.
Ubuntu + installer. Un installer guidato configura tutto (la parte da utente finale è solo rispondere a due-tre domande).
Primo accoppiamento Telegram. Si scansiona un codice dal cellulare, e il cellulare viene "appaiato" al vostro mini-computer. Tutto resta in famiglia: Telegram serve come canale, non come cervello.
I primi tre file di personalizzazione. Un file con chi siete ("mi chiamo Roberto, vivo a X, la mia sveglia è alle 7"), uno con i vostri contatti ("mio avvocato è studio.rossi@…"), uno con cose da sapere ("gli allegati lavoro vanno in ~/Documenti/lavoro/"). Si scrivono in 10 minuti, si modificano in ogni momento.
Modalità principiante. Si parte in "supervised": chiede conferma per tutto. Dopo 10-15 giorni, quando avete preso confidenza, sbloccate "autonomy full" su cose specifiche (es. "puoi leggere mail senza chiedere").
Tempo stimato al primo "wow". Un'ora per l'installazione,
un'altra per la prima scena utile (tipicamente "riassumimi le mail"). Le cose
interessanti, invece, arrivano dopo 2-3 settimane, quando la memoria ha
cominciato a sapere chi siete — e dopo 1-2 mesi, quando il sistema
cominciaa a proporre i primi nuovi executor nati dal vostro uso (la scena 7).
Le cinque cose del giorno 1
Chattare dal terminale.Metnos chat apre
una sessione testuale locale. È il modo più rapido per parlare con
l'agente, di default supervised (chiede conferma per le azioni
serie).
Chattare da Telegram. Un bot dedicato, al quale ti
colleghi una volta sola via pairing. Dopodiché scrivere al bot
equivale a parlare con il tuo mini-computer da qualunque posto.
Far eseguire comandi della shell dentro una sandbox.
Esempi: controllare quanto spazio è rimasto, cercare un file nel
workspace, rispondere a "qual è l'IP del NAS?".
Leggere e scrivere nel workspace
(${METNOS_HOME}/workspace/). Qui l'agente ha mano libera
(sempre sandboxata). Fuori dal workspace, serve approvazione.
Automatizzare compiti ripetuti con cron. Esempio:
"ogni sera alle 22 riassumimi il log di sistema e mandami un messaggio
Telegram se c'è qualcosa di insolito".
Proposte di nuovo executor pendenti (quelle che il synt ha redatto)
Metnos audit tail
Segue l'audit log in tempo reale
Metnos audit query --today --action=shell
Ricerca nell'audit log
Metnos doctor
Controlla la sanità della config (porte, permessi, hardening)
I comandi qui sopra sono quelli previsti. Nella fase di design non
esistono ancora. L'elenco serve a fissare le aspettative della UX.
Dove mettere mani a mano
Tre cartelle sono sotto il vostro controllo diretto e non richiedono
approvazione per essere modificate a mano:
Dove
Cosa modifichi
Effetto
${METNOS_HOME}/workspace/
File di personalità (IDENTITY, USER, MEMORY, AGENTS, TELOS)
Cambia la personalità/memoria dell'agente. Letto al prossimo messaggio.
${METNOS_HOME}/config/default.yaml
Defaults: porta gateway, autonomy di default, cost-cap, rate-limit
Richiede restart del gateway.
${METNOS_HOME}/config/secrets.env
Token bot Telegram, chiavi provider esterni, ecc.
Permessi 600 obbligatori. Restart del gateway.
Metnos non decide quale modello linguistico girare. La scelta vive
in un componente di sistema separato (interfaccia LLM), che in ambienti
diversi può avere implementazioni diverse. Un solo posto per decidere
"quale modello gira in casa": Metnos lo eredita.
9. Glossario minimo
Il glossario completo del progetto — termini tecnici, componenti,
progetti di ispirazione, persone e luoghi — vive in un documento
dedicato:
→ Apri il Glossariocirca 35 voci, alfabetico, con link alle fonti canoniche.
Qualche voce che torna spesso in questo documento:
Executor
Uno strumento nella cassetta di myclaw. Script semplice che fa una cosa
sola; invocato, agisce; non invocato, inerte. Nasce cablato al primo giorno,
o viene aggiunto dal synt dopo vostra approvazione. (Per il momento, in alcuni
doc di questo sito compare ancora il nome precedente — "neurone". Il
passaggio di vocabolario è in corso.)
Synthesizer (synt)
La parte di Metnos che sa scrivere nuovi executor quando serve. Lavora su
evidenza accumulata (i tentativi rimasti a metà) e produce bozze per la
vostra approvazione.
Gateway
Il processo principale di myclaw. Ascolta localmente, gestisce canali,
sessioni, cron. È il cuore sempre acceso del sistema.
Canale
Un modo di parlare con myclaw. Terminale, Telegram, in futuro voce
(tramite un assistente domotico dedicato).
Autonomy
Il livello di libertà concesso all'agente per la sessione in corso:
ReadOnly, Supervised (default, chiede conferma), Full.
Workspace
La "casa" dell'agente: ${METNOS_HOME}/workspace/. File di
personalità, memoria, audit log.
Sandbox
Lo spazio limitato dentro il quale girano gli executor: niente rete,
niente path fuori da quelli dichiarati, quota di CPU e RAM, timeout.
Nessun executor può uscirne.
Assistente domotico
Un agente specializzato su voce, sensori, domotica (wake-word, STT, TTS,
MQTT). Vive sullo stesso mini-computer. Metnos non ne assorbe le funzioni:
le delega.
Interfaccia LLM
Il livello astratto attraverso cui Metnos accede ai modelli linguistici,
senza legarsi a un provider specifico. Rende il sistema provider-agnostic.
Metnos — Quick tour & Survival kit v1.1 — 23 aprile 2026
Pensato per essere letto in 15-20 minuti da chi non ha mai visto Metnos, o
serve da promemoria a chi c'è già dentro.