ClawTalk: Chrome Extension per parlare con il tuo assistente OpenClaw Una pratica estensione che ti consente di parlare con il tuo agente OpenClaw direttamente all'interno del browser

ClawTalk: A Talk-to-Your-Assistant Chrome Extension for OpenClaw

Se stai leggendo questo articolo, probabilmente sai già che cos’è OpenClaw (in precedenza Clawdbot / Moltbot), oppure ti è quantomeno capitato di imbatterti nel progetto mentre cercavi un assistente AI self-hosted, capace di usare strumenti, che tu possa realmente controllare.

Questo è il punto chiave: OpenClaw non è “solo” una UI di chat. È una piattaforma che puoi installare su una tua macchina (Linux, macOS o Windows) e con la quale puoi comunicare utilizzando una pluralità di canali diversi (app di messaggistica, web chat, automazioni), invocare strumenti, pianificare promemoria e mantenere un contesto persistente nel tempo, ottenendo una esperienza molto più vicino a un vero assistente che a un semplice prompt per chatbot.

Al centro di questo ecosistema c’è il Gateway di OpenClaw: il centro di controllo che consente di inviare messaggi all’interno di una sessione e ricevere le risposte dell’assistente. Ed è qui che entra in gioco ClawTalk.

Che cos’è ClawTalk?

ClawTalk è una piccola estensione per Chrome che vive nel pannello laterale di Chrome e trasforma il tuo Gateway OpenClaw in un’interfaccia “parla con il mio assistente” sempre disponibile.

Il concetto è deliberatamente semplice:

  • Tieni aperto il pannello laterale mentre navighi.
  • Premi Connect per collegarti al tuo Gateway.
  • Premi Talk, parla in modo naturale e fai una pausa.
  • La trascrizione viene inviata a OpenClaw (all’interno di uno specifico sessionKey).
  • La risposta dell’assistente appare nel pannello — e può essere letta ad alta voce tramite TTS.
Il progetto, interamente open-source e rilasciato su licenza MIT, è disponibile qui: https://github.com/Ryadel/ClawTalk

A cosa serve se OpenClaw ha già una interfaccia web UI?

Perché una classica scheda di chat non è la stessa cosa di un ciclo vocale. Quando utilizzi OpenClaw come assistente, potresti voler fare qualcos’altro mentre ci parli. Forse stai già facendo qualcos’altro nel browser, non vuoi cambiare scheda, non vuoi un’interfaccia pesante sempre visibile, oppure desideri un ritmo rapido “premi-parla-rilascia” che risulti naturale.

ClawTalk è progettato proprio per soddisfare questo tipo di esigenze, garantendo una esperienza "frictionless" grazie a interfaccia minima e una robustezza sufficiente a non mandare in crisi il browser se la rete è instabile (buffer limitati, comportamento di riconnessione sensato e utilizzo prudente del protocollo).

ClawTalk si connette al Gateway tramite WebSocket e invia i tuoi messaggi a OpenClaw usando il meccanismo standard di eventi (l’equivalente di un “invia messaggio di chat a una sessione”). Scegli un sessionKey (per esempio main) e ClawTalk instrada tutto lì. Questo è importante perché significa che puoi riutilizzare il contesto già attivo: se la tua web chat o la Control UI utilizzano la stessa chiave di sessione, ClawTalk diventa un “telecomando vocale” per lo stesso cervello dell’assistente.

Installazione

Al momento, ClawTalk non è ancora disponibile sul Chrome Web Store, quindi può essere installato in modalità sviluppatore nel seguente modo.

  • Scarica l'ultima release (zip) dal repository ufficiale su GitHub
  • Apri chrome://extensions
  • Abilita la Developer mode
  • Fai clic su Load unpacked
  • Seleziona la cartella ClawTalk/

Dopo l’installazione, apri l’estensione e scegli Side panel. Il pannello fornisce i controlli Connect/Talk, un’area di chat e le impostazioni.

Panoramica della configurazione

La maggior parte della configurazione risiede nel pannello Settings del side panel. Le categorie principali sono:

  • Gateway: URL, token e header opzionali
  • Session: chiave di sessione con cui vuoi dialogare
  • Speech: lingua predefinita per il riconoscimento vocale
  • TTS: SpeechSynthesis (predefinito) oppure ElevenLabs (opzionale)

1) URL del Gateway

Se il tuo Gateway è in esecuzione in locale, il valore predefinito più comune è:

ws://127.0.0.1:18789

Se invece il Gateway è remoto, utilizzerai il suo URL WebSocket pubblico. In questo caso, presta attenzione al controllo degli accessi (token + protezioni a livello di rete).

2) Token del Gateway

Imposta il Gateway Token (o device token, a seconda di come è protetta la tua istanza di OpenClaw). ClawTalk lo memorizza localmente nello storage di Chrome ed evita di stamparlo nei log.

3) Header Cloudflare Zero Trust (Cloudflare Access)

Se il tuo Gateway è protetto da Cloudflare Zero Trust (Cloudflare Access), puoi utilizzare ClawTalk impostando un service token e configurandolo nel pannello settings di ClawTalk. Per farlo, aggiungi questi valori nella configurazione degli header del Gateway:

  • CF-Access-Client-Id: YOUR_CLIENT_ID
  • CF-Access-Client-Secret: YOUR_CLIENT_SECRET

Questi valori provengono dalla dashboard di Cloudflare Zero Trust, dove generi un Service Token di accesso. Una volta configurati, ClawTalk li allegherà alle richieste, consentendo a Cloudflare di permettere al WebSocket di raggiungere il tuo Gateway.

IMPORTANTE: tratta questi valori come credenziali. Non inserirli in screenshot, non committarli e ruotali se sospetti una compromissione.

4) Chiave di sessione

Scegli una sessionKey (di solito il valore predefinito è main). Se desideri condividere il contesto con la tua web UI di OpenClaw già esistente, utilizza la stessa chiave di sessione anche lì.

Text-to-Speech: SpeechSynthesis vs ElevenLabs

ClawTalk supporta due percorsi TTS, e la scelta riguarda principalmente qualità, privacy e dipendenze.

Opzione A: SpeechSynthesis del browser (predefinita)

È la configurazione più semplice: utilizza le voci disponibili nel browser o nel sistema operativo.

  • Nessuna chiamata ad API esterne per il TTS (positivo per privacy e affidabilità)
  • Nessuna API key, nessuna fatturazione
  • La qualità delle voci dipende da quelle installate nel sistema (a volte ottima, a volte un po’ robotica)
  • Ideale quando desideri un’esperienza “funziona ovunque, configurazione minima”

Opzione B: ElevenLabs TTS (opzionale)

ElevenLabs è una piattaforma cloud di text-to-speech (TTS) e voice AI. Tra le altre cose, fornisce un’API che riceve del testo (per esempio, la risposta dell’assistente) e restituisce audio parlato dal suono naturale utilizzando voci di alta qualità. Gli sviluppatori la usano quando desiderano voci che risultino più umane rispetto a quelle tipicamente integrate nei sistemi.

Se vuoi che ClawTalk utilizzi voci di qualità superiore e più naturali, puoi usare ElevenLabs purché tu lo configuri nella sezione Settings.

Per farlo, avrai bisogno di una API Key di ElevenLabs e di un Voice ID di ElevenLabs: entrambi possono essere creati dalla dashboard EvelenLabs Developers.

Compromessi:

  • La generazione audio avviene tramite richieste esterne verso ElevenLabs
  • La qualità è spesso sensibilmente migliore (soprattutto per risposte lunghe)
  • L’utilizzo dipende dal tuo piano, dai limiti e dalla connettività

ClawTalk include un pulsante Test speech per verificare la configurazione TTS senza eseguire l’intero ciclo di conversazione.

Conclusione

ClawTalk esiste perché l’“esperienza di assistente” non riguarda solo i modelli: riguarda anche l’ergonomia. Un pannello laterale con un ciclo vocale stabile può far sembrare una sessione OpenClaw uno strumento reale da tenere sempre a portata di mano, non una scheda da visitare occasionalmente.

Se utilizzi già OpenClaw, ClawTalk è un naturale passo successivo: configura il Gateway, scegli la giusta chiave di sessione, aggiungi gli header di Cloudflare Access se necessario e scegli tra un TTS senza dipendenze (SpeechSynthesis) o una qualità vocale premium (ElevenLabs).

Fork me on GitHub

About Ryan

IT Project Manager, Web Interface Architect e Lead Developer di numerosi siti e servizi web ad alto traffico in Italia e in Europa. Dal 2010 si occupa anche della progettazione di App e giochi per dispositivi Android, iOS e Mobile Phone per conto di numerose società italiane. Microsoft MVP for Development Technologies dal 2018.

View all posts by Ryan

Leave a Reply

Your email address will not be published. Required fields are marked *


Il periodo di verifica reCAPTCHA è scaduto. Ricaricare la pagina.

Questo sito utilizza Akismet per ridurre lo spam. Scopri come vengono elaborati i dati derivati dai commenti.