Google collabora con EVE Online per testare l'intelligenza artificiale
Google DeepMind testa modelli di intelligenza artificiale in EVE Online
Google DeepMind ha stretto una partnership con CCP Games per testare modelli di intelligenza artificiale (AI) nell’universo virtuale di EVE Online, dopo che CCP ha ricevuto finanziamenti per 120 milioni di dollari per la sua indipendenza e ha cambiato nome in Fenris Creations. La collaborazione sfrutta l’ambiente live persistente di EVE per valutare il comportamento dell’AI in condizioni complesse e guidate dai giocatori. I test includono interazioni di agenti autonomi e processi decisionali in un sandbox di 16 anni con 800.000 account registrati.
L’ecosistema di EVE Online fornisce un laboratorio unico per l’AI a causa delle economie dei giocatori, dei conflitti territoriali e dei sistemi emergenti. Il motore fisico e i modelli economici del gioco creano sfide imprevedibili per i sistemi di intelligenza artificiale. Il CEO di Fenris Creations, Hilmar Pétursson, ha confermato che la partnership si sarebbe concentrata sulle tecniche di apprendimento per rinforzo, ma ha rifiutato di divulgare specifici parametri tecnici.
L’AI cerca su Reddit per consigli esperti
Google ha aggiornato la sua ricerca AI SGE per attingere a “Consigli degli esperti” da Reddit, ampliando oltre le fonti esistenti come Wikipedia e YouTube. La funzione visualizza thread di Reddit pertinenti in risposta a query tecniche su sviluppo software, risoluzione dei problemi hardware e argomenti di nicchia. Gli utenti con account Reddit Premium vedono l’accesso prioritario a contenuti verificati.
L’integrazione con Reddit segue mesi di test con Stack Overflow e forum specializzati. L’algoritmo di Google mappa l’intento della query sui domini di subreddit utilizzando l’elaborazione del linguaggio naturale. I risultati dei test iniziali hanno mostrato un aumento del 37% di risposte tecniche accurate rispetto ai risultati web generici. Tuttavia, il sistema fatica con argomenti sensibili al contesto in cui le comunità di Reddit hanno informazioni contrastanti.
Uno strumento open-source collega Google Sheets e LLM
Un’estensione open-source chiamata AISheeter consente ora agli utenti di integrare qualsiasi LLM con Google Sheets utilizzando le proprie chiavi API. Lo strumento supporta GPT-5.4, Claude Sonnet 4.5, Gemini 2.5 e modelli Groq con funzionalità come formule autocorreggenti, divulgazione di ragionamento progressivo e apprendimento della memoria di sessione. Gli sviluppatori possono automatizzare attività come l’analisi del sentiment, l’estrazione di funzionalità e la priorità urgente con prompt in linguaggio naturale.
L’architettura dell’estensione include un modello di ottimizzatore-evalutatore che rileva gli errori nei riferimenti di colonna e nei parametri logici prima dell’esecuzione. I test di prestazioni mostrano una latenza di 10 ms per operazioni con cache utilizzando la ricerca semantica pgvector. Le funzionalità di trasparenza dello strumento consentono agli utenti di visualizzare il processo di pensiero del modello prima dell’output finale. Sebbene lo strumento funzioni bene per attività di dati strutturati, la modellazione finanziaria complessa richiede ancora la convalida manuale delle formule generate dall’AI.
Il modello SaaS Phoenix guadagna popolarità
Un kit di avvio SaaS basato su Phoenix sta guadagnando popolarità tra gli sviluppatori indie, offrendo componenti predefiniti per autenticazione, pagamenti e integrazione AI. Il modello include sistemi di pagamento Stripe e LemonSqueezy pronti per la produzione, query PostgreSQL ottimizzate con Ecto e dashboard di analisi in tempo reale. Gli sviluppatori possono distribuire su Fly.io in meno di cinque minuti con scalabilità automatica e supporto Docker.
Lo strato AI del modello supporta più fornitori con elaborazione fault-tolerant e gestione dei prompt zero-shot. I test mostrano una riduzione del 40% del codice boilerplate per le funzionalità SaaS comuni. Tuttavia, la dipendenza da Erlang del framework crea una curva di apprendimento per i team non familiari con la programmazione funzionale. I primi adottanti segnalano notevoli risparmi di tempo nella configurazione iniziale, ma notano che la manutenzione continua richiede personalizzazioni al di là dell’ambito del modello.
Contesto industriale e limitazioni tecniche
La collaborazione DeepMind-EVE riflette una tendenza più ampia dei laboratori di intelligenza artificiale che cercano ambienti controllati ma dinamici per l’addestramento. Aziende di giochi come Ubisoft e Epic Games hanno analogamente collaborato con ricercatori di intelligenza artificiale, sebbene il cambio di nome di CCP in Fenris Creations segni un pivot strategico verso l’infrastruttura AI. La sfida tecnica consiste nel mantenere l’equilibrio del gioco mentre si testano sistemi AI sperimentali.
Le integrazioni di ricerca AI attuali rimangono limitate da pregiudizi specifici della piattaforma. Il modello di contenuto guidato dalla comunità di Reddit crea rischi intrinseci di propagazione della disinformazione, anche con filtri di qualità. La natura open-source dell’estensione Sheets consente miglioramenti della comunità ma manca di certificazioni di sicurezza di livello aziendale. Nel frattempo, il design modulare del modello SaaS Phoenix richiede agli sviluppatori di gestire le dipendenze tra i componenti, il che può introdurre complessità di integrazione.
Cosa tenere d’occhio
Fenris Creations prevede di rilasciare i risultati beta dei test AI di EVE Online entro il quarto trimestre del 2024. Il team SGE di Google misurerà le prestazioni dell’integrazione con Reddit rispetto ai risultati di ricerca tradizionali nei benchmark futuri. Gli sviluppatori di AISheeter mirano ad aggiungere funzionalità di ensemble multi-modello entro la metà del 2024. I creatori del modello SaaS Phoenix stanno esplorando ottimizzazioni AI specifiche per Elixir tramite il loro strumento di analisi del runtime Tidewave MCP.