top of page


Kwai-STaR: Una nuova frontiera per il ragionamento matematico dei LLM
Kwai-STaR rafforza il ragionamento matematico dei LLM con “State-Transition Reasoning”, superando CoT con minori costi computazionali.

Andrea Viliotti
11 nov 2024Tempo di lettura: 11 min


FrontierMath: An Advanced Benchmark Revealing the Limits of AI in Mathematics
FrontierMath tests AI’s limits with complex, original problems. AI scores below 2%, revealing a gap with human intuition.

Andrea Viliotti
10 nov 2024Tempo di lettura: 10 min


FrontierMath: Un benchmark avanzato per rivelare i limiti dell'AI in matematica
FrontierMath testa i limiti dell'AI con problemi inediti complessi. L'AI ottiene meno del 2%, mostrando il divario con l’intuizione umana.

Andrea Viliotti
10 nov 2024Tempo di lettura: 11 min


CRMArena: The New Frontier for Evaluating LLM Agents in CRM Environments
CRMArena: benchmark for LLM agents in complex CRM, improving evaluations on challenging tasks, costs, and adaptability.

Andrea Viliotti
9 nov 2024Tempo di lettura: 14 min


CRMArena: La nuova frontiera per la valutazione degli agenti LLM in ambienti CRM
CRMArena: benchmark per agenti LLM in CRM complessi, migliorando valutazione su task sfidanti, costi e capacità di adattamento.

Andrea Viliotti
9 nov 2024Tempo di lettura: 16 min


Technology 2024: The Impact of AI
Technology 2024: AI revolutionizes sectors and competitiveness. Big tech invests in R&D, innovating in infrastructure and sustainability.

Andrea Viliotti
8 nov 2024Tempo di lettura: 17 min


Tecnologia 2024: L'impatto globale dell'AI
Tecnologia 2024: L'AI rivoluziona settori e competitività. Big tech investe in R&D, innovando su infrastrutture e sostenibilità.

Andrea Viliotti
8 nov 2024Tempo di lettura: 19 min


MobileLLM: Ottimizzazione dei LLM di piccole dimensioni per l'uso su dispositivi mobili
MobileLLM rende l'AI mobile ed efficiente, con bassi consumi e meno dipendenza dal cloud, offrendo accessibilità e privacy avanzate.

Andrea Viliotti
8 nov 2024Tempo di lettura: 9 min


Multi-expert Prompting: Improving the Reliability of LLMs
Multi-expert Prompting: technique using virtual “experts” for balanced LLM responses, reducing bias and improving reliability.

Andrea Viliotti
6 nov 2024Tempo di lettura: 11 min


Multi-expert Prompting: Migliorare l'affidabilità dei LLM
Multi-expert Prompting: tecnica che usa “esperti” virtuali per risposte bilanciate nei LLM, riducendo bias e migliorando l'affidabilità.

Andrea Viliotti
6 nov 2024Tempo di lettura: 12 min


Artificial Intelligence in Schools
Artificial intelligence in schools. AI personalizes, but privacy and bias demand teachers guide its ethical and human-centered use.

Andrea Viliotti
5 nov 2024Tempo di lettura: 14 min


L'Intelligenza artificiale nelle scuole
Intelligenza artificiale nelle scuole. L’AI personalizza, ma privacy e bias richiedono che l’insegnante guidi un uso etico e umano dell’AI.

Andrea Viliotti
5 nov 2024Tempo di lettura: 15 min


AI Corporate Culture: Adoption of Artificial Intelligence in Italian Companies
AI Corporate Culture: AI is growing in Italy, but strategic vision and team collaboration are needed to overcome barriers.

Andrea Viliotti
5 nov 2024Tempo di lettura: 11 min


Cultura aziendale AI: Adozione dell'intelligenza artificiale nelle aziende italiane
Cultura aziendale AI: L'AI cresce in Italia, ma servono visione strategica e cooperazione tra team per superare le barriere.

Andrea Viliotti
5 nov 2024Tempo di lettura: 12 min


KGLA: Knowledge Graph Enhanced Language Agents for Recommendation Systems
KGLA combines graphs and LLMs for more accurate, explainable recommendations, achieving 95% better NDCG@1 over traditional methods.

Andrea Viliotti
4 nov 2024Tempo di lettura: 10 min


KGLA: Agenti linguistici potenziati da grafi di conoscenza per sistemi di raccomandazione
KGLA unisce grafi e LLM per raccomandazioni più accurate e spiegabili, migliorando il 95% su NDCG@1 rispetto ai metodi tradizionali.

Andrea Viliotti
4 nov 2024Tempo di lettura: 11 min


GSM-Symbolic: Understanding the Limitations of Mathematical Reasoning in Language Models
GSM-Symbolic highlights LLM limits in math reasoning, advising caution for enterprise use.

Andrea Viliotti
4 nov 2024Tempo di lettura: 7 min


GSM-Symbolic: Comprensione delle limitazioni del ragionamento matematico nei LLM
GSM-Symbolic evidenzia i limiti dei LLM nei test matematici, suggerendo cautela nell'uso aziendale.

Andrea Viliotti
4 nov 2024Tempo di lettura: 8 min


Sparsh: Redefining Tactile Perception in Advanced Robotics Systems
Sparsh: Redefining Tactile Perception – Meta launches a model for tactile sensors that cuts costs and autonomously adapts robots.

Andrea Viliotti
1 nov 2024Tempo di lettura: 12 min


Sparsh: Ridefinire la percezione tattile nei sistemi di robotica avanzati
Sparsh: Ridefinire la percezione tattile – Meta lancia un modello per sensori tattili che riduce costi e adatta i robot in modo autonomo.

Andrea Viliotti
1 nov 2024Tempo di lettura: 15 min
bottom of page


