Papers2

#long-context robustness

Building Production-Ready Probes For Gemini

János Kramár, Joshua Engels et al.Jan 16arXiv

The paper shows how to build tiny, fast safety checkers (called probes) that look inside a big AI’s brain activity to spot dangerous cyber-attack requests.

#activation probes#misuse mitigation#long-context robustness

Not triaged yet

Memory-T1: Reinforcement Learning for Temporal Reasoning in Multi-session Agents

Intermediate

Yiming Du, Baojun Wang et al.Dec 23arXiv

Memory-T1 teaches chatty AI agents to keep track of when things happened across many conversations.

#temporal reasoning#multi-session dialogue#reinforcement learning

Not triaged yet