Papers3

All Beginner Intermediate Advanced

All Sources arXiv

#logits

TOPReward: Token Probabilities as Hidden Zero-Shot Rewards for Robotics

Intermediate

Shirui Chen, Cole Harrison et al.Feb 22arXiv

Robots learn better when they get small hints at every step instead of only a final thumbs-up or thumbs-down.

#TOPReward#token probabilities#logits

Not triaged yet

Spilled Energy in Large Language Models

Intermediate

Adrian Robert Minut, Hazem Dewidar et al.Feb 21arXiv

The paper treats the last layer of a Large Language Model (the softmax over tokens) as an Energy-Based Model, which lets us measure a new signal called spilled energy.

#spilled energy#energy-based models#marginal energy

Not triaged yet

Parallel Context-of-Experts Decoding for Retrieval Augmented Generation

Intermediate

Giulio Corallo, Paolo PapottiJan 13arXiv

This paper introduces PCED, a way to use many documents as separate 'experts' in parallel so an AI can stitch answers together without stuffing everything into one giant prompt.

#Retrieval-Augmented Generation#PCED#contrastive decoding

Not triaged yet