How I Study AI - Learn AI Papers & Lectures the Easy Way

MAEB: Massive Audio Embedding Benchmark

Adnan El Assadi, Isaac Chung et al.Feb 17arXiv

MAEB is a giant, fair report card for audio AI that tests 50+ models on 30 tasks across speech, music, environmental sounds, and audio–text tasks in 100+ languages.

#audio embeddings#MAEB#MTEB

Not triaged yet

C-RADIOv4 (Tech Report)

Intermediate

Mike Ranzinger, Greg Heinrich et al.Jan 24arXiv

C-RADIOv4 is a single vision model that learns from several expert models at once and keeps their best skills while staying fast.

#C-RADIOv4#agglomerative vision models#multi-teacher distillation

Not triaged yet

DanQing: An Up-to-Date Large-Scale Chinese Vision-Language Pre-training Dataset

Intermediate

Hengyu Shen, Tiancheng Gu et al.Jan 15arXiv

DanQing is a fresh, 100-million-pair Chinese image–text dataset collected from 2024–2025 web pages and carefully cleaned for training AI that understands pictures and Chinese text together.

#DanQing#Chinese vision-language dataset#image-text pairs

Not triaged yet

Papers3

MAEB: Massive Audio Embedding Benchmark

C-RADIOv4 (Tech Report)

DanQing: An Up-to-Date Large-Scale Chinese Vision-Language Pre-training Dataset