Runavot's picture

20 19

Runavot

Aurjfbkfkehz

·

AI & ML interests

None yet

Organizations

Aurjfbkfkehz's activity

upvoted a paper 6 months ago

Toto: Time Series Optimized Transformer for Observability

Paper • 2407.07874 • Published Jul 10 • 29

upvoted a paper 7 months ago

TextGrad: Automatic "Differentiation" via Text

Paper • 2406.07496 • Published Jun 11 • 27

upvoted 4 papers 9 months ago

Compression Represents Intelligence Linearly

Paper • 2404.09937 • Published Apr 15 • 27

Evolutionary Optimization of Model Merging Recipes

Paper • 2403.13187 • Published Mar 19 • 50

The Unreasonable Ineffectiveness of the Deeper Layers

Paper • 2403.17887 • Published Mar 26 • 78

The Era of 1-bit LLMs: All Large Language Models are in 1.58 Bits

Paper • 2402.17764 • Published Feb 27 • 604

upvoted a paper 10 months ago

Common 7B Language Models Already Possess Strong Math Capabilities

Paper • 2403.04706 • Published Mar 7 • 16

upvoted 4 papers 12 months ago

DocLLM: A layout-aware generative language model for multimodal document understanding

Paper • 2401.00908 • Published Dec 31, 2023 • 181

Improving Text Embeddings with Large Language Models

Paper • 2401.00368 • Published Dec 31, 2023 • 79

Astraios: Parameter-Efficient Instruction Tuning Code Large Language Models

Paper • 2401.00788 • Published Jan 1 • 21

Beyond Chinchilla-Optimal: Accounting for Inference in Language Model Scaling Laws

Paper • 2401.00448 • Published Dec 31, 2023 • 28

upvoted 9 papers about 1 year ago

WaveCoder: Widespread And Versatile Enhanced Instruction Tuning with Refined Data Generation

Paper • 2312.14187 • Published Dec 20, 2023 • 49

LLM in a flash: Efficient Large Language Model Inference with Limited Memory

Paper • 2312.11514 • Published Dec 12, 2023 • 257

LLM360: Towards Fully Transparent Open-Source LLMs

Paper • 2312.06550 • Published Dec 11, 2023 • 57

RepoFusion: Training Code Models to Understand Your Repository

Paper • 2306.10998 • Published Jun 19, 2023 • 14

PathFinder: Guided Search over Multi-Step Reasoning Paths

Paper • 2312.05180 • Published Dec 8, 2023 • 9

Nash Learning from Human Feedback

Paper • 2312.00886 • Published Dec 1, 2023 • 14

Magicoder: Source Code Is All You Need

Paper • 2312.02120 • Published Dec 4, 2023 • 80

Mamba: Linear-Time Sequence Modeling with Selective State Spaces

Paper • 2312.00752 • Published Dec 1, 2023 • 138

DSPy: Compiling Declarative Language Model Calls into Self-Improving Pipelines

Paper • 2310.03714 • Published Oct 5, 2023 • 31