29 2 58

Kyle O'Brien PRO

Kyle1668

https://kyobrien.io

AI & ML interests

Interpretability, model editing, alignment

Recent Activity

upvoted a paper about 6 hours ago

Deep Ignorance: Filtering Pretraining Data Builds Tamper-Resistant Safeguards into Open-Weight LLMs

updated a dataset about 6 hours ago

EleutherAI/deep-ignorance-annealing-mix

updated a dataset about 6 hours ago

EleutherAI/deep-ignorance-pretraining-mix

View all activity

Organizations

Collections 1

Papers 2

arxiv:2402.08225

arxiv:2304.01373

models 27

datasets 9

Kyle1668/mmlu_auxiliary_train_formatted_cloze

Viewer • Updated Jun 19 • 99.8k • 4

Kyle1668/wmdp_bio_historical_bioweapons

Viewer • Updated Jun 13 • 36 • 6

Kyle1668/mmlu_auxiliary_train_formatted

Viewer • Updated May 17 • 99.8k • 15

Kyle1668/phi_sae_training

Viewer • Updated Sep 7, 2024 • 17.2M • 10

Kyle1668/LLM-TTA-Cached-Rewrites

Viewer • Updated Feb 7, 2024 • 986k • 17

Kyle1668/LLM-TTA-Augmentation-Logs

Viewer • Updated Feb 7, 2024 • 4.43M • 60

Kyle1668/AG-Tweets

Viewer • Updated Nov 29, 2023 • 7.6k • 7

Kyle1668/BOSS-Robustness-Benchmark

Preview • Updated Oct 11, 2023 • 2

Kyle1668/pythia-semantic-memorization-perplexities

Viewer • Updated Sep 19, 2023 • 99.7M • 376

Kyle O'Brien PRO

AI & ML interests

Recent Activity

Organizations

Collections 1

Improving Black-box Robustness with In-Context Rewriting

Kyle1668/boss-sentiment-24000-bert-base-uncased

Kyle1668/boss-sentiment-bert-base-uncased

Kyle1668/boss-toxicity-bert-base-uncased

Improving Black-box Robustness with In-Context Rewriting

Kyle1668/boss-sentiment-24000-bert-base-uncased

Kyle1668/boss-sentiment-bert-base-uncased

Kyle1668/boss-toxicity-bert-base-uncased

Papers 2

models 27

Kyle1668/answerdotai-ModernBERT-large_20250111-002259

Kyle1668/answerdotai-ModernBERT-large_20250111-224237

Kyle1668/answerdotai-ModernBERT-large_20241230-093521

Kyle1668/allenai-scibert_scivocab_uncased_20241230-091934

Kyle1668/boss-toxicity-bert-base-uncased

Kyle1668/ag-news-t5-large

Kyle1668/ag-news-76800-bert-base-uncased

Kyle1668/ag-news-38400-bert-base-uncased

Kyle1668/ag-news-19200-bert-base-uncased

Kyle1668/ag-news-9600-bert-base-uncased

datasets 9

Kyle1668/mmlu_auxiliary_train_formatted_cloze

Kyle1668/wmdp_bio_historical_bioweapons

Kyle1668/mmlu_auxiliary_train_formatted

Kyle1668/phi_sae_training

Kyle1668/LLM-TTA-Cached-Rewrites

Kyle1668/LLM-TTA-Augmentation-Logs

Kyle1668/AG-Tweets

Kyle1668/BOSS-Robustness-Benchmark

Kyle1668/pythia-semantic-memorization-perplexities

Kyle O'Brien PRO

AI & ML interests

Recent Activity

Organizations

Collections 1

Papers 2

models 27 Sort: Recently updated

datasets 9 Sort: Recently updated

models 27

datasets 9