Farima Fatahi 's picture

Farima Fatahi

farimafatahi

·

farimafatahi

AI & ML interests

None yet

Recent Activity

authored a paper about 1 month ago

FactBench: A Dynamic Benchmark for In-the-Wild Language Model Factuality Evaluation

authored a paper about 1 month ago

Logit Arithmetic Elicits Long Reasoning Capabilities Without Training

authored a paper about 1 month ago

From Proof to Program: Characterizing Tool-Induced Reasoning Hallucinations in Large Language Models

View all activity

Organizations

authored 3 papers about 1 month ago

FactBench: A Dynamic Benchmark for In-the-Wild Language Model Factuality Evaluation

Paper • 2410.22257 • Published Oct 29, 2024

Logit Arithmetic Elicits Long Reasoning Capabilities Without Training

Paper • 2507.12759 • Published Jul 17

From Proof to Program: Characterizing Tool-Induced Reasoning Hallucinations in Large Language Models

Paper • 2511.10899 • Published Nov 14 • 3

published a model 10 months ago

farimafatahi/my_awesome_model

updated 3 Spaces about 1 year ago

Factbench

View and compare language model factuality scores

Factbench

View and compare language model factuality scores

Factbench

View and compare language model factuality scores