Recent AI model progress feels mostly like bullshit

Alpha This system is experimental. Scores and classifications are early-stage research and may be unreliable. Methodology →

ND	Recent AI model progress feels mostly like bullshit (www.lesswrong.com)
	579 points by paulpauper 338 days ago \| 458 comments on HN ~lite vlite-2.0

Summary ~lite

The post critiques recent AI model progress, discussing it in a community blog focused on refining rationality.

Lite evaluation by llama-4-scout-wai-psq · editorial channel only · no per-section breakdown available

Longitudinal · 5 evals

Audit Trail 10 entries

2026-03-05 12:35	eval_success	PSQ evaluated: g-PSQ=-0.040 (3 dims)	- -
2026-03-05 12:35	eval	Evaluated by llama-4-scout-wai-psq: -0.04 (Neutral)
2026-03-05 12:30	eval_success	PSQ evaluated: g-PSQ=-0.400 (3 dims)	- -
2026-03-05 12:30	eval	Evaluated by llama-3.3-70b-wai-psq: -0.40 (Moderate negative) -0.40
2026-03-05 12:25	eval_success	PSQ evaluated: g-PSQ=0.000 (3 dims)	- -
2026-03-05 12:25	eval	Evaluated by llama-3.3-70b-wai-psq: 0.00 (Neutral)
2026-03-02 12:45	eval_success	Lite evaluated: Neutral (0.00)	- -
2026-03-02 12:45	eval	Evaluated by llama-4-scout-wai: 0.00 (Neutral)
	reasoning ED neutral tech discussion
2026-03-02 12:41	eval_success	Lite evaluated: Neutral (0.00)	- -
2026-03-02 12:41	eval	Evaluated by llama-3.3-70b-wai: 0.00 (Neutral)
	reasoning ED neutral tech discussion

build 35d02a3+aiqm · deployed 2026-03-09 11:48 UTC · evaluated 2026-03-08 02:36:46 UTC