본문으로 건너뛰기

#Logit Lens

4개의 포스트

[논문리뷰] Spurious Rewards Paradox: Mechanistically Understanding How RLVR Activates Memorization Shortcuts in LLMs

댓글 수 로딩 중

[논문리뷰] Beyond Transcription: Mechanistic Interpretability in ASR

댓글 수 로딩 중

[논문리뷰] Map the Flow: Revealing Hidden Pathways of Information in VideoLLMs

댓글 수 로딩 중