[논문리뷰] 360Anything: Geometry-Free Lifting of Images and Videos to 360°본 논문은 기존의 카메라 메타데이터(FoV, 자세)에 의존하는 한계를 극복하고, 단일 시점의 이미지 및 비디오를 360° 파노라마 로 변환하는 견고하고 기하학적 제약이 없는(geometry-free) 프레임워크를 개발하는 것을 목표로 합니다.#Review#Panorama Generation#Diffusion Transformers#Geometry-Free Learning#Latent Encoding#Seam Artifacts#Camera Pose Estimation#Video Outpainting2026년 1월 22일댓글 수 로딩 중
[Loki] shuffle shard 캐시 크기 설정을 experimental로 표시Grafana Loki의 shuffle-shard-cache-size 설정 플래그를 experimental로 표시하여, 향후 변경 가능성을 사용자에게 명확히 전달하는 PR을 분석합니다.#Grafana Loki#Configuration#Experimental#Documentation#Cache2026년 1월 22일댓글 수 로딩 중
[triton] AMD membarFilter에 bufferID 고려 추가AMD 백엔드의 membar 분석에서 buffer ID를 고려하여 불필요한 barrier 삽입을 줄이고, 재사용된 allocation 간 누락된 barrier를 올바르게 삽입하도록 개선한 PR을 분석합니다.#Triton#AMD GPU#Memory Barrier#Shared Memory#Optimization2026년 1월 22일댓글 수 로딩 중
[Triton] AxisInfo의 divisibility 초기화 로직 문서화 개선MulIOp에서 contiguity > 1일 때 divisibility를 1로 리셋하는 이유를 명확히 문서화#Triton#Documentation#MLIR#AxisInfo#Compiler Analysis2026년 1월 22일댓글 수 로딩 중
[triton] CUDA 가변 인자 Pre-compiled Launcher로 커널 런치 오버헤드 제거Triton의 CUDA/HIP 커널 런처를 Python 문자열 치환 방식에서 C 기반 가변 인자 방식으로 전환하여 런치 오버헤드를 제거한 PR을 분석합니다.#Triton#CUDA#HIP#Runtime#Performance2026년 1월 21일댓글 수 로딩 중
[논문리뷰] sangkuriang: A pseudo-spectral Python library for Korteweg-de Vries soliton simulation본 논문은 Korteweg-de Vries (KdV) 방정식을 해결하는 오픈소스 Python 라이브러리인 sangkuriang을 소개하는 것을 목표로 합니다.#Review#Nonlinear Wave Physics#Soliton Simulation#Korteweg-de Vries Equation#Pseudo-spectral Methods#Adaptive Time Integration#Python Library#Computational Physics2026년 1월 21일댓글 수 로딩 중
[논문리뷰] XR: Cross-Modal Agents for Composed Image RetrievalAI 시대의 Composed Image Retrieval (CIR)에서 기존 유사성 기반 패러다임의 한계를 극복하고, 레퍼런스 이미지와 텍스트 수정 사항을 통합하는 데 필요한 교차-모달 추론 능력 을 향상시키는 것이 목표입니다.#Review#Composed Image Retrieval#Cross-Modal Agents#Multimodal Reasoning#Training-free Framework#Information Retrieval#Agentic AI#Progressive Retrieval2026년 1월 21일댓글 수 로딩 중
[논문리뷰] Typhoon OCR: Open Vision-Language Model For Thai Document Extraction기존 VLM이 태국어와 같은 저자원 언어의 복잡한 스크립트 특성(비라틴 문자, 명시적 단어 경계 부재, 스택형 발음 구별 부호) 및 비정형 문서 레이아웃으로 인해 겪는 한계를 해결하는 것입니다.#Review#Vision-Language Model#OCR#Thai Language Processing#Document Understanding#Low-Resource Language#Data Synthesis#Fine-tuning#Layout Analysis2026년 1월 21일댓글 수 로딩 중
[논문리뷰] Typhoon ASR Real-time: FastConformer-Transducer for Thai Automatic Speech Recognition본 논문은 높은 지연 시간 때문에 스트리밍 애플리케이션에 비실용적인 대규모 오프라인 ASR 모델(예: Whisper)의 한계를 극복하고, 저지연 태국어 자동 음성 인식(ASR)을 위한 효율적인 스트리밍 솔루션을 개발하는 것을 목표로 합니다.#Review#Thai ASR#Real-time Speech Recognition#FastConformer-Transducer#Low-latency#Text Normalization#Dialect Adaptation#Data Curation#Streaming ASR2026년 1월 21일댓글 수 로딩 중
[논문리뷰] The Responsibility Vacuum: Organizational Failure in Scaled Agent Systems본 논문은 현대 AI 에이전트 기반 시스템에서 의사결정 처리량이 인간의 검증 역량을 초과할 때 발생하는 구조적인 책임 귀속 실패, 즉 책임 공백(Responsibility Vacuum) 현상을 정의하고 분석합니다. 의사결정에 대한 공식적 승인 권한과 이해 역량이 일치하지 않는 조직적 문제를 규명하는 것을 목표로 합니다.#Review#Responsibility Vacuum#Scaled Agent Systems#Organizational Failure#CI/CD Pipelines#Human Verification Capacity#Authority-Capacity Mismatch#AI Governance#Ritualized Approval2026년 1월 21일댓글 수 로딩 중
[논문리뷰] RoboBrain 2.5: Depth in Sight, Time in Mind본 논문은 기존 embodied AI foundation model의 2D pixel 기반 grounding 및 sparse temporal supervision의 한계를 극복하고, 정확한 3D 공간 추론(Precise 3D Spatial Reasoning) 과 밀집 시간 가치 예측(Dense Temporal Value Estimation) 능력을 통해 로봇의 물리적 상호작용 신뢰성과 실행 인지도를 향상시키는 것을 목표로…#Review#Embodied AI#Foundation Model#3D Spatial Reasoning#Temporal Value Estimation#Robotics#Manipulation#Multimodal Learning2026년 1월 21일댓글 수 로딩 중
[논문리뷰] Rethinking Video Generation Model for the Embodied World본 연구는 로봇 상호작용을 정확하게 반영하는 고품질 비디오 생성의 어려움을 해결하고, 표준화된 벤치마크 부족으로 인한 공정한 비교 및 발전의 한계를 극복하는 것을 목표로 합니다. 궁극적으로 로봇 학습 및 행동 예측을 위한 비디오 생성 모델의 실제 적용 가능성을 높이고, 신체화된 AI의 발전을 가속화하고자 합니다.#Review#Video Generation#Embodied AI#Robotics Benchmark#RBench#Robotics Dataset#RoVid-X#Physical Plausibility#Task Completion2026년 1월 21일댓글 수 로딩 중
[논문리뷰] Render-of-Thought: Rendering Textual Chain-of-Thought as Images for Visual Latent Reasoning본 논문은 Chain-of-Thought (CoT) 프롬프팅의 지나친 장황함으로 인한 높은 연산 오버헤드 와 중간 추론 과정의 불투명성 문제를 해결하고자 합니다.#Review#Chain-of-Thought (CoT)#Large Language Models (LLMs)#Vision Language Models (VLMs)#Latent Reasoning#Visual Modality#Image Rendering#Computational Efficiency#Knowledge Distillation2026년 1월 21일댓글 수 로딩 중
[논문리뷰] Quantifying Speaker Embedding Phonological Rule Interactions in Accented Speech Synthesis현재 TTS 시스템에서 스피커 임베딩이 액센트 외의 음색이나 감정과 같은 특성까지 인코딩하여 액센트 제어가 불투명하고 어렵다는 문제를 해결하고자 합니다.#Review#Text-to-Speech#Accent Control#Phonological Rules#Speaker Embeddings#Speech Synthesis#Disentanglement#Accent Classification2026년 1월 21일댓글 수 로딩 중
[논문리뷰] Paper2Rebuttal: A Multi-Agent Framework for Transparent Author Response AssistanceAI/ML 논문 심사 과정에서 발생하는 저자 답변(rebuttal) 작성의 어려움을 해결하는 것을 목표로 합니다.#Review#Multi-Agent Framework#LLM Agents#Peer Review#Rebuttal Generation#Evidence-centric Planning#Transparency#Human-in-the-loop2026년 1월 21일댓글 수 로딩 중
[논문리뷰] Numina-Lean-Agent: An Open and General Agentic Reasoning System for Formal Mathematics기존 에이전트 기반 형식 증명 시스템의 유연성, 재현성, 확장성 한계를 해결하고자 합니다.#Review#Agentic Systems#Formal Theorem Proving#Large Language Models (LLMs)#Lean Theorem Prover#Multi-Agent Systems#Code Generation#Automated Reasoning#Human-AI Collaboration2026년 1월 21일댓글 수 로딩 중
[논문리뷰] MMDeepResearch-Bench: A Benchmark for Multimodal Deep Research Agents본 논문은 기존 연구 에이전트 벤치마크들이 텍스트 전용 또는 짧은 형태의 멀티모달 질의응답에 초점을 맞춰, 멀티모달 증거를 활용한 종단 간 보고서 생성 능력을 평가하는 데 한계가 있음을 지적합니다.#Review#Multimodal Deep Research#Research Agents#Benchmark#Evaluation Framework#Retrieval-Augmented Generation#Large Multimodal Models#Visual Grounding#Citation Analysis2026년 1월 21일댓글 수 로딩 중
[논문리뷰] Lost in the Prompt Order: Revealing the Limitations of Causal Attention in Language Models본 논문은 대규모 언어 모델(LLM)이 프롬프트 구조에 민감하게 반응하는 이유를 밝히고, 특히 다중 선택 질의응답(MCQA) 태스크에서 컨텍스트의 순서가 성능에 미치는 영향을 분석하는 것을 목표로 합니다.#Review#Prompt Engineering#Large Language Models#Causal Attention#Multiple-Choice QA#Prompt Order Sensitivity#Information Bottleneck#Decoder-only Transformers2026년 1월 21일댓글 수 로딩 중
[논문리뷰] FinVault: Benchmarking Financial Agent Safety in Execution-Grounded Environments금융 에이전트(LLM 기반)가 투자 분석, 위험 평가, 자동화된 의사결정 등 고위험 및 고규제 환경에서 새로운 보안 위험을 초래하는 문제를 해결하고자 합니다.#Review#Financial AI Agents#Security Benchmark#Execution-Grounded#LLM Safety#Prompt Injection#Jailbreaking#Compliance#Vulnerability Assessment2026년 1월 21일댓글 수 로딩 중
[논문리뷰] Facilitating Proactive and Reactive Guidance for Decision Making on the Web: A Design Probe with WebSeek컴퓨터 비전 태스크에서 CNN의 의존성을 완전히 제거 하고, 순수한 Transformer 아키텍처 만으로 이미지 분류 성능을 달성하는 것을 목표로 합니다. 기존 CNN 기반 접근법의 한계를 극복하고 self-attention 메커니즘 이 이미지 패치 간의 관계를 효과적으로 학습할 수 있음을 증명하고자 합니다.#Review#Mixed-Initiative AI#Human-AI Collaboration#Web Data Analysis#Proactive Guidance#Large Language Models (LLMs)#Browser Extension#Data-Centric Design2026년 1월 21일댓글 수 로딩 중