[cpython] Python dataclasses 모듈의 성능 최적화: inspect 모듈의 Lazy Import 도입

2026년 4월 26일수정: 2026년 4월 26일

PR 링크: python/cpython#144387 상태: Merged | 변경: +None / -None

들어가며

Python의 dataclasses 모듈은 매우 유용하지만, 모듈을 임포트할 때마다 inspect 모듈을 함께 불러오는 과정에서 상당한 오버헤드가 발생합니다. inspect 모듈은 기능이 강력한 만큼 로드 시 비용이 크며, 이는 dataclasses를 사용하는 모든 프로그램의 초기 실행 속도를 저하시키는 원인이 되어왔습니다. 본 PR(gh-137855)은 inspect를 즉시 임포트하는 대신, 실제로 필요한 시점에만 임포트하는 'Lazy Import' 전략을 도입하여 이 문제를 해결합니다.

코드 분석

1. `Lib/dataclasses.py`: Lazy Import 및 Descriptor 도입

핵심 변경 사항은 inspect 모듈을 lazy import로 변경하고, 클래스 문서화(__doc__) 로직을 지연 실행하는 것입니다.

Before:

import inspect
# ...
if not getattr(cls, '__doc__'):
    text_sig = str(inspect.signature(cls, ...))
    cls.__doc__ = (cls.__name__ + text_sig)

After:

lazy import inspect

class _AutoDocstring:
    def __get__(self, _obj, cls):
        # inspect가 필요한 시점에만 호출
        text_sig = str(inspect.signature(cls, ...))
        # ...
        return doc

_auto_docstring = _AutoDocstring()

# __doc__ 생성 로직을 descriptor로 대체
if not getattr(cls, '__doc__'):
    cls.__doc__ = _auto_docstring

_AutoDocstring이라는 비데이터 디스크립터를 사용하여, 클래스 정의 시점이 아닌 __doc__ 속성에 처음 접근할 때 inspect.signature를 호출하도록 변경했습니다.

2. `Lib/dataclasses.py`: `inspect.unwrap`의 지연 호출

슬롯(slots)이 있는 클래스에서 inspect.unwrap을 호출하는 경로 역시 최적화되었습니다.

Before:

member = inspect.unwrap(member)

After:

if not isinstance(member, type) and hasattr(member, '__wrapped__'):
    member = inspect.unwrap(member)

__wrapped__ 속성을 먼저 확인하여 inspect 모듈을 로드하지 않고도 언래핑이 필요한지 판단함으로써 불필요한 임포트를 방지합니다.

왜 이게 좋은가

성능 개선 수치

hyperfine을 이용한 벤치마크 결과, import dataclasses 실행 시간이 기존 약 15.4ms에서 11.0ms로 약 28% 감소했습니다. 특히 _colorize와 같이 dataclasses를 빈번하게 사용하는 모듈에서는 전체적인 모듈 로드 및 실행 속도에서 유의미한 이득을 보았습니다.

교훈

Lazy Import의 힘: 표준 라이브러리 내에서도 무거운 모듈 의존성을 지연시키면 초기 로딩 속도를 크게 개선할 수 있습니다.
Descriptor 활용: 클래스 속성 생성 시점에 비용이 큰 연산을 수행해야 한다면, 디스크립터를 사용하여 접근 시점까지 연산을 미루는 패턴이 효과적입니다.
코드의 가독성과 성능: inspect.unwrap 호출 전 속성 존재 여부를 확인하는 간단한 체크만으로도 불필요한 모듈 로드를 막을 수 있음을 보여줍니다.

리뷰어 피드백 분석

리뷰 과정에서 re 모듈의 Lazy Import와 관련된 논의가 있었으며, 이는 별도의 PR(#148379)로 분리되어 처리되었습니다. 또한, __doc__ 생성 시점에 ForwardRef가 올바르게 처리되지 않던 기존 버그가 디스크립터 도입으로 인해 자연스럽게 해결되는 부수적인 이점도 확인되었습니다.

참고 자료

⚠️ 알림: 이 분석은 AI가 실제 코드 diff를 기반으로 작성했습니다.

PR Analysis 의 다른글

이전글 [cpython] Python `subprocess` 테스트 최적화: `communicate()` 타임아웃 테스트 속도 향상
현재글 : [cpython] Python dataclasses 모듈의 성능 최적화: inspect 모듈의 Lazy Import 도입
다음글 [cpython] Python subprocess.communicate() 타임아웃 성능 개선: 느린 자식 프로세스 응답 방식 변경