2007년 8월 8일 수요일

fork는 epoll에서 감시하는 객체까지 복제하지 않는다.

리눅스 서버에서 epoll을 이용해서 event를 감시하면서 동시에 fork할 때는 주의가 아주매우많이 필요하다. 커널 소스를 직접 들여다 봐야하겠지만, 대략 시간이 없고 귀찮은 관계로 생략한다. 결론부터 말하자만 epoll_fd로 관리하는 감시할 이벤트 목록은 커널영역에 만들어지며, fork가 이를 복제하지 않기 때문에 부모 자식 간에 동일한 epoll_fd로 목록을 수정하면 인생 종치는거다. 자자... 말이 길었다. 대충 소스를 보도록 하자.
#include <sys/epoll.h>
#include <stdio.h>
#include <stdlib.h>
#include <string.h>

int
main(int argc,char* argv[])
{
        const size_t epoll_size(1024);

        int epoll_fd = epoll_create(epoll_size);
        struct epoll_event ev;
        memset(&ev, 0, sizeof(ev));
        ev.events = EPOLLIN;

        epoll_ctl(epoll_fd, EPOLL_CTL_ADD, 0, &ev);
        printf("%s\n", strerror(errno));

        if (!fork())
        {
                //epoll_ctl(epoll_fd, EPOLL_CTL_DEL, 0, &ev); // 여기 주목!
                close(epoll_fd);
                return 0;
        }

        sleep(1);

        struct epoll_event evs[epoll_size];
        int res = epoll_wait(epoll_fd, evs, epoll_size, 1000);
        printf("%s/res=%d\n", strerror(errno), res);
        return 0;
}
위에서 epoll_create로 epoll객체를 만들고, 여기에 표준입력(fd번호 0)을 감시하도록 epoll_ctl로 목록에 추가하였다. 이것을 실행하면 Success가 처음 뜨는데 이때 아무키나 잽싸게 눌러보자. 조금 뒤에 Success/res=1이라고 뜰 것이다. 표준입력으로부터 뭔가 입력 이벤트가 발생했다는 것이다. 여기서 알 수 있는 사실은 자식 프로세스에서 epoll객체를 close해도 부모 프로세스에서 영향을 받지 않는다는 것이다. 이것은 epoll_fd가 커널 내부에서 레퍼런스 카운팅을 하고 있을 것으로 추측할 수 있다. 역시나 커널 소스는 가볍게 생략한다. (귀찮아)

자, 위 소스에서 '여기 주목!'이라고 쓰여진 줄에 맨 앞 주석 기호를 없애고 컴파일하고 위와 동일한 방법으로 실험해보자. 실행하고 잽싸게 아무키나 누르면 Success/res=0이라고 뜰 것이다. 이것으로 자식 프로세스에서 epoll_fd를 통해 목록을 조작하면, 부모 프로세스에서도 동일한 커널 객체를 보기 때문에 영향을 받는다는 사실을 알아낼 수 있으며, 이는 fork를 통해 epoll이 감시하고 있는 이벤트 목록까지 복제하지 않는다는 사실을 유추할 수 있다. 물론 제대로 증명하려면 커널 소스 분석해야지만, 역시나 귀찮다.

결론은 버킹검이 아니라, epoll객체와 fork를 함께 쓸 때는 주의해서 써야한다는 것이다.

* 참고로 FreeBSD/kqueue는 kqueue_fd마저도 복제를 하는 듯 하다. (참고: Kqueue Programming) 그래서 fork하고 이벤트 목록 건들여도 부모 자식간에 아무런 상관 관계가 없다. 실험해봤는데 예상대로이며 생략한다.
* select, poll은 유저레벨에서 이벤트를 관리하기 때문에 fork하면 당연히 부모자식간에 완전히 독립된 목록을 가지고 있는다.