기본 콘텐츠로 건너뛰기

MIME 알아내기

POSIX 시스템에는 file이라는 명령이 있고, 이것은 주어진 파일을 가지고 타입을 알아낸다. 별다른 것은 없고, 타입마다 헤더나 테일에 매직필드를 미리 알고 있고, 이것을 파일에 대입해서 mime을 알아내는 것이다.

이미 libmagic이라는 API가 존재하며 사용법은 매우 간단하다.

#include <magic.h>
#include <stdio.h>

int main(int argc, char* argv[])
{
// 초기화
magic_t mt = magic_open(MAGIC_CONTINUE|MAGIC_ERROR|MAGIC_MIME);

// DB 읽기
magic_load(mt, NULL);

// 파일 검사
printf("%s\n", magic_file(mt, "SOD_AOI_SORA.AVI");

// 종료
magic_close(mt);
}

중간에 이상한게 보인다면 착각이다.

magic_open으로 적당히 핸들 얻고, magic_load로 DB를 로딩한 뒤부터 magic_file로 mime 문자열을 알아낸다. 물론 magic_file은 여러번 사용할 수 있다.

* 컴파일 할 때, 반드시 -lmagic 을 붙여 라이브러리 링크를 하도록 하자.
* 패키지 이름은 레드햇은 file-devel, 우분투는 libmagic-dev이다.


댓글

이 블로그의 인기 게시물

Bash Array, Map 정리

Bash에서 Array, Map에 대한 정리. (매번 찾기 귀찮) 찾아보진 않았지만, Bash에서 Array든 Map이든 동일하게 Map(C++에서 Unordered Map)으로 동작하는 것 같다. 왜냐하면, Array의 Index가 연속하지 않아도 동작한다. 그저 Key가 0 이상의 정수인 Map이랑 비슷하게 동작한다. 예) 1, 2, 3, 9, 10 Array # 생성 declare -a empty_array declare -a ar=(haha hoho baba "long string haha hoho") # 접근 echo "ar[0]=${ar[0]}" echo "all as array=${ar[@]}" # 큰따옴표 안에서 각 원소를 따로따로 전달한다. echo "all as one=${ar[*]}" # 큰따옴표 안에서 각 원소를 문자열 하나로 합쳐 전달한다. echo "indexes=${!ar[@]}" echo "indexes=${!ar[*]}" echo "length=${#ar[@]}" echo "length=${#ar[*]}" echo "last=${ar[-1]}" echo "last=${ar[@]: -1}" # 콜론 뒤에 빈 칸이 꼭 필요하다. 옛 방식 # 현재 상황 declare -p ar #(출력) declare -a ar=([0]="haha" [1]="hoho" [2]="baba" [3]="long string haha hoho") ar[100]=hello # 인덱스를 건너 뛰어도 동작한다. declare -p ar #(출력) declare -a ar=([0]="haha" [1]="hoho" [2]="baba" [3]=...

설치한 패키지에서 RPM 추출하기

오래된 패키지를 관리할 저장소가 없어졌고, 기존 패키지로 다른 서버를 세팅해야할 일이 생겼다면 RPM의 리패키지 기능을 이용해보자. $ rpm -e --repackage [PACKAGE_NAME] 위와 같이 리패키지하면, /var/spool/repackage/ 에 생성한 RPM파일이 있다. :-)