기본 콘텐츠로 건너뛰기

Java8 Stream List to Map

느린 GNU std::string

신이 내린 축복이라 생각했던 std::string. 삭막하던 C/C++에 string이란 타입을 선사해주신 SGI에게 감사하고 있었다. 가변길이 string. 생각만 해도 아힝~*이 절로 나온다.

그러나...

씨밤. 상당히 평범한 상황에서 그냥 char[]을 쓰는 것보다 느리다. 그도 그럴 것이, assign에서 Allocator를 돌리기 때문이다. 예를 보자.

void
testChar(const char* data)
{
    char field[10][1024+1];
    // data를 ' '로 파싱해서 field에 strncpy함. (귀찮아서 패스)
}

void
testString(const char* data)
{
    string field[10];
    // data를 ' '로 파싱해서 field에 assign(ptr+pos, length)함. (귀찮아서 패스)
}

뭐, 대충 이런 코드가 있다고 치자. 위 함수들을 상당히 큰 수만큼 돌렸다고 치자. 퍼포먼스는 얼마 정도 될까? 자료를 전부 공개할 수 없다는 점은 대충 이해하시라. (아니면 만들어서 돌려보시던가) 약 3.5배 정도 string이 느리다. 그도 그럴 것이 char는 (1024+1)*10을 미리 stack에 잡아놓고 call을 호출한다. 그러나 string은 string이라는 instance만 stack에 쌓여 있고, 실제 메모리는 data를 파싱하여 assign하는 동안 내부적으로 new(malloc)을 호출하여 heap에 메모리 덩어리를 할당받는다. 이게 위에서 stack 지랄하는 것보다 훨씬 느리다. testString에서 for문을 하나 더 넣어서 파싱하기 전에 field에 reserve(1024+1)을 하면 빨라질까? 아쉽게도 더 느려진다. 실험에서는 거의 2배가 넘게 느려졌다.

안습인데?! -_-

더욱 날 경악케 하는 것은 string[] 대신에 vector<string>에 push_back을 했을 경우는 string[]에 비해 2배가 조금 못 되게 느려졌다. (당연하겠지만!)

... 그래도 난 std::string을 사랑한다. 어흑!

댓글

이 블로그의 인기 게시물

Bash Array, Map 정리

Bash에서 Array, Map에 대한 정리. (매번 찾기 귀찮) 찾아보진 않았지만, Bash에서 Array든 Map이든 동일하게 Map(C++에서 Unordered Map)으로 동작하는 것 같다. 왜냐하면, Array의 Index가 연속하지 않아도 동작한다. 그저 Key가 0 이상의 정수인 Map이랑 비슷하게 동작한다. 예) 1, 2, 3, 9, 10 Array # 생성 declare -a empty_array declare -a ar=(haha hoho baba "long string haha hoho") # 접근 echo "ar[0]=${ar[0]}" echo "all as array=${ar[@]}" # 큰따옴표 안에서 각 원소를 따로따로 전달한다. echo "all as one=${ar[*]}" # 큰따옴표 안에서 각 원소를 문자열 하나로 합쳐 전달한다. echo "indexes=${!ar[@]}" echo "indexes=${!ar[*]}" echo "length=${#ar[@]}" echo "length=${#ar[*]}" echo "last=${ar[-1]}" echo "last=${ar[@]: -1}" # 콜론 뒤에 빈 칸이 꼭 필요하다. 옛 방식 # 현재 상황 declare -p ar #(출력) declare -a ar=([0]="haha" [1]="hoho" [2]="baba" [3]="long string haha hoho") ar[100]=hello # 인덱스를 건너 뛰어도 동작한다. declare -p ar #(출력) declare -a ar=([0]="haha" [1]="hoho" [2]="baba" [3]=&

Linux에서 find결과를 시간 순서대로 정렬하기

때때로 어떤 디렉토리 내용을 수정시간 순서(보통 역순)대로 정렬할 필요가 있다. 그럴 때 사용할 수 있는 옵션이 -printf 옵션이다. %T+는 마지막 수정시간을 YYYY-MM-DD+HH:MM:SS.ssssssssss 형태로 출력한다. 참조: https://man7.org/linux/man-pages/man1/find.1.html find /path/something/ -mindepth 1 -maxdepth 1 -type d \ -name 'myapp-*' -printf "%T+\t%p\n" | \ sort -r | awk -F'\t' '{print $2}'