구글 스프레드시트 - 중급편 (4) (중복되는 데이터 정리하기)
중복되는 데이터 정리하기
- UNIQUE 함수 이용하기
- SORT 함수 이용하기
아무도 알려주지 않아서 실무에서 혼자 맨땅에 헤딩하면서 습득한 내용을 다룹니다.
(최적화된 방법보다는 그냥 제가 할 줄 아는 방법을 다룬 것이라 이 블로그에 있는 방법이 가장 효율적인 방법은 아닐 수 있습니다!)
안녕하세요 데이빗입니다.
오늘은 중복되는 데이터를 보기 좋게 정리하는데 도움을 줄 수 있는 함수들에 대해 알아보도록 하겠습니다.
제가 이전 포스팅들에서 잘 모아진 로우 데이터(Raw Data)를 의미 있는 정보(Information)로 가공하는 것에 대한 언급을 몇 번 했는데, 이번 포스팅에서 알아볼 함수들 역시 이 로우 데이터(Raw Data)를 가공하는데 도움을 줄 수 있는 함수들이라고 할 수 있습니다.
지난 포스팅에서 VLOOKUP 함수와 INDEX-MATCH 함수에 대해 알아볼 때 사용했던 예제로, 1/4 분기동안 장을 본 기록을 예시로 들어보겠습니다.
구글 스프레드시트 예제 >> 링크
해당 데이터에서 물품은 총 몇 종류가 있을까요?
일일이 세어볼 수 있겠지만 귀찮은 작업이 될 것이고, 만약 1/4분기가 아니라 연간이라면, 그리고 실제 가계부라고 한다면 훨씬 많은 데이터가 있는 상황에서 수작업으로 확인하기는 정말 어려울 것입니다.
UNIQUE 함수 이용하기
이때 사용할 수 있는 함수가 UNIQUE 함수입니다.
먼저 UNIQUE 함수에 대한 정의부터 보도록 하겠습니다.
셀(Cell)에 '=UNIQUE('를 입력하면 아래와 같이 나옵니다.

사실 UNIQUE 함수 자체는 함수의 [선택사항] 부분을 이용하면 더 풍부하게 활용할 수 있지만 여기에서는 제가 주로 사용하는 방법으로 단일 열에 대해서 활용하는 것에 대해서만 다루도록 하겠습니다.
UNIQUE 함수는 범위 내의 데이터를 한 번씩만 불러오는 함수이며, 아래와 같이 단일 열을 범위로 잡을 경우, 해당 열에 있는 데이터를 확인하여, 중복 없이 한 번씩만 데이터를 불러오게 됩니다.
K열(Column)의 범례('물품')를 제외하고 K3부터 K92까지를 범위로 잡았을 때, 해당 범위 내에는 사과, 바나나, 대파, 애호박, 샤인머스켓이라는 물품명들이 여러 번 등장하지만, U열(Column)에서 한 번씩만 나타나는 것을 확인할 수 있습니다.
SORT 함수 이용하기
다음으로 이용할 수 있는 함수는 SORT 함수입니다.
셀(Cell)에 '=SORT('를 입력하면 아래와 같이 나옵니다.
SORT 함수 또한 UNIQUE 함수와 마찬가지로 [선택사항] 부분을 이용하면 더 풍부하게 활용할 수 있지만 마찬가지로 단일 열에 대해서 활용하는 것에 대해서만 다루도록 하겠습니다.
SORT 함수는 선택한 열을 오름차순 혹은 내림차순으로 정렬하는 함수입니다. (기본은 오름차순입니다.)
UNIQUE 함수로 한 번씩만 불러온 데이터를 범위로 하여 SORT 함수를 걸어주면 위와 같이 오름차순으로(가나다 순으로) 정리가 되는 것을 확인할 수 있습니다.
SORT 함수가 반드시 UNIQUE 함수와 함께 사용되어야 하는 것은 아니지만, 함께 사용할 때 데이터를 깔끔하게 정리할 수 있습니다.
특히 UNIQUE 함수가 무질서하게 산재해 있는 데이터들을 한 번씩만 불러오는 함수임을 감안할 때, SORT와 함께 유용하게 사용될 수 있다고 생각합니다.
물론, 아래와 같이 UNIQUE 함수와 SORT 함수를 동시에도 사용해 줄 수 있습니다.
이번 포스팅에서는 UNIQUE 함수와 SORT 함수에 대해 알아보았습니다.
다음 포스팅에서는 문자열을 더하고 나누는 방법에 대해 알아보도록 하겠습니다.