[한입 IT] #01. 넷플릭스 영화는 전부 한곳에 저장되어 있을까?

블로그에 일 얘기는 정말 안 쓰려고 했어. 일이 싫다기보다는 고등학교때부터 벌써 10년간 네이버…m.blog.naver.com

넷플릭스 영화는 다 한곳에 저장되어 있을까?

여러분 소리바다… 기억나시나요? 소리바다의 첫 번째 버전은 P2P였습니다. Person to person, 즉 타인의 PC 하드디스크에 있는 그 음악을 자신의 PC에 복사해 오는 방식입니다. 트렌트가 위험한 이유도 바로 이 때문입니다. 다른 사람의 디스크 조각을 복사해 오는 것이기 때문에, 그 파일에 바이러스가 있으면 그 바이러스 조각도 함께 따라올 것입니다. 그러니까 세상에 공짜는 없다는 거네요… 파일도 사람처럼 좋은 게 오면 나쁜 것도 같이 오나 봐요.하하.

소리바다의 두 번째 버전이 우리가 좀 더 익숙한 방식입니다. 멜론, 지니 등 음악 스트리밍 사이트에서는 해당 음악 파일이 저장된 서버에서 일괄 다운로드하는 방식입니다. 그리고 오늘 말씀드릴 넷플릭스도 비슷한 방식을 사용합니다.

데이터는 이용되는 frequency에 따라 Hot data와 Cold data로 나뉘는데 콜드 데이터는 감각적으로도 알 수 있듯이 잘 사용하지 않는 데이터를 말합니다. 예를들면우리가고객센터에전화를할때나오는댓글이있죠. “그 통화 내용은 1년 동안 보관할 수 있고~~” 이 댓글! 그래서 우리 통화 내용은 실제로 저장이 되고 콜센터가 스토리지를 많이 구입하는 곳이기도 합니다.

하지만 수많은 고객 중 실제로 컴플레인을 걸고 해당 통화 녹음본을 다시 들어야 하는 경우는 글쎄요… 100명 중 1명꼴이겠죠. 그래서 이 데이터는 한번 write가 되면 read가 많이 발생하지 않습니다. 하지만 규정상 바로 삭제할 수는 없기 때문에 저장은 해두셔야 합니다. 이런 것을 콜드 데이터라고 합니다.

넷플릭스와 왓챠가 ‘지금 인기 있는 콘텐츠’, ‘오늘날 한국 Top10 콘텐츠’ 등 현재 가장 인기 있는 스트리밍 작품을 상단에 보여주는 것은 물론 시청자들의 눈과 클릭을 사로잡기 위한 전략이기도 합니다. 그러나, 그 외에도 IT관리자의 측면에서 「Hot data」를 관리하기 쉬운 방법이기도 하지 않을까 생각합니다.

현재 가장 스트리밍되는 영상을 All Flash 등 성능이 좋은 디스크로 구성된 스토리지에 저장해 레드가 자주 발생하는 트래픽을 견딜 수 있는 환경을 만들어 놓는 것입니다. 또한 넷플릭스처럼 양이 많은 회사는 고가의 디스크가 아닌 테이프에 파일을 저장하고 있을 가능성도 높습니다.

error: Content is protected !!