1. 내용
페이스북 AI와 미시간주립대학교(Michigan State University, MSU)는 공동연구를 통해 딥 페이크(deep fake)를 탐지하는 플랫폼과 방법을 지난 6월 16일(현지시간)에 제시했습니다. 딥 페이크를 논하는 현재의 방법은 이미지의 딥 페이크 조작 여부, 학습 중에 본 모델에 의해 이미지가 생성되었는지 여부 등을 확인하는 데 초점을 맞추고 있습니다. 이는 클로즈셋(close-set) 분류를 통한 이미지 속성이라고도 하는데, 딥 페이크 확산 문제를 해결하기 위해선 한 단계 더 논의를 진행해야 하고, 학습 중에 존재하는 제한된 모델 세트를 넘어 이미지 속성을 확장하는 방법을 이해하기 위해 노력해야 합니다. 즉, 학습에서 볼 수 없는 생성 모델을 이용해 딥 페이크를 만들 수 있기 때문에 클로즈셋 된 이미지 속성을 넘어서는 것이 중요하다는 것을 의미합니다.
딥 페이크 문제에 접근하는 다른 방법은 리버스 엔지니어링을 이용한 방법, CPU 및 메모리 사용과 같은 하드웨어 정보를 모델 간섭 중에 사용할 수 있다고 가정하는 방법 등이 있지만, 이 두 가지 접근 방식은 기존 지식에 의존하기 때문에 실제 사례에서 사용성이 제한되기도 한다고 합니다.
이런 상황에서 페이스북 AI는 지문 추정 네트워크(Fingerprint Estimation Network, FEN)를 통해 딥 페이크 생성 모델이 남긴 일종의 지문에 대한 세부 정보를 추정하는 작동 원리를 적용한 리버스 엔지니어링을 사용합니다. 이는 단일 딥 페이크 이미지를 생성하는 데 사용된 AI 모델의 고유 패턴, 사용된 모델의 속성, 딥 페이크 모음의 패턴들 사이에서 유사점 추적을 통해 하나의 소스에서 유래했는지 등 근본적인 더 많은 정보 추론이 가능하게 합니다.
한편, 미시간주립대는 연구에 사용된 모든 가짜 얼굴 이미지를 생성, 리버스 엔지니어링 프로세스에 대한 모든 실험 수행 등을 맡았다고 합니다. 그리고 사용된 데이터 세트, 코드 및 훈련된 모델을 더 많은 연구 및 개발자 커뮤니티에 오픈 소스로 공개한 상태입니다.
2. 고찰
우선 이 기사를 접했을 때 생각보다 이해하기 어려운 용어와 내용들이 많다고 느꼈습니다. 파이썬과 머신러닝에 대해 독학을 짧게나마 해보면서 조금은 자신감을 가졌는데, 최근 현대자동차 공모전을 경험해보고, 이 기사까지 접하면서 내가 배웠던 것은 정말 시작 단계에 불과한 부분이라는 것을 여실히 느꼈습니다. 특히, 공모전을 경험하면서 아직 실제 생활, 현실적인 프로젝트에 투입하기에는 많이 부족하다는 것을 알았고, 우리가 흔히 기사나 커뮤니티, 영상 등을 통해 접하는 인공지능과 머신러닝은 그보다 높은 단계에 있는 지식인 것 같았습니다. 이 기사의 경우에도 데이터 세트, 코드, 모델 등 아주 기초적인 단어 외에는 리버스 엔지니어링이라던가 클로즈셋 등의 용어는 잘 이해하지 못했습니다. 그저 어떤 흐름과 방식인지 파악이 가능했으며, 계속해서 인공지능에 관심을 갖고 발전하는 개발자가 되기 위해서는 더 많은 공부의 필요성을 느꼈습니다.
그리고 개인적인 고민을 떠나서 이 기사 자체에 집중하자면, 우선 딥 페이크 문제에 대해 페이스북 AI 또한 많은 노력과 연구를 하고 있다는 것을 알았습니다. 특히, 구체적인 알고리즘과 흐름까지는 정확히 이해하지 못했지만 특정 딥 페이크 생성 모델로 인해 생성된 결과물에는 그 모델마다 어쩔 수 없이 발생하는 결함, 결측치 등을 일종의 디지털 지문으로 정의하고, 이로부터 거꾸로 해당 모델에 대한 정보와 속성을 파악하는 기술은 보다 근본적인 문제 해결 방안이라는 생각이 들었습니다. 예를 들면, 범죄 현장에서 피해자의 상처와 사망 여부만을 파악하는 것에 그치지 않고, 이를 통해 범인의 범죄 동기와 범죄에 사용한 흉기 등까지 파악하는 것은 매우 중요한 것처럼, 페이스북 AI의 연구와 발전된 플랫폼, 코드를 통해 딥 페이크 악용 문제를 보다 근본적으로 해결하는 것에 대한 기대를 하게 됩니다.
3. 출처 및 오픈소스
1) 출처:
http://www.aitimes.kr/news/articleView.html?idxno=21387
2) 오픈소스:
'SW, IT 이슈 > 스크랩(Scrap)' 카테고리의 다른 글
[스크랩] 포스트 모바일 게임, '클라우드 게임' (0) | 2021.07.13 |
---|---|
[스크랩] 네이버 D2SF, AR 커머스·동영상 반도체 스타트업 2곳에 투자 (0) | 2021.06.23 |
[스크랩] 당근마켓, 벼룩시장, 네이버, '지역밀착사업' 쟁탈전 시작됐다 (0) | 2021.06.20 |
[스크랩] 화웨이, GPT-3 넘는 최대 2,000억 개의 매개변수 포함한 초거대 언어 AI 모델 '판구 알파(PanGu Alpha)' 공개 (0) | 2021.06.16 |
[스크랩] 네이버랩스, 도시 단위 '디지털 트윈' 구축하는 '어라이크' 솔루션 공개 (0) | 2021.06.15 |