"AI 기업, 언론과 뉴스생태계 고민·기술협력해야"

'생성형 AI 시대 뉴스 저작권 보호방안'
신문협회·언론재단 토론회

  • 페이스북
  • 트위치

“세계적으로 혼란한 상황 속에서 우리가 먼저 기준과 원칙을 마련해보자. (AI 학습 데이터 비용으로) 얼마를 책정하자는 게 아니다. 올바른 차원을 마련하는 기준을 언론사와 AI 기업이 같이 고민해야 된다.”


강종구 한국일보 미디어전략부 기자는 지난 13일 한국신문협회와 한국언론진흥재단이 주최한 ‘생성형 AI 시대 뉴스 저작권 보호방안’ 토론회에서 언론사와 AI 기업 간 협력이 필수적인 시기임을 강조하며 이같이 밝혔다. 토론자로 참석한 그는 그간 포털의 검색기반 비즈니스모델, 언론사들의 디지털 수익구조 및 이용자 뉴스소비 방식을 송두리째 바꿀 기술로 생성형 AI를 바라보며 “AI기업들은 지금까지처럼 언론사와 협력을 단순히 콘텐츠를 구입한다는 식으로 생각해선 안 된다”고 말했다.

한국신문협회와 한국언론진흥재단이 주최한 '생성형 AI 시대 뉴스 저작권 보호방안' 토론회가 지난 13일 서울 중구 한국프레스센터에서 개최됐다. 사진은 토론자와 발제자로 참석한 (왼쪽부터) 강종구 한국일보 미디어전략부 기자, 박대민 선문대 미디어커뮤니케이션학부 교수, 이성규 미디어스피어 대표, 좌장 배정근 숙명여대 미디어학부 교수, 이대희 고려대 법학전문대 교수, 김찬동 한국저작권위원회 법제연구팀장, 양진영 법무법인 민후 변호사 등의 모습.


20여년 전 포털뉴스 출범 당시 이 서비스가 국내 언론, 나아가 디지털 뉴스 생태계 전반에 미칠 영향은 고민되지 못했다. 특히 공공재적 성격의 뉴스를 함께 선보이는 파트너 관계로서 포털과 언론사 간 협업은 일천했다. 새 국면에 맞는 파트너십으로서 강 기자는 “뉴스 콘텐츠를 활용한 서비스나 솔루션, AI 모델은 저널리즘 생태계에 기여해야 된다”는 원칙 공유를 강조하며 비용지불 차원을 넘어 “전면적 기술협력이 동반돼야 한다”고 언급했다. 또 “전재료와 별개로 생성형 AI 서비스 ‘콜’ 횟수에 따라 피(fee)를 추가로 주는 방식” 등을 예로 들며 뉴스가치 산정방법도 변해야 한다고 제안했다.


이날 두 번째 발제 ‘AI 기업과 언론의 상생을 위한 협력 방안’에서도 협업 방식에 대한 제언이 나왔다. 챗GPT 개발사 오픈AI와 협업한 AP통신, 미국 지역뉴스 지원 목적의 단체 아메리칸저널리즘프로젝트 사례가 제시됐다. 뉴스 데이터 일부를 AI 학습에 지원하고 대신 펀딩과 뉴스룸 자동화 관련 기술지원 등을 받는다. 특정 언어모델의 시장 확대지원 및 마케팅 협조란 명분 아래 AI 기업과 콘텐츠-기술 파트너십에 대한 포괄적 보상을 거래한다는 아이디어이지만 국내에선 소수 매체만 협상 여지가 있다.


해외 개발사에 뒤처진 국내 AI 기업의 취약점을 지렛대 삼은 ‘집단 딜’ 방식도 거론됐다. 해외 언어모델 크롤러를 집단 차단해 국내 시장우위 여건을 주고 언론단체, 협회 등을 중심으로 계약하는 방안이다. 해외 생성형 AI는 텍스트를 넘어 멀티모달 단계로 나아가고 있고 국내 AI기업도 그렇게 갈 수밖에 없는 상황에서 언론사 내 이미지와 영상을 텍스트와 쌍으로 묶어 포괄적 데이터 협상을 하는 방법도 언급됐다.


발제자 이성규 미디어스피어 대표는 ‘집단 딜’ 방식 등과 관련해 “제한된 데이터를 제한된 모델에만 특정 기간에 사용하는 조건에서 협의해야지 과거처럼 모든 걸 풀로 다 내주고 모든 모델이 학습데이터를 사용하게 하는 접근은 앞으로 해선 안된다”고 지적했다. 그러면서 “AP의 사례 등은 구글이나 페이스북 행보에서 보듯, 빅테크는 이해가 맞지 않으면 언제든 지원을 끊을 수 있다는 맥락에서 현명하게 접근해야 한다. 결국 언론사들이 더 영리해져야 한다”고 덧붙였다.


협업 필요성이 시사됐지만 영미권에선 AI기업과 언론 간 긴장관계가 이어지고, 국내에서도 법적 분쟁 소지는 열려 있다. 실제 이날 토론에선 국내 ‘네이버 뉴스 콘텐츠제휴 약관’을 두고 지적이 나오기도 했다. 발제자 이대희 고려대 법학전문대학원 교수는 “현재 약관의 목적·정의 규정 등에 따르면 이는 뉴스 공급과 관련이 있지 AI 개발에 적용하긴 어려워 보인다. 학습 데이터 사용이 중요사항이었다면 사용자(포털)는 설명의무를 지는데 이뤄졌는지도 따져봐야 한다”며 “약관, 제8조3항이 무효가 된다면 저작권 침해가 될 테고, 네이버 측에선 학습 데이터 사용에 정당한 근거를 찾는 게 숙제가 된다. 결국 ‘공정이용’ 여부가 본격 전장이 될 것으로 보인다”고 했다.


다만 이날 첫 번째 발제 ‘AI 시대 뉴스 저작권 보호를 위한 법·제도적 방안’에서 소개됐듯, 한국과 유사한 저작권법 체계의 미국 내 생성형 AI 관련 다수 소송 사례, 양측의 입장 등에 비춰볼 때 ‘공정이용’은 매우 첨예한 지점이다. 입법 논의도 잇따르며 “사상이나 감정 향유가 아닌 경우” “필요 한도”에서 “적법 접근”한 경우 저작물 복제·전송을 인정한 저작권법(도종환 의원), ‘대학, 연구기관 또는 대통령령으로 정한 단체’, ‘비상업적 목적’, ‘적법 접근’ 등을 AI 학습 데이터 활용 시 공정이용 요건으로 본 법률안(이인영 의원) 등도 발의된 상태다. 어느 쪽도 ‘승소’를 자신할 수 없고, 입법 여부나 정부 정책방향을 단언할 수 없는 현재, 적극적인 파트너십 구축이 더 이득이 될 수 있다는 고민을 양쪽이 해볼 만하다.


토론자 박대민 선문대 교수는 “이미 AI 모델이 학습할 텍스트가 부족하다는 연구가 나온다. 퀄리티가 보장된 텍스트가 없다는 뜻인데 전문 미디어 생산자들의 콘텐츠를 제외하긴 쉽지 않다”며 “현 상황은 마치 철광석(언론사 원천데이터) 없이 강판을, 자동차를 만든다는 얘기고, 공정이용이라기엔 상업적 사용 사례가 너무 많은데 언론사들로선 침해 사실을 보여줄 계기도 된다. 데이터 퀄리티를 높이고 거래를 일으키기 위해 언론사의 준비도 필요한 시점”이라고 했다.

최승영 기자의 전체기사 보기

배너

많이 읽은 기사