최근 한 글로벌 빅테크 기업이 대한민국 언론사들을 대상으로 인공지능(AI) 도구 개발지원 프로그램을 준비하고 있다. 6주 온라인 교육, 이틀 워크샵, 15개월 실험 및 도입으로 구성된 이 프로그램은 AI 전환에 어려움을 겪는 언론사들에게 유용한 제안임이 틀림없다. 자사의 클라우드 기술 지원과 업무 협업 도구 라이선스까지 제공하겠다니, 잘만 활용한다면 언론사의 AI 경쟁력을 강화하는 기회가 될 수 있다.
그러나 참여 조건을 꼼꼼히 들여다보면 고민이 깊어진다. 의무사항 가운데 한 항목이 눈에 걸린다. “파트너사는 해당 기업의 AI 학습용 봇을 포함하여 자사 크롤러들이 매체사의 콘텐츠에 접근할 수 있도록 허용한다.” 이 조항에 동의하는 순간, 언론사는 자사의 콘텐츠를 해당 기업의 AI 훈련에 제공하는 셈이 된다. 세계 곳곳에서 언론사들이 무단 AI 학습에 맞서 소송을 벌이는 지금, 프로그램 참여의 대가로 스스로 그 문을 열어두는 조항에 서명하는 것이 자사의 중장기 콘텐츠 전략과 충돌하지는 않는지 충분히 검토해야 한다. 제공받는 기술 지원의 가치와 오랜 시간 축적한 콘텐츠 자산을 AI 학습 데이터로 내어주는 것의 가치가 과연 등가인지 면밀히 따져봐야 할 것이다.
언론산업이 자체적으로 AI 경쟁력을 강화할 수는 없을까? 최근 언론산업 안팎에서 하나의 조용한 흐름이 감지된다. 언론사들이 자체 개발한 AI 도구를 오픈소스로 개방하려는 움직임이다. 세계뉴스미디어협회(INMA)의 조디 홉퍼튼이 지적했듯, 지금 전 세계 언론사들은 같은 문제를 풀기 위해 비슷한 도구를 각자 만들고 있다. 뉴욕타임스도, 월스트리트저널도 유사한 AI 파이프라인을 독립적으로 구축하고 있다. 이 중복 투자의 낭비를 줄이고 산업 전체의 AI 전환 속도를 높이기 위해 ‘공유 인프라’로 전환하자는 주장이 설득력을 얻고 있다. AI 도구와 데이터를 공유하려는 ‘오픈 저널리즘 프로젝트’나 스칸디나비아 최대 미디어 그룹 십스테드가 자사의 텍스트-투-비디오 툴을 오픈소스로 공개한 것도 같은 맥락이다.
IT산업은 이 교훈을 일찍이 체득했다. 리눅스, 쿠버네티스, 리액트는 오픈소스를 통해 비용을 낮추고 표준을 정립하는 동시에 생태계를 키웠다. 핵심 코드를 개방하자 경쟁의 무게중심이 코드 자체에서 그것을 둘러싼 생태계로 이동했다. 기사 요약 엔진, 자동 태깅 시스템, 뉴스 형식 변환 도구는 언론의 본질적 경쟁력과 거리가 있다. 이 범용 레이어를 업계가 함께 공유하고, 아낀 자원을 저널리즘 자체에 집중하는 것이 훨씬 현명한 선택이다.
이를 위해서는 먼저 오해 하나를 걷어내야 한다. AI 도구를 공유한다고 모든 언론사가 곧바로 동등한 역량을 갖추는 것은 아니다. 도구의 성능은 결국 그것에 공급되는 데이터의 질과 구조에 달려 있다. 수십 년간 쌓인 기사가 어떻게 분류되어 있는지, 독자 행동 데이터가 어떻게 관리되는지, 편집 기준이 AI 워크플로우에 어떻게 반영되는지가 실질적인 격차를 만든다. 오픈소스 도구를 받아 들고도 자사 데이터 구조와 편집 현장에 녹여내지 못하면 그림의 떡에 불과하다. 이는 역설적으로 공유 전략의 정당성을 강화한다. 도구를 나눠도 데이터 내재화 역량의 차이가 경쟁의 진짜 변수로 남기 때문이다. 도구는 공유해도 노하우는 각자 쌓인다.
결국 언론이 지금 해야 할 일은 시각을 바꾸는 것이다. AI 도구를 독점적 자산으로 쌓아두는 전략에서, 도구는 함께 만들되 저널리즘으로 싸우는 전략으로 전환해야 한다. 업계가 기반 기술을 공유하고 확장된 생태계를 바탕으로 플랫폼과의 관계를 공동으로 설계할 때, 비로소 대등한 협상 테이블이 만들어진다. 플랫폼 기업이 내미는 손을 무조건 거부하자는 것이 아니다. 그 손이 무엇을 요구하는지 명확히 보고, 협상력을 갖추고 마주해야 한다는 것이다. 협상력은 언론사 각자가 고립적으로 AI 도구를 만들어서는 생기지 않는다. 특종의 속도, 취재의 깊이, 독자와의 신뢰 등은 오픈소스로 나눌 수 없는, 언론이 끝까지 지켜야 할 진짜 자산이다.
이현우 한국언론진흥재단 선임연구위원의 전체기사 보기Copyright @2004 한국기자협회. All rights reserved.