한국언론진흥재단은 데이터저널리즘을 지원하기 위한 ‘빅 카인즈(BIG Kinds)’분석 시스템을 오는 3월쯤 선보일 예정이라고 19일 밝혔다.
빅 카인즈는 언론재단 뉴스 아카이브 ‘카인즈’에 축적된 60개 언론사의 20년 치 뉴스DB를 빅데이터 분석기술과 접목시켜 유의미한 자료를 검색할 수 있는 분석시스템이다.
빅 카인즈는 일반인용과 언론인용으로 나뉜다. 언론인용 빅 카인즈의 특징은 시소러스(정보 검색을 위해 컴퓨터에 기억된 용어 사전) 기반의 뉴스 검색이나 정의한 패턴으로 뉴스 내에서 메타정보를 추출하고 시각화해 기사 작성 등에 활용할 수 있다는 점이다.
특히 텍사노미(분류 체계)를 활용한 검색질의가 가능할 뿐 아니라 뉴스 텍스트 내 정보 추출하기 위한 패턴 정의 기능이 가미된 게 장점이다.
이를 통해 특정 시기의 기사를 바탕으로 주요 키워드 트렌드를 알 수 있고, 기사 내 인용문구만 따로 뽑아낼 수 있는 ‘인용문 검색’기능도 들어 있다.
또 검색어에 포함된 뉴스를 분석해 인물·장소·기관의 네트워크를 구성, 주요 개체 간 연계성을 한눈에 볼 수 있다.
언론재단 뉴스 빅데이터를 활용한 보도물 제작연구 사업자로 선정된 동아일보 노지현 기자는 “2010년부터 데이터저널리즘에 대한 얘기가 나왔지만 잘못된 이해로 지역별·연령별로 순위를 매기는 기사가 한 때 유행했다”며 “빅 카인즈가 더 정교하고 세분화되면 기자들에겐 좋은 무기가 될 것 같다”고 말했다.