실시간 뉴스



네이버 "지난 종이신문 온라인에서 보세요"


'디지털 뉴스 아카이브' 30일 공개

다음커뮤니케이션이 전 '국토'를 스캔하는 동안 네이버는 10년치 '신문'을 스캔했다.

NHN(대표 김상헌)의 인터넷 포털 네이버는 29일 오전 광화문 프레스센터에서 간담회를 열고 과거 신문기사를 웹에 되살린 '디지털 뉴스 아카이브(dna.naver.com)'를 선보였다.

네이버가 2년여에 걸쳐 준비한 디지털 뉴스 아카이브는 종이 신문을 디지털화 해 웹 브라우저에서 원본 그대로 제공하는 서비스로 오는 30일부터 이용자들에 공개된다.

네이버는 경향신문, 동아일보, 매일경제 등 세 매체의 1976년부터 1985년까지의 기록을 구축했다. 정식 서비스에서는 이 언론사들의 1920년부터 1999년까지 80년 간의 기사를 제공할 계획이다.

그간 몇몇 언론사가 종이 신문을 스캔해 데이터베이스(DB)를 쌓은 적은 있었지만, 디지털 뉴스 아카이브는 단순히 이미지를 제공하는데 그치지 않고 기사의 모든 텍스트를 검색해 볼 수 있도록 만든 것이 특징이라고 네이버 측이 밝혔다.

이용자가 원하는 검색어를 입력해 과거 신문 지면 편집 그대로 정보를 파악할 수 있도록 한 것. 가령 '박정희' 키워드를 1면으로 설정해 검색하면 3개 신문의 1면에 '박정희'에 해당되는 기사들을 제공하는 식이다.

네이버는 이를 위해 3개 신문 12만면의 텍스트를 광학식문자판독기(optical character reader, OCR)를 통해 추출했다. 이 텍스트를 기사, 광고, 소설, 만평 등 신문을 구성하는 17가지의 요소별로 분류해 시간별, 분야별로 쉽게 기사를 찾아보는 환경을 만들었다.

원본 이미지 해상도(DPI)는 뉴욕타임스와 가디언의 100, 300 DPI보다 높은 400 DPI이다. 네이버는 현재 600명 이상의 인력을 투입해 총 53만면, 285만개의 기사에 대한 디지타이징 작업을 진행 중이다.

NHN 홍은택 미디어&편집그룹장(이사)은 "신문은 시대적 가치를 반영하는 사회의 축소판이자 역사 자료로서도 매우 가치 있는 콘텐츠"라며 "숨어 있던 과거의 정보를 온라인 공간에 되살려 세대가 함께 과거와 현재의 시대적 가치를 공유하고 소통할 수 있는 계기가 되기를 바란다"고 말했다.

다음은 홍은택 이사와의 일문일답.

- 네이버 초기 검색 화면에서는 어디에 위치하는지.

"현재 뉴스 박스에는 '뉴스홈' '경제' '스포츠' '연예' 등 네개 메뉴가 있는데 연예를 빼고 그 자리에 '과거기사'로 들어간다."

- 네이버 검색과 어떻게 연동시킬 것인가.

"통합검색에 '과거기사 콜렉션'이라는 형태로 붙일 수도 있을 것이다. 최신 뉴스와의 연계는 고려하고 있지 않다."

- 상세검색은 왜 로그인을 해야만 이용할 수 있나. 유료화를 위한 단계인지.

"이 서비스의 또다른 목적은 언론사에 정당한 콘텐츠 대가를 지불하는 것이다. 이용자 로그인을 통한 이용 패턴 데이터가 유료화를 위한 참고자료가 될 수 있을 것이다. 그러나 지금은 유료화에 대해 확정된 것은 없다. 폭발적인 트래픽을 유도하는 서비스는 아니기 때문에 B2B 모델로 가능할 것도 같다."

- 방대한 기사 텍스트는 어떻게 구축했는지.

"3개 신문 12만면의 텍스트를 광학식문자판독기(optical character reader, OCR)를 통해 추출했다. 이 방식은 1만자 중 5자 정도 오류율을 보여 틀린 글자는 일일이 수작업을 통해 정정했다."

- 왜 경향, 동아, 매경 3개사인가. 추가로 타사와 구축할 계획은.

"제휴에만 8개월이 걸렸다. 제안을 넣었는데 잘 안 됐다. 3사가 우선 협상순위였던 이유는 훌륭한 역사를 가지고 있다고 판단해서다. 세 회사만으로도 올해 뉴스 서비스 가용 재원이 바닥났다. 돈 많이 쓴다고 욕먹었다.(웃음)"

- 과거 신문에서 개인정보를 표시하는 방식은 지금과 많이 다른데. 프라이버시 침해 문제가 예상된다.

"뉴스 저작권은 언론사가 가지고 있기 때문에 DB 제작사인 우리가 쉽게 판단할 수 있는 문제가 아니다. 언론사와의 핫라인을 구축해 문제가 될 시 요청이 오면 블라인드 처리를 할 계획이다."

정병묵기자 honnezo@inews24.com







alert

댓글 쓰기 제목 네이버 "지난 종이신문 온라인에서 보세요"

댓글-

첫 번째 댓글을 작성해 보세요.

로딩중
포토뉴스