주요 기술
빅데이터 검색 엔진
특정 온라인 채널이 아닌 뉴스, 커뮤니티, 카페, 블로그, SNS, RSS 등 다양한 채널에서 생성되고 있는 빅데이터를 수집합니다. 방대한 데이터는 분석 목적과 용도에 맞춰 관계형 데이터베이스와 NoSQL 데이터베이스에 저장됩니다.
자연어 처리 기술
자연어 형태소 사전 구축하고 있으며 기계 학습을 통한 신조어들을 보유하고 있습니다. 확률 기반 감성 분석, 조건부 기반 형태소 분석 기술을 통해 자연어 분석을 수행합니다 (동명이인, 동음이의어 구분, 문법 오류 처리).
데이터 마이닝 기술
유사 패턴 매칭을 통해 주요 정보를 군집화하고 추출합니다. 주제어 추출, 연관 키워드, 서술어 추출을 이용하여 데이터를 분류하고 정제합니다.
지표 기반 보고서 생성
브랜드 상태를 요약할 수 있는 각종 지표 기반의 보고서를 자동 생성하고 인사이트를 제공합니다. 보유한 데이터를 기업이 원하는 다양한 차원으로 나누어 분석하고 시각화된 결과를 고객에게 전달합니다.
데이터 퀄리티 필터
미디어 데이터가 가지고 있는 주요 수치를 기반으로 강력한 퀄리티 컨트롤을 수행하여 좋은 데이터를 구분합니다. 데이터 퀄리티 필터를 통해 사용자가 조회하는 페이지엔 정제되고 검증된 정보들이 노출됩니다.
머신러닝 기반 관심사 추출
사용자들의 축적된 데이터를 기반으로 각 사용자들이 원하는 관심사를 학습하고 추출합니다. 각 사용자의 구체적 관심사를 기반으로 CTR, CVR이 5배 가량 높은 네이티브 타겟 광고를 수행합니다.
데이터 프로세스
1. 데이터 수집
데이터 크롤러를 통해 방대한 온라인 데이터 수집
2. 데이터 센터
데이터를 분산된 클라우드 서버에 저장
3. 자연어 분석
수집된 비정형 데이터를 자연어 처리기를 통해 분석
4. 통계적 해석
데이터가 가지고 있는 각종 수치 정보를 통계적 기법으로 분석
5. 데이터 마이닝
데이터가 내포하는 인사이트 및 사용자들의 관심사 추출
6. 결과물 전송
최종 결과물을 웹과 모바일을 통해 전송
분석 예시
언급량그래프
긍부정그래프
주요키워드
요약
11월9일 허니버터칩 생산 중단, 보일러실 불에 관한 트위터 글이 이슈가 되면서 언급량 증가 시작
11월19일 블로그, 커뮤니티, 뉴스, SNS, 카페 모든 채널에서 이슈화됨, 뉴스는 이날 대대적으로 보도. 전체 기간의 뉴스 중 1/3이 19일에 게시됨
11월21에는 지식인에서 11월23일에는 각각 이물질과 벌레가 발견됐다는 사진이 올라왔으나 전체 긍부정 비율에는 큰 영향을 미치지 못함
허니버터칩과 관련해서 가장 많이 언급된 타사 제품은 포카칩(2349건)이고 그 중 스윗치즈 맛과 가장 많이 비교됨
부정적 의견이 가장 많았던 주제는 인질마케팅(끼워팔기)에 대한 글이였으며 댓글의 동조율도 높은편
언급량그래프
긍부정그래프
주요키워드
요약
두산 베어스 김현수 재계약과 장원준 영입이 가장 큰 이슈였고 반응은 각각 다름
김현수 재계약에 관해서는 긍정적 여론이 형성되었고, 장원준 선수영입에 대해서는 부정적인 여론이 형성됨
더스틴 니퍼트는 부정적인 의견이 1% 미만으로 매우 긍정적 평가를 받음. 용병 중 최고 라는 평가를 받고 있음
김현수 재계약에 관해 약 90%의 긍정도를 보임, 주요 의견은 '김현수 선수와 재계약을 꼭 해야 한다'로 요약 가능
오재원은 75%의 매우 부정적인 반응을 얻고 있으며, '연봉이 너무 높다', '허세이미지', '구단입장에서 손해'라는 의견이 다수임