반응형

(304100) 솔트룩스 - (4) 클라우드 서비스 Cloud Service

saltlux

  • 동사는 1981년 8월에 설립되었으며, B2B 및 B2G 인공지능·빅데이터 솔루션을 프로젝트 수주하여 구축 혹은 클라우드 기반으로 서비스 하는 사업을 영위.
  • 동사의 주요 제품으로는 지능형 빅데이터 분석 플랫폼인 Big Data Suite와 인공지능 플랫폼인 AI Suite가 있으며, 각각 2019년 전체 매출액의 41.2%, 37.75%를 차지.
  • 아웃바운드 컨택센터 자동화, 지능형 채용/HR 심사 등의 신규 사업 확장 계획.

 

클라우드 서비스 Cloud Service

Cloud 기반 지능형 서비스 및 데이터 산업 패러다임 변화

클라우드컴퓨팅의 초기 목적이 IT 관리 효율화였다면 4차 산업혁명이 진행되면서 그 목적이 빅데이터 분석과 인공지능 개발로 변화되고 있습니다. 빅데이터는 모든 산업의 발전과 새로운 가치 창출의 촉매 역할을 하고 있으며 이러한 패러다임 전환은 IT(Information Technology) 시대에서 DT(Data Technology) 시대로 이끌었습니다. 1950년대부터 관련 연구가 시작되어 발전해 온 인공지능은 기술적 한계에 부딪히며 한동안 침체를 겪어왔으나 고속 병렬 처리가 가능한 클라우드 컴퓨팅의 등장으로 대용량 딥러닝 연산 소요 시간이 대폭으로 단축되어 지능형 서비스에도 활발히 적용되고 있습니다.

하지만 DT시대에서 빅데이터의 수집, 저장, 분석을 위한 방대한 컴퓨팅자원과 인공지능 개발을 위한 슈퍼컴퓨터를 개별기업이 자체적으로 구비하는 것은 현실적이지 않습니다. 특히 자본력이 부족한 중소기업이나 스타트업은 4차 산업혁명 실행을 위한 대규모 컴퓨팅자원을 저렴하게 활용할 방법이 필요하였으며 클라우드를 통해 대규모 컴퓨팅자원을 저렴하게 활용할 수 있게 되었습니다. 이러한 이유로 4차 산업혁명이 진행될수록 클라우드서비스의 역할이 중요해지고 있습니다.

 

시장 변화에 따른 제품 서비스 혁신의 통찰력

빅데이터 분석과 지능형 서비스의 특성에 따라 클라우드는 필수 불가결한 수단이며 솔트룩스는 이러한 시장의 변화에 대하여 선제적으로 대응하고 있습니다. 4차 산업혁명 시대의 데이터 경제 패러다임 변화를 이끌기 위하여 오래전부터 데이터를 지식화(스마트 데이터)하여 제대로 활용하기 위하여 AI & Big Data 기술을 융합한 인공지능(AI) 클라우드서비스와 데이터사이언스 클라우드서비스를 출시하였습니다.

데이터사이언스 클라우드서비스는 인공지능과 데이터 과학자를 위한 국내 유일의 데이터사이언스포털(DATAMIXI.com)입니다. 데이터 분석을 위한 통찰과 인공지능이 결합한 인지분석으로 데이터를 융합하여 심층 분석하고 다양한 관점에서 시각화함으로써 데이터 간의 숨겨진 패턴을 발견하고 미래를 예측할 수 있습니다.

 

소개

솔트룩스 Cloud Service는 인공지능 서비스 개발자, 데이터 과학자, 데이터 분석가, 금융거래 이상징후 분석 담당자와 같은 사용자 모델을 대상으로 다양한 산업영역에 적용 가능한 인공지능 서비스를 제공합니다.

< 클라우드 서비스 개념도 >

솔트룩스 Cloud Service는 두 가지 서비스로 구성되어 있습니다. 1) AI Cloud(ADAMS.ai) 서비스는 솔트룩스가 지난 20년간 자연언어처리와 시맨틱, 추론을 포함한 인공지능 원천기술을 바탕으로 개발된 언어지능, 시각지능, 감성지능, 학습/추론 지능을 인공지능 서비스 개발에 필요한 API 형태로 제공하는 클라우드서비스입니다. 2) Data Science Cloud(DATAMIXI.com)는 ADAMs.ai가 미리 학습된 일반 도메인 모델을 웹 서비스로 노출한 오픈 API의 특성을 갖는 데 반하여, 고객이 보유한 도메인 데이터셋을 이용하여 새로운 모델을 학습하고 서비스에 반영할 수 있도록 기계학습 워크플로우 서비스 및 지능형 빅데이터 인지 분석 서비스를 제공합니다.

 

주요 특성

< Cloud Service 특성 >

 

주요 경쟁력

< 솔트룩스 클라우드서비스 기반기술의 차별성 >

 

클라우드 서비스 Cloud Service 상세

3세대 AI 클라우드 서비스

솔트룩스의 ‘AI 클라우드’는 ADAMS.ai 라는 이름으로 2017년 대한민국 최초로 상용화된 인공지능 클라우드 서비스(AI as a Service) 입니다. 이제 그 이름을 ‘솔트룩스 AI 클라우드’로 서비스 명을 변경하고, 기존의 Open APIs 기반의 AI 서비스에서 맞춤형 AI PaaS 서비스 플랫폼으로 새롭게 출발을 합니다.

솔트룩스 AI 클라우드 튜토리얼 - 종합편

youtu.be/8HwfdsTPuEk

도메인 학습과 온디맨드 AI

다양한 인공지능 기술이 연구개발 되도 실제 사업화, 현장 적용에 실패하는 경우가 많습니다. 인공지능 기술의 성능은 ‘학습 데이터’에 크게 의존하고 있고, 일반 도메인에서 99%의 성능을 보여도, 실제 문제 해결 현장에 적용 하면 50% 수준으로 품질이 낮아지게 됩니다.

이런 이유로, 솔트룩스는 국내 유일하게 (1) 각 도메인에 학습 최적화, 적응이 가능한 ‘커스텀‘ AI 서비스와 (2) 서비스 사업자(개발자)의 요청에 따라 신규 개발, 클라우드에 배포 가능한 ‘온디맨드’ AI 서비스를 제공하고 있습니다. 공통 Open API로는 실제 인공지능 상용 서비스와 시스템 구현이 어렵습니다. 이제 솔트룩스의 커스텀 AI 서비스와 온디맨드 AI 서비스를 통해 성공적 AI 사업을 추진해 보세요.

 

쿠버네티스 기반의 멀티 클라우드 확장성

솔트룩스의 AI 클라우드는 쿠버네티스와 콘테이너(도커) 기반의 AI 서비스와 커스텀 모델 배포, 관리 체계를 제공하고 있습니다.
무료 Open APIs 서비스는 자체 IaaS를 사용하고 있으며, 커스텀 및 온 디맨드 AI 서비스는 사용자 (개발자)가 솔트룩스의 IaaS 혹은, 마이크로소프트(Azure), 아마존(AWS)을 운영 정책과 가격 등에 따라 선택할 수 있습니다. 필요에 따라서는 여러 IaaS를 연결 융합해서 사용, 확장할 수도 있습니다.

 

 

Data Science Cloud Service (DataMixi.com)

Data Science Cloud Service - DATAMIXI는 데이터 과학자를 위하여 지능형 데이터 분석을 위한 통찰과 인공지능이 결합한 인지분석 서비스로 데이터를 융합하여 심층 분석하고 다양한 관점에서 시각화함으로써 데이터 간의 숨겨진 패턴을 발견하고 미래를 예측할 수 있는 국내 유일의 데이터 과학자들을 위한 포털 서비스입니다. 데이터 과학자나 인공지능 기반 데이터 분석 서비스를 매시업 (mashup) 방식으로 프로젝트에 통합하고자 하는 IT 엔지니어, 개발자들을 위해 기획된 데이터 과학 컨설팅 서비스입니다.

< Data Science Cloud Service - DATAMIXI >

Data Science Cloud Service - DATAMIXI는 데이터사이언스, 데이터 큐레이션, 인지분석 서비스로 구성되어 있습니다. 데이터사이언스는 빅데이터구축에서 분석 및 활용까지의 전 과정을 지원하는 클라우드서비스에 대한 명칭입니다. 데이터 큐레이션은 솔트룩스 데이터구축-분석 프로세스를 특징짓는 <Human-in-the-loop>를 통해서 데이터구축자와 소프트웨어 시스템이 협업할 수 있는 구조를 통칭합니다. 인지분석 서비스는 트렌드 분석, 감성분석, 시각화 서비스로 구성되어 있으며 수백억 단위의 인스턴스로 이루어진 데이터셋을 바탕으로 분석 및 시각화 서비스를 제공합니다.

 

주요 특징

인공지능과 데이터 과학자를 위한 국내유일의 데이터 과학 포털 DATAMIXI는 데이터 분석을 위한 통찰과 인공지능이 결합된 인지분석으로 데이터를 융합하여 심층 분석하고 다양한 관점에서 시각화 함으로써 데이터 간의 숨겨진 패턴을 발견하고 미래를 예측할 수 있습니다.

 

주요 서비스

데이터사이언스 서비스

솔트룩스의 데이터사이언스 서비스는 지난 20년 동안 축적된 인지분석과 기계학습의 성공 경험과 전문가(데이터 과학자)들의 참여를 통해 데이터 수집, 정제에서 시작해 기계학습 및 분석 모델의 선정과 최적화, 예측과 지능화 결과에 대한 평가와 시각화에 이르는 전주기에 대한 실무에 바로 적용 가능한 IT 실무 지식과 기술교육 등을 제공하는 컨설팅 및 교육 서비스입니다.

< 데이터 사이언스 서비스 >

Data Science Cloud Service - DATAMIXI의 데이터사이언스 서비스는 컴퓨터공학, 수리통계학, 데이터 모델링, 기계학습 알고리즘, 도메인 지식 모델링 기법이 솔트룩스만의 이중나선 방법론을 통해 융합되어 지능형 빅데이터 분석 서비스, 질의응답이나 대화 서비스와 같은 인공지능 기반 지식서비스 개발로 이어집니다.

< 이중나선 방법론 기반의 데이터 서비스 >

탁월한 수준의 심층 데이터 분석과 서비스 지능화를 위해서는 사람과 기계의 적극적인 협력(human-in-the-loop)이 필요합니다. DATAMIXI의 데이터사이언스 체계는 알고리즘/도구와 전문가가 적극적으로 상호 협력하는 이중나선 방법론(dual spiral methodology)에 기반하고 있습니다.

전형적 데이터사이언스의 절차는 솔트룩스만의 이중나선 방법론을 적용하여 데이터 수집, 정제에서 시작해 기계학습 및 분석 모델의 선정과 최적화, 예측과 지능화 결과에 대한 평가와 시각화 과정이 반복적으로 수행됩니다.

< 데이터 사이언스 컨설팅 서비스 절차 >

① 요구 사항 분석 단계

고객이 요구하는 데이터 분석에 대하여 분석/지능화 목표 도출, 핵심 문제의 분석 및 이해를 통하여 데이터 분석에 필요한 데이터 자원들을 정의 및 방향성을 도출하는 단계입니다.

② 데이터 큐레이션 단계

심층 분석과 기계학습 수행 시의 가장 큰 고충은 오류를 포함한 대규모 데이터에 대한 정제와 학습 데이터의 부족에 있습니다. 데이터 큐레이션은 요구사항 단계에서 정의되어진 데이터 자원을 수집하고 각 분석과 지능화 목적에 부합되는 프로세스와 도구 그리고 훈련된 전문가를 통해 데이터를 정제필터링을 통해 분석 및 학습을 위한 데이터를 생산하는 단계입니다.

③ 데이터 분석 및 학습 단계

전통적 통계 분석 뿐 아니라 CRF와 SVM과 같은 다양한 기계학습 기술과 CNN, RNN과 같은 심층신경망 기반의 딥러닝 기술을 활용한 데이터 심층 분석을 수행하는 단계입니다. 솔트룩스의 다양한 분석 엔진들과 R, TensorFlow와 같은 강력한 오픈소스를 융합한 지능형 분석 플랫폼을 활용하여 대규모의 데이터의 기계학습 및 예측, 딥러링 기반의 심층분석 등을 수행하며, 모델의 검증, 평가, 모델 매개변수 튜닝. 학습 알고리즘 변경 등을 통해 고객의 요구사항에 부합되는 최적을 분석 결과를 도출해 내는 과정입니다.

④ 데이터 분석 검증 및 피드백 단계

고객에게 분석 결과를 전달하기 전 분석되어진 결과에 대하여 지식, 패턴, 예외를 발견하거나 내·외부 전문가 및 고객의 피드백을 통하여 학습·예측 분석 결과의 평가, 검증을 받는 단계입니다.

⑤ 데이터 분석 최종 보고 단계

데이터의 분석과 활용이 개인과 조직의 새로운 힘이 되고 경쟁력이 될 수 있는 고객의 요구사항에 부합하는 데이터 분석 결과보고서 제공 단계입니다.

 

데이터 큐레이션 서비스

데이터 수집과 정제에서 메타정보태깅(annotation)과 분류, 학습용 데이터 생성 등 데이터의 활용 가치를 높이기 위한 모든 활동을 의미합니다. 데이터 기반의 심층 분석과 기계학습을 위해서는 대규모 데이터의 확보뿐 아니라 기계가 읽고, 학습하고, 의미 이해 가능한 형태로 가공되어야 합니다. 솔트룩스의 데이터 큐레이션 서비스는 솔트룩스 20년의 데이터 품질관리와 기계학습 경험이 축적된 세계 최고 수준의 데이터 서비스를 제공합니다.

< 데이터 큐레이션 서비스 >

① 데이터 큐레이션 서비스 절차

데이터 큐레이션의 6단계는 모든 도메인에 공통적으로 적용되며, 각 단계별 전문가 팀이 고객의 지식서비스 구축을 위해 유기적으로 협업하게 됩니다.

② 데이터 큐레이션 서비스 기능

데이터 큐레이션은 데이터의 활용 가치를 높이는 모든 활동을 의미합니다. 도서 등의 데이터 디지털화, 원시 데이터 수집, 데이터 정제 등 일반 데이터 가공 분야 외에 아래와 같이 이미지&동영상 어노테이션, R&D 데이터 어노테이션, 지식베이스 구축 등 전문 데이터 큐레이션 서비스를 제공합니다.

 

지능형 인지분석 서비스

솔트룩스의 지능형 인지 분석 서비스는 무료로 제공되는 약 100억 건 이상의 소셜 데이터를 활용하여 인공지능 기술이 적용된 융합분석, 연관주제 분석, 감성 분석, 트렌드 분석, 이슈 감지, 실시간 R 연동을 통한 고급 분석 기능과 데이터 속의 의미관계망 분석 기능을 통해 심층 분석을 할 수 있는 지능형 인지 분석 기능을 무료로 제공하고 있습니다.

1) 데이터 서비스에서 제공하는 다양한 공공 데이터와 내 데이터를 직접 업로드하여 등록하고 사용할 수 있는 데이터 기능

2) 두 개 이상의 파일에서 원하는 요소들만 선택하고 병합하여 원하는 분석에 최적화된 데이터를 만들 수 있는 데이터 병합 기능

3) 제공하는 소셜 데이터를 이용하여 관심 있는 분석 주제에 대한 지능형 분석을 통하여 다양한 차트를 적용해 위젯으로 만들 수 있는 위젯 생성 기능

4) 생성한 위젯들을 간단하게 드래그 앤 드롭 방식으로 원하는 위치에 배치하여 나만의 대시보드를 생성할 수 있는 대시보드 생성 기능

5) 다양한 사람들의 시각으로 만들어진 대시보드를 갤러리를 통해 공유하거나 SNS를 사용하여 공유 할 수 있는 웹 공유 및 퍼블리싱 기능

① 내 데이터 기능

인지 분석 서비스에서 내 데이터 기능은 솔트룩스에서 제공하는 약 100건 이상의 소셜 데이터와 34만 건의 오픈 데이터를 활용하거나, 사용자 필요에 의한 사용자 데이터를 지능형 인지분석 서비스에서 활용하기 위하여 분석에 적합한 CSV 파일 혹은 엑셀 파일 형태로 가공하여 저장 및 등록 할 수 있는 기능입니다.

② 분석 위젯 기능

인지 분석 서비스에서 분석 위젯 기능은 솔트룩스에서 제공하는 약 100건 이상의 소셜 데이터와 34만 건의 오픈 데이터를 활용하거나, 사용자 필요에 의한 사용자 데이터를 활용하여 지능형 인지 분석을 하는 기능으로, 사용자 분석 주제에 대하여 지능형 인지 분석 기능을 활용하여 분석 결과를 다양한 차트에 적용할 수 있으며 이를 사용자 위젯으로 생성할 수 있습니다. 크게 소셜 빅데이터를 활용한 인지 분석 기능과, 내 데이터를 활용한 인지 분석 기능으로 나뉠 수 있으며, 상세 인지 분석 기능으로 트렌드 분석, 연관어 분석, 감성 분석을 할 수 있습니다.

③ 사용자 대시보드 및 갤러리 기능

사용자 인지 분석 결과 위젯은 분석 위젯 갤러리에 저장 및 등록을 할 수 있으며, 이렇게 등록된 인지 분석 결과 위젯을 활용하여 사용자는 대시보드를 생성할 수 있습니다. 생성된 대시보드는 사용자 대시보드 갤러리에 저장 및 등록을 할 수 있으며, 사용자 선택에 의하여 다른 사용자에게 공유 및 다운로드가 가능한 기능입니다.

 

데이터 처리 및 기계학습 기능 서비스 - Dataiku

중앙화된 데이터 기반 지능형 빅데이터 플랫폼으로서 비즈니스가 데이터를 단지 저장하는 수준에서 머무르지 않고 기업의 프로세스와 긴밀한 영향을 갖도록 분석 기능을 최대한 활용합니다. 이를 통해 데이터가 머신러닝 과정을 통해 모델화되고 기업 운영에 적용되는 단계까지 지원합니다.

< Data Science Cloud Service - Dataiku >

① 데이터 탐색 기능

데이터 세트에 대한 자동 보고서를 작성하고 잠재적인 데이터 품질 문제를 지적합니다. 단일 데이터 및 다 변수 통계를 생성하여 세부 데이터 집합 감사 보고서를 생성합니다. Excel에서처럼 쉽게 데이터를 필터링 하고 검색합니다. Spark, Hadoop 또는 SQL 엔진에서의 실행을 통해 분석범위를 확장하여 통찰력을 확보합니다.

② 데이터 전처리 및 시각적 변환 기능

코드가 없는 데이터 논쟁을 막기 위해 80개 이상의 내장형 비주얼 프로세서에 쉽게 액세스 할 수 있습니다. 자동으로 제안된 문맥 변환 및 데이터에 대한 대량 작업 수행이 가능합니다.

③ 기계학습 기능

모델의 모든 종류의 데이터를 사용하는 자동 엔지니어링, 생성 및 선택이 가능합니다. 다양한 교차 유효성 검사 전략을 사용하여 모델 하이퍼 매개 변수를 최적화합니다. 모델에서 즉각적인 시각적 통찰력을 얻고(변수 중요성, 상호 작용 또는 매개 변수 특징) 상세한 메트릭을 통해 모델 성능을 평가할 수 있습니다.

④ 기계학습 기반 모델 배포 기능

분석가와 데이터 과학자가 몇 번의 클릭만으로 생산에 모델을 배치할 수 있도록 지원합니다. 데이터 정리, 풍부화, 전처리가 함께 묶여 단순화된 채점 파이프 라인이 됩니다. 배포된 모델은 버전 관리되므로 사용자는 언제든지 새 버전을 배포하고 비교하고 롤백 할 수 있습니다.

⑤ 데이터 생성 정보 관리 기능

단일 UI 내에서 데이터 생산에 필요한 1)데이터 생성 모델(워크플로우) 개발, 2)모델 및 생산 데이터 테스트, 3)데이터 시제품(생산 전 검증), 4)데이터 제품화(데이터 및 생성 모델 패키징)에 이르는 데이터 생성에 필요한 모든 단계를 포함하고 있는 배포 모델을 제공합니다.

 

주요 경쟁력

 

주요 서비스 화면

 

클라우드 서비스 Cloud Service 적용사례

AI Cloud Service

T 기가 지니(GIGA Genie)와 ADAMs.ai 연계

최근 AI(인공지능) 기술을 일상에서 손쉽게 경험할 수 있게 하는 ‘AI 스피커’가 전 세계적으로 잇따라 출시되고 있습니다. 2014년 아마존이 자사 AI 비서 알렉사를 기반으로 출시한 ‘에코’를 시초로 세계적으로 관련 시장이 가파르게 성장하고 있습니다.

국내에서는 KT, SK텔레콤, LG유플러스의 통신사 3곳이 AI 스피커 시장을 견인하고 있으며, 글로벌 인터넷 기업들이 견인하는 북미 등 주요 국가보다는 태동이 늦었지만 가파르게 성장하고 있습니다. 그 중에서 KT는 가입자 150만 명에 달하는 국내 AI(인공지능) 스피커 시장 1위 기업이며, 2017년 1월 AI 스피커 ‘기가지니’를 출시한 이후, 기가지니 LTE, 기가지니 버디, 기가지니2, AI메이커스키드 등 제품군을 다각화하고 있습니다.

기가지니는 KT의 각 홈 서비스 플랫폼 (IPTV, 음악, 통화, 홈 IoT)과 밀결합하여 동작하고, 3rd party들의 플랫폼과도 연동하여 전반적인 AI 생태계를 구성하고 있습니다. 그 중에서 이용자와 AI(인공지능) 간의 대화 품질 고도화를 위하여 솔트룩스 ADAMs.ai 플랫폼을 연동하였으며, 이를 통하여 광범위한 지식을 필요로 하는 생활형 심층 질의응답(QA) 서비스를 제공하고 있습니다.

< KT ‘기가지니’와 ADAMs.ai 간 연계 >

① 주요 내용

  1. ‘기가지니’는 이용자의 질문에 대한 답변을 찾아 전달하는 질의응답(QA) 서비스를 제공합니다. 광범위한 지식을 필요로 하는 생활정보, 일반상식, 전문지식 분야의 심층 질의응답(QA) 서비스를 위하여 솔트룩스의 ADAMs.ai가 연동되었습니다. ‘기가지니’를 통해 입력 받은 이용자의 질문이 ADAMs.ai 플랫폼에 전달되면, ADAMs.ai는 대규모 지식그래프 기반 심층 질의응답(QA) 기술을 통하여 전달받은 질문의 대한 답을 찾습니다. 이렇게 찾은 답변을 ‘기가지니’에 전달하여 사용자에게 원하는 답변을 제공합니다. 그 과정에서 질의응답에 필요한 새로운 지식을 지속적으로 추가 학습하여 질의응답의 품질을 고도화하고 있습니다.

② 적용 기술

  1. 앙상블 기술을 활용한 유연한 질의응답
    KT ‘기가지니’는 ADAMs.ai에서 Open API를 통해 제공하는 심층 질의응답 (Deep QA) 서비스를 활용하여 생활정보, 일반상식, 전문지식 분야의 질문에 대한 답변을 구합니다. 심층 질의응답(Deep QA) 서비스는 입력된 질문에 대하여 지식그래프 기반 질의응답(KBQA), 정보 검색 기반 질의응답(IRQA), MRC 기반 질의응답(MRQA) 등이 앙상블 되어 질의 유형에 따라 최적의 풀이 방식을 채택하여 사용자에게 답변을 제공합니다.
  2. 지속적 QA 모니터링 및 지식 큐레이션
    심층질의응답을 적용하는 생활정보, 일반상식, 전문지식 분야에 따라 지속적인 QA 모니터링을 지원하며, 지식 큐레이션을 통하여 매일 분야별 대규모의 신규 지식을 추가 구축합니다. 이렇게 구축된 신규 지식들은 플랫폼의 관리기능을 통하여 쉽게 질의응답에 활용 가능한 데이터로 변환됩니다.

③ 주요 성과

  1. 지식그래프로 구축된 약 8억 건의 일반지식을 대상으로 하는 복합추론에서 50만 단위지식/초의 속도를 제공하며, 이러한 복합추론과 일 데이터 수집량인 5백만 문서를 매일 지속 학습하는 강점을 통하여 생활정보, 일반상식, 전문지식 분야 질의응답 정답 확률 94% 수준을 제공합니다.

 

우리은행 AI(인공지능) 상담 시스템과 ADAMs.ai 연계

최근 금융 분야에서는 모바일을 비롯한 다양한 고객 서비스 채널이 확대되고 있고, 최신 인공지능 기반의 기술 트렌드에 대응하는 서비스 요구가 증가하고 있습니다. 우리은행에서도 대 고객, 대 직원 금융서비스의 패러다임 변화를 위하여 AI(인공지능) 상담 시스템 구축의 필요성이 대두되었습니다.

< 우리은행 AI(인공지능) 상담시스템 >

우리은행은 AI(인공지능) 기술을 이용해 고객과 실시간 상담이 가능한 챗봇 서비스 ‘위비봇’을 2017년 9월에 개시하였습니다. 24시간 실시간 금융 상담 서비스를 제공합니다. ‘위비봇’은 기존의 질문과 답변을 고르는 단순 선택형 방식이 아닌 질문자의 의도를 파악해 상담원처럼 고객과 대화하는 방식으로 답변을 제공하며, 금융정보 외에도 일반상식 정보도 제공합니다.

① 주요 내용

  1. 우리은행의 AI(인공지능) 상담시스템은 크게 데이터 영역, AI 플랫폼 영역, 그리고 서비스 영역으로 구분할 수 있으며, 특히, 날씨나 인물정보 등 일반상식 정보를 질의응답을 통해 제공하기 위하여 방대한 지식베이스 기반 플랫폼인 솔트룩스의 ADAMs.ai를 연동하였습니다. 금융 분야의 상담 서비스에 대한 지식은 데이터 영역에 자체 구축하여 상담 서비스에 활용하고 있으나, 단기간에 구축이 어려운 일반상식 정보에 대해서는 외부 오픈 플랫폼인 ADAMs.ai를 연동하여 서비스하고 있습니다.

② 적용 기술

  1. 지식그래프 기반 심층질의응답
    우리은행 ‘위비봇’은 금융 분야 외의 일반상식에 대한 질문에 대하여 ADAMs.ai에서 Open API를 통해 제공하는 심층 질의응답(Deep QA) 서비스를 활용하여 구합니다. 심층 질의응답(Deep QA) 서비스는 아시아 최대 규모의 지식그래프를 기반으로 하는 복합추론을 통하여 일반 시사 상식에 대한 질의응답을 제공합니다.
  2. 새로운 지식에 대한 빠른 적용
    심층질의응답을 적용하는 일반 시사 상식에 대한 새로운 지식을 생성, 학습, 추론하여 질의응답을 처리할 수 있도록 사전, 지식, 색인 등 정보를 관리할 수 있는 플랫폼을 제공하며, 쉽게 새로운 지식을 구축할 수 있고 해당하는 질의응답을 구현할 수 있습니다.

③ 주요 성과

  1. 우리은행 ‘위비봇’은 약 8억건의 일반지식에 대한 지식그래프를 내장한 ADAMs.ai를 연동하여, AI(인공지능) 챗봇을 통해 제공할 수 있는 서비스의 범위를 금융 분야 상담뿐만 아니라, 날씨, 인물정보 등 광범위한 일반상식 영역까지 크게 확대하였습니다.

 

Data Science Cloud Service

Data Science Cloud Service 현황

 

한국여성정책연구원 여성정책 소셜 빅데이터 수집 및 분석

데이터 관련 기술이 발전됨에 따라 과거 전통적인 조사 방법인 표본조사에서 빅데이터 기반 전수 조사로 연구의 흐름이 변화되고 있습니다. 이는 공공기관, 지차제, 기업 등 전 산업 분야로 확대되고 있으며 빅데이터 기반 행정 서비스 제공 및 증거 기반 정책 수립을 위한 다양한 정책이 추진되고 있습니다. 이에 여성정책연구 분야에서도 시시각각 변하는 사회 전반의 여론을 신속하게 분석함으로써 여성 정책수요를 파악하고 대응 방안을 마련하기 위한 기초 자료를 구축하고자 하였습니다.

< 여성정책연구원 분석프로세스 >

① 주요 내용

  1. 본 연구는 소셜 데이터를 수집 및 분석하여 소셜 미디어를 중심으로 전개되는 다양한 사회 현상과 젠더 이슈를 분석할 목적으로 추진되었습니다. 분석 방법으로는 솔트룩스 내부 솔루션인 단어 가중치 분석, 감성 분석, 동시 출현 단어 분석 등을 활용하였습니다. 시각화 차트를 활용한 분석 결과는 여성정책 추진에 필요한 기초자료를 제공하였다는 측면에서 중요한 연구 결과를 도출하였다는 평가를 받았습니다.

② 적용 기술

  1. 트랜드 분석
    분석 대상에 대한 언급량을 월별/일별로 집계하여 언급량이 집중된 시기를 중심으로 사람들의 주요 관심사항이 무엇이고 어떤 담론이 생산, 확대, 축소되었는지 파악하였습니다.
  2. 단어 가중치 및 감성 분석
    문서간/문서내 단어 빈도수를 이용하여 모든 문서에서 나타나는 흔한 단어들을 걸러 내고 중요 단어들을 추출하였습니다. 감성어휘 사전과 지도 기계학습을 이용하여 문장별로 감성을 분류하였습니다. 이를 기반으로 분석 대상 또는 단어에 대한 종합적인 감성을 파악하였습니다.
  3. 동시출현 단어 및 원문(VOC)분석
    출현 빈도가 높은 중요 단어를 선별한 후, 해당 단어를 포함한 문장만 추출하였습니다. 단어 간 연관성을 파악하기 위해 주요 단어들이 함께 언급된 원문을 추출하였습니다. 추출된 원문을 검토하여 분석 대상에 대한 동향 및 연계 맥락을 파악하였습니다.

③ 주요 성과

  1. 특정 표본에 대한 제한적 이해가 아니라 대중 의견에 대한 종합적인 분석을 위해 본 연구에서는 페미니즘, 최저임 금 주제와 관련된 언론, 소셜미디어, 커뮤니티 데이터를 수집하였습니다. 또한, 수집된 데이터를 분석하여 여성정 책 추진에 필요한 기초자료를 마련하였습니다. 이는 과거 소수에 불과했던 미디어 연구를 확장한 연구 사례로써 향후 여성정책 수요를 발굴하고 대응 방안을 모색함에 빅데이터 활용을 촉진할 것으로 기대합니다.

 

현대자동차 전세계 경쟁 차량 정보 수집

전세계 경쟁 차량 수집 서비스는 멀티 채널 다국어 외부 데이터를 주비한 후, 이를 활용한 적극적 마켓 센싱을 통해 고객 만족도 향상 및 시장 경쟁력 강화를 목표로 진행되었습니다. 이를 위해 수집된 전세계 경쟁 차량 정보로부터 고객 니즈에 대한 포괄적 이해, 경쟁 시장 동향에 대한 정보 획득 그리고, 잠재적 리스크에 대한 실시간 모니터링을 위해 대용량 데이터 수집 전용 인프라를 구성하였습니다. 데이터 수집 대상은 자동차 관련 전세계 모든 뉴스, 잡지, 카페, 커뮤니티 및 포럼 사이트뿐만 아니라 Facebook, Twitter, Instagram, YouTube 그리고, 고객 요청에 의한 커스텀 사이트로부터 데이터를 수집합니다. 수집된 데이터는 자동분류, 필터링, 정제 및 가공 과정을 거쳐 정규화 되어 고객이 바로 활용할 수 있는 데이터 형태로 구축하여 제공하였습니다.

< 현대자동차 데이터 수집 및 정제 서비스 >

① 주요 내용

  1. 본 사업은 멀티 채널의 외부 데이터를 수집한 후, 이를 활용한 적극적 마켓 센싱을 통해 고객 만족도 향상 및 시 장 경쟁력 강화를 목표로 진행되었습니다. 이를 위해 수집된 정보로부터 고객 니즈에 대한 포괄적 이해, 경쟁시장 동향에 대한 정보 획득, 잠재적 리스크에 대한 실시간 모니터링을 추출할 수 있는 데이터 수집전용 인프라를 구성하였습니다. 수집대상은 사이트의 자동차 관련 세부 게시판과 카페 사이트 및 키워드 기반 데이터, Facebook, Twitter, Instagram, Youtube, 기타 커스텀 사이트 데이터로서 수집된 데이터는 필터링 및 정규화 되어 고객이 바로 활용할 수 있는 형태로 제공하게 됩니다.

② 적용 기술

  1. 데이터 수집
    고객 선정 약 1,500개의 수집 대상 사이틀르 검토하고 선별합니다. 큐레이션 센터에서 직접 수집 대상 사이트에 대한 메타데이터 조사 및 고객과 협의를 거처 데이터 필터링을 합니다. 검색결과 URL 추출 및 수집 데이터의 본문 내 URL 추출 후 빈도수 분석 및 큐레이터가 직접 자동차와 연관성이 높은 사이트를 추가 발굴합니다.
  2. 데이터 품질 자동화
    데이터 필터링, 카페스키마 자동 감지, 기계학습 스팸 분류, 날짜 함수 정규화, 전송데이터 생성, 장애 감지 등의 기능을 수행합니다.
  3. 수집 현황 모니터링 대시보드
    프로젝트의 수집 현황 실시간 모니터링, 각 프로젝트의 관리 현황 확인, 수집 위험도 상위 사이트 확인, 수집 데이터 추이 확인, 수집처 리스트 확인이 가능합니다.

③ 주요 성과

  1. 수집된 데이터를 통해 고객 Needs에 대한 포괄적 이해, 경쟁시장 동향에 대한 정보 획득, 잠재적 리스크 모니터링 진행, 고객의 행동 패턴 등 숨겨진 정보를 추출, 내부 분석에 바로 활용 가능한 고객 맞춤형 데이터를 제공하였습니다.

 

AIA생명 3645 싱글들의 보험상품 니즈 파악 및 그들을 대상으로 한 상품기획

보험상품의 개발에 있어 과거의 직관적 경험에 의존하던 방법에서 데이터 기반으로 상품을 기획하여 시장경쟁력을 높이는 것이 필요했습니다. 싱글족에 관련된 분석 대상 데이터를 확보하고, 확보된 정형/비정형 데이터를 융합분석 및 인지 분석을 통해 3545싱글들의 관심을 끌 수 있는 보험 상품을 개발하고자 합니다.

< AIA생명 3545싱글들의 보험상품 상품기획 >

① 주요 내용

  1. 본 사업은 "3545싱글들의 보험상품 니즈 파악 및 그들을 대상으로 한 상품기획" 목적을 위해 연령대별, 성별 소셜 빅데이터 수집 및 분석 서비스 사례입니다. 3545 싱글들의 타겟팅/이슈 및 가설 검증을 통해 인사이트를 도출했으며, AIA 생명 상품 전략 수립에 활용된 사례입니다.

② 적용 기술

  1. 가설 검증 시나리오
    3545 싱글에게 관심을 끌 수 있는 보험 상품 개발을 위해 주제 키워드를 발굴하고 도출된 키워드를 그룹화하여 소비자들의 관심도와 평판을 분석합니다.
  2. 언급량 트렌드 분석
    속성별 트랜드 비교를 통해 고객의 관심사항에 대한 동향과 경향성을 파악 및 상세 이슈사항까지 파악하고 검토합니다.
  3. 워드 클라우드와 연관어 분석
    소비자들의 연관 이슈별 관심도 및 평판 분석을 하고, 연관 키워드들의 관계를 밝혀 통찰력을 제공합니다.
  4. 감성분석
    속성별 상세 속성 키워드의 감성분석 결과와 버블차트 분석을 통해 언급량 대비 소비자들의 반응을 쉽게 파악합니다.

③ 주요 성과

  1. 멀티 채널의 외부 데이터를 활용한 적극적 마켓 센싱으로 고객 만족도 향상 및 시장 경쟁력을 강화할 수 있습니다. 대상의 변경만으로 손쉽게 맞춤형 상품을 개발할 수 있는 검증된 플랫폼을 확보할 수 있습니다.

 

PwC 컨설팅 실시간 기업 정보 및 모니터링 서비스

다양한 정보를 통해 기업의 현황 파악이 실시간으로 가능하게 함으로써 급변하는 기업의 사회적 변화에 대하여 신속히 대응하기 위한 기반이 필요하였습니다. 특히 방대한 량의 소셜 데이터와 SNS데이터의 수집과 이를 통한 분석 및 시각화는 특정 기업의 인사이트를 얻기 위해 필요한 수단이며 목표입니다.

< PwC 컨설팅 기업정보 및 모니터링 서비스 목적 >

① 주요 내용

  1. 150억건 이상의 소셜데이터를 기반으로 실시간 기업 정보 및 경쟁사 모니터링 서비스 제공합니다. 트랜드 분석, 키워드 비교 분석, 연관어 분석, 감성 분석, 사전관리등의 분석 및 기능을 제공하였으며 이를 바탕으로 기업에 대한 분석 및 모니터링을 함에 있어 중요한 결과를 제공했습니다.

② 적용 기술

  1. 소셜 데이터 검색
    질의어를 포함하고 있는 문서를 뉴스, 블로그, 트위터의 각 검색 소스에서 추출하여 제공합니다. 전체 검색된 문서의 수와 중복을 제거한 문서의 수를 제공합니다.
  2. 트랜드 분석
    주어진 질의어에 대해 뉴스, 블로그, 트위터에 등록되어 있는 문서의 기간별 통계를 제공합니다. 결과는 json 형태로 제공되며, 질의어에 해당하는 문서 통계 결과와 같은 기간의 전체 문서 통계 결과를 제공합니다.
  3. 연관 주제어 자동 분석
    주어진 질의어에 대해 뉴스, 블로그, 트위터 데이터에서 연관 주제어들을 추출하고 출현 빈도를 기준으로 순위를 제공하며, 연결정보를 제공합니다. 입력된 기간에 대하여 단위 기간을 설정할 수 있습니다.
  4. 오늘의 토픽 분석
    입력된 뉴스 카테고리에 대하여 N개의 오늘의 토픽을 추출하여 Ranking을 제공합니다.

③ 주요 성과

  1. 특정기업 및 경쟁사의 데이터를 수집, 저장, 분석, 표현의 전체 과정을 통합적으로 처리할 수 있습니다. 본 사업은 기업과 관련된 언론, 소셜미디어, 커뮤니티 데이터를 수집하였습니다. 기업에 대한 현황, 기술, 서비스형태 등 다양한 정보를 수집하고, 수집된 데이터의 분석을 통해 인사이트를 제공하며 맞춤형 정보로 활용할 수 있습니다.

 

한국과학기술연구원(KIST) 데이터 기반 R&D 환경 구축 서비스

생산되는 디지털 데이터의 비중이 점차 증가하는 현실 속에서 연구기관에서 빅데이터를 활용한 연구지원 시스템 도입은 연구기관의 전체적 생산성을 높일 수 있습니다. 본 사업은 KIST가 지속적인 연구 개발에 대한 경쟁력을 가질 수 있도록 정형·비정형 데이터의 수집 및 관리체계를 확립하여, 연구원의 연구 생산성을 높일 수 있는 글로벌 스케일의 연구자료 분석 환경 구축을 하였습니다.

< 한국과학기술연구원 정보분석 플랫폼 >

① 주요 내용

  1. 연구기관에서 연구개발 생산성에 도움이 되기 위해서는, 내부의 연구정보가 실시간 공유되고, 외부(해외) 연구논문 정보와 연계되어 연구방향 설정에 도움을 주는 시스템을 구축하였습니다. 시스템은 촉매분야 관련 연구에 필요한 대내외 논문이나 특허 등 자료를 수집/정제 및 저장 관리하는 KiRI DataBank, 수집된 연구 자료에 대한 검색/분석할 수 있는 플랫폼인 KiRI Platform, 그리고 연구 데이터를 기록/관리를 위한 KiRI Note플랫폼으로 구성되어졌습니다.

② 적용 기술

  1. 연구 활동 기록 및 현황조회
    연구노트 기능을 통해서 연구 활동을 효율적으로 관리할 수 있으며, 현재 진행중인 프로젝트 현황을 효율적으로 관리할 수 있습니다.
  2. 기본 논문 검색 분석 유사 논문/트랜드/연관어 분석
    중심 키워드와 관련된 컨텐츠를 검색/분석하는 기능입니다. 기본 시계열 분석에서 부터, 트랜드 비교, 연관어 분석, 논문-저자 또는 물질-논문 네트워크 다이어그램까지 다양한 분석이 가능합니다.
  3. 논문 정보를 섬세하게 추출할 수 있는 큐레이션 툴
    웹에서 크롤링한 논문의 기본정보 뿐 아니라 큐레이션 툴도 함께 제공합니다. 기본 초록 정보를 이용하여 자동으로 DB화 시켜주고, 큐레이션작업을 통해서 상세하고 전문적인 내용들을 구조화시켜 저장 관리합니다.
  4. 논문내의 분석 결과를 추출하는 디지타이징
    논문에 수록된 그래프화 되어 있는 연구결과를 Data화 할 수 있는 디지타이징 툴을 제공합니다. 추출할 이미지 선택 및 축, 대상 등을 설정하면 그래프 이미지를 디지털 정보화 할 수 있으며 결과는 논문별 저장소에 저장 관리되어집니다.

③ 주요 성과

  1. 실험정보의 공유를 통하여 연구생산성 및 커뮤니케이션의 질적 향상을 통한 연구지원이 가능하게 되었으며, 대내외 연구 논문 및 특허정보를 DB화 함으로 촉매 분야별 최신정보 센싱 및 논문 활용을 향상시켰습니다. 각종 실험을 통하여 발생하는 실험노트를 데이터화하고 데이터마이닝, 인공지능(AI)등 데이터사이언스에 용용 합니다.

 

반응형

+ Recent posts