머신러닝은 금융 서비스 산업에서 상당한 발전을 이루고 있습니다. 금융회사가 왜 관심을 가져야 하는지, AI와 머신러닝을 활용해 어떤 솔루션을 구현할 수 있는지, 이 기술을 정확히 어떻게 적용할 수 있는지 알아보자 컬쳐캐피탈.
정의
기계 학습(ML)은 통계 모델을 사용하여 통찰력을 얻고 예측을 수행하는 데이터 과학의 하위 집합으로 정의할 수 있습니다. 아래 차트는 AI, 데이터 과학 및 기계 학습이 어떻게 관련되어 있는지 설명합니다. 단순화를 위해 이 게시물에서는 머신러닝에 중점을 둡니다.
머신러닝 솔루션의 마법은 명시적으로 프로그래밍하지 않고도 경험을 통해 학습한다는 것입니다. 간단히 말하면, 모델을 선택하고 데이터를 공급해야 합니다. 그런 다음 모델은 매개변수를 자동으로 조정하여 결과를 개선합니다.
데이터 과학자는 기존 데이터 세트를 사용하여 기계 학습 모델을 훈련한 다음 잘 훈련된 모델을 실제 상황에 적용합니다.
금융 분야의 AI, 데이터 사이언스, 딥 러닝, 머신 러닝의 차이점
모델은 백그라운드 프로세스로 실행되며 학습된 방식에 따라 자동으로 결과를 제공합니다. 데이터 과학자는 모델을 최신 상태로 효과적으로 유지하는 데 필요한 만큼 자주 모델을 재교육할 수 있습니다. 예를 들어, 우리 고객인 Mercanto는 매일 기계 학습 모델을 재교육합니다.
일반적으로 더 많은 데이터를 제공할수록 결과가 더 정확해집니다. 공교롭게도 금융 서비스 업계에서는 막대한 데이터 세트가 매우 일반적입니다. 거래, 고객, 청구서, 송금 등에 관한 페타바이트 규모의 데이터가 있습니다. 이는 머신러닝에 딱 맞습니다.
기술이 발전하고 최고의 알고리즘이 오픈소스화됨에 따라 머신러닝이 없는 금융 서비스의 미래는 상상하기 어렵습니다.
즉, 대부분 금융 서비스 회사 다음과 같은 이유로 아직 이 기술의 실제 가치를 추출할 준비가 되어 있지 않습니다.
기업은 기계 학습과 조직에 대한 가치에 대해 완전히 비현실적인 기대를 갖는 경우가 많습니다.
AI와 머신러닝 연구 및 개발 비용이 많이 든다.
DS/ML 엔지니어 부족은 또 다른 주요 관심사입니다. 아래 그림은 AI 및 머신러닝 기술에 대한 수요가 폭발적으로 증가하는 것을 보여줍니다.
금융 기관은 데이터 인프라 업데이트에 있어 민첩성이 부족합니다.
금융권 머신러닝 엔지니어 인재 부족
이 게시물의 뒷부분에서 이러한 문제를 극복하는 방법에 대해 이야기하겠습니다. 먼저 금융 서비스 기업이 머신러닝을 무시할 수 없는 이유를 살펴보겠습니다.
금융 분야에서 머신러닝을 고려하는 이유는 무엇입니까?
이러한 어려움에도 불구하고 많은 금융 회사는 이미 이 기술을 활용하고 있습니다. 아래 그림은 금융 서비스 임원들이 머신 러닝을 매우 중요하게 여기고 있으며 이를 수행하는 데는 여러 가지 이유가 있음을 보여줍니다.
프로세스 자동화 덕분에 운영 비용이 절감됩니다.
향상된 생산성과 향상된 사용자 경험으로 인해 수익이 증가했습니다.
규정 준수가 향상되고 보안이 강화되었습니다.
머신러닝에 투자하는 금융회사
금융 데이터에 매우 적합한 다양한 오픈 소스 기계 학습 알고리즘과 도구가 있습니다. 또한, 기존 금융 서비스 회사는 최첨단 컴퓨팅 하드웨어에 지출할 수 있는 상당한 자금을 보유하고 있습니다.
금융 영역의 정량적 특성과 대량의 과거 데이터를 활용하는 머신 러닝은 금융 생태계의 여러 측면을 향상시킬 준비가 되어 있습니다.
그래서 많은 금융회사들이 머신러닝 R&D에 막대한 투자를 하고 있습니다. 후발 기업의 경우 AI와 ML을 무시하면 비용이 많이 들 수 있습니다.
금융 분야의 머신러닝 사용 사례는 무엇입니까?
금융 분야에서 유망한 머신러닝 애플리케이션을 살펴보겠습니다.
금융 사용 사례의 기계 학습
프로세스 자동화
프로세스 자동화는 금융 분야에서 머신러닝을 적용하는 가장 일반적인 애플리케이션 중 하나입니다. 이 기술을 통해 수동 작업을 대체하고 반복 작업을 자동화하며 생산성을 높일 수 있습니다.
결과적으로 기계 학습을 통해 기업은 비용을 최적화하고, 고객 경험을 개선하고, 서비스를 확장할 수 있습니다. 금융 분야의 머신러닝 자동화 사용 사례는 다음과 같습니다.
챗봇
콜센터 자동화.
서류 자동화.
직원 교육의 게임화 등
다음은 은행 업무 프로세스 자동화의 몇 가지 예입니다.
JPMorgan Chase는 머신러닝 기술 중 하나인 자연어 처리를 활용하는 COiN(Contract Intelligence) 플랫폼을 출시했습니다. 이 솔루션은 법률 문서를 처리하고 해당 문서에서 필수 데이터를 추출합니다. 연간 12,000개의 상업 신용 계약을 수동으로 검토하는 데는 일반적으로 약 360,000시간이 소요됩니다. 반면, 머신러닝을 사용하면 단 몇 시간 안에 동일한 수의 계약을 검토할 수 있습니다.
BNY Mello는 프로세스 자동화를 은행 생태계에 통합했습니다. 이 혁신은 다음을 담당합니다. 연간 $300,000 절감 광범위한 운영 개선을 가져왔습니다.
Wells Fargo는 다음을 사용합니다. AI 기반 챗봇 Facebook 메신저 플랫폼을 통해 사용자와 소통하고 비밀번호 및 계정에 대한 지원을 제공합니다.
Privatbank는 모바일 및 웹 플랫폼 전반에 걸쳐 챗봇 도우미를 구현한 우크라이나 은행입니다. 챗봇은 일반적인 고객 문의 해결 속도를 높이고 인간 보조원의 수를 줄일 수 있었습니다.
보안
거래 수, 사용자 수, 제3자 통합이 증가함에 따라 금융 분야의 보안 위협도 증가하고 있습니다. 그리고 머신러닝 알고리즘은 사기 탐지에 탁월합니다.
예를 들어, 은행은 이 기술을 사용하여 모든 계좌에 대해 수천 개의 거래 매개변수를 실시간으로 모니터링할 수 있습니다. 알고리즘은 카드 소지자가 취하는 각 행동을 검사하고 시도된 활동이 해당 특정 사용자의 특징인지 평가합니다. 이러한 모델은 높은 정확도로 사기 행위를 찾아냅니다.
시스템이 의심스러운 계정 활동을 식별하면 거래를 검증하기 위해 사용자에게 추가 식별을 요청할 수 있습니다. 또는 사기일 확률이 95% 이상인 경우 거래를 완전히 차단할 수도 있습니다. 기계 학습 알고리즘은 거래를 평가하는 데 단 몇 초(또는 심지어 몇 초)만 필요합니다. 속도는 범죄가 이미 발생한 후에 사기를 발견하는 데 그치지 않고 실시간으로 사기를 방지하는 데 도움이 됩니다.
재무 모니터링은 금융 분야의 머신러닝을 위한 또 다른 보안 사용 사례입니다. 데이터 과학자는 대량의 소액 결제를 감지하고 스머핑과 같은 자금세탁 기술을 표시하도록 시스템을 교육할 수 있습니다.
기계 학습 알고리즘은 네트워크 보안도 크게 향상할 수 있습니다. 머신러닝은 수천 개의 매개변수를 실시간으로 분석하는 데 있어 타의 추종을 불허하므로 데이터 과학자는 사이버 위협을 발견하고 격리하도록 시스템을 교육합니다. 그리고 이 기술이 가까운 미래에 가장 발전된 사이버 보안 네트워크를 강화할 가능성이 높습니다.
Adyen, Payoneer, Paypal, Stripe 및 Skrill은 보안 기계 학습에 막대한 투자를 하는 주목할만한 핀테크 회사입니다.
은행이 금융 분야의 머신러닝에 투자하는 곳
인수 및 신용 평가
기계 학습 알고리즘은 금융 및 보험 분야에서 매우 일반적인 인수 업무에 완벽하게 들어맞습니다.
데이터 과학자는 각 고객에 대해 수백 개의 데이터 항목을 사용하여 수천 개의 고객 프로필을 기반으로 모델을 교육합니다. 잘 훈련된 시스템은 실제 환경에서 동일한 인수 및 신용 평가 작업을 수행할 수 있습니다. 이러한 채점 엔진은 직원이 훨씬 더 빠르고 정확하게 작업할 수 있도록 도와줍니다.
은행과 보험 회사는 수많은 과거 소비자 데이터를 보유하고 있으므로 이러한 항목을 사용하여 기계 학습 모델을 교육할 수 있습니다. 또는 대규모 통신 또는 유틸리티 회사에서 생성된 데이터 세트를 활용할 수도 있습니다.
예를 들어, BBVA Bancomer는 대체 신용 평가 플랫폼인 Destacame과 협력하고 있습니다. 이 은행은 라틴 아메리카에서 신용 기록이 부족한 고객의 신용 접근성을 높이는 것을 목표로 합니다. Destacame은 개방형 API를 통해 유틸리티 회사의 청구서 지불 정보에 액세스합니다. 청구서 결제 방식을 사용하여 Destacame은 고객의 신용 점수를 생성하고 그 결과를 은행에 보냅니다.
알고리즘 트레이딩
알고리즘 거래에서 기계 학습은 더 나은 거래 결정을 내리는 데 도움이 됩니다. 수학적 모델은 뉴스와 거래 결과를 실시간으로 모니터링하고 주가를 상승 또는 하락시킬 수 있는 패턴을 감지합니다. 그런 다음 예측에 따라 주식을 판매, 보유 또는 구매하기 위해 적극적으로 조치를 취할 수 있습니다.
기계 학습 알고리즘은 수천 개의 데이터 소스를 동시에 분석할 수 있는데, 이는 인간 거래자가 달성할 수 없는 것입니다.
기계 학습 알고리즘은 인간 거래자가 시장 평균보다 약간의 우위를 점할 수 있도록 도와줍니다. 그리고 엄청난 양의 거래 작업을 고려할 때 작은 이점이 상당한 이익으로 이어지는 경우가 많습니다.
로보어드바이저
로보어드바이저는 이제 금융 분야에서 흔한 일이 되었습니다. 현재 자문 영역에는 기계 학습의 두 가지 주요 응용 프로그램이 있습니다.
포트폴리오 관리는 알고리즘과 통계를 사용하여 고객의 자산을 할당, 관리 및 최적화하는 온라인 자산 관리 서비스입니다. 사용자는 50세까지 백만 달러를 저축하겠다는 등 현재의 금융 자산과 목표를 입력합니다. 그런 다음 로보어드바이저는 위험 선호도와 원하는 목표에 따라 투자 기회에 따라 현재 자산을 할당합니다.
금융상품 추천. 많은 온라인 보험 서비스는 로보어드바이저를 사용하여 특정 사용자에게 맞춤형 보험 플랜을 추천합니다. 고객은 저렴한 수수료와 개인화되고 보정된 추천으로 인해 개인 금융 자문가보다 로보어드바이저를 선택합니다.
금융 분야의 머신러닝 – 이유, 내용, 방법
금융에서 머신러닝을 어떻게 활용하나요?
AI와 머신러닝의 모든 장점에도 불구하고, 자금이 풍부한 회사라도 이 기술에서 실제 가치를 추출하는 데 어려움을 겪는 경우가 많습니다. 기존 금융 서비스 업체들은 기계 학습의 고유한 기회를 활용하고 싶어하지만 현실적으로 데이터 과학의 작동 방식과 사용 방법에 대한 모호한 아이디어를 갖고 있습니다.
그들은 비즈니스 KPI 부족과 같은 유사한 문제에 자주 직면합니다. 결과적으로 비현실적인 추정 결과가 나오고 예산이 고갈됩니다. 적절한 소프트웨어 인프라를 갖추는 것만으로는 충분하지 않습니다(물론 좋은 시작이기는 하지만). 가치 있는 머신러닝 개발 프로젝트를 제공하려면 명확한 비전, 탄탄한 기술 인재, 결단력이 필요합니다.
이 기술이 비즈니스 목표 달성에 어떻게 도움이 되는지 잘 이해한 후 즉시 아이디어 검증을 진행하세요. 이는 데이터 과학자의 임무입니다. 그들은 아이디어를 조사하고 실행 가능한 KPI를 공식화하고 현실적인 추정을 내리는 데 도움을 줍니다.
이 시점에서 모든 데이터를 수집해야 합니다. 그렇지 않으면 이 데이터를 수집하고 정리하려면 데이터 엔지니어가 필요합니다.
특정 사용 사례와 비즈니스 조건에 따라 금융 회사는 머신러닝을 채택하기 위해 다양한 경로를 따를 수 있습니다. 확인해 봅시다.
머신러닝 대신 빅데이터 엔지니어링에 집중
종종 금융 회사는 적절한 데이터 엔지니어링이 필요하다는 사실을 깨닫고 기계 학습 프로젝트를 시작합니다. N-iX의 수석 데이터 과학자인 Max Nechepurenko는 다음과 같이 말합니다.
[데이터 과학] 솔루션을 개발할 때 지나치게 복잡하지 않음을 의미하는 Occam의 면도날 원리를 사용하는 것이 좋습니다. 사실 머신러닝을 목표로 하는 대부분의 기업은 견고한 데이터 엔지니어링, 집계된 데이터에 통계를 적용하고 해당 데이터를 시각화하는 데 중점을 두어야 합니다.
처리되고 잘 구조화된 데이터에 통계 모델을 적용하는 것만으로도 은행은 운영의 다양한 병목 현상과 비효율성을 격리할 수 있습니다.
그러한 병목 현상의 예는 무엇입니까? 이는 특정 지점의 대기열, 제거할 수 있는 반복 작업, 비효율적인 HR 활동, 모바일 뱅킹 앱의 결함 등일 수 있습니다.
게다가 데이터 과학 프로젝트의 가장 큰 부분은 CRM, 보고 소프트웨어, 스프레드시트 등과 같은 수백 가지 소스로부터 분리된 데이터를 수집하는 플랫폼의 조율된 생태계를 구축하는 것입니다.
알고리즘을 적용하기 전에 데이터를 적절하게 구조화하고 정리해야 합니다. 그래야만 해당 데이터를 통찰력으로 전환할 수 있습니다. 실제로 ETL(추출, 변환 및 로드) 및 데이터 추가 정리가 기계 학습 프로젝트 시간의 약 80%를 차지합니다.
금융을 위한 머신러닝 개발의 ETL 절차
타사 기계 학습 솔루션 사용
회사가 향후 프로젝트에서 머신러닝을 활용하기로 결정하더라도 반드시 새로운 알고리즘과 모델을 개발할 필요는 없습니다.
대부분의 기계 학습 프로젝트는 이미 해결된 문제를 다룹니다. Google, Microsoft, Amazon, IBM과 같은 거대 기술 기업은 기계 학습 소프트웨어를 서비스로 판매합니다.
이러한 기본 제공 솔루션은 다양한 비즈니스 작업을 해결하도록 이미 교육을 받았습니다. 귀하의 프로젝트가 동일한 사용 사례를 다루는 경우 귀하의 팀이 거대한 R&D 센터를 갖춘 거대 기술 기업의 알고리즘보다 뛰어난 성능을 발휘할 수 있다고 생각하십니까?
한 가지 좋은 예는 Google의 다중 플러그 앤 플레이 추천 솔루션입니다. 해당 소프트웨어는 다양한 도메인에 적용되며 해당 소프트웨어가 귀하의 비즈니스 사례에 적합한지 확인하는 것이 논리적입니다.
기계 학습 엔지니어는 특정 데이터 및 비즈니스 도메인에 초점을 맞춘 시스템을 구현할 수 있습니다. 전문가는 다양한 소스에서 데이터를 추출하고, 이를 특정 시스템에 맞게 변환하고, 결과를 받고, 결과를 시각화해야 합니다.
단점은 타사 시스템에 대한 통제력이 부족하고 솔루션 유연성이 제한된다는 점입니다. 게다가 기계 학습 알고리즘은 모든 사용 사례에 적합하지 않습니다. N-iX의 수석 데이터 과학자인 Ihar Rubanau는 다음과 같이 말합니다.
보편적인 기계 학습 알고리즘은 아직 존재하지 않습니다. 데이터 과학자는 알고리즘을 다양한 도메인의 다양한 비즈니스 사례에 적용하기 전에 알고리즘을 조정하고 미세 조정해야 합니다.
따라서 Google의 기존 솔루션이 특정 도메인의 특정 작업을 해결한다면 아마도 이를 사용해야 할 것입니다. 그렇지 않다면 맞춤형 개발 및 통합을 목표로 하세요.
혁신과 통합
기계 학습 솔루션을 처음부터 개발하는 것은 가장 위험하고 비용이 많이 들고 시간이 많이 걸리는 옵션 중 하나입니다. 그러나 이는 일부 비즈니스 사례에 ML 기술을 적용하는 유일한 방법일 수 있습니다.
기계 학습 연구 및 개발은 특정 틈새 시장의 고유한 요구 사항을 목표로 하며 심층적인 조사가 필요합니다. 이러한 특정 문제를 해결하기 위해 개발된 즉시 사용 가능한 솔루션이 없는 경우 타사 기계 학습 소프트웨어가 부정확한 결과를 생성할 가능성이 높습니다.
금융 분야의 머신러닝: 개발팀
그럼에도 불구하고 Google 등의 오픈 소스 기계 학습 라이브러리에 크게 의존해야 할 것입니다. 현재 기계 학습 프로젝트는 주로 기존 최첨단 라이브러리를 특정 도메인 및 사용 사례에 적용하는 것입니다.
N-iX에서는 머신러닝 분야에서 성공적인 기업 R&D 프로젝트의 7가지 공통 특성을 식별했습니다. 여기 있습니다:
명확한 목표. 데이터를 수집하기 전에 AI와 머신러닝을 통해 달성하려는 결과에 대해 최소한 어느 정도 일반적인 이해가 필요합니다. 프로젝트 초기 단계에서 데이터 과학자는 해당 아이디어를 실제 KPI로 전환하는 데 도움을 줄 것입니다.
머신러닝 솔루션의 견고한 아키텍처 설계. 이 작업을 실행하려면 숙련된 소프트웨어 설계자가 필요합니다.
적절한 빅데이터 엔지니어링 생태계(Apache Hadoop 또는 Spark 기반)는 필수입니다. 이를 통해 금융 서비스 회사의 수많은 사일로 데이터 소스로부터 엄청난 양의 데이터를 수집, 통합, 저장 및 처리할 수 있습니다. 빅데이터 설계자와 빅데이터 엔지니어는 생태계 구축을 담당합니다.
새로 생성된 생태계에서 ETL 절차(추출, 변환 및 로드)를 실행합니다. 빅 데이터 설계자 또는 기계 학습 엔지니어가 이 작업을 수행합니다.
최종 데이터 준비. 데이터 변환 및 기술 정리 외에도 데이터 과학자는 특정 비즈니스 사례에 적합하도록 데이터를 더욱 구체화해야 할 수도 있습니다.
적절한 알고리즘을 적용하고, 이러한 알고리즘을 기반으로 모델을 생성하고, 모델을 미세 조정하고, 새로운 데이터로 모델을 재교육합니다. 데이터 과학자와 기계 학습 엔지니어가 이러한 작업을 수행합니다.
통찰력을 명쾌하게 시각화합니다. 비즈니스 인텔리전스 전문가가 이를 담당합니다. 게다가 사용하기 쉬운 UI로 대시보드를 만들려면 프런트엔드 개발자가 필요할 수도 있습니다.
소규모 프로젝트에는 훨씬 적은 노력과 훨씬 작은 팀이 필요할 수 있습니다. 예를 들어, 일부 R&D 프로젝트는 소규모 데이터 세트를 다루므로 정교한 빅 데이터 엔지니어링이 필요하지 않을 수 있습니다. 다른 경우에는 복잡한 대시보드나 데이터 시각화가 전혀 필요하지 않습니다.
주요 시사점
금융 기관에서는 프로세스 자동화 및 보안을 위해 머신러닝을 가장 자주 사용합니다.
데이터를 수집하기 전에 데이터 과학에서 기대하는 결과를 명확하게 파악해야 합니다. 프로젝트를 시작하기 전에 실행 가능한 KPI를 설정하고 현실적인 추정을 할 필요가 있습니다.
많은 금융 서비스 회사에는 데이터 과학 및 기계 학습에 대한 데이터 엔지니어링, 통계 및 데이터 시각화가 필요합니다.
학습 데이터 세트가 더 크고 깨끗할수록 기계 학습 솔루션이 생성하는 결과가 더 정확해집니다.
기계 학습 알고리즘을 중단하지 않고도 필요한 만큼 자주 모델을 재교육할 수 있습니다.
다양한 비즈니스 사례에 적용할 수 있는 보편적인 기계 학습 솔루션은 없습니다.
머신러닝 기능을 갖춘 금융 소프트웨어를 개발하는 데는 비용이 많이 듭니다.
Google과 같은 거대 기술 기업은 기계 학습 솔루션을 만듭니다. 프로젝트가 이러한 사용 사례와 관련된 경우 Google, Amazon 또는 IBM의 알고리즘보다 뛰어난 성능을 기대할 수 없습니다.