자연어 처리

[논문요약] Sentence Classification for Investment Rules Detection

Hanwool Albert 2022. 5. 16. 14:03

Abstract

간단히, 투자 업계에서 Compliance Requirements를 맞추는 것이 점점 어려워지고 있어서, 이걸 text classification으로 해결해보자는 이야기입니다.

Introduction

근 몇년간 투자 업계(Investment Funds)는 아주 세세한 부분까지 그들의 투자 전략을 설명해야 하는 법적 의무를 지게 되었는데, 관련 법령의 변화가 아주 잦은 편(로이터에 따르면 12분마다 바뀐다고...)

하지만 법령의 변화 속도에 비해 이걸 적용하는데에는 시간이 꽤 오래걸려서 이를 일일이 확인하고 적용하는데에는 몇 달이나 걸린다고 한다. 그래서 이를 준수하기 위한 비용이나 벌금이 근 몇년간 45배나 증가하였다.

그래서 투자업계는 이를 4-eye-protocol을 활용해서(4개의 눈이니까 두사람...) 법령을 체크해왔는데 이것은 굉장히 시간 및 인력 낭비고, 머신러닝을 쓰는게 훨씬 나을 것.

그래서 해당 논문에서는 이를 binary text classification으로 해결하자고 문제를 제시하고, 본인들이 직접 해결을 했다.

Rule Detection in Prospectus

Data

The Gold standard Database 썼다고 합니다(label 1-rules 0-non-rules)

Proposed Method

  • Glove Embedding + linear network (임베딩의 평균값을 Linear layer에 넣음)
  • Convolutional Neural Network (Conv1d 후 Maxpooling)
  • BiLSTM (BiLSTM+Linear)

Results

CNN이 제일 좋았다고 합니다.

Conclusions

그래서 classifier를 이용해서 자동적으로 rule과 관련된 내용을 분류하는 모델을 만드는데에 성공했다고 하네요.

 

 

 

소감

Fin-NLP 초창기 논문(18~20년도)들은 새로운 Fin-NLP 영역을 제시하는 대신에 NLP 활용 자체는 별거 없는 논문이 많은 것 같습니다. 한국 투자업계에서도 어느정도 필요할 수 있는 task인 것 같습니다