[논문요약] Sentence Classification for Investment Rules Detection

자연어 처리

Hanwool Albert 2022. 5. 16. 14:03

간단히, 투자 업계에서 Compliance Requirements를 맞추는 것이 점점 어려워지고 있어서, 이걸 text classification으로 해결해보자는 이야기입니다.

근 몇년간 투자 업계(Investment Funds)는 아주 세세한 부분까지 그들의 투자 전략을 설명해야 하는 법적 의무를 지게 되었는데, 관련 법령의 변화가 아주 잦은 편(로이터에 따르면 12분마다 바뀐다고...)

하지만 법령의 변화 속도에 비해 이걸 적용하는데에는 시간이 꽤 오래걸려서 이를 일일이 확인하고 적용하는데에는 몇 달이나 걸린다고 한다. 그래서 이를 준수하기 위한 비용이나 벌금이 근 몇년간 45배나 증가하였다.

그래서 투자업계는 이를 4-eye-protocol을 활용해서(4개의 눈이니까 두사람...) 법령을 체크해왔는데 이것은 굉장히 시간 및 인력 낭비고, 머신러닝을 쓰는게 훨씬 나을 것.

그래서 해당 논문에서는 이를 binary text classification으로 해결하자고 문제를 제시하고, 본인들이 직접 해결을 했다.

Data

The Gold standard Database 썼다고 합니다(label 1-rules 0-non-rules)

Proposed Method

Results

CNN이 제일 좋았다고 합니다.

그래서 classifier를 이용해서 자동적으로 rule과 관련된 내용을 분류하는 모델을 만드는데에 성공했다고 하네요.

Fin-NLP 초창기 논문(18~20년도)들은 새로운 Fin-NLP 영역을 제시하는 대신에 NLP 활용 자체는 별거 없는 논문이 많은 것 같습니다. 한국 투자업계에서도 어느정도 필요할 수 있는 task인 것 같습니다

[3월 하반기에 읽은 논문들] Extractive Financial Narrative Summarisation using SBERT-base clustering, BERTopic, etc (0)	2022.04.13
[3월 상반기에 읽은 논문들] Deep Learning for sentiment analysis, Financial Text Data Analytics Framework, etc (0)	2022.03.17
[논문 요약] BERT + RoBERTa 같이 보기 (0)	2022.03.06
[2월에 읽은 논문들] Transformer, Bahdanau Attention, Comparison of PTLM, etc (0)	2022.02.27

통계, Machine Learning, NLP에 대한 지식을 바탕으로 재밌는 걸 만들고자 합니다.

nlp, 퀀트, 금융빅데이터, Fin-NLP, 논문요약, 금융공학, 이상한연구소, FIND-A, 논문리딩, 학회, Roberta, 텍스트마이닝, 논문리뷰, 빅데이터, Bert, 논문, 코크리, 알버트, 시계열분석, 자연어처리,

알버트의 이상한 연구소