AI Researcher가 될끄야!/메타러닝3 [논문 리뷰] Few Shot Dialogue State Tracking using Meta-learning (PART 2 Result, additional Analysis) Result 평가는 일반적으로 dst 분야는 jga를 사용하는데 여기서는 none값으로 분류된 slot 말고 실제 값이 매칭되는 activate한 slot에 대해서만 정확도를 평가했다고 합니다. 그리고 모델은 starc 모델 구조로 두가지 알고리즘을 비교했고, 기본적으로 워드 임베딩은 로버타 라지 모델, 그리고 옵티마이저는 아담을 사용했습니다. 결과적으로 32개의 대화 셋 데이터만을 가진 로우 리소스에서 dst가 잘된다. 여기 정확도를 보시면 동일한 데이터 양으로 기존의 dst 모델을 학습시켰을 때는 다음과 같은 성능인데 본 모델은 가장 낮은 도메인에서도 32를 넘습니다. 이는 메타러닝에 의해 선택된 초기화가 그레이디언트 단계 측면에서 대상 도메인의 최적 매개 변수에 더 가깝기 때문에 데이터가 매우 적을.. 2022. 1. 17. [논문 리뷰] Few Shot Dialogue State Tracking using Meta-learning (PART 1 intro, background, method) 본 논문은 acl 2021 메타러닝 워크샵에 공개된 논문입니다. 메타러닝 방식을 dst 분야에 처음으로 적용한 연구라고 생각하시면 됩니다. 논문은 dst 분야의 메타러닝 적용의 필요성에 대한 부분부터 시작하게 됩니다. 목적지향형 대화를 실제 세계에 맞게 구축하려면 정말 다양한 도메인들에 맞춤화 될 필요가 있습니다. 새로운 타겟 도메인에서의 대화시스템이 필요할 경우 많은 양의 도메인 specific한 어노테이션 된 데이터가 필요합니다. 이러한 작업은 굉장히 힘들다는것 아마 공감하실 것 같습니다! Intro 이 문제를 해결하기 위해 이전 연구들에서는 기계독해 문제로 DST 문제를 변환하여 사용할 수 있는 외부 데이터를 통해 학습을 진행된 바 있습니다. 또한 특정 도메인 지식을 다른 도메인으로 transfer.. 2022. 1. 17. Automatic deep learning with meta learner - 2019년 까지의 연구동향 Auto Iteration을 통해 하이퍼 파라미터를 최적화 하는 연구가 진행되어왔다. 하지만 최근에는 라벨되지 않는 데이터를 활용하는 방법, 데이터 증강에 대한 방식이 많이 연구되고 있음. 따라서 모델을 선택하는 부분과 데이터를 다루는 부분을 자동으로 하는 것을 메타러닝의 방식을 사용한다. -Auto Data 라벨링을 하는 과정을 스스로 해주는 것이고, 라벨이 불분명한 경우는 스스로 사람에게 물어봐 라벨을 정정하는 과정입니다. 불분명한 라벨이란 다양한 것이 있다. cvat 이라는 기본 툴을 활용하여 auto data 를 수행할 수 있다. -Auto Trainer 여러개의 모델들의 결과를 받아볼 수 있고, 이터레이션 반복을 거쳐 다양한 프리트레인 모델에서 성능이 안좋은 것은 .. 2022. 1. 17. 이전 1 다음