[2020.05.04 기록] 페이스북 발표 논문 번역(2) 초록


연어입니다.


주요 내용만 번역하겠습니다. 배경지식과 이해가 필요한 부분은 따로 코멘트 해두려 합니다.


[Abstract 초록]

Being engaging, knowledgeable, and empathetic are all desirable general qualities in a conversational agent. Previous work has introduced tasks and datasets that aim to help agents to learn those qualities in isolation and gauge how well they can express them. But rather than being specialized in one single quality, a good open-domain conversational agent should be able to seamlessly blend them all into one cohesive conversational flow.

(대화에) 어울리고, 지식도 갖추고, 공감하는 것 모두 챗봇에게 바라는 일반적인 특성이라 하겠다. 좋은 자유대화형 챗봇이라면 이 모든 것들을 단일한 플로우로 결합해 나가며 완벽하리만치 블렌딩 해낼 수 있어야 한다.

In this work, we investigate several ways to combine models trained towards isolated capabilities, ranging from simple model aggregation schemes that require minimal additional training, to various forms of multi-task training that encompass several skills at all training stages. We further propose a new dataset, BlendedSkillTalk, to analyze how these capabilities would mesh together in a natural conversation, and compare the performance of different architectures and training schemes.

여기 간단한 모델에서부터 멀티 태스킹 형태까지 다양한 트레이닝 방법을 조사한다. 더 나아가 새로운 데이터셋인 BlendedSkillTalk가 어떻게 자연스러운 대화를 엮어가는지 분석하고 다른 아키텍처와의 성능 비교도 해보려 한다.

Our experiments show that multi-tasking over several tasks that focus on particular capabilities results in better blended conversation performance compared to models trained on a single skill, and that both unified or two-stage approaches perform well if they are constructed to avoid unwanted bias in skill selection or are fine-tuned on our new task.

우리의 실험은 멀티 태스킹이 한 가지 기술로 훈련된 모델과 비교하여 대화에 더 나은 블렌딩 퍼포먼스 결과를 보이고, (대답이) 원치 않게 치우치는 것을 기술적으로 잘 골라내며, 미세한 조정도 잘 수행한다는 것을 보여준다.


  • open domain / close domain : 챗봇은 크게 개방형(open domian)과 폐쇄형(close domian)으로 나눌 수 있습니다. 대화 주제를 한정하지 않고 자유롭게 한다면 open, 특정 주제와 목적에 한해 대화한다면 close형이라 합니다. 도메인(domain)의 어원이 영토나 영역에서 출발한다는 것을 기억해 두면 웹과 인공지능에 사용되는 의미도 쉽게 이해할 수 있을 것입니다.
  • 데이터셋(dataset) : 인공지능은 학습을 위해 다량의 데이터를 필요로 합니다. 이렇게 인공지능 학습용 데이터들을 잘 모아둔 것이 데이터셋입니다. 잘 선별한 고품질의 데이터들일수록 인공지능의 성능을 높일 수 있을 것입니다.
  • 바이어스(bias) : 고의적인 의도에 인해 결과가 편향성을 갖게 되는 상태입니다. 전자 회로에서 특정한 결과를 유도하기 위해 설계자가 의도적으로 전압을 걸어두는 경우가 있습니다. 이런 경우를 '바이어스를 건다'고 하며 여기에서 파생된 표현으로 생각됩니다.
  • BlendedSkillTalk

Comments 0