구글 람다(LaMDA)란?

구글 람다는 구글이 2021 Google I/O에서 발표한 언어 모델입니다. 국내에서도 이루다와 같은 챗봇 기술들이 서비스되는 것을 볼 수 있었는데, 구글에서도 이러한 챗봇과 같은 언어 모델에 대해 발표하였습니다.

구글이 람다 모델 개발에서 집중한 부분은, 기존 챗봇 모델들이 단어들의 위치 관계에 기반해서 다음 무슨 단어가 나올 지 예측하는 방식으로 훈련되었던 반면에, 람다는 대화에 집중하여 훈련되었다는 것입니다.

대화 모델 개발에 있어서 '말이 되는가'와 '질문에 대해 구체적인가' 둘 다 모두 중요합니다.어떤 질문의 답변으로 "그거 좋네요!" 와 "잘 모르겠네요." 둘 다 답변으로 말이 되는 경우가 많습니다.

하지만 질문에 대해 구체적으로 연결된 정보를 내어주지는 못합니다. 구글은 구체적인 답변에 대해서도 잘 커버하는 것이 가능한 대화가 되게끔 학습을 시켰다고 합니다.

이러한 것은 영상에 나오는 예시에 보면 어떤 토픽에 대해 구체적으로 답변하는 모습을 볼 수 있습니다. 영상의 첫 예시에는 LaMDA가 사진의 행성인 명왕성이 되어 답변을 해 줍니다.

(구글 CEO 순다 피차이의 LaMDA 시연 영상)

질문 : 내가 방문하면 어떤걸 볼 수 있는지 알려줘.

LaMDA의 답변 : 너는 거대한 협곡들, 얼음들, 크레이터들을 볼 수 있어.

질문 : 그거 멋있네.

LaMDA의 답변 : 이 여행은 분명 재미있을 꺼야. 엄청 추울 수 있으니까 코트를 들고 와.

질문 : 기억하고 있을께. 혹시 누가 방문했던 적 있어?

LaMDA의 답변 : 응. 누군가 왔다 갔었지. 호라이즌스 우주선이 방문했었어.

질문 : 그때 정말 재미있었겠다.

LaMDA의 답변 : 뉴 호라이즌스 팀이 날 보고 매우 좋아했어. 난 그들에게 그동안 가까이 볼 수 없었던 뒷편의 사진을 보내줬어.

종이비행기가 되어서 이야기 하는것도 신기합니다.

질문 : 좋은 종이비행기가 되는 비밀이 뭐야?

LaMDA의 답변 : 글쎄, 친구야. 일단 먼저 '좋은'이 정확히 뭔지 먼저 물어봐야겠어. '좋은' 이 멀리 가는 걸 말하는건지, 똑바로 가는걸 말하는건지, 얼마나 잘 착륙하는 건지. 어떻게 생각해?

질문 : 거리가 중요한 것 같아.

LaMDA의 답변 : 그러면 나는 넓은 날개를 가지는 게 너가 찾는 답이라고 생각해. 또한 종이가 아주 튼튼해야 할 필요가 있어.

아직 람다는 초기 개발 단계에 있다고 합니다. 말이 안되는 답변을 하는 경우도 많고, 중간에 대화를 끊고 가버리는 경우도 있다고 합니다.

이러한 모델이 구글 검색 엔진에 적용되면 질문을 좀 더 구체적으로 이해하고, 더 구체적인 답변을 해줄 수 있는 가능성을 제공할 것입니다.

한편으로는 이러한 대화 모델이 잘못 사용될 가능성에 대해서도 걱정하는 우려가 있습니다. 학습에 사용된 데이터에 공격적인 말이 있거나, 정치적, 차별적 대화들이 있으면, 모델이 이러한 경향을 따라할 수도 있을 것입니다.

구글 CEO도 이러한 문제에 대해서 설명하고 있습니다. 이러한 문제들 없이 공정하고 안전하게 사용될 수 있게끔 총력을 다할 것이라고 이야기합니다.

GLBVISION